Oracle-verified reasoning dataset: verify-or-fix + witnesses + traces (preview + gated pilot)

Giuelvy · January 7, 2026, 7:17am

I released a preview of an oracle-verified reasoning dataset generated by a deterministic Python oracle (no LLM-generated labels).

Key feature: verify-or-fix records with explicit witnesses (counterexamples / better solutions) and bounded reasoning traces (e.g., Dijkstra pop/relax, DP transitions).

Preview: Giuelvy/diamond-logic-miner-preview · Datasets at Hugging Face

Pilot (gated): Giuelvy/diamond-logic-miner-pilot-1m-gold · Datasets at Hugging Face

Happy to share quick stats (task mix, hard-positive rate, length p95) if helpful.

Giuelvy · January 7, 2026, 7:20am

Quick verify-or-fix example: candidate shortest distance=99, oracle says 97 with a counterexample path + full pop/relax trace. This is the kind of “auditable” supervision we’re generating.

Topic	Replies	Views
Oracle Verified Reasoning Supervision via Deterministic Generation (Verify-or-Fix + Witnesses + Traces) 🤗Datasets	5	January 7, 2026
Oracle-Verified Reasoning Supervision via Deterministic Generation (Verify-or-Fix + Witnesses + Traces) 🤗Datasets	7	January 7, 2026
Tools, datasets ,benchmarks in AI Safety 🤗Datasets	123	June 20, 2024
Dataset for inducing hallucinations or dataset with hallucinations in it 🤗Datasets	321	February 12, 2024
Dataset evaluation Spaces	36	December 18, 2024

Oracle-verified reasoning dataset: verify-or-fix + witnesses + traces (preview + gated pilot)

Related topics