近期,DeepSeek-R1 引发的推理模型热潮仍在持续走高——1 月 31 日,OpenAI 推出全新推理模型 o3-mini;2 月 18 日,xAI 推出 Grok 3,包含具备推理能力的 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning;2 月 25 日,Anthropic 推出首款混合推理模型 Claude 3.7 Sonnet 。
诚然,在大模型日益同质化、竞争激烈的背景下,推理能力已经成为衡量其性能的重要指标,同时也是 AI 向 AGI 进阶的重要发展方向。而随着算法优化的天花板逐渐显现,加之模型参数正逐渐被压缩至极限,数据的质量成为了决定模型能否从单纯的「答案记忆」转向深度「逻辑推演」的关键因素之一。
推理数据集的构建,远非简单的题目堆砌。为了防止模型在训练过程中泄露信息,在测试时作弊,数据需严格隔离测试集与训练集,并引入动态更新机制,定期更新题型。而在应对数学证明、代码生成这类复杂任务时,构建数据集时还需精心设计多个逻辑链条,巧妙设置隐藏陷阱条件,尽可能模拟人类解题过程中的试错与思考过程,以此为模型提供更贴近真实应用场景的学习素材。
DeepSeek 在 AIME 数学竞赛中的优异表现正是一个鲜明的例证,其依赖的 OpenThoughts-114k 数据集,涵盖了一系列需要逐步推导、涉及多个逻辑链条的问题,以严格的验证机制和巧妙编排的多步推理结构,保证了数据的准确性和可靠性的同时,让模型能够从中学习到更深层次的推理能力,而不是仅仅依赖于「记忆」来答题。
总而言之,DeepSeek 的成功,使整个行业对高质量推理数据集的关注度激增。接下来,HyperAI 超神经为大家整理了目前热度较高的推理数据集,覆盖数学、代码、科学、谜题等多个领域。对于期望切实提升大模型推理能力的从业者与研究者而言,这些数据集无疑是绝佳的起点。
点击查看更多开源数据集:
推理数据集汇总
预估大小:922.07 MB
下载地址:https://go.hyper.ai/SaAit
该数据集由 Open Thoughts 于 2025 年发布,专注于数学、代码、科学和谜题等领域,包含 11.4 万个高质量样本。旨在训练小型推理模型,使其在数学和代码推理任务上超越现有的大型模型(如 DeepSeek-R1-Distill-Qwen-32B 和 DeepSeek-R1-Distill-Qwen-7B)。
2 、 Bespoke-Stratos-17k 推理任务数据集
预估大小:125 MB
下载地址:https://go.hyper.ai/nLGos
该数据集是一个专为推理任务设计的高质量数据集,包含问题、推理轨迹和答案,覆盖代码、数学和科学谜题等多个领域,旨在为训练高性能推理模型提供支持。数据集由 3 部分组成:
* 编程数据:5 千条来自 APPs 和 TACO 的数据* 数学数据:1 万条来自 NuminaMATH 数据集的 AIME 、 MATH 和 Olympiads 子集
* 科学与谜题数据:1 千条来自 STILL-2 的数据
预估大小:2.24 GB
下载地址:https://go.hyper.ai/grwUo
Dolphin-R1 推理数据集包含约 80 万个样本,数据来源包括 DeepSeek-R1 、 Gemini Flash 以及 Dolphin Chat 提供的 20 万个样本,旨在为训练类似 DeepSeek-R1 的推理模型提供高质量的样本。这些样本主要用于提升模型在推理任务中的表现,涵盖数学、逻辑、编码等复杂任务。
预估大小:4.22 MB
下载地址:https://go.hyper.ai/0p72o
LIMO 数学推理基准数据集仅包含了 817 个高质量数学推理样本,旨在通过精心挑选高质量的训练样本,训练和评估大模型的数学推理能力,该数据集主要用于训练大模型的数学解题能力,提升其在数学考试、竞赛题目(如 AIME 、 MATH-500 等)上的表现。
预估大小:446.62 MB
下载地址:https://go.hyper.ai/qVAgO
NuminaMath-1.5 数学推理数据集适用于数学教育、竞赛问题领域,包含了大约 900k 个高质量的竞赛级别数学问题,每个问题的解决方案都采用链式思维 (CoT) 格式。这些问题来源于中国高中数学练习和美国及国际数学奥林匹克竞赛问题。
预估大小:8.44 GB
下载地址:https://go.hyper.ai/nuhSv
OpenR1-Math-220k 是一个大规模的数学推理数据集,由 Open R1 团队于 2025 年发布,旨在填补 DeepSeek R1 合成数据的缺口。该数据集包含 22 万条高质量的数学问题及其推理轨迹,这些数据源自 80 万条由 DeepSeek R1 生成的推理轨迹。
7 、 Chinese DeepSeek R1 Distill data
预估大小:376 MB
下载地址:https://go.hyper.ai/8Podu
该数据集为中文开源蒸馏满血 R1 的数据集,数据集中不仅包含 Math 数据,还包括大量的通用类型数据,总数量为 110K 。其中包括:
* Math:36,987 个样本
* Exam:2,440 个样本
* STEM:12,000 个样本
* General:58,573 个样本,包含弱智吧、逻辑推理、小红书、知乎、 Chat 等
以上就是 HyperAI 超神经为大家汇总的推理数据集,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
关于 HyperAI 超神经 (hyper.ai)
HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
* 为 1200+ 公开数据集提供国内加速下载节点
* 收录 300+ 经典及流行在线教程
* 解读 100+ AI4Science 论文案例
* 支持 500+ 相关词条查询
* 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅:
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。