DeepSeek推出新模型,主打自验证数学推理能力

DeepSeek推出DeepSeekMath-V2模型,主打自验证数学推理能力

IT之家11月27日消息,DeepSeek发布了DeepSeekMath-V2,该框架为可自我验证的数学推理训练平台。

团队认为,仅追求最终答案正确率不足以确保推理链条的严谨性,特别是在定理证明等需要逐步推导的任务中尤其明显。模型通过构建基于大语言模型(LLM)的验证器,对生成的证明进行自动审核,并通过扩展的验证计算不断生成高难度训练样本,以提高验证器的能力。

据IT之家了解,DeepSeekMath‑V2 基于 DeepSeek‑V3.2‑Exp‑Base,在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中均获得金牌级别的出色成果,并且在2024年普特南数学竞赛(Putnam 2024)中取得了118/120(接近满分)的傲人的成绩。官方表示,尽管仍有许多工作待完成,当前的成果已经明确表明:可自验证的数学推理是一条切实可行的研究路径,有望为构建更强大、更可靠的数学智能系统奠定坚实的基础。

 分享

本文由网络整理 © 版权归原作者所有

共  条评论

评论

  •  主题颜色

    • 橘色
    • 绿色
    • 蓝色
    • 粉色
    • 红色
    • 金色
  • 扫码用手机访问

© 2025 www.trjyy.com  E-Mail:[email protected]  

观看记录