DeepSeek开源了IMO金牌级数学模型：DeepSeek-Math-V2，这

DeepSeek开源了IMO金牌级数学模型：DeepSeek-Math-V2，这个模型基于 DeepSeek-V3.2-Exp-Base 开发，它的性能优于 Gemini DeepThink，实现了 IMO 金牌级的水平。这个版本最大的亮点，它不只是生成答案，而是引入了一个专门的“验证器”模型来检查推理步骤，模仿了人类数学家“大胆假设，小心求证”的过程，其中：生成器：负责提出解题思路和步骤。验证器：负责评估每一步的逻辑严密性，甚至能主动发现并纠正错误。冷启动与强化学习：基于DeepSeek-V3.2-Exp-Base底座，利用强化学习针对数学领域进行了深度优化。这种自验证机制为什么重要？是因为它直接解决了数学 AI 长期存在的核心问题：算对答案，并不意味着真正懂得推理。DeepSeek新模型有多猛