


凤凰网科技讯 12月24日,字节跳动Seed团队近日推出新一代形式化数学推理模型Seed Prover 1.5。该模型基于大规模智能体强化学习训练,在数学竞赛题的形式化证明能力上有所提升。
据官方信息,该模型在IMO 2025的前5道题目上,于16.5小时内生成了完整可编译验证的Lean证明代码,换算成绩达到此前金牌分数线。在Putnam 2025的12道赛题中,其用时9小时对其中11道生成了可验证代码。在Putnam历史评估集上,该模型解决了88%的问题。
团队表示,当前模型仍主要面向“规则清晰、背景封闭”的竞赛题目,与前沿数学研究所需的长链条、文献依赖推理尚有距离。技术报告已公开,后续将开放API供研究者体验。