Seed Prover 1.5 – 字节跳动推出的新一代数学推理模型

AI框架 2025-12-24

Seed Prover 1.5是什么

Seed Prover 1.5 是字节跳动 Seed 团队推出的新一代形式化数学推理模型。模型采用创新的 Agentic Prover 架构，通过大规模强化学习（Agentic RL）训练，显著提升数学推理能力和效率。模型在解决 IMO 和 Putnam 等高难度数学竞赛问题上表现出色，达到金牌水平。Seed Prover 1.5 引入 Sketch Model，将自然语言证明转化为形式化引理，降低复杂度，提升推理成功率。Seed Prover 1.5 在本科、硕士和博士级别数学问题上刷新了 SOTA 表现，为未来 AI 协助数学研究奠定了基础。

Seed Prover 1.5的主要功能

解决高难度数学问题：支持高效解决国际数学奥林匹克竞赛（IMO）、北美本科数学竞赛（Putnam）和研究生级别的数学问题。
生成形式化证明代码：将数学问题的解题过程转化为可编译验证的 Lean 证明代码，确保证明的严谨性和正确性。
提升推理效率：通过创新的架构和强化学习训练，显著提高推理效率，减少计算资源消耗。
桥接自然语言与形式语言：用 Sketch Model 将自然语言证明转化为形式化引理，降低复杂问题的难度，提升推理成功率。
多智能体协作：通过分层级的多智能体系统，实现自然语言证明、引理生成和形式化证明的高效协作。

Seed Prover 1.5的技术原理

Agentic Prover 架构：将 Lean 语言视为工具，模型在证明过程中能自主调用 Mathlib 搜索工具、Python 代码执行工具等，通过工具调用获取知识和验证猜想。模型将复杂问题拆解为多个引理，每证明一个引理就将其保留复用，逐步构建完整的形式化证明。通过与 Lean 编译器的交互，模型在训练过程中不断积累经验，优化证明策略，提高推理能力和效率。
Sketch Model：将自然语言证明转化为形式化的引理结构，降低直接生成完整形式化代码的难度。结合 Lean 编译器验证、自然语言证明检查和基于长思维链的 Rubric 评分模型，从多个角度评估生成的引理结构，确保其质量。通过多智能体协作系统，实现自然语言证明、引理生成和形式化证明的高效协同，提升推理的成功率和并行度。
多智能体协作系统：
- Natural Language Prover：生成高层的自然语言证明，提供数学直觉。
- Sketch Model：将自然语言证明转化为形式化的引理结构。
- Agentic Prover：并行地攻克每一个引理，验证猜想生成最终的形式化证明。