Claude Opus 4.7 – Anthropic 推出的最新旗舰大模型

AI项目 2026-04-17

Claude Opus 4.7是什么

Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型,为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出,SWE-bench Pro 得分提升至 64.3%,视觉分辨率支持提升至 2,576 像素(约 3.75 兆像素),具备自我验证与长程自主执行能力。模型现已全面上线 Claude 全系产品、API 及 Amazon Bedrock 等主流云平台。

Claude Opus 4.7

Claude Opus 4.7的主要功能

  • 高难度编程:在 SWE-bench Pro 测试中得分 64.3%,可自主处理复杂长时软件开发任务并自我验证结果。
  • 超高分辨率视觉:支持长边 2,576 像素(约 375 万像素)的图像输入,是前代模型的 3 倍以上。
  • 自主纠错机制:在汇报最终结果前主动检查逻辑错误,内部修正后再输出,减少人工介入。
  • 长程任务执行:可连贯运行数小时的多步骤复杂工作流,保持稳定性和一致性。
  • 多模态理解:精准解读密集截图、复杂技术图表、化学结构及像素级视觉细节。
  • 智能工具调用:支持 MCP-Atlas 等扩展工具链,工具调用错误率降低约 1/3。
  • 文件系统记忆:跨多会话长任务中记住关键笔记,减少重复上下文输入。
  • 新增 effort 档位:新增 xhigh 档位(位于 highmax 之间),Claude Code 默认采用此档位。
  • Task Budgets:支持为长任务设置 token 预算,由模型自主分配资源。
  • Ultrareview 命令:Claude Code 新增独立审查会话,深度检查代码改动与潜在问题。

如何使用Claude Opus 4.7

  • 平台访问
    • Claude 网页/App:直接在模型选择器切换至 Opus 4.7 即可使用。
    • API 调用:模型 ID 为 claude-opus-4-7,通过 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 或 Microsoft Foundry 调用。
    • Claude Code:已默认将 effort 档位提升至 xhigh,输入 /ultrareview 可启动深度代码审查。
  • API 关键参数设置
    • effort 档位:通过 effort 参数控制响应规模,选项为 low / medium / high / xhigh / max。编程与 agentic 场景建议使用 highxhigh 起步。
    • task budgets(公测):设置长任务 token 预算,让模型自主分配资源,与 effort 参数配合使用更精细。
    • thinking 参数:已弃用 thinking: {type: "enabled", budget_tokens: N},改为使用 thinking: {type: "adaptive"} 配合 effort 参数。
  • 高分辨率视觉:直接上传长边不超过 2,576 像素的原图,无需自行压缩,模型自动处理高分辨率输入。
  • Claude Code 特有指令
    • 输入 /ultrareview 启动独立审查会话,对代码改动进行深度检查(Pro 和 Max 用户每月限免 3 次)。
    • Auto mode 已下放至 Max 用户,可在 --dangerously-skip-permissions 与默认模式间提供中间档安全选项。

Claude Opus 4.7的关键信息和使用要求

  • 模型定位:Opus 4.6 的直接升级版,Anthropic 最新旗舰模型,现已全面上线 Claude 全系产品、API、Amazon Bedrock、Google Cloud Vertex AI 及 Microsoft Foundry。
  • 核心升级:高难度软件工程任务能力显著提升(SWE-bench Pro 达 64.3%),视觉分辨率支持长边 2,576 像素(约 375 万像素,为前代 3 倍以上),具备自我验证与长程自主执行能力。
  • 定价策略:维持 Opus 4.6 价格,输入 $5/百万 token,输出 $25/百万 token,模型 ID 为 claude-opus-4-7
  • 新增档位:在 highmax 之间新增 xhigh effort 档位,Claude Code 默认已切换至此档位。
  • Tokenizer 变更:新 tokenizer 下相同文本的 token 数约为旧版的 1.0–1.35 倍,需预留更高 token 预算。

Claude Opus 4.7的核心优势

  • 高难度编程突破:在 SWE-bench Pro 测试中得分 64.3%,较 4.6 提升 11 个百分点,可自主处理最复杂的软件工程任务。
  • 自我验证机制:在汇报结果前主动检查逻辑错误并内部修正,显著降低人工介入频率,提升长任务可靠性。
  • 视觉感知跃升:支持 2,576 像素长边(约 375 万像素)的高分辨率图像,视觉感知基准从 54.5% 跃升至 98.5%。
  • 长程任务稳定性:可连贯运行数小时的多步骤复杂工作流,不会因中途难题而放弃,保持执行一致性。
  • 严格指令遵循:对指令的字面执行精度大幅提升,减少模糊解读,确保按用户意图精确完成。
  • 工具调用效率:工具调用错误率降低约三分之一,token 使用效率在多步 agentic 场景中显著优化。

Claude Opus 4.7的项目地址

  • 项目官网:https://www.anthropic.com/news/claude-opus-4-7

Claude Opus 4.7的同类竞品对比

评测维度 Claude Opus 4.7 GPT-5.4 Gemini 3.1 Pro
Agentic coding (SWE-bench Pro) 64.3% 57.7% 54.2%
Agentic coding (SWE-bench Verified) 87.6% 80.6%
Agentic terminal coding (Terminal-Bench 2.0) 69.4% 75.1% 68.5%
Multidisciplinary reasoning (Humanity’s Last Exam w/ tools) 54.7% 58.7% 51.4%
Agentic search (BrowseComp) 79.3% 89.3% 85.9%
Scaled tool use (MCP-Atlas) 77.3% 68.1% 73.9%
Agentic computer use (OSWorld-Verified) 78.0% 75.0%
Agentic financial analysis (Finance Agent v1.1) 64.4% 61.5% 59.7%
Graduate-level reasoning (GPQA Diamond) 94.2% 94.4% 94.3%
Visual reasoning (CharXiv w/ tools) 91.0%
Multilingual Q&A (MMLU) 91.5% 92.6%

Claude Opus 4.7的应用场景

  • 高难度软件开发:支持处理复杂的软件工程任务,如大规模代码重构、复杂算法实现,可自主运行数小时并在汇报前自我验证结果,GitHub 实测任务解决率提升 13%。
  • 高分辨率视觉分析:模型能解读密集 UI 截图、技术图表、化学结构及像素级视觉细节,适用于计算机视觉代理、自动化渗透测试和生命科学专利工作流。
  • 长程自主工作流:自动执行跨多会话的复杂多步骤任务,如深度数据分析、研究报告生成,能够在长时间运行中保持一致性和连贯性,减少人工介入。
  • 金融与商业分析:模型能进行严谨的财务建模、投资分析和专业演示文稿生成,在 Finance Agent v1.1 基准测试中得分 64.4%,可产出严谨的分析模型和高质量商业交付物。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章