GPT-5.3 Codex – OpenA推出的最新编程AI模型

AI项目 2026-02-06

GPT-5.3 Codex是什么

GPT-5.3-Codex是OpenA推出的旗舰级智能编码模型，融合编程能力与专业推理知识，速度提升25%且token消耗减半。模型在SWE-Bench Pro、Terminal-Bench 2.0等基准测试中创下行业新高，支持长时自主任务执行与实时人机协作。模型首次实现AI参与自身开发训练，标志着智能体从”写代码”向”全流程计算机操作”进化，可胜任调试、部署、文档撰写、数据分析等软件工程全周期工作。

GPT-5.3 Codex的主要功能

编码开发：GPT-5.3-Codex 具备自主软件工程能力，能在多语言环境下完成真实开发任务，支持长周期迭代和复杂全栈项目构建。
终端操作：模型掌握强大的命令行工具使用技能，可高效执行各类终端命令和脚本操作。
视觉计算机操作：通过视觉感知桌面环境，GPT-5.3-Codex 能像人类一样点击、输入和导航，完成 GUI 自动化任务。
实时协作交互：工作过程中主动汇报进度，用户可随时介入讨论、调整方向，实现不丢失上下文的人机协作。
网络安全能力：作为首个获「高能力」评级的网络安全模型，能识别软件漏洞、在夺旗赛中取得优异成绩。
自我改进开发：早期版本已参与自身训练调试和部署管理，实现模型自举式加速迭代。
基础设施优化：基于 NVIDIA GB200 系统运行，推理速度提升 25%，支持动态 GPU 扩缩容以保障服务稳定。

如何使用GPT-5.3 Codex

GPT-5.3-Codex 现已面向 ChatGPT 付费套餐开放使用，支持所有 Codex 可用场景：应用端、命令行界面、集成开发环境扩展插件及网页端。

GPT-5.3 Codex的性能表现

SWE-Bench Pro：在更严格的多语言真实软件工程评估中达到 56.8%，超越前代模型，且使用更少 token 完成更高精度任务。
Terminal-Bench 2.0：以 77.3% 的成绩大幅领先前代 64.0%，展现出卓越的终端操作和命令行工具使用能力。
OSWorld-Verified：取得 64.7% 的突破，较前代 38.2% 提升近 26 个百分点，已接近人类约 72% 的水平，标志视觉计算机操作能力的重大飞跃。
网络安全 CTF：以 77.6% 显著超越前代约 67%，成为首个在网络安全任务上获「高能力」评级的模型。
SWE-Lancer IC Diamond：达到 81.4%，较前代提升 5.4 个百分点，在高端软件工程自由职业任务中表现突出。
速度与效率：推理速度较前代提升 25%，同时保持更高 token 效率，支持更长周期任务执行。