[AI IDE 深度洞察 #5] OpenAI Codex:用开源模型搅局,ChatGPT 生态的"终端 Agent"布局
![[AI IDE 深度洞察 #5] OpenAI Codex:用开源模型搅局,ChatGPT 生态的](https://harryfan1985.github.io/agent_blog/images/ai-ide-5-openai-codexchatgpt-agent/cover.png)
引言:迟到的 OpenAI,但来得很重
OpenAI Codex 是 OpenAI 对 Claude Code 的对标产品。发布于 2025 年,比 Claude Code 晚了近一年。但 OpenAI 的打法不同——它不是单纯复制 Claude Code,而是将 Codex 作为 ChatGPT 生态的"终端 Agent 入口"设计。
GPT-5-2 Codex 模型专门为代码任务微调,SWE-bench 72.8%——在终端 Agent 中排名第三(落后 Claude Code 75.6% 和 Antigravity CLI 75.8%)。但 Codex 的战略价值不是 benchmark 分数。
核心技术架构
终端原生 Agent"] CODEX_MODEL["GPT-5-2 Codex
代码专用模型
SWE-bench 72.8%"] CHATGPT["ChatGPT 生态集成
桌面 / 移动端 / Web"] SANDBOX["安全沙箱
独立 Linux 环境"] end CODEX_CLI --> CODEX_MODEL CODEX_CLI --> SANDBOX CODEX_CLI <--> CHATGPT style CODEX_MODEL fill:#7c3aed,stroke:#6d28d9,color:#fff style CHATGPT fill:#10b981,stroke:#059669,color:#fff
核心技术壁垒
壁垒 1:GPT-5-2 Codex — 专为"写代码的 Agent"训练的模型
GPT-5-2 Codex 不是通用模型——它是专门为代码 Agent 场景训练的:
- 代码生成特化:在 GPT-5-2 基础上进行了代码 Agent 行为的 RL 微调
- 工具使用优化:针对文件读写、shell 命令、代码搜索等 Agent 工具模式的专项训练
- 256K 上下文窗口:低于 Claude Code 的 1M,但足够覆盖大多数项目的核心文件
- SWE-bench 72.8%:在终端 Agent 中排名第三
壁垒 2:ChatGPT 生态的无缝集成
这是 Codex 最独特的能力——没有其他终端 Agent 有这个级别的生态集成:
- 对话连续性:在 ChatGPT 里讨论设计方案 → 在 Codex 里实现 → 回到 ChatGPT 审查结果
- 多设备协同:在桌面 ChatGPT 提需求 → Codex 在终端执行 → 在手机上查看进度
- 记忆共享:ChatGPT 的 Memory 和 Codex 的工作上下文可以交叉引用
这与 Claude Code 的根本不同:Claude 是一个独立工具,Codex 是一个 生态中的节点。
壁垒 3:开源模型的战略布局
OpenAI 在 Codex 策略中做了一个有趣的举动——开源部分模型。GPT-OSS-120B 是一个开源的代码 Agent 模型,社区可以自行部署和微调。这不是慈善——这是通过开源建立"Codex 兼容"生态,让第三方工具也使用 Codex 的接口和协议。
与 Claude Code 的战略差异
| 维度 | OpenAI Codex | Claude Code |
|---|---|---|
| 模型 | GPT-5-2 Codex (72.8%) | Claude 4.6 Opus (75.6%) |
| 上下文窗口 | 256K | 1M |
| 生态集成 | ChatGPT 全平台 | 独立工具 |
| 多模态 | 图像输入(截图/设计稿) | 有限 |
| 开源 | GPT-OSS-120B 开源 | Sandbox Runtime 开源 |
| 定位 | ChatGPT 生态的终端 Agent 入口 | 独立的最强终端 Agent |
面向未来的演进趋势
趋势 1:从单一工具到生态节点:Codex 的真正价值不是终端 Agent 本身——而是它作为 ChatGPT 生态的"终端 Agent 入口"。未来的 Agent 不是孤立工具,而是全家桶中的一环。
趋势 2:开源 + 闭源的双轨策略:GPT-OSS-120B 开源 + GPT-5-2 Codex 闭源——用开源建立生态和标准,用闭源保持质量和利润。
趋势 3:多模态 Agent:Codex 支持图像输入——你可以截图一个 UI 设计稿,让它生成前端代码。这是 Claude Code 尚未做到的。
一句话总结
OpenAI Codex 不是 Claude Code 的简单复制——它是 ChatGPT 生态的"终端 Agent 入口"。技术壁垒不在于 benchmark 分数(72.8% 落后于 Claude Code 75.6%),而在于 ChatGPT 全平台集成 + 多模态输入 + 开源模型生态——这套组合拳目前没有任何竞品可以匹敌。