OpenAI Codex 团队:从 Chat 到 Agent 的产品哲学
OpenAI Codex 团队核心成员解析
目录
1. 核心领导层
2. 技术骨干
3. 团队工作方式
4. 技术选型
5. 参考资源
1. 核心领导层
Thibault "Tibo" Sottiaux — Head of Codex
Tibo 是 Codex 的工程负责人,直接向 OpenAI 高层汇报。他的背景非常有趣:
- 前 Google 软件工程师,在 Google 期间积累了大规模系统开发经验
- 应用研究背景:专注于决策系统、预测建模和数据库系统
- 在 OpenAI 的职级是 Member of Technical Staff
Tibo 在多个公开场合分享了 Codex 的愿景,包括 OpenAI Forum 和 Software Engineering Daily 播客。他强调 Codex 的目标不仅是代码生成,而是"agentic SDLC"(代理驱动的软件开发生命周期)。
"Greg 和 Sam 有强烈的信念:'最终,我们应该有一个自主软件工程师与我们一起工作'……时机就是现在。"
—— Thibault Sottiaux
Greg Brockman — OpenAI Co-founder
Greg Brockman 是推动 Codex 成为 OpenAI 战略重点的关键人物:
- 2024 年底,他将 aSWE (Autonomous Software Engineer) 定为 2025 年的 top-line goal
- 与 Sam Altman 共同推动了 Codex 从实验项目到核心产品的转变
- 在 Apple Podcasts 的访谈中与 Tibo 一起讨论 Codex 的演进
Sam Altman — OpenAI CEO
Sam Altman 对 Codex 的评价非常直接:
"Codex 是我们最受喜爱的内部产品。"
这一评价反映了 Codex 在 OpenAI 内部的使用深度——不仅是面向外部的产品,也是 OpenAI 工程师日常工作的核心工具。
2. 技术骨干
Michael Bolin — Tech Lead(开源仓库)
Michael Bolin 负责 Codex 开源仓库的技术方向:
- 前 Meta Distinguished Engineer (E9):Meta 的最高工程职级之一
- 曾在 Google 和 Meta 工作,积累了丰富的 Big Tech 工程经验
- 主导了 Codex CLI 的架构设计,包括 agent loop 的 state machine 实现
- 发表了技术博客 "Unrolling the Codex Agent Loop"
Michael 在访谈中提到,他在 OpenAI 学到的关键经验是:"技术上正确是不够的"——必须考虑用户体验和实际影响。
Gabriel Peal — Engineering Lead(IDE Extension & Desktop App)
Gabriel 负责 Codex 的 IDE 扩展和桌面应用:
- 前 Airbnb:React Native 迁移决策的核心人物,主导了 Airbnb 从 React Native 回归原生开发的工程
- 前 Google:Android GSE (Google Software Engineer)
- 前 Watershed、Tonal:气候科技和健身科技领域的工程经验
- Lo 维护者:一个开源动画库
Gabriel 几乎是独立构建了 VS Code 扩展,并奠定了桌面应用的基础。他的多领域经验(移动端、桌面端、云)让 Codex 的多平台策略更加扎实。
Fouad Matin — Safety & Security Lead
Fouad 负责 Codex 的安全和沙箱机制:
- 前 Indent 联合创始人/CEO(2018-2024):云访问管理领域的网络安全创业公司
- 前 Segment 工程师(2016-2017):数据基础设施
- VotePlz 联合创始人:帮助数百万人投票的公益项目
- 在 OpenAI 专注于代码执行代理的安全和沙箱技术
Fouad 的背景在 Codex 团队中至关重要——Codex 的核心差异化之一就是默认安全沙箱,这让非技术用户也能安全使用。
3. 团队工作方式
Agent-First 开发
Codex 团队是自己产品的重度用户:
- 典型工程师同时运行 4-8 个并行 agent
- 工程师的角色从"写代码"转变为"agent 管理者"
- 每天到达工位时,多个 agent 已经在处理:代码审查、功能实现、安全审计、代码库理解、计划总结、bug 修复等
自举开发(Self-Hosted)
Codex 团队实现了真正的自举:
- >90% 的 Codex 代码由 Codex 自己生成
- 这与 Anthropic 的 Claude Code 团队报告的数据一致
- GPT-5.3-Codex 是第一个帮助创造自己的模型
发布频率
- 内部发布:每天 3-4 次
- 外部发布:每几天一次(通过 Homebrew、npm)
- 截至 2026 年 4 月,Codex CLI 已有 709 个 release
技能系统(Skills)
团队内部有 100+ 个 skill,持续在内部共享:
| Skill | 功能 |
|---|---|
| Security best-practices | 检查代码是否符合安全规范,生成补丁 |
| "Yeet" | 从计划自动生成 PR 标题/描述,一键创建 draft PR |
| Datadog integration | 连接 Datadog,审查告警/问题,尝试生成修复 |
分层代码审查
- AI 审查: bespoke 模型自动运行,约 90% 的 AI 评论指出有效问题
- 非关键代码:AI 审查后即可合并,无需人工
- 核心代码(agent、开源部分):强制人工审查
4. 技术选型
为什么用 Rust?
团队曾对比 TypeScript、Go 和 Rust,最终选择 Rust:
- 性能:大规模场景下每毫秒都重要
- 正确性:强类型和内存管理
- 工程文化:Rust 设定了高门槛
- 依赖少:避免 npm 依赖链的脆弱性
- 长期愿景:agent 需要在嵌入式系统、数据中心、笔记本上运行
团队甚至雇佣了 Ratatui(Rust TUI 库)的维护者全职加入。
Agent Loop 架构
核心是一个 state machine:
1. Prompt assembly:用户输入 + 系统指令 + 工具列表 + 文件 + 环境
2. Inference:token 发送到模型,流式返回推理步骤、工具调用或响应
3. Response:流式输出到终端;如果是工具调用,执行(读文件、运行 bash、写代码)
4. Tool response(可选):失败时错误返回模型诊断/重试
5. Assistant message:最终消息给用户,循环重启
Compaction 机制
当对话超过 token 阈值时,特殊的 Responses API endpoint 生成紧凑表示,避免二次推理成本。
安全沙箱
- 默认在沙箱中运行(限制网络/文件系统)
- 用户可以禁用,但默认安全
- 这是 Codex 区别于其他终端 agent 的关键设计
5. 参考资源
- How Codex is Built - Pragmatic Engineer(Gergely Orosz, 2026年2月)
- Unrolling the Codex Agent Loop - Michael Bolin