两年来,硅谷一直在重复同样的口号:人工智能代理是初级工程师。他们需要监督。它们可以处理日常任务,但难以应对复杂的问题。
随后,OpenAI Codex 团队负责人 Thibault 在 2025 年 DevDay 上发表了打破常规的言论。“Codex 现在是一名高级工程师,所以让它也做自己的文书工作吧。”
这是业内第一次有人公开称呼人工智能为高级工程师。不是助理,也不是初级开发人员,而是高级工程师。
OpenAI 的内部数据也印证了这一说法。目前,92% 的技术人员每天都会使用 Codex,而 7 月份这一比例仅为 50%。这些工程师每周提交的拉取请求增加了 70%。虽然并非像大家承诺的那样,实现了神话般的 10 倍增长,但这是一种可衡量的、可持续的、随着时间的推移不断累积的进步。
每个拉取请求都会自动通过 Codex 审核。以往拖慢软件交付速度的瓶颈问题现在瞬间得到解决。
OpenAI 的使用中出现了三种工作流程模式,展示了高级能力。
首先是 Friel 的执行计划模式。Codex 维护实时设计文档,并自主执行架构师级别的工作。他的记录是:独立执行 7 小时,处理 1.5 亿个 token,完成 15,000 行重构。在一次会话中,Codex 大约在一小时内编写了 4,200 行生产代码。
这验证了周一关于架构师-实施者工作流程的帖子。原本需要单个开发人员花费三个小时进行测试,现在大规模自主运行了七个小时。OpenAI 92% 的采用率证明了 AI 驱动开发的产品与市场的契合度。
第二,Nacho 的视觉验证模式。多模态 AI 编写代码、截取屏幕截图、与设计图进行比较,然后不断迭代直至像素完美。反馈循环无需人工干预即可完成。UI 实现完全自动化。
第三,Daniel 的全新视角评审。Codex 会创建单独的评审线索,并提供清晰的上下文。它不会标记 20 个小问题,而是会显示 1-2 个重要的高信号错误。高级工程师专注于架构,而 AI 则负责处理实现细节。
市场影响波及三个领域。
开发者工具面临颠覆。当人工智能承担起繁重的工作时,代码审查平台将变得商品化。价值将转移到工作流程编排和质量把关上。
当现有团队的生产力提高 70% 时,工程招聘模式将发生转变。企业可以推迟招聘,同时扩大产出。人才短缺问题可以通过补充而非替代来缓解。
当工程速度提升 70% 时,SaaS 单位经济效益将得到提升。功能开发速度更快,错误修复速度更快,技术债务也随之减少,这些都体现在季度累积效应中。更低的开发成本意味着更高的利润率。
但真正的转变是心理层面的。两年来,风险投资家和创始人一直谨慎地将人工智能定位为能力有限但功能强大的工具。它只是需要人工监督的初级辅助工具。
Thibault 的评论标志着一个转折点。AI 不仅仅是编写代码——它掌控着整个开发生命周期:设计、实现、审查和维护。
关于文书工作的评论可不是随便开玩笑。高级工程师负责处理自己的文档、测试和部署。如果 Codex 真的在高层运作,它也应该负责这些职责。
问题不再是人工智能是否能够取代初级工程师,而是人类高级工程师是否能够跟上。
原文: https://www.tomtunguz.com/openai-calls-codex-a-senior-engineer/