OpenAI 今天发布了一个新模型:GPT-5-Codex,这是一个经过微调的 GPT-5 变体,专门为其各种 AI 辅助编程工具而设计。
我说“半发布”是因为它还不能通过他们的 API 提供,但他们“计划很快在 API 中提供 GPT‑5-Codex”。
几个月前,我曾写过一篇关于OpenAI 产品系列的文章,这些产品都共用 Codex 这个名字,让人困惑不已。这个新模型又增加了一个,不过至少“GPT-5-Codex”(使用两个连字符)这个名字足够明确,不会造成太多混淆。
此时,最好将Codex视为 OpenAI 的编码模型和工具系列的品牌名称。
新模型已经集成到他们的 VS Code 扩展、Codex CLI 以及 Codex Cloud 异步编码代理中。我一直把后者称为“Codex Web”,但我认为 Codex Cloud 更合适,因为它也可以直接从他们的 iPhone 应用访问。
Codex Cloud 还新增了一个功能:你可以将其配置为自动针对特定的 GitHub 仓库运行代码审查(我在chatgpt.com/codex/settings/code-review上找到了这个选项),它会创建一个临时容器用于代码审查。相关文档如下。
新 GPT-5-Codex 模型的一些记录特征:
- 专门针对代码审查进行培训,直接支持其新的代码审查功能。
- GPT-5-Codex 会根据任务的复杂程度,更动态地调整其思考时间。简单任务(例如“列出此目录中的文件”)应该运行得更快。大型复杂任务应该运行更长时间——OpenAI 报告称,在某些情况下,Codex 的运算时间长达七个小时!
- 其专有的“代码重构评估”得分从 GPT-5(高)的 33.9% 提升至 GPT-5-Codex(高)的 51.3%。如果不了解评估细节,很难做出评估,但这至少表明重构性能是他们关注的重点。
- “GPT‑5-Codex 在创建移动网站时,在人类偏好评估方面也表现出了显著的进步”——过去我习惯性地提示模型“使其适合移动设备”,也许我不再需要这样做了。
- “我们发现 GPT-5-Codex 的注释不太可能不正确或不重要”——代码中不重要的注释减少绝对是一种进步!
Codex CLI 中GPT-5-Codex 的系统提示符值得一读。它比其他型号的系统提示符明显短得多——这里有一个区别。
Theo Browne 对该模型及其附带功能进行了视频评测。他总体上对它印象深刻,但指出该模型在使用 Codex CLI 搜索工具浏览代码时表现异常糟糕。希望这个问题可以通过系统提示更新来修复。
最后,它能画出一只骑自行车的鹈鹕吗?由于没有 API 访问权限,我尝试了一下,并提示:
Generate an SVG of a pelican riding a bicycle, save as pelican.svg
结果如下:
标签: ai 、 openai 、 generative-ai 、 llm 、 ai-assisted-programming 、 pelican-riding-a-bicycle 、 llm-release 、 coding-agents 、 gpt-5 、 codex-cli
原文: https://simonwillison.net/2025/Sep/15/gpt-5-codex/#atom-everything