GPT-5-Codex 及其升级版本 – 搞英语 → 看世界

OpenAI 今天发布了一个新模型：GPT-5-Codex，这是一个经过微调的 GPT-5 变体，专门为其各种 AI 辅助编程工具而设计。

我说“半发布”是因为它还不能通过他们的 API 提供，但他们“计划很快在 API 中提供 GPT‑5-Codex”。

几个月前，我曾写过一篇关于OpenAI 产品系列的文章，这些产品都共用 Codex 这个名字，让人困惑不已。这个新模型又增加了一个，不过至少“GPT-5-Codex”（使用两个连字符）这个名字足够明确，不会造成太多混淆。

此时，最好将Codex视为 OpenAI 的编码模型和工具系列的品牌名称。

新模型已经集成到他们的 VS Code 扩展、Codex CLI 以及 Codex Cloud 异步编码代理中。我一直把后者称为“Codex Web”，但我认为 Codex Cloud 更合适，因为它也可以直接从他们的 iPhone 应用访问。

Codex Cloud 还新增了一个功能：你可以将其配置为自动针对特定的 GitHub 仓库运行代码审查（我在chatgpt.com/codex/settings/code-review上找到了这个选项），它会创建一个临时容器用于代码审查。相关文档如下。

新 GPT-5-Codex 模型的一些记录特征：

专门针对代码审查进行培训，直接支持其新的代码审查功能。
GPT-5-Codex 会根据任务的复杂程度，更动态地调整其思考时间。简单任务（例如“列出此目录中的文件”）应该运行得更快。大型复杂任务应该运行更长时间——OpenAI 报告称，在某些情况下，Codex 的运算时间长达七个小时！
其专有的“代码重构评估”得分从 GPT-5（高）的 33.9% 提升至 GPT-5-Codex（高）的 51.3%。如果不了解评估细节，很难做出评估，但这至少表明重构性能是他们关注的重点。
“GPT‑5-Codex 在创建移动网站时，在人类偏好评估方面也表现出了显著的进步”——过去我习惯性地提示模型“使其适合移动设备”，也许我不再需要这样做了。
“我们发现 GPT-5-Codex 的注释不太可能不正确或不重要”——代码中不重要的注释减少绝对是一种进步！

Theo Browne 对该模型及其附带功能进行了视频评测。他总体上对它印象深刻，但指出该模型在使用 Codex CLI 搜索工具浏览代码时表现异常糟糕。希望这个问题可以通过系统提示更新来修复。

最后，它能画出一只骑自行车的鹈鹕吗？由于没有 API 访问权限，我尝试了一下，并提示：

Generate an SVG of a pelican riding a bicycle, save as pelican.svg

结果如下：

有点乱——鹈鹕很好，自行车也很好，但是鹈鹕站在那里，与自行车重叠，而不是骑着它。