Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

GPT-5-Codex 及其升级版本

Posted on 2025-09-16

GPT-5-Codex 及其升级版本

OpenAI 今天发布了一个新模型:GPT-5-Codex,这是一个经过微调的 GPT-5 变体,专门为其各种 AI 辅助编程工具而设计。

我说“半发布”是因为它还不能通过他们的 API 提供,但他们“计划很快在 API 中提供 GPT‑5-Codex”。

几个月前,我曾写过一篇关于OpenAI 产品系列的文章,这些产品都共用 Codex 这个名字,让人困惑不已。这个新模型又增加了一个,不过至少“GPT-5-Codex”(使用两个连字符)这个名字足够明确,不会造成太多混淆。

此时,最好将Codex视为 OpenAI 的编码模型和工具系列的品牌名称。

新模型已经集成到他们的 VS Code 扩展、Codex CLI 以及 Codex Cloud 异步编码代理中。我一直把后者称为“Codex Web”,但我认为 Codex Cloud 更合适,因为它也可以直接从他们的 iPhone 应用访问。

Codex Cloud 还新增了一个功能:你可以将其配置为自动针对特定的 GitHub 仓库运行代码审查(我在chatgpt.com/codex/settings/code-review上找到了这个选项),它会创建一个临时容器用于代码审查。相关文档如下。

新 GPT-5-Codex 模型的一些记录特征:

  • 专门针对代码审查进行培训,直接支持其新的代码审查功能。
  • GPT-5-Codex 会根据任务的复杂程度,更动态地调整其思考时间。简单任务(例如“列出此目录中的文件”)应该运行得更快。大型复杂任务应该运行更长时间——OpenAI 报告称,在某些情况下,Codex 的运算时间长达七个小时!
  • 其专有的“代码重构评估”得分从 GPT-5(高)的 33.9% 提升至 GPT-5-Codex(高)的 51.3%。如果不了解评估细节,很难做出评估,但这至少表明重构性能是他们关注的重点。
  • “GPT‑5-Codex 在创建移动网站时,在人类偏好评估方面也表现出了显著的进步”——过去我习惯性地提示模型“使其适合移动设备”,也许我不再需要这样做了。
  • “我们发现 GPT-5-Codex 的注释不太可能不正确或不重要”——代码中不重要的注释减少绝对是一种进步!

Codex CLI 中GPT-5-Codex 的系统提示符值得一读。它比其他型号的系统提示符明显短得多——这里有一个区别。

Theo Browne 对该模型及其附带功能进行了视频评测。他总体上对它印象深刻,但指出该模型在使用 Codex CLI 搜索工具浏览代码时表现异常糟糕。希望这个问题可以通过系统提示更新来修复。

最后,它能画出一只骑自行车的鹈鹕吗?由于没有 API 访问权限,我尝试了一下,并提示:

Generate an SVG of a pelican riding a bicycle, save as pelican.svg

结果如下:

有点乱——鹈鹕很好,自行车也很好,但是鹈鹕站在那里,与自行车重叠,而不是骑着它。

标签: ai 、 openai 、 generative-ai 、 llm 、 ai-assisted-programming 、 pelican-riding-a-bicycle 、 llm-release 、 coding-agents 、 gpt-5 、 codex-cli

原文: https://simonwillison.net/2025/Sep/15/gpt-5-codex/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme