Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

氛围编码的风险

Posted on 2025-08-30

氛围编码的风险

我接受了伊莱恩·摩尔(Elaine Moore)的采访,这篇评论文章刊登在了《金融时报》上,最后也刊登在了该报的印刷版上!我昨天拿到了一份:

氛围编码的危险——本月,OpenAI 推出了一款新的模型,伴随着光鲜亮丽的直播、集体观赛派对,以及挥之不去的失望情绪。YouTube 评论区一片哗然。“我想他们都开始意识到,这个世界不会像他们想象的那样,”一位观众写道。“我能从他们的表情上看出来。”但如果普通用户对此不以为然,那么氛围编码或许就是该 AI 模型的救命稻草。编码是生成式 AI 的最新战场。面对巨额账单、高估值以及市场波动,该行业需要证明其企业生产力。编码几乎不被推广为一种已经奏效的商业用例。首先,AI 生成的代码有望取代程序员——一个收入丰厚的职业。其次,这项工作可以量化。今年 4 月,微软首席执行官萨蒂亚·纳德拉表示,目前公司多达 50% 的代码是由 AI 编写的。谷歌首席执行官桑达尔·皮查伊也说过同样的话。Salesforce 暂停了工程师招聘,马克·扎克伯格告诉播客乔·罗根,Meta 将把人工智能用作编写代码的“中级工程师”。与此同时,Replit 和 Cursor 旗下的 Anysphere 等初创公司正试图让人们相信,有了人工智能,任何人都可以编程。理论上,每个员工都可以成为软件工程师。那么,为什么我们还没有呢?一种可能是,这一切仍然太陌生了。但当我问那些以编写代码为生的人时,他们给出了另一种建议:不可预测性。正如程序员西蒙·威利森所说:“很多人都忽略了这个领域的奇特和趣味。我做了 30 年的计算机程序员,[人工智能模型] 的行为方式与普通计算机不同。”威利森因其人工智能实验而闻名于软件工程界。他是一位充满热情的氛围程序员——使用法学硕士 (LLM) 通过自然语言提示生成代码。OpenAI 的最新模型 GPT-3.1s,他现在最受欢迎。尽管如此,他预测,如果氛围编码被用于生产出存在故障的软件,它终将崩溃。程序员——那些热衷于寻找新方法来解决问题的人——会是法学硕士的早期采用者,这合情合理。代码是一种语言,尽管是一种抽象的语言。生成式人工智能几乎接受了所有语言的训练,包括像Cobol这样的老语言。但这并不意味着它们会接受它的所有建议。威利森认为,了解一个新模型能做什么的最好方法是提出一些不寻常的要求。他喜欢请求一个骑自行车的鹈鹕的svg(一种由用代码描述的线条组成的图像)​​,并要求它记住他花园里鸡的名字。结果可能会很奇怪。一个模型忽略了关键提示,而选择创作一首诗。尽管如此,他在氛围编码方面的冒险经历听起来像是该行业未来的广告。 Anthropic 的 Claude Code 是开发者们最青睐的模型,他开发了一款 OCR(光学字符识别)软件,该软件可以复制粘贴屏幕截图中的文本。他编写了一款可以汇总博客评论的软件,并计划开发一款自定义工具,当从他位于太平洋海岸的家中看到鲸鱼时,该工具会发出警报。所有这些都可以通过输入英文提示来实现。这听起来就像比尔·盖茨在写下自然语言人工智能代理将带来“自我们从输入命令到点击图标以来计算领域最大的革命”时所想的那样。但观看代码和了解其工作原理是两码事。我尝试制作自己的评论汇总工具,却得到了一个无法运行的结果,它给出了过长的答案,然后还沾沾自喜地庆祝成功。Willison 表示,除非他仔细检查了每一行代码,否则他不会在计划发布的项目中使用人工智能生成的代码。这不仅存在产生幻觉的风险,而且聊天机器人想要表示同意的愿望意味着它可能是一个无法使用的想法。对于那些不知道如何修复代码的人来说,这是一个特别大的问题。我们冒着创建带有隐藏问题的软件的风险。这也可能不会节省时间。非营利性模型评估和威胁研究机构 7 月份发表了一项研究,评估了 16 位开发人员的工作 — — 一些开发人员使用了人工智能工具,一些没有。那些使用人工智能辅助的人速度更快。事实上,他们花费的时间增加了近五分之一。我采访过的几位开发人员表示,人工智能最适合用来通过交流解决编码问题。这是他们称之为小黄鸭的东西的一种版本(因为他们有和桌上的玩具说话的习惯) — — 只是这只小黄鸭可以回应。正如有人所说,代码不应该以数量或速度来判断。人工智能编码的进步是看得见的。但衡量生产率的提高并不像简单的百分比计算那么简单。

摘自文章,其中包含我添加的相关项目链接:

Willison 认为,了解新模型能力的最好方法是提出一些不寻常的要求。他喜欢要求生成一个 SVG(一种用代码描述的线条组成的图像) ​​,图片上有一只骑着自行车的鹈鹕,然后要求它记住花园里鸡的名字。结果可能会出乎意料。一个模型甚至无视了他的要求,直接创作了一首诗。

尽管如此,他在氛围编码方面的冒险经历听起来就像是这个行业的广告。他使用了 Anthropic 的 Claude Code(开发人员最青睐的模型)开发了一个 OCR (光学字符识别 – 软件喜欢缩写)工具,可以从屏幕截图中复制粘贴文本。

他编写了一款软件,可以汇总博客评论,并计划开发一款自定义工具,当从他位于太平洋海岸的家中看到鲸鱼时,该工具会发出警报。所有这一切都可以通过输入英文提示来实现。

我已经谈论那个观鲸项目太久了。既然它已经发表在《金融时报》上了,我真的需要把它做好。

(关于 OCR……我尝试使用 GPT-5 从上面的图像中提取文本,结果却出奇地糟糕,充满了幻觉细节。Claude Opus 4.1 的表现要好得多,但仍然犯了一些错误。)

标签: ocr 、 ai 、 generative-ai 、 llms 、 vibe-coding 、 press-quotes

原文: https://simonwillison.net/2025/Aug/29/the-perils-of-vibe-coding/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme