去年一个被低估的人工智能故事是 Anthropic 在编码工具市场取得的成功。
“我们认为编码极其重要,” Anthropic 工程师 Sholto Douglas 在上周的一次采访中说道。“我们非常重视编码,也非常重视衡量编码的进度。我们认为这是衡量模型能力最重要的领先指标。”
这种专注得到了回报。自去年六月发布 Claude 3.5 Sonnet 以来,该公司的模型在软件工程方面表现出色。在过去一年中,许多基于 Claude 的编程工具(包括 Cursor、Windsurf、Bolt.new 和 Lovable)都实现了爆炸式增长。今年 2 月,Anthropic发布了一款名为 Claude Code 的编程助手,在程序员中广受欢迎。
在媒体采访中,Anthropic 的员工都夸耀 Claude 为其程序员带来的极大效率提升。
“对我来说,它大概让我的生产力提高了两倍,”Anthropic 工程师 Boris Cherny 在最近的一期播客节目中说道。“我觉得 Anthropic 的一些工程师的生产力大概提高了十倍。但也有一些人还没弄清楚如何使用它。”
Anthropic 的产品经理 Cat Wu 也举了个例子:“有时候我们一起开会,销售或合规部门的人会说,嘿,我们真的需要某个功能。然后 Boris 会问几个问题来了解规格。大概 10 分钟后,他会说,好吧,功能已经建好了。我稍后会合并它。还有其他吗?”
Anthropic 在编码市场的成功引起了 OpenAI 和 Google 的关注:
-
5 月初,OpenAI 宣布收购 Windsurf ,这是一款由 Anthropic 模型提供支持的 AI 代码编辑工具。
-
次周,OpenAI宣布推出 Codex ,这是一种旨在与 Anthropic 的 Claude Code 竞争的编码代理。
-
上周,谷歌宣布了自己的编码代理,名为Jules 。
我猜想,Anthropic 上周发布的Claude 4 的主要目标之一就是保持其在该市场的领先地位。这似乎起到了作用。Claude 4 发布几天后,氛围编码工具 Lovable 的首席执行官写道:“Claude 4 彻底消除了 Lovable 的大部分错误。” 他发布了一张图表,显示 Lovable 升级到 Claude 4 后,语法错误数量急剧下降。
最近几周,我与多位软件开发者和产品经理探讨了人工智能工具如何改变他们的工作方式。基于这些对话,我认为我们正处于软件开发方式发生巨大变革的边缘。
在本文中,我将概述过去一年中备受关注的新型软件开发工具。首先,我将介绍旨在帮助编程新手构建功能齐全的应用程序的“氛围编码”工具。然后,我将讨论为经验丰富的程序员设计的工具。正如我们将看到的,这两个类别中的领先工具的成功都归功于 Claude。
氛围编码革命
上周我与Gloo的产品经理Anthony Jantzi进行了交谈,Gloo 是一家为教堂和其他基督教组织开发软件的初创公司。
Jantzi 告诉我:“以前我们会用Figma来构建交互式原型,点击一下就能看到,看起来就像一个网页应用。” 但他最近开始使用一个名为 Bolt.new 的 Vibe 编码平台进行原型设计,这极大地改变了他的工作方式。
那些旧的 Figma 模型看起来像真正的网站,但很多功能实际上无法使用。例如,Gloo 的网站包含一个聊天机器人,这超出了 Figma 模型的功能范围。因此,尽管 Jantzi 可以征求用户对新功能布局的意见,但他告诉我,关于其功能,“根本不可能得到任何好的反馈”。
Jantzi 仅用几周的时间就使用 Bolt 创建了 Gloo 网站的功能齐全的克隆版。
他告诉我:“我基本上已经在 Bolt 中构建了我们应用程序的原型版本,我可以对其进行任何我想要的更改,然后将其放在潜在用户面前,看看他们如何使用它。”
Bolt 让 Jantzi 能够用简单的英语提示添加新功能。这比使用传统编程工具所花的时间要少得多。但 Jantzi 表示,他不会使用 Bolt(或其他 Vibe 编码工具)来构建可交付的软件产品。
“它还没达到真正应用的稳健程度,”他告诉我。“如果我把它放到用户量很大的环境中使用,它都会崩溃。”
因此,Jantzi 仍然需要传统工程师的帮助才能将新功能投入生产。但首先在 Bolt 沙盒中测试功能可以让 Jantzi 更有效地利用时间。
他告诉我:“我不会让我的工程师把时间浪费在用户不想要的东西上。”
Bolt.new 公司的首席执行官埃里克·西蒙斯 (Eric Simons) 表示,Jantzi 的故事并不罕见。
原文: https://www.understandingai.org/p/claude-powered-coding-tools-are-poised