人们正在讨论为什么 OpenAI 在 x dot com 上收购了 Windsurf。显然不是为了收入。 1 亿美元的收入流不会给 OpenAI 增加太多价值,其估值已经达到 $300B。虽然 Windsurf 团队确实很有才华,并且收购他们是有益的,但我认为主要原因是,虽然 OpenAI 已成为一般聊天的默认应用程序,但在编码能力方面,他们落后于 Claude 和快速改进的 Gemini 模型。
OpenAI 如何迎头赶上?在构建更好的模型时,他们通常通过 Mercor 和 ScaleAI 等合作伙伴根据人类反馈进行强化学习 (RLHF),这些合作伙伴帮助标记任务并提供有关这些模型输出的反馈。想象一下,您正在尝试生成 iOS 代码,您将需要来自 Mercor、Scale AI 和 Turing AI 的大量 iOS 专家为您提供有关生成的代码的反馈。目前没有足够的 iOS 代码可供基础模型训练。这变得昂贵,并且包括与人类贴标者的重复交易,这些贴标者甚至与基础模型没有直接关系,并且来自那些采购这些专家的第三方。 OpenAI 当然不希望这些运营费用(额外的专家人数)出现在他们的资产负债表上,他们也不希望不断地通过第三方来削减他们的利润。
最好的方法是获取能够实现持续反馈循环的软件。目前,当人们使用 ChatGPT 生成代码时,OpenAI 不会收到有关用户是否应用了代码、使用过代码、进行了哪些迭代,甚至是否将推荐代码推送到 GitHub 的反馈。没有反馈循环 – OpenAI 在 ChatGPT 客户端上提供输出,并且没有接受、拒绝按钮,用户不会响应其是否达到目的。用户甚至可能不会说“谢谢,这有效”,因为这需要额外的代币。 Sam Altman 本人一直在抱怨 OpenAI 因为一般对话中的这些“谢谢”而烧了多少钱。
通过 Windsurf,用户可以与依赖基础模型并提供持续反馈的代理进行交互。系统跟踪用户对响应和后续操作的满意度。更重要的是,由于 Windsurf 是多个模型的包装,通过收购 Windsurf,OpenAI 不仅可以获得自己模型的反馈,还可以获得竞争对手模型的反馈。这将创建一个永久的数据和反馈循环,有助于构建更好的编码代理。
Replit 的 Amjad 认为,实现 AGI 的关键是拥有完美的编码代理,因为它可以编码任何你想要的内容,并最终实现自我复制。不过不记得来源了(他是在哪里说的,如果我记错了,抱歉)。基础模型公司知道这一点。 Claude 现在拥有 Claude Code,OpenAI 最近还推出了一款独立的编码产品,您可以从名为 OpenAI Codex CLI 的终端运行该产品。
然而,这些产品可能还不够,因为它们是基于终端的,并且主要针对专业开发人员。是的,专业开发人员也使用 IDE,但我的观点是,目前发布的基础模型是基于终端的编码代理。 Windsurf 和 Cursor 可以访问更多的数据,因为它们的用户友好界面不仅吸引了专业开发人员,还吸引了新手编码人员,即“vibecoder”——基本上是所有开发人员。这会导致响应质量的数据量和反馈显着增加。我相信,在数据生成和反馈循环方面,拥有最大编码人员基础的 IDE 始终会优于当前版本的 Claude Code 和 OpenAI Codex。在 Tegus 上查看了 Mercor 和 ScaleAI 等公司的数十份成绩单后,我了解了这些基础模型和应用层产品为确保在特殊任务(例如通过人在环反馈进行编码)中获得最佳性能而产生的成本。
编码是基础模型公司的 P0 用例,Anthropic 似乎也不可避免地会尝试获取编码 IDE。 Sundar Pichai 关注 x dot com 上的 Cursor 帐户引发了人们对 Google 最终可能收购 Cursor 的猜测。不过,Cursor 将面临激烈的竞争,其收入高达 3 亿美元,最近又筹集了 9 亿美元,因此它们可能不会很快以低价出售。
谷歌最近发布了自己的编码 IDE,但考虑到谷歌过去曾关闭未达到预期规模的产品,我怀疑人们是否会采用它。
原文: https://manassaloi.com/2025/05/09/openai-buys-windsurf.html