Anthropic 今日发布了 Claude Opus 4 和 Claude Sonnet 4,Opus 4 凭借其在 SWE-bench 上 72.5% 和 Terminal-bench 上 43.2% 的性能,成为全球领先的编码模型。两种模型均采用混合架构,支持近乎即时的响应和扩展的思维模式,可执行复杂的推理任务。这些模型引入了并行工具执行和内存功能,使 Claude 能够在获得本地文件访问权限时提取并保存关键信息。此前处于研究预览阶段的 Claude Code 现已正式发布,并集成了新的 VS Code 和 JetBrains 代码,可直接在开发者的文件中显示编辑内容。GitHub 集成使 Claude 能够响应拉取请求反馈并通过新的 Beta 版 SDK 修复持续集成 (CI) 错误。定价与前几代保持一致,Opus 4 为每百万代币 15 美元/75 美元,Sonnet 4 为每百万代币 3 美元/15 美元。两种模型均可通过 Claude 的网页界面、Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获取。 Pro、Max、Team 和 Enterprise 套餐均包含扩展思维功能,Sonnet 4 也可供免费用户使用。这家初创公司的投资者包括亚马逊和谷歌,该公司表示,Claude Opus 4 可以自主工作近乎一个完整的工作日——七个小时。CNBC 补充道:“我经常用 Claude 进行写作,在 Opus 4 和 Sonnet 4 之前,我主要将这些模型作为思考伙伴,但大部分写作仍然是我自己完成的,”Anthropic 首席产品官 Mike Krieger 在接受采访时表示。“而他们已经突破了这个门槛,现在我的大部分写作实际上……主要是 Opus,现在我的写作已经完全无法辨认了。”克里格补充道:“我很高兴我们在两个方面都在不断突破前沿。一方面是编码部分和整体的代理行为,这为许多编码初创公司提供了动力……另一方面,我们也在不断探索这些模型如何真正学习,并成为真正有用的写作伙伴。”
在 Slashdot 上阅读更多内容。