Anthropic 发布 Claude 4 型号，可自主完成近乎整个企业工作日的工作

Anthropic 今日发布了 Claude Opus 4 和 Claude Sonnet 4，Opus 4 凭借其在 SWE-bench 上 72.5% 和 Terminal-bench 上 43.2% 的性能，成为全球领先的编码模型。两种模型均采用混合架构，支持近乎即时的响应和扩展的思维模式，可执行复杂的推理任务。这些模型引入了并行工具执行和内存功能，使 Claude 能够在获得本地文件访问权限时提取并保存关键信息。此前处于研究预览阶段的 Claude Code 现已正式发布，并集成了新的 VS Code 和 JetBrains 代码，可直接在开发者的文件中显示编辑内容。GitHub 集成使 Claude 能够响应拉取请求反馈并通过新的 Beta 版 SDK 修复持续集成 (CI) 错误。定价与前几代保持一致，Opus 4 为每百万代币 15 美元/75 美元，Sonnet 4 为每百万代币 3 美元/15 美元。两种模型均可通过 Claude 的网页界面、Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获取。 Pro、Max、Team 和 Enterprise 套餐均包含扩展思维功能，Sonnet 4 也可供免费用户使用。这家初创公司的投资者包括亚马逊和谷歌，该公司表示，Claude Opus 4 可以自主工作近乎一个完整的工作日——七个小时。CNBC 补充道：“我经常用 Claude 进行写作，在 Opus 4 和 Sonnet 4 之前，我主要将这些模型作为思考伙伴，但大部分写作仍然是我自己完成的，”Anthropic 首席产品官 Mike Krieger 在接受采访时表示。“而他们已经突破了这个门槛，现在我的大部分写作实际上……主要是 Opus，现在我的写作已经完全无法辨认了。”克里格补充道：“我很高兴我们在两个方面都在不断突破前沿。一方面是编码部分和整体的代理行为，这为许多编码初创公司提供了动力……另一方面，我们也在不断探索这些模型如何真正学习，并成为真正有用的写作伙伴。”

在 Slashdot 上阅读更多内容。

原文： https://slashdot.org/story/25/05/22/1653257/anthropic-releases-claude-4-models-that-can-autonomously-work-for-nearly-a-full-corporate-workday?utm_source=rss1.0mainlinkanon&utm_medium=feed