更新了人择模型比较表 – 搞英语 → 看世界

这里有一些关于 Claude 4 的细节，我在其他地方没有发现过：

Claude Opus 4 和 Claude Sonnet 4 的培训截止日期是 2025 年 3 月！这是目前所有热门型号中最新的截止日期，真是令人印象深刻。
Opus 4 的最大输出为 32,000 个代币，Sonnet 4 的最大输出为 64,000 个代币。Claude 3.7 Sonnet 也是 64,000 个代币，所以这对 Opus 来说是一个小的回归。
Claude 4 两款型号的输入限制仍然停留在 20 万。我对此感到很困惑，我原本希望能突破 100 万，赶上 GPT 4.1 和 Gemini Pro 系列。
Claude 3 Haiku 仍然在该表中 – 它仍然是 Anthropic 最便宜的型号，价格略低于 Claude 3.5 Haiku。

定价方面：Sonnet 4 与 Sonnet 3.7 价格相同（输入：3 美元/百万美元，输出：15 美元/百万美元）。Opus 4 的价格与老款 Opus 3 相同——输入：15 美元/百万美元，输出：75 美元/百万美元。我已在llm-prices.com上更新了新型号。

我在 Anthropic 的迁移到 Claude 4文档中发现了一些更有趣的细节：

由于Claude 4模型智能程度的提高，Claude 4模型针对模型因安全原因拒绝生成的内容引入了新的refusal停止原因。

另外，关于新的总结思维功能，还有以下说明：

启用扩展思维后，Claude 4 模型的消息 API 将返回 Claude 完整思维过程的摘要。摘要式思维能够充分发挥扩展思维的智能优势，同时防止误用。

虽然 API 在 Claude 3.7 和 4 模型中是一致的，但扩展思考的流式响应可能会以“块状”传送模式返回，并且流式事件之间可能会出现延迟。

处理汇总的模型与您在请求中指定的模型不同。思维模型看不到汇总的输出。

有一个新的测试版标题： interleaved-thinking-2025-05-14 ，它启用了“交错思维”功能，允许将工具作为思维链的一部分进行调用。更多详细信息，请参阅交错思维文档。

这是一个令人沮丧的注释：

您需要为原始请求生成的完整思考令牌付费，而不是摘要令牌。

计费的输出令牌数将与您在响应中看到的令牌数不匹配。

我一直假设 API 的输入/输出计数可用于估算准确的成本 – 但看起来这不再正确，并且真实成本只会在 Anthropic 的最终账单中显现出来。

标签： anthropic 、 claude 、 generative-ai 、 ai 、 llm 、 llm-pricing

原文： https://simonwillison.net/2025/May/22/updated-anthropic-models/#atom-everything