这里有一些关于 Claude 4 的细节,我在其他地方没有发现过:
- Claude Opus 4 和 Claude Sonnet 4 的培训截止日期是 2025 年 3 月!这是目前所有热门型号中最新的截止日期,真是令人印象深刻。
- Opus 4 的最大输出为 32,000 个代币,Sonnet 4 的最大输出为 64,000 个代币。Claude 3.7 Sonnet 也是 64,000 个代币,所以这对 Opus 来说是一个小的回归。
- Claude 4 两款型号的输入限制仍然停留在 20 万。我对此感到很困惑,我原本希望能突破 100 万,赶上 GPT 4.1 和 Gemini Pro 系列。
- Claude 3 Haiku 仍然在该表中 – 它仍然是 Anthropic 最便宜的型号,价格略低于 Claude 3.5 Haiku。
定价方面:Sonnet 4 与 Sonnet 3.7 价格相同(输入:3 美元/百万美元,输出:15 美元/百万美元)。Opus 4 的价格与老款 Opus 3 相同——输入:15 美元/百万美元,输出:75 美元/百万美元。我已在llm-prices.com上更新了新型号。
我在 Anthropic 的迁移到 Claude 4文档中发现了一些更有趣的细节:
由于Claude 4模型智能程度的提高,Claude 4模型针对模型因安全原因拒绝生成的内容引入了新的
refusal
停止原因。
另外,关于新的总结思维功能,还有以下说明:
启用扩展思维后,Claude 4 模型的消息 API 将返回 Claude 完整思维过程的摘要。摘要式思维能够充分发挥扩展思维的智能优势,同时防止误用。
虽然 API 在 Claude 3.7 和 4 模型中是一致的,但扩展思考的流式响应可能会以“块状”传送模式返回,并且流式事件之间可能会出现延迟。
处理汇总的模型与您在请求中指定的模型不同。思维模型看不到汇总的输出。
有一个新的测试版标题: interleaved-thinking-2025-05-14
,它启用了“交错思维”功能,允许将工具作为思维链的一部分进行调用。更多详细信息, 请参阅交错思维文档。
这是一个令人沮丧的注释:
- 您需要为原始请求生成的完整思考令牌付费,而不是摘要令牌。
- 计费的输出令牌数将与您在响应中看到的令牌数不匹配。
我一直假设 API 的输入/输出计数可用于估算准确的成本 – 但看起来这不再正确,并且真实成本只会在 Anthropic 的最终账单中显现出来。
标签: anthropic 、 claude 、 generative-ai 、 ai 、 llm 、 llm-pricing
原文: https://simonwillison.net/2025/May/22/updated-anthropic-models/#atom-everything