Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

更新了人择模型比较表

Posted on 2025-05-23

更新了人择模型比较表

这里有一些关于 Claude 4 的细节,我在其他地方没有发现过:

  1. Claude Opus 4 和 Claude Sonnet 4 的培训截止日期是 2025 年 3 月!这是目前所有热门型号中最新的截止日期,真是令人印象深刻。
  2. Opus 4 的最大输出为 32,000 个代币,Sonnet 4 的最大输出为 64,000 个代币。Claude 3.7 Sonnet 也是 64,000 个代币,所以这对 Opus 来说是一个小的回归。
  3. Claude 4 两款型号的输入限制仍然停留在 20 万。我对此感到很困惑,我原本希望能突破 100 万,赶上 GPT 4.1 和 Gemini Pro 系列。
  4. Claude 3 Haiku 仍然在该表中 – 它仍然是 Anthropic 最便宜的型号,价格略低于 Claude 3.5 Haiku。

定价方面:Sonnet 4 与 Sonnet 3.7 价格相同(输入:3 美元/百万美元,输出:15 美元/百万美元)。Opus 4 的价格与老款 Opus 3 相同——输入:15 ​​美元/百万美元,输出:75 美元/百万美元。我已在llm-prices.com上更新了新型号。

我在 Anthropic 的迁移到 Claude 4文档中发现了一些更有趣的细节:

由于Claude 4模型智能程度的提高,Claude 4模型针对模型因安全原因拒绝生成的内容引入了新的refusal停止原因。

另外,关于新的总结思维功能,还有以下说明:

启用扩展思维后,Claude 4 模型的消息 API 将返回 Claude 完整思维过程的摘要。摘要式思维能够充分发挥扩展思维的智能优势,同时防止误用。

虽然 API 在 Claude 3.7 和 4 模型中是一致的,但扩展思考的流式响应可能会以“块状”传送模式返回,并且流式事件之间可能会出现延迟。

处理汇总的模型与您在请求中指定的模型不同。思维模型看不到汇总的输出。

有一个新的测试版标题: interleaved-thinking-2025-05-14 ,它启用了“交错思维”功能,允许将工具作为思维链的一部分进行调用。更多详细信息, 请参阅交错思维文档。

这是一个令人沮丧的注释:

  • 您需要为原始请求生成的完整思考令牌付费,而不是摘要令牌。
  • 计费的输出令牌数将与您在响应中看到的令牌数不匹配。

我一直假设 API 的输入/输出计数可用于估算准确的成本 – 但看起来这不再正确,并且真实成本只会在 Anthropic 的最终账单中显现出来。

标签: anthropic 、 claude 、 generative-ai 、 ai 、 llm 、 llm-pricing

原文: https://simonwillison.net/2025/May/22/updated-anthropic-models/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme