Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

DeepSeek 的开发成本比报道的要高得多吗?

Posted on 2025-02-02

ai_64.png

大约三年前,为 DeepSeek 母公司工作的中国人工智能工程师团队推出了一款早期的人工智能超级计算机,《华盛顿邮报》称该计算机是由从 Nvidia 购买的 10,000 个 A100 GPU 构建而成。大约六个月后,“华盛顿禁止 Nvidia 向中国出售更多 A100”,文章指出。当你阅读本文时,请记住这个数字。 10,000 个 A100 GPU…DeepSeek 的新聊天机器人本周在硅谷和华尔街引起了恐慌,导致股市蒸发了 1 万亿美元。这种影响在很大程度上源于该公司声称,其最新模型的训练成本仅为 560 万美元,并且仅使用了 2,000 块左右的 Nvidia 不太先进的 H800 芯片。周一,随着 DeepSeek 飙升至下载排行榜榜首,英伟达的市值暴涨 5890 亿美元,促使唐纳德·特朗普总统呼吁美国工业界“高度关注”竞争……但仔细观察 DeepSeek 就会发现,其母公司该公司在其超级计算机中部署了大型而复杂的芯片组,专家们评估该项目的总成本远高于美国市场本周反应的相对微​​不足道的成本…… Rand 表示,DeepSeek 对[早期]超级计算机的明显访问将使该公司更容易开发更高效的模型,需要更少的芯片。该文章称,早期的项目“表明 DeepSeek 取得了重大进展……”,“其技术可与美国领先的人工智能公司相媲美。”尽管 DeepSeek 声称只花费了 560 万美元来训练其一个先进模型,但“其母公司表示,建造早期的超级计算机花费了 10 亿元人民币,即 1.39 亿美元。”)然而,该文章还引用了周五的最新见解芯片投资公司 SemiAnalysis 总结了他们的发现,DeepSeek“在 GPU 上花费了超过 5 亿美元,总资本支出近 13 亿美元”。文章指出,OpenAI 首席执行官 Sam Altman 周四表示,DeepSeek 的能源效率声明“被过分夸大了……这是我们很久以前就有的能力水平的模型”。 Palmer Luckey 称 DeepSeek 在 X 上“确实令人印象深刻”,但称 560 万美元的培训成本数字“虚假”,并表示硅谷的崩溃是“歇斯底里”。专家表示,即使考虑到总成本较高,美国公司对 DeepSeek 颠覆市场的担忧也是正确的。民主、社会与新兴研究所的人工智能专家 Kai-Shen Huang 表示:“我们确信有两件事:一是 DeepSeek 的服务定价非常有竞争力,二是其模型的性能可与领先竞争对手相媲美。” Technology,一家位于台北的智库。 “我认为 DeepSeek 的定价策略有可能扰乱全球市场……”中国更广泛的人工智能政策推动帮助创造了有利于像 DeepSeek 这样的公司崛起的环境。北京于 2017 年公布了雄心勃勃的人工智能蓝图,目标是到 2030 年成为全球人工智能领导者,并承诺为大学和私营企业提供资金。全国各地的地方政府都纷纷推出了自己的支持人工智能的计划。

twitter_icon_large.png facebook_icon_large.png

在 Slashdot 上阅读这个故事的更多内容。

原文: https://slashdot.org/story/25/02/01/0517258/were-deepseeks-development-costs-much-higher-than-reported?utm_source=rss1.0mainlinkanon&utm_medium=feed

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Alin Panaitiu
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • PostHog
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme