Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

DeepSeek-V3 现在在 Mac Studio 上以每秒 20 个令牌的速度运行

Posted on 2025-03-26

ai_64.png

一位匿名读者引用了 VentureBeat 的一篇报道:中国人工智能初创公司 DeepSeek 悄然发布了一种新的大型语言模型,该模型已经在人工智能行业引起了轩然大波——不仅是因为它的功能,还因为它的部署方式。今天,名为 DeepSeek-V3-0324 的 641 GB 型号出现在 AI 存储库 Hugging Face 上,几乎没有任何公告(只是一个空的 README 文件),延续了该公司低调但有影响力的发布模式。这次发布特别引人注目的是该模型的 MIT 许可证——使其可以免费用于商业用途——以及早期报道称它可以直接在消费级硬件上运行,特别是带有 M3 Ultra 芯片的苹果 Mac Studio。 “新的 4 位 DeepSeek-V3-0324 在带有 mlx-lm 的 512GB M3 Ultra 上以 > 20 个令牌/秒的速度运行!”人工智能研究员 Awni Hannun 在社交媒体上写道。虽然 9,499 美元的 Mac Studio 可能扩展了“消费者硬件”的定义,但在本地运行如此庞大的模型的能力与通常与最先进的人工智能相关的数据中心要求有很大的不同。 […] 开发工具创建者 Simon Willison 在一篇博客文章中指出,4 位量化版本将存储占用空间减少至 352GB,使其可以在配备 M3 Ultra 芯片的 Mac Studio 等高端消费硬件上运行。这代表着人工智能部署的潜在重大转变。虽然传统的 AI 基础设施通常依赖于多个消耗几千瓦功率的 Nvidia GPU,但 Mac Studio 在推理过程中消耗的功率不到 200 瓦。这种效率差距表明人工智能行业可能需要重新考虑有关顶级模型性能的基础设施要求的假设。 VentureBeat 报道称:“先进的开源推理模型的意义怎么强调都不为过。” “当前的推理模型,如 OpenAI 的 o1 和 DeepSeek 的 R1,代表了人工智能能力的最前沿,展示了从数学到编码等领域前所未有的解决问题的能力。免费提供这项技术将使目前仅限于拥有大量预算的人使用人工智能系统变得民主化。” “如果 DeepSeek-R2 遵循 R1 设定的轨迹,它可能会对 GPT-5 构成直接挑战,GPT-5 据称将在未来几个月发布 OpenAI 的下一个旗舰模型。OpenAI 的封闭、资金充足的方法与 DeepSeek 的开放、资源高效的策略之间的对比代表了人工智能未来的两种相互竞争的愿景。”

twitter_icon_large.png facebook_icon_large.png

在 Slashdot 上阅读这个故事的更多内容。

原文: https://apple.slashdot.org/story/25/03/25/2054214/deepseek-v3-now-runs-at-20-tokens-per-second-on-mac-studio?utm_source=rss1.0mainlinkanon&utm_medium=feed

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme