Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

🔮 周日版 #525:整合代理;代币危机;中国电动汽车的胜利;喷火机器人、大脑和克劳德控制++

Posted on 2025-05-25

你好,我是 Azeem。

本周,我们将探讨人工智能从原始马力到系统集成的转变。模型正被接入反馈回路、基础设施和生态系统。从克劳德四世的自主编码冲刺到开放代理协议的兴起,“代理网络”已不再只是理论,而是正在构建中。各行各业都在竞相将人工智能投入实际运营。

我们走吧!

立即订阅


代理网络正在到来

2025年被称为人工智能代理之年,从很多方面来看,这一年已经到来。谷歌、OpenAI和Anthropic都推出了能够按需编码并在几分钟内获取引用的代理。Codex修复错误的速度比你起草工单的速度还快。但问题不再在于它们有多智能,而是它们能否跨系统无人值守运行。目前,它们还做不到——即使1%的幻觉率也能破坏一长串任务链。

尽管如此,进步是毋庸置疑的。日本科技集团乐天让 Claude 4在零干预的情况下重构了七个小时的代码。但每一次成功都伴随着致命的失误——尽管 Claude 4 令人印象深刻,但它仍然搞砸了“9.9 减 9.11 等于多少”——这证明了 1% 的误差仍然很重要。

微软首席技术官凯文·斯科特将这种构建称为“代理网络”,即通过共享协议工作的人工智能网络。苹果即将推出的Intelligence SDK将把这些接口提供给每一位开发者,而新兴标准——用于工具的MCP 、用于人工智能之间聊天的Agent2Agent——正在成为连接线。

管道正在安装中,熟练工仍处于试用期,但每一个新的接头都会减少泄漏,让我们更接近“免提”人工智能。

参见:

  • Sam Altman 和 Jony Ive 的 AI 设备协作目标于 2025 年底实现——新的界面是否会进一步推动代理潜力?

  • 谷歌发布了Veo 3 ,一款可以生成会说话的视频的人工智能模型。其逼真度加剧了人们对合成媒体泛滥的担忧。

贪婪的推理代理

谷歌的推理负载在短短 12 个月内飙升了 50 倍,从 2024 年 4 月的 10 万亿个令牌增加到 2025 年 4 月的 480 万亿个令牌。更多的用户发挥了作用,但更大的驱动力是推理模型的兴起,由于它们运行较长的内部思维链,因此它们消耗的令牌数量大约是前代模型的 17 倍。

通过内森·兰伯特

随着代理工作量变得越来越普遍,这种指数增长将会持续下去。

例如,我花了200万个代币,用Claude在不到一小时内开发了一款小型视频游戏;而一个典型的聊天机器人会话在同一时间内可能只使用1万个代币。聊天机器人等待人类输入,而代理则持续运行,仅受可用计算能力的限制。这意味着高昂的价格:Google AI Ultra每月250美元,Claude Max每月100-200美元,ChatGPT Pro每月200美元。据报道,OpenAI正在考虑每月2万美元的套餐。

上周,我们展示了训练成本如何沿着可预测的曲线持续下滑,但推理却有所不同。尽管摩尔定律和更先进的算法降低了每个令牌的成本,但去年需求仍然增长了 50 倍,远超效率的提升。推理的经济性能否满足我们对更长上下文、更深入推理和始终在线代理的需求,仍是一个悬而未决的问题。

我们可能需要对自主智能体施加硬预算——就像《THX 1138》里的机器人警察一样,一旦成本超过设定的阈值,它们就会放弃追捕。这种成本控制的自主性,即智能体必须根据计算限制来证明、限制或取消操作,可能会成为一个决定性的约束。推理瓶颈不会扼杀智能体AI,但它可能会迫使它以外科手术般的精准度行动。

立即订阅

电网紧张还是电网脑?

人工智能会消耗能源;一切都是如此。真正的问题是, 我们在人工智能上花费的电力是否有助于我们应对气候变化。我相信会的。

兰德公司预测,到2030年,人工智能将消耗约327吉瓦的电力,约占当今全球发电量的3.6%至4%。这一负荷固然巨大,但人工智能也能找到减少自身碳足迹并加速气候解决方案的方法。

想想微软的 Discovery 平台,它在数小时内(而不是数年)就设计出了一种不含 PFAS 的数据中心冷却剂;还有 FutureHouse 的 Robin AI,它在数周内就确定了有前景的老年性黄斑变性候选药物。同样的处理器,虽然推高了电费,却也能发现降低电费的突破性进展。

当地电力供应紧张是真实存在的。内华达州约有十几个超大规模项目已向内华达能源公司申请近6吉瓦的新增电力容量,约占该州电网总容量的40% 。政府应坚持要求新建数据中心尽可能使用清洁能源,并回收利用废热。

这种权衡值得吗?是的。如果人工智能的扩张与积极的清洁能源建设相结合,这项技术将有助于经济增长与排放脱钩。今天限制人工智能以节约能源,将会扼杀一个可以在未来大幅削减能源消耗的工具。

参见:

  • 如今,快速的“ 事件归因”研究利用人工智能在数周内将极端天气与气候变化联系起来。世界天气归因小组已经进行了40多次此类分析,并给出了关于气候变暖如何增加极端天气事件发生概率或严重程度的确切数据。

深圳的硬件霸权

近年来,汽车制造商一直在为行业的未来而战。我们此前曾指出,德国汽车行业面临着生存威胁。如今,中国显然赢得了电动汽车硬件竞赛。

证据比比皆是。比亚迪声称其电池可在五分钟内充满电。小米以大众的价格提供法拉利般的造型,摩根士丹利预计到2027年小米的汽车业务收入将达到320亿美元,相当于特斯拉2020年整个汽车业务的规模。中国还控制着整个供应链——电池、电机和电子产品。其优势不仅在于速度,还在于西方无法复制的生态系统密度。

然而,硬件的主导地位只是故事的一半。摩根士丹利分析师亚当·乔纳斯指出,价值正在从硬件转向软件。特斯拉从打造“最好的汽车”到实现“最佳自动驾驶”的转变表明,一旦硬件商品化,软件就会变得与众不同。利润池如今在于无线更新、数据服务和自动驾驶出租车网络。算法和监管审批,而不是金属板,创造了新的护城河。

中国在硬件上取得了胜利,但在软件方面,胜负尚未确定。特斯拉要么赢,要么一无所获。

参见:

  • 小米将投资69 亿美元用于芯片制造,追求超越其电动汽车部门的垂直整合。

  • 分析师他认为,中国在关键技术方面正领先于美国——他表示,在特朗普的贸易战期间,中国的发展速度加快了。

  • 中国目前拥有100 辆自动采矿卡车,展示了工业人工智能如何扩大重型设备的规模。

  • 警告称,美国看起来像一个“晚期共和国”,必须重建科技和文化实力才能与中国竞争。点击此处查看我关于美国现状的对话。


别处

  • 使用不同数据训练的独立 AI 模型仍然学习相同的隐藏意义图谱。这暗示着概念之间共享一个底层的通用结构。

  • 伯克利的自动化A-Lab实验室全天候运行机器人,每天测试的材料样本数量是人工团队的50到100倍。

  • 斯蒂芬·沃尔夫勒姆表示,更大的大脑可以挖掘出一些简单的计算能力。这些能力可以让大脑形成更高层次的想法,并处理更大的思维空间。

  • Anthropic 已为 Claude Opus 4 启动了AI 安全级别 3 保障措施,因为该公司尚不能排除它可能为 CBRN 1武器项目提供实质性援助的可能性。

  • 对缅甸、斯里兰卡、泰国和新加坡的统计研究发现,是国家特权——而不是佛教信仰——导致了佛教徒对少数民族的暴力行为。

  • 人工智能高管现在将数据中心称为“人工智能工厂”。该术语旨在寻求补贴,并将这些站点视为战略资产,尽管它们雇佣的员工很少。

  • 通过选择罗伯特·普雷沃斯特担任教皇利奥十四世,教会表明了美国全球领导地位的一种以谦逊为基础的替代模式。

  • 乌克兰已批准克朗普斯(Krampus)机器人,该机器人可发射温压弹(即火焰喷射器)。这意味着其地面武装机器人数量已超过80个。

  • 奥利维尔·布兰查德在美国国家经济研究局(NBER)发表的新论文回顾了40年来主流宏观经济学的发展。他给该领域的成熟度评分为7.5分(满分8分),但指出其预测记录较弱。

感谢阅读!

1

CBRN武器项目涉及化学、生物、放射性和核武器,涵盖旨在开发、测试、部署和减轻此类武器相关风险的各种举措。

原文: https://www.exponentialview.co/p/ev-525

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • Elad Gil
  • Ellie Huxtable
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme