Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

新的人工智能模型推进了“接吻问题”及其他问题的解决

Posted on 2025-05-15

绿色像素顶部的绿色代码屏幕

有一个数学概念叫做“接吻数”。有点令人失望的是,这与真正的接吻无关。它枚举有多少个球体可以接触(或“亲吻”)相同大小的单个球体而不交叉它。在一维中,接吻数是二。在二维中它是 6(想想《纽约时报》的拼字比赛配置)。随着维数的增加,答案变得不那么明显:对于大多数超过 4 的维数,只有接吻数的上限和下限是已知的。现在,谷歌 DeepMind 开发的一款名为 AlphaEvolve 的 AI 智能体为解决这个问题做出了贡献,将 11 维接吻数的下限从 592 增加到 593。

这看起来像是对问题的渐进式改进,特别是考虑到 11 维中接吻数的上限为 868,因此未知范围仍然相当大。但它代表了人工智能代理的一项新颖的数学发现,并挑战了大型语言模型无法做出原创科学贡献的观点。

这只是 AlphaEvolve 所取得成就的一个例子。 “我们将 AlphaEvolve 应用于研究数学中的一系列开放性问题,并特意从数学的不同部分挑选问题:分析、组合学、几何,”参与该项目的 DeepMind 研究科学家Matej Balog说道。他们发现,对于 75% 的问题,人工智能模型复制了已知的最佳解决方案。在 20% 的情况下,它找到了超越任何已知解决方案的新最佳方案。 “每一个这样的案例都是一个新发现,”巴洛格说。 (在另外 5% 的情况下,人工智能收敛的解决方案比已知的最佳解决方案更差。)

该模型还开发了一种新的矩阵乘法算法——这是大部分机器学习的基础运算。 DeepMind 人工智能模型的早期版本(称为 AlphaTensor)已经击败了1969 年发现的之前最知名的 4 x 4 矩阵乘法算法。 AlphaEvolve 找到了该改进算法的更通用版本。

三个蓝色图图标,显示数据中心、芯片和带有箭头的多个芯片。 DeepMind 的 AlphaEvolve 对 Google 的几个实际问题进行了改进。谷歌深度思维

除了抽象数学之外,该团队还将他们的模型应用于谷歌公司每天面临的实际问题。 AI 还用于优化数据中心编排以获得 1% 的改进,优化下一代 Google 张量处理单元的设计,并发现对 Gemini 训练中使用的内核的改进,从而使训练时间减少 1%。

DeepMind 的高级研究科学家Alexander Novikov表示:“令人非常惊讶的是,你可以用一个系统做这么多不同的事情。”他也曾参与 AlphaEvolve 的工作。

AlphaEvolve 的工作原理

AlphaEvolve 之所以能够如此通用,是因为它几乎可以应用于任何可以用代码表示的问题,并且可以通过另一段代码来检查。用户提供对问题的初步尝试——解决当前问题的程序,尽管不是最理想的——以及检查一段代码满足所需标准的程度的验证程序。

然后,一个大型语言模型(在本例中为 Gemini)会提出其他候选程序来解决同一问题,并且每个程序都会由验证者进行测试。从那时起,AlphaEvolve 使用遗传算法,使所提出的解决方案中的“最适者”得以生存并进化到下一代。重复这个过程,直到解决方案停止改进。

具有指向代码的四个组件的图表 AlphaEvolve 将 Gemini 大语言模型 (LLM) 与评估代码结合使用,所有这些都由遗传算法精心编排以优化一段代码。谷歌深度思维

“大型语言模型出现了,我们开始问自己,它们是否只会添加训练数据中的内容,或者我们实际上可以使用它们来发现一些全新的东西、新算法或新知识?”巴洛格说。 Balog 声称,这项研究表明“如果你以正确的方式使用大型语言模型,那么你可以在非常精确的意义上以算法的形式获得可证明是新的、可证明是正确的东西。”

AlphaEvolve 源自 DeepMind 模型的悠久传承,可以追溯到 AlphaZero,它在不使用任何人类知识的情况下,仅通过玩游戏并使用强化学习来掌握它,就比任何人类玩家更好地学习下棋、围棋和其他游戏,从而震惊了世界。另一种基于强化学习的数学解决人工智能 AlphaProof 在 2024 年国际数学奥林匹克竞赛中获得银牌。

然而,对于 AlphaEvolve,该团队打破了强化学习传统,转而采用遗传算法。 “系统要简单得多,”巴洛格说。 “这实际上会带来后果,那就是更容易解决各种各样的问题。”

(完全不可怕)的未来

AlphaEvolve 背后的团队希望以两种方式发展他们的系统。

首先,他们希望将其应用于更广泛的问题,包括自然科学领域的问题。为了实现这一目标,他们计划为感兴趣的学者开放一个早期访问计划,以便在他们的研究中使用 AlphaEvolve。让系统适应自然科学可能会更困难,因为对所提出的解决方案的验证可能不太简单。但是,Balog 说,“我们知道,在自然科学中,有很多针对不同类型问题的模拟器,这些模拟器也可以在 AlphaEvolve 中使用。未来,我们非常有兴趣扩大这个方向的范围。”

其次,他们希望改进系统本身,或许可以将其与另一个 DeepMind 项目: AI 联合科学家结合起来。该人工智能还使用法学硕士和遗传算法,但它侧重于自然语言的假设生成。 “他们提出了这些更高层次的想法和​​假设,”巴洛格说。 “我相信,将此组件合并到类似 AlphaEvolve 的系统中,将使我们能够进入更高的抽象层次。”

这些前景令人兴奋,但对某些人来说也可能听起来很危险——例如,AlphaEvolve 对 Gemini 训练的优化可能被视为递归自我改进人工智能的开始,一些人担心这会导致失控的智能爆炸,即所谓的奇点。当然,DeepMind 团队坚称这不是他们的目标。诺维科夫表示:“我们很高兴能够为推进造福人类的人工智能做出贡献。”

原文: https://spectrum.ieee.org/deepmind-alphaevolve

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • Elad Gil
  • Ellie Huxtable
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme