Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

谷歌DeepMind的AlphaGo一次解码一百万个“字母”基因组

Posted on 2026-01-30

已有数千名科学家正在利用人工智能技术研究癌症和脑部疾病。

DNA储存着人体的运行手册。有些基因编码蛋白质。另一些基因则通过调控基因的开启或关闭来改变细胞的行为。至于其他一些基因, 也就是基因组中的“暗物质” ,它们的作用仍然是个谜——如果它们真的有作用的话。

通常情况下,这些遗传指令指挥着蛋白质和分子的协同运作,维持着细胞的正常运转。但即使是微小的错误也可能导致分子程序陷入混乱。科学家们已经孜孜不倦地将许多DNA突变——有些发生在基因中,有些发生在调控区域——与一系列人类最严重的疾病联系起来。但由于基因组极其复杂,我们对基因组的全面了解仍然遥不可及。

人工智能或许能助我们一臂之力。本周,谷歌旗下DeepMind公司在《自然》杂志上正式发布了AlphaGenome,这是一款能够预测基因突变如何影响基因表达的工具。该模型能够处理多达一百万个DNA碱基对——这是前所未有的长度——并同时分析11种可能破坏基因正常功能的基因组突变。

AlphaGenome 是在名为 Enformer 的前代版本的基础上开发的,它能够预测基因组非编码区域中 DNA 碱基的用途,而这些区域在很大程度上仍然是个谜。

目前已有基因表达预测工具,但它们通常只针对某一类基因改变及其后果。AlphaGenome 则是一款功能全面的工具,能够追踪多种基因表达机制,使研究人员能够快速全面地了解特定突变,并有望加速治疗方法的研发。

DeepMind 的 Pushmeet Kohli 在新闻发布会上表示,自去年 6 月首次推出以来,来自 160 个国家的约 3000 名科学家已经使用人工智能对一系列疾病进行了试验,包括癌症、感染和神经退行性疾病。

AlphaGenome 目前可通过免费在线门户网站供非商业用途使用,但 DeepMind 团队计划将该模型发布给科学家,以便他们可以根据自己的研究进行定制。

“我们认为 AlphaGenome 是一个了解基因组中功能元件作用的工具,我们希望它能加速我们对生命密码的基本理解,”该研究的作者娜塔莎·拉蒂舍娃在新闻发布会上说。

98%隐形

我们的基因蓝图看似简单。DNA由四种基本分子组成,分别用字母A、T、C和G表示。这些字母三个一组,称为密码子。大多数密码子负责编码氨基酸,氨基酸是人体用来合成蛋白质的分子。基因突变会阻碍细胞合成健康的蛋白质,并可能导致疾病。

实际的基因调控机制远比这复杂得多。

21世纪初,科学家们拼凑出人类基因组的第一个草图时,惊讶地发现其中只有极少部分用于指导蛋白质的合成。我们DNA中只有2%编码蛋白质。其余98%似乎作用不大,因此被戏称为“垃圾DNA”。

然而,随着时间的推移,科学家们逐渐意识到,这些非编码碱基对基因何时以及在哪些细胞中被激活起着决定性作用。最初人们认为这些区域在物理上与它们调控的基因非常接近。但实际上,即使相隔数千个碱基,DNA片段也能控制基因表达,这使得追踪这些片段并弄清它们的作用变得异常困难。

情况变得更糟了。

细胞将基因翻译成信使分子,这些信使分子将DNA指令传递到细胞的蛋白质合成工厂。在这个被称为DNA剪接的过程中,一些DNA序列会被跳过。这使得单个基因可以产生多种功能不同的蛋白质。可以把它想象成同一部电影的多个剪辑版本:不同的剪辑产生了不同的但仍然连贯的故事情节。许多罕见的遗传疾病是由DNA剪接错误引起的,但预测基因的剪接位置一直很困难。

其次是可及性问题。DNA链紧密缠绕在蛋白质轴上,这使得参与基因表达的蛋白质无法直接附着在其上。一些分子可以与DNA的微小片段结合,并将其从蛋白质轴上拉开以提供可及性,但这些结合位点很难找到。

DeepMind团队认为人工智能非常适合解决这些问题。

科利在新闻发布会上说:“基因组就像生命的配方。而AlphaGenome的研究重点就在于了解‘改变配方中的任何部分会产生什么影响?’”

理解无意义之事

AlphaGenome的灵感来源于先前将基因与功能联系起来的研究。它的工作原理分为三个步骤。第一步是检测DNA碱基的短序列模式。接下来,算法会将这些信息传递到整个分析的DNA片段。最后一步,AlphaGenome将检测到的模式映射到预测结果,例如,突变如何影响剪接。

研究团队利用生物学家过去十年间积累的各种公开基因库对AlphaGenome进行了训练。每个基因库都涵盖了基因表达的重叠方面,包括细胞类型和物种之间的差异。AlphaGenome能够分析来自人类或小鼠的长达百万个DNA碱基的序列,并能以单碱基变化的分辨率预测一系列分子结果。

研究团队在一篇博文中写道:“长序列上下文对于覆盖远距离调控基因的区域至关重要。”该算法的高分辨率能够捕捉“精细的生物学细节”。以往的方法往往在两者之间做出取舍;而AlphaGenome则兼顾了这两方面。

这款人工智能系统功能极其强大,能够同时理解11种不同的基因调控过程。在与目前最先进的程序(每个程序都专注于其中一种过程)的对比测试中,AlphaGenome的表现全面且毫不逊色,甚至更胜一筹。它能够快速检测参与剪接的区域,并评估DNA碱基变化可能对基因表达产生的影响程度。

在一项测试中,人工智能追踪到了距离一个与血液癌症相关的基因约8000个碱基对的DNA突变。通常情况下,该基因帮助免疫细胞成熟,从而抵抗感染。之后,它会关闭。但突变会使其持续激活,导致免疫细胞不受控制地复制并癌变。人工智能能够预测这些远距离DNA突变的影响,展现了其基因组解码的潜力。

然而,该算法也存在局限性。它难以捕捉超过10万个DNA碱基对之外的调控区域的作用。虽然它可以预测突变的分子结果——例如,会产生哪些蛋白质——但它无法评估突变如何导致涉及环境和其他因素的复杂疾病。此外,它也无法预测DNA突变对特定个体的影响。

不过,AlphaGenome 仍然是一个基准模型,科学家可以根据自己的研究领域对其进行微调,前提是有足够的组织良好的数据来进一步训练人工智能。

“这项研究是揭示‘暗基因组’进程中令人振奋的一步。我们距离真正理解DNA中那些不直接编码蛋白质的长序列还有很长的路要走。”

“正是这些机器的持续运转维持着我们的健康,”伦敦国王学院的里夫卡·艾萨克森说道,她并未参与这项研究。“AlphaGenome 为科学家们提供了全新的、庞大的数据集,供他们筛选和搜寻线索。”

这篇文章《谷歌DeepMind的AlphaGo一次解码一百万个“字母”基因组》最初发表在SingularityHub上。

原文: https://singularityhub.com/2026/01/29/google-deepminds-alphago-decodes-the-genome-a-million-letters-at-a-time/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Alin Panaitiu
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brent Simmons
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • PostHog
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Slava Akhmechet
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2026 搞英语 → 看世界 | Design: Newspaperly WordPress Theme