Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

感知器:用声音看东西、学会走路和预测地震物理的人工智能

Posted on 2022-11-08

机器学习和人工智能领域的研究,现在几乎是每个行业和公司的一项关键技术,对于任何人来说都过于庞大,无法通读。本专栏Perceptron旨在收集一些最相关的最新发现和论文——特别是但不限于人工智能——并解释它们为何重要。

本月,Meta 的工程师详细介绍了公司研究实验室的两项最新创新:压缩音频文件的 AI 系统和可将蛋白质折叠 AI 性能提高 60 倍的算法。在其他地方,麻省理工学院的科学家透露,他们正在使用空间声学信息来帮助机器更好地想象他们的环境,模拟听众如何从房间的任何位置听到声音。

Meta 的压缩工作并没有完全达到未开发的领域。去年,谷歌发布了Lyra ,这是一种经过训练可压缩低比特率语音的神经音频编解码器。但 Meta 声称它的系统是第一个适用于 CD 质量、立体声音频的系统,使其可用于语音通话等商业应用。

元音频压缩

Meta 的 AI 音频压缩模型的架构图。图片来源:元

使用 AI,Meta 的压缩系统Encodec可以在单个 CPU 内核上以大约 1.5 kbps 到 12 kbps 的速率实时压缩和解压缩音频。与 MP3 相比,Encodec 可以在 64 kbps 下实现大约 10 倍的压缩率,而没有明显的质量损失。

Encodec 背后的研究人员表示,人工评估者更喜欢 Encodec 处理的音频质量而不是 Lyra 处理的音频,这表明 Encodec 最终可用于在带宽受限或溢价的情况下提供质量更好的音频。

至于 Meta 的蛋白质折叠工作,它没有直接的商业潜力。但它可以为生物学领域的重要科学研究奠定基础。

元蛋白折叠

Meta 系统预测的蛋白质结构。图片来源:元

Meta 表示,其人工智能系统ESMFold预测了来自细菌、病毒和其他尚未表征的微生物的约 6 亿种蛋白质的结构。这是今年早些时候 Alphabet 支持的 DeepMind 设法预测的 2.2 亿个结构的三倍多,后者几乎涵盖了 DNA 数据库中已知生物体的所有蛋白质。

Meta 的系统不如 DeepMind 的准确。在它产生的约 6 亿蛋白质中,只有三分之一是“高质量的”。但它在预测结构方面要快 60 倍,使其能够将结构预测扩展到更大的蛋白质数据库。

为了不给 Meta 过多的关注,该公司的 AI 部门本月还详细介绍了一个旨在进行数学推理的系统。该公司的研究人员表示,他们的“神经问题解决者”从成功的数学证明数据集中学习,以推广到新的、不同类型的问题。

Meta 并不是第一个构建这样一个系统的人。 OpenAI 开发了自己的 Lean,并于 2 月宣布。另外,DeepMind 已经尝试了可以​​解决对称性和结研究中具有挑战性的数学问题的系统。但 Meta 声称,它的神经问题求解器能够解决的国际数学奥林匹克竞赛比以前的任何 AI 系统多五倍,并且在广泛使用的数学基准上击败了其他系统。

Meta 指出,数学求解 AI 可以使软件验证、密码学甚至航空航天领域受益。

将我们的注意力转向麻省理工学院的工作,那里的研究科学家开发了一种机器学习模型,可以捕捉房间中的声音如何在空间中传播。通过对声学建模,系统可以从录音中学习房间的几何形状,然后可以将其用于构建房间的视觉效果图。

研究人员表示,该技术可以应用于必须在复杂环境中导航的虚拟和增强现实软件或机器人。未来,他们计划增强系统,使其可以推广到新的更大的场景,例如整个建筑物甚至整个城镇。

在伯克利的机器人部门,两个独立的团队正在加快四足机器人学习走路和做其他技巧的速度。一个团队希望将强化学习的众多其他进步中的同类最佳工作结合起来,以使机器人能够在 20 分钟内实时从白板到在不确定的地形上稳健行走。

“也许令人惊讶的是,我们发现通过在任务设置和算法实现方面的几个精心设计决策,四足机器人有可能在 20 分钟内通过深度强化学习从头开始学习,跨越一系列不同的环境和表面类型。至关重要的是,这不需要新颖的算法组件或任何其他意想不到的创新,”研究人员写道。

相反,他们选择并结合了一些最先进的方法并获得了惊人的结果。你可以在这里阅读论文。

EECS 教授 Pieter Abbeel 于 2022 年在加利福尼亚州伯克利的实验室进行的机器狗演示。(照片由 Philipp Wu/Berkeley Engineering 提供)

(TechCrunch 的朋友)Pieter Abbeel 实验室的另一个运动学习项目被描述为“训练想象力”。他们让机器人能够尝试预测其行动将如何发挥作用,尽管它一开始很无助,但它很快就获得了更多关于世界及其运作方式的知识。这会导致更好的预测过程,从而导致更好的知识,等等反馈,直到它在不到一个小时的时间内走完。就像术语所说的那样,它学会了从被推或以其他方式“purturbed”中恢复过来的速度。他们的工作记录在这里。

本月早些时候,洛斯阿拉莫斯国家实验室开展了一项可能更直接的应用工作,研究人员在那里开发了一种机器学习技术来预测地震期间发生的摩擦——提供了一种预测地震的方法。该团队表示,使用语言模型,他们能够分析从实验室地震机器中的断层发出的地震信号的统计特征,以预测下一次地震的时间。

“该模型不受物理学的限制,但它可以预测物理学,即系统的实际行为,”该项目的研究负责人之一克里斯约翰逊说。 “现在我们正在根据过去的数据做出未来的预测,这超出了系统瞬时状态的描述。”

梦幻时光

图片来源:梦想时光

研究人员说,在现实世界中应用这项技术具有挑战性,因为尚不清楚是否有足够的数据来训练预测系统。但同样,他们对这些应用持乐观态度,其中可能包括预测对桥梁和其他结构的损坏。

上周,麻省理工学院的研究人员发出了警告,他们警告说,用于模拟实际神经网络的神经网络应该仔细检查训练偏差。

神经网络当然是基于我们自己的大脑处理和传递信息的方式,加强节点的某些连接和组合。但这并不意味着合成和真实的工作方式相同。事实上,麻省理工学院的团队发现,基于神经网络的网格细胞(神经系统的一部分)模拟只有在他们的创造者精心约束时才会产生类似的活动。如果允许按照实际细胞的方式进行自我管理,它们就不会产生所需的行为。

这并不意味着深度学习模型在这个领域毫无用处——远非如此,它们非常有价值。但是,正如 Ila Fiete 教授在学校的新闻帖子中所说:“它们可以成为一种强大的工具,但在解释它们并确定它们是否真正在进行从头预测,甚至阐明它的含义时,必须非常谨慎。是大脑在优化。”

感知器:用声音看东西、学会走路和预测地震物理学的 AI由Kyle Wiggers最初发表在TechCrunch上

原文: https://techcrunch.com/2022/11/07/perceptron-ai-that-sees-with-sound-learns-to-walk-and-predicts-seismic-physics/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme