The Morning After：微软的 VALL-E AI 可以从三秒钟的样本中复制声音

微软在文本到语音 AI 方面的最新研究以一种新的 AI 模型VALL-E为中心。虽然已经有多种服务可以复制您的声音，但它们通常需要大量输入。微软声称其模型可以通过三秒钟的音频样本模拟某人的声音。演讲可以匹配演讲者的音色和情绪基调 – 甚至是房间的声学效果。有一天它可能会被用于定制或高端文本到语音的应用程序，但就像 deepfakes 一样，存在被滥用的风险。

研究人员使用 Meta 的 Libri-Light 音频库中 7,000 多名演讲者的 60,000 小时英语演讲对 VALL-E 进行了训练。结果并不完美：有些是细小的类似机器的样本，而另一些则非常逼真。

微软并未将代码开源，可能是因为存在固有风险。该公司在论文中表示：“由于 VALL-E 可以合成保持说话人身份的语音，它可能会带来滥用该模型的潜在风险，例如欺骗语音识别或冒充他人。”

我们都看过 1992 年的电影运动鞋，正确的？正确的？！

– 马特·史密斯

你可能错过的最重要的故事

亚马逊将 Prime 送货服务扩展到更多购物网站

但是您需要 Prime 订阅。

亚马逊正在扩大 Prime 以覆盖更多网络。该公司表示，将于 1 月 31 日向美国符合条件的第三方网站“广泛提供”Buy with Prime。越来越多的商店可以为 Prime 会员提供免费送货、简化结账和简化退货服务。理论上的优势很明显：您可以更轻松地获得产品，而商店更有可能将访客转变为付费客户。与此同时，亚马逊希望提高人们对 Prime 订阅的兴趣。当然，要注意的是你必须为那个讨厌的 Prime 潜艇付费。

继续阅读。

美国宇航局资助未来太空探索的想法和原型

包括泰坦水上飞机和更快的深空旅行。

美国宇航局

NASA 将向 14 个可能对太阳系内外任务有用的新项目发放 175,000 美元的初始研究补助金。 TitanAir 可能是最不寻常的一个：来自 Planet Enterprises 的 Quinn Morley 的水上飞机可以飞越土星最大卫星 Titan 的氮气和甲烷大气层，并在其海洋中航行。

麻省理工学院的 Mary Knapp 提出了一个深空天文台，该天文台将使用由数千颗微型卫星组成的集群来探测早期宇宙的低频无线电发射，而加州大学洛杉矶分校的 Artur Davoyan 的想法可以加快对太空外缘的探索。他的设计将使用激光爆炸以非常高的速度（每秒超过 74 英里）行进的微观粒子“球束”来推动航天器。

继续阅读。

有史以来第一次英国太空飞行未能进入轨道

维珍轨道公司表示，火箭出现异常情况，无法到达目的地。

与此同时，英国在太空飞行方面的首次尝试以失败告终。维珍轨道历史性的 Start Me Up 任务于 1 月 9 日按计划从康沃尔太空港发射升空，但未能进入轨道。显然，该公司发推文是因为“异常”。该任务携带了来自七个商业和政府客户的有效载荷卫星。它们包括名为 CIRCE（协调电离层重建立方体卫星实验）的英美联合项目和英国国防部的两颗立方体卫星。正如Ars Technica指出的那样，这次失败可能会对公司产生巨大影响，该公司正在努力启动足够多的任务以实现收支平衡。

继续阅读。

到 2025 年，苹果可能会在 iPhone 中使用内部无线芯片

Broadcom 和 Qualcomm 可能很快就会被淘汰。

彭博社消息称，苹果不仅在准备其首款蜂窝调制解调器（现在定于 2024 年底或 2025 年初），而且还在准备蓝牙和 WiFi 芯片的组合，以取代目前在 iPhone 中处理这些任务的 Broadcom 芯片。虽然没有提到过渡的确切原因，但苹果开始在多种产品上设计自己的芯片已经不是什么秘密了。

继续阅读。

原文： https://www.engadget.com/the-morning-after-microsofts-vall-e-ai-can-replicate-a-voice-from-a-three-second-sample-121605576.html?src=rss