Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

The Morning After:微软的 VALL-E AI 可以从三秒钟的样本中复制声音

Posted on 2023-01-11

微软在文本到语音 AI 方面的最新研究以一种新的 AI 模型VALL-E为中心。虽然已经有多种服务可以复制您的声音,但它们通常需要大量输入。微软声称其模型可以通过三秒钟的音频样本模拟某人的声音。演讲可以匹配演讲者的音色和情绪基调 – 甚至是房间的声学效果。有一天它可能会被用于定制或高端文本到语音的应用程序,但就像 deepfakes 一样,存在被滥用的风险。

研究人员使用 Meta 的 Libri-Light 音频库中 7,000 多名演讲者的 60,000 小时英语演讲对 VALL-E 进行了训练。结果并不完美:有些是细小的类似机器的样本,而另一些则非常逼真。

微软并未将代码开源,可能是因为存在固有风险。该公司在论文中表示:“由于 VALL-E 可以合成保持说话人身份的语音,它可能会带来滥用该模型的潜在风险,例如欺骗语音识别或冒充他人。”

我们都看过 1992 年的电影运动鞋, 正确的?正确的?!

– 马特·史密斯

你可能错过的最重要的故事

  • 三星 2023 年首场 Unpacked 活动将于 2 月 1 日举行

  • 现代成功地将其“螃蟹行走”e-Corner 技术应用到 Ioniq EV 中

  • 天鹅座星团中的一颗“古怪”恒星可以告诉我们脉泽是如何产生的

  • 2023 年最好的快速充电器

  • DJI 的轻型 RS 3 Mini 相机稳定器专为单手使用而设计

  • “忍者神龟:碎纸机的复仇”作为 Netflix 移动设备独家登陆 iOS 和 Android

亚马逊将 Prime 送货服务扩展到更多购物网站

但是您需要 Prime 订阅。

亚马逊正在扩大 Prime 以覆盖更多网络。该公司表示,将于 1 月 31 日向美国符合条件的第三方网站“广泛提供”Buy with Prime。越来越多的商店可以为 Prime 会员提供免费送货、简化结账和简化退货服务。理论上的优势很明显:您可以更轻松地获得产品,而商店更有可能将访客转变为付费客户。与此同时,亚马逊希望提高人们对 Prime 订阅的兴趣。当然,要注意的是你必须为那个讨厌的 Prime 潜艇付费。

继续阅读。

美国宇航局资助未来太空探索的想法和原型

包括泰坦水上飞机和更快的深空旅行。

三甲基丙烯酸甲酯

美国宇航局

NASA 将向 14 个可能对太阳系内外任务有用的新项目发放 175,000 美元的初始研究补助金。 TitanAir 可能是最不寻常的一个:来自 Planet Enterprises 的 Quinn Morley 的水上飞机可以飞越土星最大卫星 Titan 的氮气和甲烷大气层,并在其海洋中航行。

麻省理工学院的 Mary Knapp 提出了一个深空天文台,该天文台将使用由数千颗微型卫星组成的集群来探测早期宇宙的低频无线电发射,而加州大学洛杉矶分校的 Artur Davoyan 的想法可以加快对太空外缘的探索。他的设计将使用激光爆炸以非常高的速度(每秒超过 74 英里)行进的微观粒子“球束”来推动航天器。

继续阅读。

有史以来第一次英国太空飞行未能进入轨道

维珍轨道公司表示,火箭出现异常情况,无法到达目的地。

与此同时,英国在太空飞行方面的首次尝试以失败告终。维珍轨道历史性的 Start Me Up 任务于 1 月 9 日按计划从康沃尔太空港发射升空,但未能进入轨道。显然,该公司发推文是因为“异常”。该任务携带了来自七个商业和政府客户的有效载荷卫星。它们包括名为 CIRCE(协调电离层重建立方体卫星实验)的英美联合项​​目和英国国防部的两颗立方体卫星。正如Ars Technica指出的那样,这次失败可能会对公司产生巨大影响,该公司正在努力启动足够多的任务以实现收支平衡。

继续阅读。

到 2025 年,苹果可能会在 iPhone 中使用内部无线芯片

Broadcom 和 Qualcomm 可能很快就会被淘汰。

彭博社消息称,苹果不仅在准备其首款蜂窝调制解调器(现在定于 2024 年底或 2025 年初),而且还在准备蓝牙和 WiFi 芯片的组合,以取代目前在 iPhone 中处理这些任务的 Broadcom 芯片。虽然没有提到过渡的确切原因,但苹果开始在多种产品上设计自己的芯片已经不是什么秘密了。

继续阅读。

原文: https://www.engadget.com/the-morning-after-microsofts-vall-e-ai-can-replicate-a-voice-from-a-three-second-sample-121605576.html?src=rss

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme