Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

Alexa陷入了对话兔子洞

Posted on 2022-06-24

本周在 re:Mars 的舞台上,亚马逊展示了一个正在开发的 Alexa 功能,旨在模仿自然语言的流动。两个人之间的对话很少遵循某种预定义的结构。它去了奇怪和意想不到的地方。当参与者注入他们的生活经验时,一个主题会延续到另一个主题。

在一个演示中,关于树木的话题变成了关于徒步旅行和公园的话题。在公司人工智能的背景下,Alexa 的高级副总裁兼首席科学家 Rohit Prasad 将这种现象称为“对话探索”。确切地说,它不是适当功能的适当名称。没有一个开关可以在一夜之间突然启用对话。相反,它是 Alexa 如何以更人性化(或者可能更人性化)的方式与用户交互的不断演变概念的一部分。

传统上,像 Alexa 这样的智能助手提供了一个更加简单的问答模型。向 Alexa 询问天气,Alexa 会告诉您预定区域的天气。问她 A 的分数(或者,老实说,可能不会),Alexa 会告诉你 A 的分数。这是一种直接的交互,与在搜索引擎中输入问题没有什么不同。但是,现实世界的对话很少以这种方式进行。

“Alexa 得到了一系列的问题,这些问题包含了很多信息。当这些问题发生时,你可以想象它们不是重点问题,”普拉萨德在活动的一次谈话中告诉 TechCrunch。 “它们真的是关于客户想要了解更多的东西。我们现在最关心的是通货膨胀正在发生什么。我们收到了大量这样的 Alexa 请求,它为您提供了那种探索体验。”

然而,这样的对话功能是像 Alexa 这样的家庭助理所采用的方式。在亚马逊推出八年后,该助手仍在学习——收集数据并确定与消费者互动的最佳方式。即使有些事情已经到了亚马逊准备在主题演讲舞台上展示它的地步,仍然需要进行调整。

“Alexa 需要成为许多主题的专家,”Prasad 解释说。 “这是一个巨大的范式变化,这种专业知识需要一段时间才能获得。这将是一段旅程,通过我们客户的互动,Alexa 不会从第一天起就知道一切。但这些问题可以演变成更多的探索,最终你会做一些你认为自己没有做过的事情。”

在 Prasad 身后的舞台上看到用粗体字写成的“同理心”这个词令人头晕目眩——尽管可能不如接下来发生的那样多。

在与人类和智能助手的对话中,有一些简单的场景可以或应该考虑移情的概念。以阅读社交线索的能力为例。这是我们通过经验获得的一项技能——能够阅读面部和身体有时微妙的语言。 Alexa 的情商是 Rashad 多年来一直在讨论的一个概念。首先是改变助手的语气,以表达快乐或失望的方式做出回应。

另一方面是确定人类说话者的情绪,这是该公司多年来一直在努力完善的概念。这项工作以各种方式表现出来,包括该公司备受争议的可穿戴Halo于 2020 年首次亮相,它提供了一个名为 Tone 的功能,旨在“分析客户声音中的能量和积极性,以便他们了解他们对他人的声音并改善他们的沟通和关系。”

“我认为同理心和情感都是众所周知的互动方式,就建立关系而言,”普拉萨德说。 “Alexa 不能对你的情绪状态充耳不闻。如果你走进去,心情不愉快,很难说你应该做什么。熟悉你的人会有不同的反应。这对人工智能来说是一个非常高的标准,但它是你不能忽视的。”

这位高管指出,Alexa 已经成为某些用户的一种伴侣——尤其是在老年人群中。一种更具对话性的方法可能只会增强这种现象。在本周的 Astro 演示中,该公司经常将家用机器人称为在家中填充几乎类似于宠物的功能。然而,这样的概念有其局限性。

“它不应该隐藏它是人工智能的事实,”普拉萨德补充道。 “当涉及到无法区分的程度时——我们离这点很远——它仍然应该非常透明。”

随后的一段视频展示了一种令人印象深刻的新语音合成技术,该技术利用短短一分钟的音频来创建令人信服的近似人声。其中,一位祖母的声音正在朗读她的孙子《绿野仙踪》。通过机器学习来纪念亲人的想法并不是全新的。例如,像 MyHeritage 这样的公司正在使用技术为已故亲属的图像制作动画。但这些情况总是——而且可以理解——引起一些麻烦。

Prasad 很快指出,该演示更像是一个概念验证,突出了底层的语音技术。

“更多的是关于技术,”他解释说。 “我们是一家非常注重客户的科学公司。我们希望我们的科学对客户有意义。与在没有正确门的情况下使用生成和合成的许多事情不同,这感觉就像一个客户会喜欢的。我们必须给他们一套正确的控制,包括它是谁的声音。”

考虑到这一点,这样的功能没有时间表——如果真的这样的功能真的存在于 Alexa 上的话。然而,这位高管指出,为其提供动力的技术在亚马逊实验室中已经非常成熟并正在运行。不过,同样,如果它真的到了,它需要一些上述的透明度。

“与 deepfakes 不同,如果你对它的用途保持透明,有一个明确的决策者,并且客户可以控制他们的数据以及他们希望将其用于什么,我认为这是正确的步骤,”普拉萨德解释道。 “这不是关于‘死去的祖母’。奶奶还活着,这件事要说得很清楚。”

当被问及未来 10 到 15 年的 Alexa 会是什么样子时,Prasad 解释说,这完全取决于选择——尽管与其说是为 Alexa 灌输个人和独特的个性,不如说是为用户提供一个灵活的计算平台。

“它应该能够完成你想要的任何事情,”他说。 “这不仅仅是通过声音;它是适时的智能,这就是环境智能的用武之地。它应该在某些情况下主动帮助您并预测您的需求。这是我们进一步进行对话探索的地方。任何你要找的东西——想象一下你在预订假期上花了多少时间 [当你没有] 有旅行社时。想象一下你花了多少时间购买你想要的相机或电视。任何需要你花时间搜索的东西都应该变得更快。”

原文: https://techcrunch.com/2022/06/23/alexa-goes-down-the-conversational-rabbit-hole/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme