本周在 re:Mars 的舞台上,亚马逊展示了一个正在开发的 Alexa 功能,旨在模仿自然语言的流动。两个人之间的对话很少遵循某种预定义的结构。它去了奇怪和意想不到的地方。当参与者注入他们的生活经验时,一个主题会延续到另一个主题。
在一个演示中,关于树木的话题变成了关于徒步旅行和公园的话题。在公司人工智能的背景下,Alexa 的高级副总裁兼首席科学家 Rohit Prasad 将这种现象称为“对话探索”。确切地说,它不是适当功能的适当名称。没有一个开关可以在一夜之间突然启用对话。相反,它是 Alexa 如何以更人性化(或者可能更人性化)的方式与用户交互的不断演变概念的一部分。
传统上,像 Alexa 这样的智能助手提供了一个更加简单的问答模型。向 Alexa 询问天气,Alexa 会告诉您预定区域的天气。问她 A 的分数(或者,老实说,可能不会),Alexa 会告诉你 A 的分数。这是一种直接的交互,与在搜索引擎中输入问题没有什么不同。但是,现实世界的对话很少以这种方式进行。
“Alexa 得到了一系列的问题,这些问题包含了很多信息。当这些问题发生时,你可以想象它们不是重点问题,”普拉萨德在活动的一次谈话中告诉 TechCrunch。 “它们真的是关于客户想要了解更多的东西。我们现在最关心的是通货膨胀正在发生什么。我们收到了大量这样的 Alexa 请求,它为您提供了那种探索体验。”
然而,这样的对话功能是像 Alexa 这样的家庭助理所采用的方式。在亚马逊推出八年后,该助手仍在学习——收集数据并确定与消费者互动的最佳方式。即使有些事情已经到了亚马逊准备在主题演讲舞台上展示它的地步,仍然需要进行调整。
“Alexa 需要成为许多主题的专家,”Prasad 解释说。 “这是一个巨大的范式变化,这种专业知识需要一段时间才能获得。这将是一段旅程,通过我们客户的互动,Alexa 不会从第一天起就知道一切。但这些问题可以演变成更多的探索,最终你会做一些你认为自己没有做过的事情。”
在 Prasad 身后的舞台上看到用粗体字写成的“同理心”这个词令人头晕目眩——尽管可能不如接下来发生的那样多。
在与人类和智能助手的对话中,有一些简单的场景可以或应该考虑移情的概念。以阅读社交线索的能力为例。这是我们通过经验获得的一项技能——能够阅读面部和身体有时微妙的语言。 Alexa 的情商是 Rashad 多年来一直在讨论的一个概念。首先是改变助手的语气,以表达快乐或失望的方式做出回应。
另一方面是确定人类说话者的情绪,这是该公司多年来一直在努力完善的概念。这项工作以各种方式表现出来,包括该公司备受争议的可穿戴Halo于 2020 年首次亮相,它提供了一个名为 Tone 的功能,旨在“分析客户声音中的能量和积极性,以便他们了解他们对他人的声音并改善他们的沟通和关系。”
“我认为同理心和情感都是众所周知的互动方式,就建立关系而言,”普拉萨德说。 “Alexa 不能对你的情绪状态充耳不闻。如果你走进去,心情不愉快,很难说你应该做什么。熟悉你的人会有不同的反应。这对人工智能来说是一个非常高的标准,但它是你不能忽视的。”
这位高管指出,Alexa 已经成为某些用户的一种伴侣——尤其是在老年人群中。一种更具对话性的方法可能只会增强这种现象。在本周的 Astro 演示中,该公司经常将家用机器人称为在家中填充几乎类似于宠物的功能。然而,这样的概念有其局限性。
“它不应该隐藏它是人工智能的事实,”普拉萨德补充道。 “当涉及到无法区分的程度时——我们离这点很远——它仍然应该非常透明。”
随后的一段视频展示了一种令人印象深刻的新语音合成技术,该技术利用短短一分钟的音频来创建令人信服的近似人声。其中,一位祖母的声音正在朗读她的孙子《绿野仙踪》。通过机器学习来纪念亲人的想法并不是全新的。例如,像 MyHeritage 这样的公司正在使用技术为已故亲属的图像制作动画。但这些情况总是——而且可以理解——引起一些麻烦。
Prasad 很快指出,该演示更像是一个概念验证,突出了底层的语音技术。
“更多的是关于技术,”他解释说。 “我们是一家非常注重客户的科学公司。我们希望我们的科学对客户有意义。与在没有正确门的情况下使用生成和合成的许多事情不同,这感觉就像一个客户会喜欢的。我们必须给他们一套正确的控制,包括它是谁的声音。”
考虑到这一点,这样的功能没有时间表——如果真的这样的功能真的存在于 Alexa 上的话。然而,这位高管指出,为其提供动力的技术在亚马逊实验室中已经非常成熟并正在运行。不过,同样,如果它真的到了,它需要一些上述的透明度。
“与 deepfakes 不同,如果你对它的用途保持透明,有一个明确的决策者,并且客户可以控制他们的数据以及他们希望将其用于什么,我认为这是正确的步骤,”普拉萨德解释道。 “这不是关于‘死去的祖母’。奶奶还活着,这件事要说得很清楚。”
当被问及未来 10 到 15 年的 Alexa 会是什么样子时,Prasad 解释说,这完全取决于选择——尽管与其说是为 Alexa 灌输个人和独特的个性,不如说是为用户提供一个灵活的计算平台。
“它应该能够完成你想要的任何事情,”他说。 “这不仅仅是通过声音;它是适时的智能,这就是环境智能的用武之地。它应该在某些情况下主动帮助您并预测您的需求。这是我们进一步进行对话探索的地方。任何你要找的东西——想象一下你在预订假期上花了多少时间 [当你没有] 有旅行社时。想象一下你花了多少时间购买你想要的相机或电视。任何需要你花时间搜索的东西都应该变得更快。”
原文: https://techcrunch.com/2022/06/23/alexa-goes-down-the-conversational-rabbit-hole/