人工智能行业中某些人的最终成就是创建一个具有通用人工智能 (AGI) 的系统,或者能够理解和学习人类可以完成的任何任务。长期以来一直被归入科幻小说领域,有人建议 AGI 将带来具有推理、计划、学习、表示知识和以自然语言进行交流的能力的系统。
并非每位专家都相信 AGI 是一个现实的目标——甚至是可能的。但可以说,由 Alphabet 支持的研究实验室 DeepMind 本周推出了一个名为Gato的人工智能系统,向它迈进了一步,
Gato 被 DeepMind 描述为一个“通用”系统,一个可以被教导执行许多不同类型任务的系统。 DeepMind 的研究人员训练 Gato 完成 604,确切地说,包括为图像添加字幕、进行对话、用真正的机械臂堆叠积木以及玩 Atari 游戏。
艾伦人工智能研究所的研究科学家杰克赫塞尔指出,一个可以解决许多任务的单一人工智能系统并不新鲜。例如,谷歌最近开始在谷歌搜索中使用称为多任务统一模型或MUM的系统,该系统可以处理文本、图像和视频,以执行从查找单词拼写的语际变化到将搜索查询与图像相关联的任务.但是,Hessel 说,这里可能更新的是所处理任务的多样性和训练方法。

DeepMind 的 Gato 架构。
“我们之前已经看到证据表明,单一模型可以处理令人惊讶的多样化输入集,”Hessel 通过电子邮件告诉 TechCrunch。 “在我看来,多任务学习的核心问题……是任务是否相互补充。如果模型在解决任务之前隐式分离任务,您可以设想一个更无聊的情况,例如,“如果我检测任务 A 作为输入,我将使用子网络 A。如果我检测任务 B,我将使用不同的子网络 B。 ‘对于该零假设,通过分别训练 A 和 B 可以获得类似的性能,但效果并不理想。相比之下,如果训练 A 和 B 共同导致其中一个(或两者)的改进,那么事情会更令人兴奋。”
与所有 AI 系统一样,Gato 通过示例学习,从现实世界和模拟环境中摄取数十亿个单词、图像、按钮按下、关节扭矩等等,以令牌的形式。这些标记用于以 Gato 可以理解的方式表示数据,使系统能够——例如——梳理出 Breakout 的机制,或者句子中的哪些单词组合可能具有语法意义。
Gato 不一定能很好地完成这些任务。例如,当与一个人聊天时,系统通常会以一个肤浅的或实际上不正确的回复(例如,“马赛”来响应“法国的首都是哪里?”)。在为图片添加字幕时,Gato 会混淆人们的性别。并且系统仅在 60% 的时间内使用真实世界的机器人正确堆叠块。
但在上述 604 项任务中的 450 项中,DeepMind 声称 Gato 在一半以上的时间里比专家表现得更好。
“如果你认为我们需要通用 [系统],这是 AI 和机器学习领域的很多人,那么 [Gato] 很重要,”计算机科学助理教授 Matthew Guzdial阿尔伯塔大学通过电子邮件告诉 TechCrunch。 “我认为人们说这是朝着 AGI 迈出的重要一步,有点夸大其词,因为我们还没有达到人类智能,而且可能不会很快达到那里(在我看来)。我个人更倾向于许多小型模型 [和系统] 更有用,但这些通用模型在训练数据之外的任务上的表现肯定有好处。”
奇怪的是,从架构的角度来看,Gato 与当今生产中的许多 AI 系统并没有太大的不同。它与 OpenAI 的 GPT-3 具有共同的特征,因为它是一个“变形金刚”。追溯到 2017 年,Transformer 已成为复杂推理任务的首选架构,展示了总结文档、生成音乐、对图像中的对象进行分类和分析蛋白质序列的能力。

Gato学会完成的各种任务。
也许更值得注意的是,Gato 在参数计数方面比包括 GPT-3 在内的单任务系统小几个数量级。参数是从训练数据中学习到的系统部分,本质上定义了系统在问题上的技能,例如生成文本。 Gato 只有 12 亿,而 GPT-3 有超过 1700 亿。
DeepMind 研究人员有意将 Gato 保持在较小的尺寸,以便系统可以实时控制机械臂。但他们假设——如果扩大规模——Gato 可以处理任何“任务、行为和兴趣的体现”。
假设事实确实如此,则必须克服其他几个障碍才能使 Gato 在特定任务中优于尖端的单任务系统,例如 Gato 无法持续学习。与大多数基于 Transformer 的系统一样,Gato 对世界的了解以训练数据为基础,并且保持不变。如果你问 Gato 一个对日期敏感的问题,比如现任美国总统,它很可能会回答错误。
Transformer – 以及 Gato,通过扩展 – 在其上下文窗口或系统可以在给定任务的上下文中“记住”的信息量方面有另一个限制。即使是最好的基于 Transformer 的语言模型也无法写出一篇冗长的文章,更不用说一本书,而不会忘记关键细节,从而忘记情节。遗忘发生在任何任务中,无论是编写还是控制机器人,这就是为什么一些专家将其称为机器学习的“阿喀琉斯之踵”。
“并不是 Gato 让新事物成为可能,”Guzdial 指出该系统的缺点补充道。 “[B] 但这清楚地表明,我们可以利用现代机器学习模型做的事情比我们想象的要多。”