依靠人工智能学习新任务的机器人通常需要费力且重复的训练过程。加州大学伯克利分校的研究人员正试图通过一种创新的学习技术来简化和缩短这一过程,让机器人填补空白,而不是从头开始。
该团队与 TechCrunch 分享了几条工作线,以在今天的 TC Sessions: Robotics 上展示,在下面的视频中,您可以听到有关它们的信息——首先来自加州大学伯克利分校的研究员 Stephen James。
“我们采用的技术是一种对比学习设置,它接收 YouTube 视频并修补一堆区域,其想法是机器人试图重建该图像,”詹姆斯解释。 “它必须了解这些补丁中可能存在什么,然后才能产生关于那里可能存在什么的想法;它必须对世界上正在发生的事情有一个非常好的了解。”
当然,它不仅仅是通过观看 YouTube 来学习的,这在人类世界中很常见。操作员必须以物理方式或通过 VR 控制器移动机器人本身,以使其大致了解它正在尝试做什么。它将这些信息与从填充视频图像中收集到的对世界的更广泛理解相结合,最终可能还会整合许多其他来源。
这种方法已经产生了效果,詹姆斯说:“通常,有时可能需要数百个演示才能执行一项新任务,而现在我们可以提供少量演示,也许 10 个,它就可以执行任务。”
图片来源: TechCrunch
Alejandro Escontrela 擅长设计从 YouTube 视频中提取相关数据的模型,例如动物、人或其他机器人的动作。机器人使用这些模型来告知自己的行为,判断给定的动作是否看起来像是它应该尝试的东西。
最终,它试图复制视频中的动作,以使观看它们的另一个模型无法分辨是机器人还是真正的德国牧羊犬在追逐那个球。
有趣的是,许多像这样的机器人首先在模拟环境中学习,基本上是在 VR 中测试运动。但正如 Danijar Hafner 解释的那样,这些过程已经变得足够高效,他们可以跳过测试,让机器人在现实世界中嬉戏,并从行走、绊倒,当然还有被推等互动中实时学习。这里的好处是它可以边工作边学习,而不必回到模拟器来整合新信息,进一步简化了任务。
“我认为机器人学习的圣杯是在现实世界中尽可能多地学习,并且尽可能快,”哈夫纳说。他们当然似乎正在朝着这个目标前进。在此处查看团队工作的完整视频。