Google DeepMind 推出了 Gemini Robotics On-Device,这是一种新的语言模型,使机器人无需互联网连接即可在本地执行复杂任务。TechCrunch 报道:Gemini Robotics On-Device 以该公司 3 月份发布的上一款 Gemini Robotics 模型为基础,可以控制机器人的动作。开发人员可以使用自然语言提示控制和微调模型以满足各种需求。在基准测试中,谷歌声称该模型的性能接近基于云端的 Gemini Robotics 模型。该公司表示,它在一般基准测试中优于其他设备上的模型,但没有透露这些模型的名称。在演示中,该公司展示了运行该本地模型的机器人执行诸如拉开袋子拉链和折叠衣服等操作。谷歌表示,虽然该模型是为 ALOHA 机器人训练的,但后来对其进行了调整,使其能够工作在双臂 Franka FR3 机器人和 Apptronik 的 Apollo 人形机器人上。谷歌声称,双臂机器人 Franka FR3 能够成功应对它从未“见过”的场景和物体,例如在工业传送带上进行装配。谷歌 DeepMind 也发布了 Gemini Robotics SDK。该公司表示,开发者可以向机器人展示 50 到 100 个任务演示,以便在 MuJoCo 物理模拟器上使用这些模型来训练它们执行新任务。
在 Slashdot 上阅读更多内容。