放大/来自演示视频的静止图像,该视频显示 ACT-1 在被要求“给我找房子”时在浏览器中在 Redfin.com 上执行搜索。 (信用:熟练)
昨天,总部位于加利福尼亚的 AI 公司 Adept 宣布了Action Transformer (ACT-1) ,这是一种 AI 模型,当给出高级书面或口头命令时,它可以像人类助手一样在软件中执行操作。据报道,它可以操作网络应用程序并在网站上执行智能搜索,同时单击、滚动和在正确的字段中键入,就好像它是使用计算机的人一样。
在Adept发布的一段演示视频中,该公司显示有人在文本输入框中输入“在休斯顿为一个 4 口之家工作的房子。我的预算是 60 万”。提交任务后,ACT-1 会自动在 Web 浏览器中浏览 Redfin.com,单击网站的适当区域,输入搜索条目并更改搜索参数,直到匹配的房子出现在屏幕上。
1/7 我们建立了一个新模型!它被称为 Action Transformer (ACT-1),我们教它使用一堆软件工具。在第一个视频中,用户只需键入一个高级请求,其余的由 ACT-1 完成。继续阅读以查看更多示例
pic.twitter.com/mq7c0Vyd7N
— Adept (@AdeptAILabs) 2022 年 9 月 14 日
Adept 网站上的另一个演示视频显示 ACT-1 操作 Salesforce,提示“在 Adept 添加 Max Nye 作为新领导”和“与 James Veel 通话,说他正在考虑购买 100 个小部件。” ACT-1 然后单击右侧按钮、滚动并填写正确的表格以完成这些任务。其他演示视频展示了 ACT-1 通过浏览器在 Google Sheets、Craigslist 和 Wikipedia 中导航。
