
放大/艺术家对使用桌面计算器的机器人手的印象。 (图片来源:Aurich Lawson | Getty Images )
ChatGPT等语言模型彻底改变了自然语言处理领域,但它们仍然难以完成一些基本任务,例如算术和事实核查。上周四,Meta 的研究人员透露了Toolformer ,这是一种 AI 语言模型,可以在不牺牲其核心语言建模能力的情况下自学使用外部工具,例如搜索引擎、计算器和日历。
Toolformer 的关键在于它可以使用API (应用程序编程接口),这是一组允许不同应用程序相互通信的协议,通常以无缝和自动化的方式进行。在训练期间,研究人员向 Toolformer 提供了一小部分人工编写的示例,演示每个 API 的使用方式,然后允许它使用潜在的 API 调用来注释大型语言建模数据集。它以“自我监督”的方式做到这一点,这意味着它可以在不需要明确的人类指导的情况下学习。
该模型学会了预测每个基于文本的 API 调用,就好像它们是任何其他形式的文本一样。在运行时——根据人工输入生成文本——它可以在需要时插入呼叫。此外,Toolformer可以自己“决定”在适当的上下文中使用哪个工具以及如何使用它。