
今年 4 月,Anthorpic 推出了一项新的 AI 技巧:多个 Claude 代理组合成一个“研究”功能,可以“在你的内部工作环境和网络上进行搜索”(以及 Google Workspace“和任何集成……”)。但 Anthropic 最近的一篇博客文章指出,此功能“涉及一个根据用户查询规划研究流程的代理,然后使用工具创建并行代理来同时搜索信息”,这给“代理协调、评估和可靠性”带来了挑战……该模型必须自主运行多个回合,并根据中间发现决定后续方向。多代理系统之所以有效,主要是因为它们有助于消耗足够的代币来解决问题……这一发现验证了我们的架构,该架构将工作分配给具有独立上下文窗口的代理,从而增强了并行推理的能力。最新的 Claude 模型在代币使用方面发挥了巨大的效率倍增器作用,因为升级到 Claude Sonnet 4 比将 Claude Sonnet 3.7 上的代币预算翻倍更能带来性能提升。多代理架构可以有效地扩展超出单个代理限制的任务的代币使用量。这些架构也存在一个缺点:在实践中,它们会快速消耗令牌。根据我们的数据,智能体通常比聊天交互多消耗约 4 倍的令牌,而多智能体系统比聊天多消耗约 15 倍的令牌。为了实现经济可行性,多智能体系统需要执行那些价值足够高的任务,以弥补提升的性能。此外,一些要求所有智能体共享相同上下文或智能体之间存在诸多依赖关系的领域,目前并不适合多智能体系统。例如,大多数编码任务中真正可并行化的任务比研究任务要少,而且 LLM 智能体目前还不擅长实时协调和委托其他智能体。我们发现,多智能体系统在执行那些需要大量并行化、处理超过单一上下文窗口的信息以及与众多复杂工具交互的宝贵任务方面表现出色。感谢 Slashdot 读者 ZipNada 分享此消息。
在 Slashdot 上阅读更多内容。