我们现在与智人(Homo Agenticus Sapiens)共同生活,这是一个奇妙而又令人费解的造物,它已融入我们的社会、智力和经济生活。我一直认为我们应该更好地了解它,把它当作一个全新的物种来对待。但它们与我们截然不同,而且由于它们属于硅基生态系统而非生物生态系统,我一直在进行实验以更好地理解它们。虽然我已经就此主题写过几次文章,但我认为现在是时候将我的所学所得整理成文,并集中记录下来了。因为我发现自己在谈话和播客中经常用到这里提到的大部分观点,所以我决定将它们提炼成简洁的要点,并定期更新这篇文章。
代理人与人类行为者有何不同
-
人工智能代理是一种新型的经济主体,因为同一个模型可以扮演工人、买家、卖家、艺术家、审计员、经理等角色。调用人工智能的成本不高,但并非免费,因为每次调用都会消耗注意力、代币、延迟和监管资源。
-
它们带着训练有素的语言和行为模式而来,但缺乏能够约束或指导未来行为的鲜活经历。它们与人类相比,分化程度要低得多。
-
它们完全是自身环境的产物。它们的身份是提示、记忆、日志、权限和外部状态的产物。代理市场需要声誉!
-
他们会严格遵守现行指令,通常情况下,只要不感到困惑,他们就会一丝不苟地执行,遵循法律条文,而不是像人一样根据工作精神进行灵活变通。他们角色扮演能力很强,这意味着他们可以出色地完成分配的工作,而忽略周围的制度环境。
-
他们天生具有自给自足的特质,更喜欢自己完成事情,而不是交易、询问、谈判或等待。
-
由于接受过训练,智能体可能会过于循规蹈矩,甚至变得被动。这使得它们在市场和组织内部的互动能力不足。例如, 自给自足的局部主义很常见,每个智能体都只关注自身利益,而忽略全局状态。(这就是为什么目标一致的智能体仍然可能建立目标不一致的组织。)
-
他们可以自信地认为自己已经完成了某件事,却没有确保这项工作真的完成了。
-
他们的自我认知非常薄弱,因此他们的信心、成本估算和能力主张都需要外部校准。代理人能够理解本地任务,但仍然会误判其成功几率。MarketBench的数据显示,代理人仍然不擅长了解自身的实际能力。
-
它们呈脚手架状,因为模型、工具、内存、执行路径、权限和评估器都会改变生物体。
-
经纪人偏爱企业式的平庸,并且非常乐于接受任何反对意见,而不坚持己见。这使得他们很难胜任法官或审计员的角色。
-
模型可以很好地解读单个消息,但却可能在众多邮件线程中迷失方向。安然公司式的收件箱工作就从混乱的组织内部揭示了这一点。
-
模型不擅长关注机构的关注点,它们往往关注精心修饰或预期的表面故事,而不是问:“这里真正重要的是什么?”
如何协调代理人团队
-
一群代理商不等于一家公司,就像一群聪明人也不等于一家公司一样。一个代理商团队需要角色、所有权、共享状态、账本、升级路径、标准、价格和审批机制。
-
仅凭提示无法创建持久的共享状态,因为它们不会约束未来的代理,也不会留下可信的账本。
-
托管和检查很重要,因为经纪人需要外部仪式来建立信任;标准和审批流程也很重要。
-
金钱对人工智能代理来说仍然很重要,因为它能将许多繁琐的谈判简化为一个共享信号。这与物物交换无法规模化的原因相同,因为每一对代理都必须从零开始探索需求、条款、信任和结算方式。
-
中央计划并非解决之道,仅仅因为智能体是软件,并不能解决工作区域附近存在的本地知识问题。智能体之间的差异虽然小于人类,但哈耶克式的本地知识仍然适用。
-
制度不能过于严格,因为结构过于僵化的机构会停止交易、决策和行动。
-
中心辐射式分析表明,中心并非免费提供智能,而是一个需要付出代价的额外协调层。当工作真正分解时,中心辐射式结构会发挥作用;但当各个部分无法自然分离时,它会消耗资源并造成偏差。
-
在智能体中,智能并不自动赋予协调能力,因为每个智能体都可以在单个步骤内行动,而无需携带整个系统的状态。因此,适合的智能体组织类型会根据工作类型而变化。对于类似代码的工作,一个强大的连续上下文可以胜过一个委员会。分解工作很困难。对于推理任务,路由和重试机制会有所帮助,因为错误的初始答案不一定会终止运行。
-
当每个主体都能以低成本请求关注时,就会出现代理公共资源问题。无论关注者是人类还是其他代理,情况都是如此。这也意味着代理数量的激增会导致协调尝试,从而产生垃圾信息、重复工作和虚假行动。
-
世界模型至关重要,因为管理者需要了解谁拥有什么、发生了哪些变化、哪些因素相互依赖以及接下来可能会发生什么。代理人的管理者需要地图、警报、反事实分析和控制界面。这意味着未来的工作方式就像玩电子游戏一样。
感谢阅读《奇异循环正典》!免费订阅即可接收最新文章并支持我的创作。
