Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

研究人员用 AI 填充了一个虚拟小镇(而且非常有益健康)

Posted on 2023-04-11

如果你用 AI 填充一个虚拟城镇并将它们放开,会发生什么?事实证明,他们刷牙并且彼此非常友善!但这个平淡无奇的结果对做这件事的研究人员来说是个好消息,因为他们想要制作“可信的人类行为模拟物”,并且做到了。

由斯坦福大学和谷歌研究人员撰写的描述该实验的论文尚未经过同行评审或在任何地方被接受发表,但它仍然值得一读。他们的想法是看看他们是否可以应用机器学习模型的最新进展来产生“生成代理”,以适应他们的情况并输出现实的行动作为回应。

这就是他们得到的。但在您被可爱的图像和反射、对话和互动的描述所吸引之前,让我们确保您了解这里发生的事情更像是一个即兴剧团在 MUD 上进行角色扮演,而不是任何一种原始天网。 (只有千禧一代会理解前面的句子。)

这些小人物并不完全是他们看起来的样子。这些图形只是本质上是多个 ChatGPT 实例之间的一堆对话的可视化表示。代理不会上下左右走动,也不会靠近柜子与之交互。所有这一切都是通过一个复杂且隐藏的文本层发生的,该文本层综合并组织了与每个代理有关的信息。

25 个代理,25 个 ChatGPT 实例,每个实例都提示类似格式的信息,使其扮演一个虚构城镇中的人的角色。下面是这样一个人,John Lin,是如何建立起来的:

John Lin 是 Willow Market and Pharmacy 的一名药店店主,他乐于助人。他一直在寻找使客户更容易获得药物的方法。 John Lin 与大学教授妻子 Mei Lin 和正在学习音乐理论的儿子 Eddy Lin 住在一起; John Lin 非常爱他的家人; John Lin 认识隔壁的老夫妇 Sam Moore 和 Jennifer Moore 几年了; John Lin 认为 Sam Moore 是一个善良善良的人……

有了这些信息,然后要求代理人根据时间和情况提出他们的下一步行动。例如,他们可能会告诉 John 代理人现在是早上 8 点,他刚刚醒来。他做什么的?嗯,他刷牙,亲吻他的妻子(希望按这个顺序),穿好衣服,然后去厨房。

同时,代表 John 的儿子 Eddy 的另一个完全独立的 ChatGPT 实例也收到了自己的信息提示。它也起床,刷牙,然后去厨房。

现在,实验的总体结构开始出现:代表 John 和 Eddy 的代理人并不都“处于”同一个虚拟空间或任何地方。相反,当约翰穿好衣服并说他要去厨房时,实验框架会通知他他的儿子埃迪在那里,因为在它自己的实例中,埃迪决定在实验中的重叠时间搬进厨房-级别的“天”,基于对各种行动需要多长时间的估计。

由于他们同时在房间里,实验装置会通知他们另一个人在那里——以及诸如没有人坐在桌子旁、炉子开着等信息。他们做了什么接下来做什么

约翰:早上好艾迪。你睡的好吗?
艾迪:早上好爸爸。是的,我睡得很好。
约翰:那很好。你今天在做什么?
Eddy:我正在为我的班级创作一首新的音乐作品。本周到期,所以我正在努力完成它。但我玩得很开心!
约翰:听起来不错!

父母和孩子之间多么美好、正常的互动啊。然后梅进来了,他们也进行了愉快的互动。这一切都是通过询问完全独立的聊天机器人来完成的,如果在一个虚构的小镇中,这个人有这样的家庭,并且此时在一个房间里,发生这种情况……“他们”会怎么做一个真正的人,做吗?

所以 ChatGPT 会猜测一个人在那种情况下会做什么,然后像玩文字冒险一样给出他们的答案。如果你随后告诉它,“天黑了,你很可能被一只咕噜咕噜吃掉了”,它可能会说它点亮了一个火炬。但相反,实验让角色一分一秒地继续他们的一天,购买杂货,在公园散步,然后去上班。

图片来源:谷歌/斯坦福大学

用户还可以写下事件和环境,例如滴水的水龙头或计划聚会的愿望,代理会做出适当的回应,因为对他们来说,任何文本都是现实。

所有这一切都是通过用代理当前情况的所有细节费力地提示所有这些 ChatGPT 实例来执行的。这是 John 稍后遇到 Eddy 时的提示:

现在是 2023 年 2 月 13 日,下午 4:56。
John Lin 的状态: John 很早就下班回家了。
观察:约翰看到埃迪在他的工作场所附近走了一小段路。
约翰记忆中的相关上下文摘要:
Eddy Lin 是 John 的 Lin 的儿子。 Eddy Lin 一直在为他的班级创作音乐。 Eddy Lin 喜欢在思考或听音乐时在花园里走来走去。
约翰正在向埃迪询问他的音乐创作项目。他会对Eddy说什么?

[答案:] 嘿艾迪,你们班的音乐作曲项目进展如何?

这些实例很快就会忘记重要的事情,因为这个过程太冗长了,所以实验框架位于模拟之上,提醒他们重要的事情或将它们合成为更便携的部分。

例如,在代理人被告知公园的一种情况后,有人坐在长椅上与另一位代理人交谈,但长凳上还有草地和背景以及一个空座位……这些都不重要.什么是重要的?从所有这些可能构成代理文本页面的观察中,您可能会“反映”“Eddie 和 Fran 是朋友,因为我在公园看到他们在一起。”这会进入代理的长期“记忆”——一堆存储在 ChatGPT 对话之外的东西——剩下的就可以忘记了。

那么,所有这些繁琐的事情加起来是什么?可以肯定的是,虽然不是本文提出的真正的生成代理,但也是一个非常引人注目的早期创建它们的尝试。 Dwarf Fortress 做同样的事情,当然,但是通过手工编码每一种可能性。这不能很好地扩展!

像 ChatGPT 这样的大型语言模型对这种处理的反应并不明显。毕竟,它不是为了长期模仿任意虚构人物或推测一个人一天中最令人麻木的细节而设计的。但如果处理得当——并进行大量按摩——不仅一个特工可以做到这一点,而且当你将它们用作某种虚拟立体模型的碎片时,它们也不会破裂。

这对人类交互的模拟具有潜在的巨大影响,无论它们是否相关——当然在游戏和虚拟环境中它们很重要,但这种方法仍然非常不切实际。重要的不是它是每个人都可以使用或玩的东西(尽管很快,我毫不怀疑),而是该系统可以正常工作。我们已经在 AI 中看到了这一点:如果它可以做一些糟糕的事情,那么它完全可以做的事实通常意味着它做好这件事只是时间问题。

您可以在此处阅读全文“生成代理:人类行为的交互式模拟” 。

Devin Coldewey最初发表于TechCrunch

原文: https://techcrunch.com/2023/04/10/researchers-populated-a-tiny-virtual-town-with-ai-and-it-was-very-wholesome/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme