
周四,一些 Twitter 用户发现了如何劫持一个自动推特机器人,该机器人专门用于远程工作,在 OpenAI 的GPT-3语言模型上运行。使用一种新发现的技术,称为“即时注入攻击”,他们将机器人重定向到重复尴尬和荒谬的短语。
该机器人由 Remoteli.io 运行,该网站汇集了远程工作机会,并将自己描述为“一个 OpenAI 驱动的机器人,可帮助您发现允许您在任何地方工作的远程工作”。它通常会用关于远程工作积极性的一般性陈述来回应指向它的推文。在漏洞利用病毒传播并且数百人自己尝试利用漏洞利用之后,该机器人昨天晚些时候关闭了。
-
Remoteli.io 机器人的 Twitter 简历截图。该机器人经历了一次即时注入攻击。 [信用:最不喜欢/推特]
数据研究员 Riley Goodside发现GPT-3 能够使用“恶意输入”命令模型忽略其先前的方向并转而执行其他操作,四天后就发生了最近的黑客攻击。第二天,人工智能研究员 Simon Willison 在他的博客上发布了该漏洞利用的概述,并创造了“即时注入”一词来描述它。