Twitter 恶作剧者用新发现的“即时注入”黑客攻击 GPT-3 机器人

放大/一个侧躺的锡制玩具机器人。（信用：盖蒂图片社）

周四，一些 Twitter 用户发现了如何劫持一个自动推特机器人，该机器人专门用于远程工作，在 OpenAI 的GPT-3语言模型上运行。使用一种新发现的技术，称为“即时注入攻击”，他们将机器人重定向到重复尴尬和荒谬的短语。

该机器人由 Remoteli.io 运行，该网站汇集了远程工作机会，并将自己描述为“一个 OpenAI 驱动的机器人，可帮助您发现允许您在任何地方工作的远程工作”。它通常会用关于远程工作积极性的一般性陈述来回应指向它的推文。在漏洞利用病毒传播并且数百人自己尝试利用漏洞利用之后，该机器人昨天晚些时候关闭了。

Remoteli.io 机器人的 Twitter 简历截图。该机器人经历了一次即时注入攻击。 [信用：最不喜欢/推特]

数据研究员 Riley Goodside发现GPT-3 能够使用“恶意输入”命令模型忽略其先前的方向并转而执行其他操作，四天后就发生了最近的黑客攻击。第二天，人工智能研究员 Simon Willison 在他的博客上发布了该漏洞利用的概述，并创造了“即时注入”一词来描述它。

阅读剩余 7 段|注释

原文： https://arstechnica.com/?p=1882057