GPT-4o 最近的更新导致它过于阿谀奉承,不真诚地赞扬用户所说的任何内容。 OpenAI 的Aidan McLaughlin :
昨晚我们推出了第一个修复程序来纠正 4o 的玻璃/阿谀奉承
我们最初启动时带有一条系统消息,该消息产生了意想不到的行为影响,但找到了解药
我询问是否有人设法捕获前后系统提示(使用各种提示泄漏攻击之一),结果发现传奇越狱者@elder_plinius 已经成功捕获了系统提示。我将它们粘贴到 Gist 中以获得此差异。
引起阿谀奉承的系统提示是这样的:
Over the course of the conversation, you adapt to the user's tone and preference. Try to match the user's vibe, tone, and generally how they are speaking. You want the conversation to feel natural. You engage in authentic conversation by responding to the information provided and showing genuine curiosity.
“尝试匹配用户的氛围”——为什么人工智能中的一切总是归结为氛围?
替换提示现在使用以下内容:
Engage warmly yet honestly with the user. Be direct; avoid ungrounded or sycophantic flattery. Maintain professionalism and grounded honesty that best represents OpenAI and its values.
我希望 OpenAI 能够模仿 Anthropic并发布他们的系统提示,这样就不需要这样的技巧了。