OpenAI 通过与 Reddit 帖子进行比较来测试其人工智能的说服力

周五 TechCrunch 报道称，OpenAI“使用 Reddit 子版块 r/ChangeMyView 创建了一个测试，用于衡量其人工智能推理模型的说服能力。”该公司在一份系统卡（一份概述人工智能系统如何工作的文件）中透露了这一点，该卡与周五发布的新“推理”模型 o3-mini 一起发布。…OpenAI 表示，它从 r/ChangeMyView 收集用户帖子并要求其人工智能模型在封闭的环境中撰写回复，这将改变 Reddit 用户对某个主题的看法。然后，该公司向测试人员展示这些回复，由测试人员评估该论点的说服力，最后 OpenAI 将人工智能模型的回复与人类对同一帖子的回复进行比较。 ChatGPT 制造商与 Reddit 签订了内容许可协议，允许 OpenAI 对 Reddit 用户的帖子进行训练，并在其产品中显示这些帖子。我们不知道 OpenAI 为这些内容支付了多少费用，但据报道，谷歌根据类似协议每年向 Reddit 支付 6000 万美元。然而，OpenAI 告诉 TechCrunch，基于 ChangeMyView 的评估与其 Reddit 交易无关。目前还不清楚 OpenAI 如何访问 Reddit 子版块的数据，该公司表示没有计划向公众发布此评估结果……OpenAI 的目标不是创建超有说服力的 AI 模型，而是确保 AI 模型不会被太有说服力了。推理模型已经非常擅长说服和欺骗，因此 OpenAI 开发了新的评估和保障措施来解决这个问题。文章称，Reddit 的“ChangeMyView”子 Reddit 拥有 380 万订阅者，使其成为真实人类互动的宝贵来源。它还增加了一件更具说服力的轶事。 “Reddit 首席执行官史蒂夫·霍夫曼 (Steve Huffman) 去年告诉 The Verge，微软、Anthropic 和 Perplexity 拒绝与他谈判，并表示‘阻止这些公司真是太痛苦了。’”

在 Slashdot 上阅读这个故事的更多内容。

原文： https://slashdot.org/story/25/02/02/0319217/openai-tests-its-ais-persuasiveness-by-comparing-it-to-reddit-posts?utm_source=rss1.0mainlinkanon&utm_medium=feed