Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

🤔 人工智能事实核查让我们失望了。以下是我们的经验

Posted on 2025-07-19

1997 年 8 月, Microsoft Word 敦促一位朋友将“我们不会开具信用票据”这句话替换成截然相反的一句话——这是一种自动虚构,可能会引发代价高昂的承诺。

快进到2025年7月17日:我们的人工智能事实核查程序读到一句话,声称参议员戴夫·麦考密克仅仅是“有希望的候选人”。它把这个事实标记为正确。两个时代,两台比我们更聪明的机器,却有一个始终存在的缺陷:当软件带着错误的确定性说话时,人类会点头。让我们来揭秘其中的原因。

我们使用由法学硕士 (LLM) 驱动的事实核查系统来审核每个版本。该事实核查系统使用 o3(可以访问网络搜索)将草稿分解成独立的声明,并与外部来源进行核对。该系统与人工核查人员同时运行。

对于此事,人们错误地认为麦考密克是参议院候选人而不是现任参议员。

平心而论,这句话乍一看似乎并无不妥。其核心在于美国在清洁能源领域的投资规模——数千亿美元的潜在资金。机构细节——参议员或参议员候选人——似乎处于次要地位。但这恰恰是问题所在。该模型,以及某种程度上我们的人工审核员,优先考虑了重要的主题事实,而忽略了具体细节。

最后的发现并非来自法学硕士,而是来自眼尖的读者,他们了解上下文,很快就发现了错误。

感谢我们的读者对我们的法学硕士和人类的监督。

意识到问题所在后,我们尝试诊断问题所在。我们用多种不同的 LLMS 软件(包括 o3、o3 Pro、Perplexity 和 Grok)测试了该部分内容。但都没有发现问题。

我们根据模型的反馈改进了提示,但问题仍然存在,即使我们明确指示模型验证人们的角色。以下是第三次迭代:

LLM 注意到了我们原文和它自己发现的差异。这个过程一直持续到我们找到一个繁琐的提示来识别错误。

奇怪的是,通过 Dia 浏览器运行了文本和我们最基本的提示。Dia 从一系列不同的法学硕士 (LLM) 中汲取灵感,并立即发现了问题所在。

换句话说,最基本的工具表现优于最先进的工具。这是人工智能锯齿状边界的典型例证,它描述了人工智能如何在某些认知任务上表现出色,而在其他任务上却出乎意料地失败,两者之间没有平滑的界限。

这是一次富有启发性的失败。以下是它给我们的启示。

1.我们的人机混合工作流程需要重新思考

我们目前的编辑流程使用 LLM 作为第一道审查线,然后才由人工编辑介入。我们的假设是,模型会发现明显的错误,而我们的团队会发现细微的错误。

但这个案例暴露了一个更深层次的缺陷:模型没有捕捉到本应显而易见的东西,因为报道的重点是美国的新产业政策。一个优秀的人类助理编辑应该能够捕捉到(或者至少核实一下关于麦考密克的说法,因为他不像特朗普那么出名)。这就是信任陷阱。沉默伪装成确定性。当法学硕士没有提出任何异议时,我们的认知警惕性就会下降;我们会把没有警觉误认为是证据,而不是无知。该如何避免这种情况?

显然,我们的人工流程需要重新审视,而且会变得更加繁琐。同样,我们的自动化事实核查流程可能需要变成一个多步骤或并行的流程,由不同的系统评估不同类型的论断。我在研究过程中早期就已经这样做了。我倾向于参考几位不同的法学硕士(LLM)来构建一个问题,并利用他们一致和不一致的观点作为进一步研究的起点。

2.随着人工智能融入工作流程,这些风险也会随之扩大

阅读更多

原文: https://www.exponentialview.co/p/ai-fact-checking-failed-us-heres

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme