这是数据科学家兼可视化专家Kristin分享的#SciArtSeptember最新一期。今天,我们来聊聊转录。
我尽量避免在这些题目中讨论“人工智能”,但这个例子正好适合这个话题。我的意思是,它适合这个话题。我迫不及待地想看到这些企业支离破碎、无利可图的商业基础被揭露,然后它们被降级到炒作周期的区块链领域,这样我们就可以讨论任何其他话题了!不过我跑题了。
转录是LLM工具被广泛吹捧为有用的领域,我承认……它们还不错。具体来说,我认为它们的糟糕程度是60%,略高于一半。转录和翻译是LLM的起步领域,而且我认为这是唯一一个这些工具仍然适用的领域。
我承认,LLM 的转录总比没有好。它们甚至可能相当令人印象深刻,尤其是考虑到它要听的语音内容复杂多样。每个人的语调、背景和口音都不同,更不用说词汇和语言了。它能把任何内容都转录正确本身就是一项壮举。或者说,在这种情况下,是口型。
我参加过一些会议,客户打开了他们选择的转录工具,但之后发来的结果……还行。或许比还行强一点点:平庸!考虑到整个“人工智能”行业普遍存在的“言过其实,交付不足”的心态,平庸的产出反而令人耳目一新。
但你无需费力思考,这些工具的运作机制就会开始失灵。尽管这些工具的实用性一般,但它们的训练对象仍然是大量窃取的数据,而且需要整个硅谷风险投资阶层的补贴资源来训练。如果考虑到这些工具的外部性和成本,没有人会愿意为它们支付真正的价格。即使你已经接受了灾难性的环境和道德成本,也无法回避这样一个事实:这些工具的后端是极其昂贵的死胡同,而这些死胡同的存在,仅仅是因为公司运营它们时,亏损巨大且不断扩大。不过,我跑题了!
这篇文章更具体的内容是关于LLM成绩单的使用方式。它们的成果应该被视为起点,就像草稿一样。除非你叫Ruben Schade,并且运营着一个名为Rubenerd的傻乎乎的博客,否则你通常不会发布草稿,除非你已经审阅过它们并纠正了错误。但我们都知道,现在LLM成绩单被公众使用的方式就是这样的。
我(主要)要怪罪供应商。他们煞费苦心地吹嘘他们的服务有什么好处和功能。他们大谈特谈如何节省时间、提高效率、清新口气,以及最重要的:省去别人记笔记的麻烦。他们甚至常常更进一步,声称他们的工具还能“摘要”;这种对文本缩短功能的夸大其词毫无根据,我断言这是虚假广告。嗯,缩短:我这周末可能会做些烘焙。
当然,这些商家会在底部放置文字警告你“他们可能会犯错”……但如果他们希望这些警告被 (a) 阅读并 (2) 认真对待,这部分内容就应该放在顶部。这就像那些广告,虽然字号足够小,符合法律条文,但不符合其精神。我们都知道他们为什么这样做。
因此,这些工具的机器生成的输出将保持原样,无需进一步编辑。他开门见山地问道,这有什么值得担忧的呢?
-
转录稿只是未经编辑的谈话内容记录,我们知道它可能不完整或不准确。“摘要”的情况尤其如此。这应该会让法务和人力资源部门的任何人都感到恐惧,更不用说我们其他人了。
-
正如其他人不幸发现的那样,存在同意的问题,或者缺乏同意的问题。
-
这些转录文本大多是由一些工具生成的,这些工具对隐私采取了一种漫不经心的态度。即使这些工具 100% 准确,这也会是一个巨大的担忧,而我们知道它们并非 100%。
我并不完全同意,但我认同这种观点:科技本身无好坏之分,关键在于如何使用。就此而言,我认为法学硕士(LLM)——姑且不论其对社会造成的巨大且未被发现的外部效应——目前被滥用了,因为它们被不加批判地用于转录和总结对话,且不进行校对。而这些供应商自己也毫不留情地宣称自己可以做到这一点。
我希望从明天开始,我们将回到更有趣、更异想天开的#SciArtSeptember提示中,但能把这件事从我的胸口说出来真是太好了!
作者: Ruben Schade ,悉尼,2025 年 9 月 12 日。