Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

#SciArtSeptember:转录

Posted on 2025-09-13

这是数据科学家兼可视化专家Kristin分享的#SciArtSeptember最新一期。今天,我们来聊聊转录。

我尽量避免在这些题目中讨论“人工智能”,但这个例子正好适合这个话题。我的意思是,它适合这个话题。我迫不及待地想看到这些企业支离破碎、无利可图的商业基础被揭露,然后它们被降级到炒作周期的区块链领域,这样我们就可以讨论任何其他话题了!不过我跑题了。

转录是LLM工具被广泛吹捧为有用的领域,我承认……它们还不错。具体来说,我认为它们的糟糕程度是60%,略高于一半。转录和翻译是LLM的起步领域,而且我认为这是唯一一个这些工具仍然适用的领域。

我承认,LLM 的转录总比没有好。它们甚至可能相当令人印象深刻,尤其是考虑到它要听的语音内容复杂多样。每个人的语调、背景和口音都不同,更不用说词汇和语言了。它能把任何内容都转录正确本身就是一项壮举。或者说,在这种情况下,是口型。

我参加过一些会议,客户打开了他们选择的转录工具,但之后发来的结果……还行。或许比还行强一点点:平庸!考虑到整个“人工智能”行业普遍存在的“言过其实,交付不足”的心态,平庸的产出反而令人耳目一新。

但你无需费力思考,这些工具的运作机制就会开始失灵。尽管这些工具的实用性一般,但它们的训练对象仍然是大量窃取的数据,而且需要整个硅谷风险投资阶层的补贴资源来训练。如果考虑到这些工具的外部性和成本,没有人会愿意为它们支付真正的价格。即使你已经接受了灾难性的环境和道德成本,也无法回避这样一个事实:这些工具的后端是极其昂贵的死胡同,而这些死胡同的存在,仅仅是因为公司运营它们时,亏损巨大且不断扩大。不过,我跑题了!

这篇文章更具体的内容是关于LLM成绩单的使用方式。它们的成果应该被视为起点,就像草稿一样。除非你叫Ruben Schade,并且运营着一个名为Rubenerd的傻乎乎的博客,否则你通常不会发布草稿,除非你已经审阅过它们并纠正了错误。但我们都知道,现在LLM成绩单被公众使用的方式就是这样的。

我(主要)要怪罪供应商。他们煞费苦心地吹嘘他们的服务有什么好处和功能。他们大谈特谈如何节省时间、提高效率、清新口气,以及最重要的:省去别人记笔记的麻烦。他们甚至常常更进一步,声称他们的工具还能“摘要”;这种对文本缩短功能的夸大其词毫无根据,我断言这是虚假广告。嗯,缩短:我这周末可能会做些烘焙。

当然,这些商家会在底部放置文字警告你“他们可能会犯错”……但如果他们希望这些警告被 (a) 阅读并 (2) 认真对待,这部分内容就应该放在顶部。这就像那些广告,虽然字号足够小,符合法律条文,但不符合其精神。我们都知道他们为什么这样做。

因此,这些工具的机器生成的输出将保持原样,无需进一步编辑。他开门见山地问道,这有什么值得担忧的呢?

  • 转录稿只是未经编辑的谈话内容记录,我们知道它可能不完整或不准确。“摘要”的情况尤其如此。这应该会让法务和人力资源部门的任何人都感到恐惧,更不用说我们其他人了。

  • 正如其他人不幸发现的那样,存在同意的问题,或者缺乏同意的问题。

  • 这些转录文本大多是由一些工具生成的,这些工具对隐私采取了一种漫不经心的态度。即使这些工具 100% 准确,这也会是一个巨大的担忧,而我们知道它们并非 100%。

我并不完全同意,但我认同这种观点:科技本身无好坏之分,关键在于如何使用。就此而言,我认为法学硕士(LLM)——姑且不论其对社会造成的巨大且未被发现的外部效应——目前被滥用了,因为它们被不加批判地用于转录和总结对话,且不进行校对。而这些供应商自己也毫不留情地宣称自己可以做到这一点。

我希望从明天开始,我们将回到更有趣、更异想天开的#SciArtSeptember提示中,但能把这件事从我的胸口说出来真是太好了!

作者: Ruben Schade ,悉尼,2025 年 9 月 12 日。

原文: https://rubenerd.com/sciartseptember-transcription/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme