MacStories 的 John Voorhees 在 macOS 26 测试版中试用了 Apple 面向所有开发人员提供的新语音框架,并在制作音频记录方面取得了出色的效果:
这些技术尚处于起步阶段,但我要告诉大家,仅凭其速度,对于那些使用语音转录来将讲座、播客、YouTube 视频等内容创建文本的人来说,就足以改变游戏规则。我每周都会多次为AppStories 、 NPC和Unwind进行语音转录,生成文字记录并上传到 YouTube,因为这些网站的内置转录功能效果不佳。
我已经使用 OpenAI 的开源 Whisper 系统(mosty whisper.cpp )几年了,虽然它似乎比 Apple 的模型更准确,但它的速度也只有我最近默认使用的 large-v3-turbo 模型的一半。
很高兴看到苹果参与了这场游戏,更棒的是,它将这种模式的权力交给应用程序开发人员,以便他们可以直接在他们的应用程序中构建语音到文本的转录功能。
阅读《六色》 。
原文: https://sixcolors.com/link/2025/06/apples-built-in-transcriber-blows-away-whisper/