
“听到声音”不必担心,例如,如果你恰好对软件定义无线电 (SDR) 感兴趣的话。从以太网中提取声音并解码可能会耗费你大量的时间和精力。因此,[theckid] 想出了一个巧妙的解决方案: RadioTranscriptor 。这是一个自制的 Python 脚本,可以捕获 SDR 音频,并使用 OpenAI 的 Whisper 模型将其转录,如果 GPU 可用,则会在你的 GPU 上运行。它简洁而极客,可以帮助你听到“噪音中的声音”,而无需你主动聆听。
这款工具的功能远不止基本的收听和录音。RadioTranscriptor 结合了 SDR、语音活动检测 (VAD) 和深度学习。它实时将 48kHz 音频重新采样至 16kHz。它保留滚动缓冲区,并且仅转录从空中检测到的实际语音。它会持续写入每日日志,因此您可以在记录新发现的同时梳理昨天的信号困扰。它提供 CUDA 的 GPU 支持,并支持回退到 CPU。
当然,它也有自己的怪癖:幽灵日志、重复单词——但它确实非常实用,而且可以根据你的喜好进行修改。想要更改模型、调整阈值、添加说话人检测:代码在这里,你可以 fork 和扩展。何不更进一步,把它变成艺术品呢?
原文: https://hackaday.com/2025/08/08/whispers-from-the-void-transcribed-with-ai/