Google DeepMind 发布有趣的全新“现场音乐模型”:
今天,我们很高兴与大家分享 Magenta RealTime(Magenta RT)的研究预览,这是一个开放权重的现场音乐模型,可让您以交互方式即时创作、控制和演奏音乐。[…]
Magenta RT 是一个开放权重模型,其目标最终是在消费级硬件上本地运行(目前运行在免费版 Colab TPU 上)。它是一个包含 8 亿个参数的自回归 Transformer 模型,基于来自多个来源的约 19 万小时的库存音乐(主要为器乐)进行训练。
目前还没有关于训练数据的详细信息,希望他们能在即将发表的论文中描述这一点。
目前,代码在 GitHub 上根据 Apache 2.0 许可证发布,权重在 HuggingFace 上根据Creative Commons Attribution 4.0 International发布。
尝试该模型的最简单方法是使用提供的Magenta_RT_Demo.ipynb Colab 笔记本。
设置大约需要十分钟,但是一旦运行了前几个单元,您就可以开始与其进行如下交互:
通过VB
原文: https://simonwillison.net/2025/Jun/20/magenta-realtime/#atom-everything