由RSS联合创始人埃卡特·沃尔瑟(Eckart Walther)领导的一个团队推出了一项新协议,旨在标准化和扩展用于人工智能训练的在线内容许可。在Reddit、Quora、雅虎和Medium等出版商的支持下,Real Simple Licensing(RSL)将robots.txt文件中的机器可读术语与一个集体权利组织相结合,旨在为人工智能训练数据带来类似美国作曲家、作家和作家协会(ASCAP)为音乐版税所做的贡献。然而,人工智能实验室是否会同意采用该协议仍有待观察。TechCrunch报道:据RSL联合创始人埃卡特·沃尔瑟(Eckart Walther,他也是RSS标准的共同创建者)称,该协议的目标是创建一个可以在整个互联网上扩展的训练数据许可系统。“我们需要为互联网制定机器可读的许可协议,”沃尔瑟告诉TechCrunch。“这正是RSL真正要解决的问题。”多年来,像数据集提供商联盟(Dataset Providers Alliance)这样的组织一直在推动更清晰的数据收集实践,但RSL是首次尝试建立技术和法律基础设施,使其能够付诸实践。在技术层面,RSL 协议规定了出版商可以为其内容设定的具体许可条款,这意味着人工智能公司需要定制许可,还是必须遵循知识共享协议的规定。参与的网站将以预先约定的格式将这些条款包含在其“robots.txt”文件中,以便轻松识别哪些数据属于哪些条款。在法律层面,RSL 团队成立了一个集体许可组织——RSL Collective,该组织可以协商条款并收取版税,类似于美国作曲家、作家和作家协会(ASCAP)之于音乐家或电影创作者协会(MPLC)之于电影。与音乐和电影领域一样,RSL Collective 的目标是为许可方提供一个支付版税的单一联系点,并为版权持有者提供一种同时与数十家潜在许可方设定条款的途径。许多网络出版商已经加入了该组织,包括雅虎、Reddit、Medium、O’Reilly Media、Ziff Davis(Mashable 和 Cnet 的所有者)、Internet Brands(WebMD 的所有者)、People Inc. 和 The Daily Beast。其他公司,例如 Fastly、Quora 和 Adweek,虽然没有加入该联盟,但都支持该标准。值得注意的是,RSL 联盟中有一些出版商已经签订了许可协议——其中最引人注目的是 Reddit,它每年从谷歌获得约 6000 万美元的培训数据使用费。没有什么可以阻止公司在 RSL 体系内自行签订许可协议,就像泰勒·斯威夫特可以设定特殊许可条款,同时仍然通过 ASCAP 收取版税一样。但对于那些规模太小而无法自行签订许可协议的出版商来说,RSL 的集体条款可能是唯一的选择。
在 Slashdot 上阅读更多内容。