Reddit 收集了过去 18 年来人类互动和对话的宝库,这个丰富的数据库一直是公司训练大型语言模型(也称为 AI 聊天机器人)的理想场所。现在,Reddit 想要分一杯羹,并将开始向公司收取 API 访问费用,这是培训法学硕士所必需的。
毕竟,这些不是使用 API 来训练 AI 聊天机器人的夫妻公司。谷歌和 OpenAI 等巨头使用 Reddit 帮助为新兴的人工智能服务提供初步指导。为此,Reddit 正在为第三方推出一个“新的高级接入点”,该公司在一份官方公告中表示。
定价仍然悬而未决,尽管 Reddit 已经确认它将被分成某种等级,可能会支持不同规模的公司。社交媒体平台提到各种使用限制和更广泛的使用权作为层级之间的区别点。
“Reddit 的数据语料库非常有价值,”Reddit 创始人兼首席执行官史蒂夫霍夫曼说, 告诉纽约时报. “但我们不需要将所有这些价值免费提供给世界上一些最大的公司。”
Reddit 远非唯一的在线信息存储库用于训练大型语言模型,就像数据抓取器一样普通抓取也是经常聊天机器人的导师。然而,Common Crawl 和相关服务交易的是原始数据,就像在线的大量信息一样,而 Reddit 则包含人与人之间的对话。一个全面的人工智能需要访问这两种类型的数据,以提高事实的准确性和类似人的行为。
Reddit 的应用程序接口 (API) 也经常用于创建和维护内容审核工具。该公司没有向内容审查员收取访问 API 的费用,而是以 iOS 和 Android 应用程序的形式创建专门的审查工具。这些应用程序将具有模组日志、规则管理工具、模组队列信息等功能。
为什么现在进行此更改?人工智能似乎在一夜之间从利基市场变成了大企业,谣言四起Reddit 计划在今年晚些时候上市.在进行首次公开募股时,建立新的收入来源从来都不是一个坏主意。
本文最初出现在 Engadget 上,网址为 https://ift.tt/2vGNHby