目前在这个星球上使用 7,000 多种语言,Meta 似乎想要了解所有这些语言。六个月前,该公司启动了雄心勃勃的“不让语言落后” (NLLB)项目,训练人工智能在多种语言之间进行无缝翻译,而无需先通过英语。周三,该公司宣布了它的第一个重大成功,称为NLLB-200 。这是一个人工智能模型,可以说 200 种语言,包括来自亚洲和非洲的一些不太广泛使用的语言,如老挝语和坎巴语。
根据该公司周三发布的一篇博客文章,NLLB-200 可以翻译 55 种非洲语言并获得“高质量的结果”。 Meta 表示,该模型在 FLORES-101 基准测试中的表现平均超过现有最先进模型 44%,在某些非洲和印度方言中超过 70%。
事实证明,在任何两种给定语言之间进行翻译——尤其是在它们都不是英语的情况下——对人工智能语言模型来说是一个重大挑战,因为在某种程度上,这些翻译系统中的许多依赖于从互联网上抓取的书面数据来进行训练。如果您说出这句话的内容,超级容易做到,如果您正在寻找 Fan 或 Kikuyu 中的优质内容,则要困难得多。
与大多数其他公开推广的 AI 程序一样,Meta 决定开源 NLLB-200,并向非营利组织提供 200,000 美元的赠款,以开发该技术的实际应用程序。例如,Facebook News Feed 或 Instagram 等应用程序。 “想象一下,访问一个最喜欢的 Facebook 群组,看到一篇伊博语或卢干达语的帖子,只需点击一下按钮,就能用你自己的语言理解它,”Meta 帖子假设。您可以在 Meta 的演示网站上了解新模型的工作原理。
原文: https://www.engadget.com/meta-ai-translate-200-language-real-time-nllb-130023464.html?src=rss