Meta 最新的 AI 公平基准测量更精细的偏差标记

d80b41d0-bdda-11ed-bfbc-bf6654b3eacb.cf。

作为一个没有明显地方口音的美国白人，我可以简单地假设现代消费技术——像虚拟助手这样的Siri、Alexa 或 Google 助理，以及我手机的摄像头——开箱即用。我认为这是因为，好吧，他们这样做了。那是因为设计和编程这些设备的书呆子绝大多数看起来和听起来都像我——即使更白一点。乡亲们他们皮肤中的黑色素更多和额外的吐舌头不要享受同样的特权。

明天的聊天机器人和视觉人工智能只会加剧这种偏见，除非今天采取措施确保这些系统的公平和公平行为的基准标准。为了解决这个问题，Meta AI 研究人员开发并发布了2021 年的休闲对话数据集，旨在“帮助研究人员评估他们的计算机视觉和音频模型在不同年龄、性别、明显肤色和环境照明条件下的准确性。”周四，该公司推出了 Casual Conversations v2，它承诺比其前身更精细的分类类别。

最初的 CC 数据集包括来自 3,000 多个付费对象的 45,000 个视频，涵盖年龄、性别、肤色和光照条件。这些视频旨在供其他 AI 研究人员使用，特别是那些使用 ChatGPT 等生成式 AI 或社交媒体过滤器和面部识别功能中使用的可视化 AI 的研究人员，以帮助他们确保无论用户看起来像什么，他们的创作都表现得一样Anya Taylor-Joy 或 Lupita Nyong’o，无论他们听起来像 Colin Firth 还是 Colin Quinn。

根据周二的公告，自 Casual Conversations 两年前首次亮相以来，Meta 一直在“与民权等领域的内部专家协商”，以扩展和改进数据集。人工智能研究中心主任Pascale Fung教授以及香港科技大学的其他研究人员参与了对政府和行业数据的文献回顾，以建立新的标注类别。

第 2 版现在包括 11 个类别（7 个自我报告和 4 个研究人员注释）和 26,467 个视频独白，由来自七个国家（巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国）的近 5,600 名受试者录制。虽然新数据集中没有那么多单独的视频，但它们的注释要多得多。正如 Meta 指出的那样，第一次迭代只有少数几个类别：“年龄、性别的三个子类别（女性、男性和其他）、明显的肤色和环境照明，”根据周四的博客文章。

“为了提高 AI 的非歧视性、公平性和安全性，在数据类别中拥有包容性数据和多样性非常重要，这样研究人员才能更好地评估特定模型或 AI 驱动的产品在不同人群中的效果，”Roy Austin， Meta 的副总裁兼民权副总法律顾问在新闻稿中说。 “这个数据集在确保我们构建的技术从一开始就考虑到所有人的公平性方面发挥着重要作用。”

与迄今为止的大多数公共 AI 研究一样，Meta 发布了 Casual Conversations v2 作为开源数据集供任何人使用和扩展——可能包括诸如“残疾、口音、方言、位置和录音设置， ”正如该公司周四暗示的那样。

本文最初出现在 Engadget 上，网址为 https://ift.tt/Yp2N01t

原文： https://www.engadget.com/metas-newest-ai-fairness-benchmark-measures-even-more-granular-bias-markers-140043320.html?src=rss