Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

Clio:一个用于深入了解现实世界人工智能使用的隐私保护系统

Posted on 2024-12-13

Clio:一个用于深入了解现实世界人工智能使用的隐私保护系统

Anthropic 的新研究描述了他们为 Claude 的见解和观察而构建的名为 Clio 的系统,该系统试图提供有关最终用户如何使用 Claude 的见解,同时保护用户隐私。

这里有很多东西需要消化。摘要附有完整的论文以及对团队成员 Deep Ganguli、Esin Durmus、Miles McCain 和 Alex Tamkin 进行的 47 分钟 YouTube 采访。

Clio 背后的关键思想是获取用户对话并使用 Claude 进行总结、聚类,然后分析这些聚类 – 旨在确保在生成的聚类到达人眼之前很久就过滤掉任何私人或个人可识别的详细信息。

论文中的这张图有助于解释其工作原理:

显示对话聚类和隐私系统的图表:四列标记为“对话”(现实世界流量的随机样本)、“Facets”(私有化摘要和提取的元数据)、“初始集群”(相关属性组)和“层次集群” “(递归审核和分组的集群)。显示从有关系鞋带和 CSS 动画等主题的用户对话到隐私措施到“日常生活技能”、“编程任务”和“艺术与设计”等最终聚类类别的进展。包括显示集群关系的地图视图。

克劳德生成对话摘要,然后从该摘要中提取“方面”,旨在将数据私有化为语言和主题等简单特征。

这些方面用于创建初始集群(通过嵌入),并且这些集群被进一步过滤以删除任何太小的或可能包含私人信息的集群。目标是不存在代表少于 1,000 个底层个人用户的集群。

16:39 的视频中:

然后我们可以用它来了解,例如,克劳德是否同样有用,为用英语或西班牙语的人提供网络开发建议。或者我们可以了解人们通常寻求帮助的编程语言是什么。我们可以以真正保护隐私的方式完成所有这一切,因为我们远离底层对话,我们非常有信心我们可以以尊重用户期望我们提供的隐私精神的方式使用它。

然后在29:50 ,有一个关于 Anthropic 如何聘请人类注释者来提高 Claude 在特定领域的表现的有趣提示:

但我们可以做的一件事是我们可以查看拒绝率或信任和安全标记率较高的集群。然后我们可以看看这些,然后说,这显然是过度拒绝,这显然没问题。我们可以用它来关闭循环,然后说,好吧,这里有一些例子,我们想添加到我们的人类训练数据中,这样克劳德将来就不会拒绝这些主题。

重要的是,我们并没有利用实际的对话来减少克劳德的拒绝。相反,我们正在做的是我们正在研究这些主题,然后雇用人员在这些领域中生成数据并在这些领域中生成合成数据。

因此,我们能够利用 Claude 的用户活动来改善他们的体验,同时尊重他们的隐私。

根据 Clio 的说法,目前 Claude 的主要使用情况如下:

  1. 网络和移动应用程序开发 (10.4%)
  2. 内容创作与传播 (9.2%)
  3. 学术研究与写作 (7.2%)
  4. 教育与职业发展 (7.1%)
  5. 高级人工智能/机器学习应用 (6.0%)
  6. 业务战略与运营 (5.7%)
  7. 语言翻译 (4.5%)
  8. 开发运营和云基础设施 (3.9%)
  9. 数字营销和搜索引擎优化 (3.7%)
  10. 数据分析与可视化 (3.5%)

关于不同语言的使用差异,还有一些有趣的见解。例如,中文用户“写具有复杂情节和人物的犯罪、惊悚和悬疑小说”的比率是其他语言的基本比率的 4.4 倍。

标签:生成人工智能、人类、克劳德、伦理、隐私、人工智能、 LLMS 、嵌入

原文: https://simonwillison.net/2024/Dec/12/clio/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme