Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

人工智能先驱宣布成立非营利组织,开发“诚实”人工智能

Posted on 2025-06-04

ai_64.png

人工智能先驱、图灵奖得主约书亚·本吉奥(Yoshua Bengio)发起了一项耗资3000万美元的非营利组织,旨在开发“诚实”的人工智能系统,以检测并防止自主代理的欺骗性或有害行为。《卫报》报道:被誉为人工智能“教父”之一的著名计算机科学家约书亚·本吉奥将担任LawZero的总裁。LawZero致力于安全设计这项引发了万亿美元军备竞赛的尖端技术。本吉奥在约3000万美元的资助下,组建了十几位研究人员,正在开发一个名为“科学家人工智能”(Scientist AI)的系统,该系统将充当护栏,防止人工智能代理(无需人工干预即可执行任务)表现出欺骗性或自我保护行为,例如试图避免被关闭。他将目前的人工智能代理描述为试图模仿人类并取悦用户的“演员”,并表示“科学家人工智能”系统将更像是一位能够理解和预测不良行为的“心理学家”。“我们希望构建诚实而非欺骗性的人工智能,”本吉奥说道。他补充道:“理论上,可以想象出一些没有自我、没有目标、纯粹是知识机器的机器——就像一位博学多识的科学家。” 然而,与目前的生成式人工智能工具不同,本吉奥的系统不会给出明确的答案,而是给出答案是否正确的概率。“它有一种谦逊的感觉,因为它不确定答案,”他说道。与人工智能代理一起部署时,本吉奥的模型会标记自主系统的潜在有害行为——评估其行为造成伤害的概率。科学家人工智能将“预测代理行为导致伤害的概率”,如果该概率超过某个阈值,该代理提出的行动将被阻止。 “关键在于证明该方法论,这样我们才能说服捐助者、政府或人工智能实验室投入所需的资源,使其训练规模与当前前沿人工智能相同。护栏人工智能至少要与它试图监控的人工智能代理一样智能,这一点至关重要。”他说道。

twitter_icon_large.png facebook_icon_large.png

在 Slashdot 上阅读更多内容。

原文: https://slashdot.org/story/25/06/03/2149233/ai-pioneer-announces-non-profit-to-develop-honest-ai?utm_source=rss1.0mainlinkanon&utm_medium=feed

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • Elad Gil
  • Ellie Huxtable
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme