Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
  • Product Hunt
  • Visual Capitalist
  • Elon Musk
Menu

混合人工智能刚刚在桥牌比赛中击败了八位世界冠军,并解释了它是如何做到的

Posted on 2022-04-03
AI击败桥牌世界冠军

桥牌冠军莎朗·奥斯伯格曾写道:“打桥牌就像经营一家企业。这是关于狩猎、追逐、细微差别、欺骗、奖励、危险、合作,以及在美好的一天,胜利。”

虽然国际象棋很久以前就落入了计算数字的超级计算机手中,这不足为奇,但您会期望人类在桥牌中保持更加无懈可击的优势,这是一种信息不完整、合作和狡猾交流的游戏。几千年来,我们的大脑已经进化到可以阅读微妙的面部表情和肢体语言。我们已经组建了庞大的社会,依赖于数百万人的竞争与合作。这些技能肯定是机器无法达到的吗?

目前,是的。但也许不是永远。近年来,最先进的人工智能已经开始侵占我们最引以为豪的一些领域。在信息有限的不确定世界中导航的能力,游戏是无限细微的,没有人能单独成功。

上周,法国初创公司NukkAI又迈出了一步,其 NooK 桥牌 AI 在巴黎举行的比赛中击败了八位桥牌世界冠军。

游戏被简化了,NooK 并没有与人类玩家完全正面交锋——更多内容见下文——但算法的表现在其他方面非常出色。值得注意的是,NooK 是一种混合算法,将符号(或基于规则的)人工智能与当今主流的深度学习方法相结合。此外,与纯粹的深度学习同行相比,NooK 更加透明并且可以解释其行为。

伦敦帝国理工学院机器学习教授斯蒂芬·马格尔顿告诉《卫报》:“我们所看到的代表了人工智能系统状态的根本性重要进步。 ”换句话说,对于一台冷酷的计算计算机来说还算不错。

黑盒、白盒

为了玩桥牌,这可能是 AI 解决的最具挑战性的纸牌或棋盘游戏,NukkAI 团队将深度强化学习与符号 AI 相结合,这是 90 年代 IBM 的深蓝在国际象棋中击败 Garry Kasparov 的著名方法。

深度强化学习算法由相互连接的人工神经元网络组成。为了学习一个游戏,一个算法自己玩了数十亿次,在每一轮之后评估它的性能,并通过调整和重新调整它的神经连接来逐步改进,直到它最终掌握游戏。

另一方面,符号人工智能是基于规则的。软件工程师对 AI 成功所需的规则进行硬编码。例如,主教可以在棋盘上沿对角线移动任意数量的方格,或者如果对手采用特定策略,则采用一些反策略会增加获胜的机会。这种方法对于有限的人来说很好,但是随着复杂游戏中所有可能移动的空间增加,它变得站不住脚。

这就是为什么 2016 年围棋世界冠军李世石被 DeepMind 的 AlphaGo 击败是一件大事。当时,专家们没想到人工智能会在十年内击败顶级围棋选手。与“老式人工智能”相比,AlphaGo 展示了深度学习的惊人力量。

但是深度学习有它的缺点。其中之一是它是一个“黑匣子”。神经网络中的数十亿个节点如何完成任何给定的任务是个谜。

AlphaGo 对李世石的第 37步是人类不会做出的选择——它计算出专业人士选择这一步的几率为万分之一——但它还是做出了这一步,并获胜了。尽管如此,该算法仍无法解释其训练中的哪些因素影响了它的信心。当赌注高于棋盘游戏时,这种不透明性是一个问题。要相信自动驾驶汽车或做出生死攸关的决定和诊断的医学算法,我们需要了解它们的基本原理。

由 NukkAI 等研究人员倡导的一种潜在解决方案将深度学习和符号 AI 结合在一起,在所谓的“神经符号”方法中利用各自的优势。

例如,NooK 首先学习游戏规则,然后通过玩来提高技能。这种组合改进了算法的概率“大脑”,Muggleton告诉《每日电讯报》 ,它超越了统计数据。 他说,NooK 使用“背景知识,就像我们利用书本和以往经验中的信息来增强我们自己的学习一样”。因此,该算法可以解释决策:它是一个“白盒”人工智能。

这就是为什么桥牌——一种抵抗人工智能征服的沟通和策略游戏——是对这种方法的一个很好的考验。 “在桥牌上,如果你不解释,你就不能玩,”NukkAI 联合创始人 Véronique Ventos 告诉卫报。

那里有打桥牌的算法,但它们与最优秀的人类相比是遥遥无期的。在一周多前的 NukkAI 的巴黎比赛中,情况似乎发生了变化。

娱乐和游戏

NukkAI 挑战赛让 NooK 与八位桥牌世界冠军展开较量。

每个冠军打了十盘十局,而 NooK 打了 80 盘十局,即 800 连发。人类和人工智能不是互相比赛,而是用相同的手对抗相同的对手,一对桥接机器人(不是 NukkAI 制造的),称为 Wbridge5。

桥牌游戏开始时,玩家竞标他们认为自己可以赢的技巧或回合数。出价最高的称为合约,谁定的就是庄家。庄家的搭档,或明手,将手朝上放在桌子上,然后退出游戏。庄家现在用双手对抗他们的对手,并试图赢得足够的墩数来满足他们的叫价。

NukkAI 挑战赛取消了叫牌以简化比赛,人类和 NooK 在每场比赛中都扮演了庄家的角色,桥牌机器人对作为对手(或防守者)。 NooK 的分数与每个人类玩家的分数之间的差异是在每组中平均的。 NooK 在 80 场比赛中以 67 场或 83% 的成绩击败了对手。

“这对人类来说非常绝望,”法国冠军托马斯贝西斯说。 “有时我们不明白为什么人工智能比我们玩得更好——但它确实如此。这非常令人沮丧。”

NooK 的胜利是一项令人印象深刻的壮举,但也有一些警告。跳过叫牌程序而只扮演庄家角色,消除了游戏中具有挑战性和细微差别的部分,在这些部分中,合作伙伴必须相互沟通并欺骗对手。此外,对于人类来说,保持专注于 100 只手是具有挑战性的,但对于计算机而言则不然。最后,NukkAI 的联合创始人 Jean-Baptiste Fantun 表示,他相信这台机器会赢得数千笔交易,但对它的前景并不乐观,超过 800 笔。换句话说,它玩得越多,获胜的几率就越大,因此,在这种情况下,连续玩很多手牌可能有助于 AI 将人类推到一边。

“所以就算是在桥上,还有其他的事情要解决。”范屯说道。 “我们面前还有一张路线图。”也就是说,说桥牌已经落入人工智能,就像国际象棋或围棋一样,太过分了。但人工智能在部分游戏中的得分超过了顶级人类玩家是 Fantun 地图上的一个关键里程碑。尽管像 OpenAI 的 GPT-3 等越来越大的 AI 算法继续给人留下深刻印象,但 NukkAI 在桥牌方面的表现可能会增加混合方法的论点。

接下来,他们必须证明 NooK 可以比赛并获胜——不需要免责声明。

图片来源: TATIANA / Unsplash


寻找保持领先变化步伐的方法?重新考虑什么是可能的。加入一个由 80 名高管组成的高度策划的独家团队,参加 Singularity 的旗舰高管项目 (EP),这是一个为期五天、完全沉浸式的领导力转型项目,颠覆了现有的思维方式。发现致力于为世界快速变化寻找解决方案的未来学家的新思维方式、工具集和网络。 单击此处了解更多信息并立即申请!

来源: https://singularityhub.com/2022/04/03/a-hybrid-ai-just-beat-eight-world-champions-at-bridge-and-explained-how-it-did-it/

发表回复 取消回复

要发表评论,您必须先登录。

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Bob Nystrom (1)
  • Joel on Software (1)
  • John Resig (1)
  • Matt Might's blog (3)
  • News Letter (166)
  • Philip Walton (1)
  • Pivotal (1)
  • Scott Hanselman's Blog (2)
  • Tom's blog (1)
  • 英文媒体 (33,076)
    • Ars Technica (2,150)
    • Daily Infographic (252)
    • Engadget (5,237)
    • Enonomist (77)
    • FlowingData (229)
    • Hacker News (773)
    • Hacker News Daily (283)
    • Hacker Noon (125)
    • Harvard Health (140)
    • KK – Cool Tools (184)
    • KK – Recomendo (233)
    • Make Use Of (158)
    • NASA Astronomy Picture (238)
    • Product Hunt (6,622)
    • Psyche (207)
    • Quanta Magazine (172)
    • Science current issue (460)
    • Sidebar (929)
    • Singularity HUB (253)
    • TechCrunch (8,231)
    • The Practical Developer (99)
    • The Verge (5,686)
    • Visual Capitalist (338)
  • 英文推特 (15,820)
    • Bill Gates (304)
    • Brett Winton (1,136)
    • Cathie Wood (271)
    • Durov's Channel (25)
    • Elon Musk (4,610)
    • GeekWire (2,679)
    • Hunter Walk (47)
    • Mark Gurman (958)
    • Naval (655)
    • Parag Agrawal (52)
    • Ray Dalio (925)
    • Riccardo Mori (15)
    • Steph Smith (1,964)
    • Tim Cook (158)
    • Vitalik Buterin (2,021)
  • 英文独立博客 (3,412)
    • A learning a day (296)
    • A Smart Bear (2)
    • AddyOsmani.com (10)
    • Adwyat Krishna (29)
    • Ahmad Shadeed (2)
    • Alex Turek (1)
    • All Poetry (1)
    • All That is Solid (49)
    • André Staltz (2)
    • arxivblog (34)
    • Astral Codex Ten (15)
    • Atoms vs Bits (24)
    • AVC (35)
    • Basic Apple Guy (38)
    • Ben Thompson (13)
    • Benedict Evans (7)
    • Blog – storytelling with data (36)
    • Built For Mars (10)
    • Caleb Porzio (1)
    • Cameron Sun (1)
    • Christian Heilmann (33)
    • Christopher C (3)
    • Chun Tian (binghe) (1)
    • Codrops (13)
    • Cold Takes (14)
    • Dan Luu (1)
    • Daniel Lemire's blog (44)
    • David Amos (19)
    • David Perell (6)
    • David Walsh Blog (33)
    • Derek Sivers (23)
    • Desvl (13)
    • Devon's Site (5)
    • Digital Inspiration (26)
    • DKB Blog (4)
    • Douglas Vaghetti (12)
    • dropsafe (52)
    • DSHR (36)
    • Dunk (5)
    • DYNOMIGHT (36)
    • eagereyes (5)
    • Endless Metrics (135)
    • Entitled Opinions (8)
    • Exception Not Found (5)
    • Experimental History (18)
    • Farnam Street (5)
    • Fed Guy (10)
    • Felix Krause (3)
    • Florent Crivello (2)
    • Free Mind (6)
    • Full Stack Economics (40)
    • Funny JS (2)
    • Future A16Z (47)
    • Glassnode Insights (49)
    • Human Who Codes (3)
    • Infographics – Cool Infographics (10)
    • Information is Beautiful (10)
    • Irrational Exuberance (35)
    • Jacob Kaplan-Moss (13)
    • Jakob Greenfeld (40)
    • James Sinclair (3)
    • Jason Fried (17)
    • Jeff Kaufman (161)
    • John's internet house (16)
    • Johnny Rodgers (4)
    • Julia Evans (19)
    • Julian.com (2)
    • Kalzumeus (1)
    • Kevin Cox (10)
    • Kevin Norman (3)
    • KK – The Technium (50)
    • Krishna (6)
    • Lee Robinson (5)
    • Lines and Colors (42)
    • Lyn Alden – Investment Strategy (3)
    • Martin Fowler (22)
    • More To That (11)
    • Morgan Housel (69)
    • My Super Secret Diary (28)
    • Naval Blog (2)
    • Neckar's New Money (70)
    • Nick Whitaker (4)
    • Nicky's New Shtuff (1)
    • nutcroft (8)
    • Paul Graham (2)
    • Paul Graham: Essays (2)
    • Penguin Random House (52)
    • Phoenix's island (1)
    • Prof Galloway (31)
    • Python Weekly (26)
    • Rachel (32)
    • Real Life (34)
    • Sasha (48)
    • Science & technology (115)
    • Sébastien Dubois (6)
    • Secretum Secretorum (11)
    • Seth's Blog (117)
    • Shu Ding (3)
    • SignalFire (8)
    • Simon Willison's Weblog (122)
    • Simons Foundation (78)
    • SLIME MOLD TIME MOLD (20)
    • Slyar Home (8)
    • Spencer Greenberg (10)
    • Stay SaaSy (8)
    • Stephen Malina (4)
    • Stephen Wolfram Writings (2)
    • Strange Loop Canon (20)
    • Stratechery (9)
    • Tech Notes (10)
    • The Commonplace (29)
    • The Generalist (2)
    • The Intrinsic Perspective (28)
    • The Latest in Hearing Health | HeardThat (7)
    • The Mad Ned Memo (2)
    • The Rabbit Hole (31)
    • TLDR Newsletter (81)
    • Tomasz Tunguz (86)
    • Tony Kulesa (2)
    • Troy Hunt (51)
    • Tychlog (1)
    • Uncharted Territories (48)
    • Visualising Data (9)
    • Weichen Liu (20)
    • What's New (51)
    • Works in Progress (1)
    • Workspaces (32)
    • Writing (7)
    • Xe's Blog (30)
    • xkcd.com (105)
    • Yihui Xie (11)
    • Zoran Jambor (11)
©2023 搞英语 → 看世界 | Design: Newspaperly WordPress Theme