Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

现在 AI 可以在 Stratego 和 Diplomacy 上战胜你

Posted on 2022-12-02

虽然人工智能很久以前就在国际象棋和最近的围棋方面超越了人类—— 让我们不要忘记毁灭战士——其他更复杂的棋盘游戏仍然对计算机系统构成挑战。直到最近,Stratego 和 Diplomacy 还是其中的两款游戏,但现在 AI 已经成为擅长前者的翻桌游戏和擅长后者的人类。

从表面上看,您可能认为这只是因为这些游戏需要一定程度的长期规划和策略。但围棋和国际象棋也是如此,只是方式不同。

关键区别实际上是 Stratego 和 Diplomacy 是基于不完全信息的策略游戏。在国际象棋和围棋中,您可以看到棋盘上的每一个棋子。 Stratego 会隐藏棋子的身份,直到它们遇到另一个棋子,而 Diplomacy 主要是关于建立协议、联盟,当然还有仇杀,这些都是保密的,但却是游戏玩法的核心。任何诚实的国际象棋游戏都不会涉及第三方突袭以用蓝车保护对手的象。

这两款游戏都不需要对通往胜利的路径进行原始计算,而是需要更软的技能,比如猜测对手在想什么,以及他们认为计算机在想什么,并采取适应并有望推翻这些假设的行动。换句话说,它必须虚张声势并说服其他玩家相信某件事,而不仅仅是用最好的动作来压倒它。

来自 DeepMind 的 Stratego-playing 模型以著名的均衡命名为 DeepNash。它较少关注巧妙的动作,而更多地关注无法利用或预测的游戏。在某些情况下,这可能是大胆的,例如团队观看的一场与人类玩家的比赛,其中 AI 牺牲了几个高水平的棋子,使其处于物质劣势 – 但拿出其他玩家的大枪完全是经过计算的风险,因此它可以围绕这些制定战略。 (它赢了。)

DeepNash 足够好,它几乎每次都击败了其他 Stratego 系统,而且 84% 的时间都超过了有经验的人类。由于在围棋和国际象棋中运行良好的算法在这里并不适用,因此他们发明了一种称为正则化纳什动力学的新算法方法——但如果您想更深入地理解它,则必须阅读这篇论文。与此同时,这是一个带注释的游戏:

在外交方面,我们有一个来自 Meta 和 CSAIL 的名为 Cicero(啊,狂妄自大!)的 AI,它设法在人类水平上玩游戏——如果这听起来像是诅咒和微弱的赞美,记住外交对大多数人来说很难在人类水平上发挥作用。人们在游戏中做出的诡计、背后捅刀子、虚假承诺和一般马基雅维利滑稽动作的程度使得它被许多友好的游戏团体禁止。计算机真的有这种水平的恶作剧能力吗?

看起来是这样,使之成为可能的进步很有趣。毕竟,Diplomacy 有趣的部分不是世界地图和棋子,它们很容易阅读和评估,而是这些安排中潜在的计划潜力。威尼斯是在两条战线上受到威胁,还是正在通过蓄谋已久的大转变将西方战线引向包围圈?

不仅如此,为了参与策划,一个人必须与其他玩家交谈(或在线聊天)并让他们相信你的诚意和意图。这需要的不仅仅是 CPU 周期!

图片学分:元

西塞罗是这样工作的:

  1. 使用棋盘状态和当前对话,初步预测每个人将做什么。
  2. 使用计划完善该预测,然后使用这些预测为自己及其合作伙伴形成意图。
  3. 根据棋盘状态、对话及其意图生成多个候选消息。
  4. 过滤候选消息以减少废话,最大化价值,并确保与我们的意图一致。

然后,为你的情况辩护,并希望其他玩家没有计划你的死亡。

当在 webDiplomacy.net 上放松时,西塞罗在与对手的比赛中表现出色,在联盟 19 场比赛中排名第二,而且得分普遍超过其他对手。

这仍然是一项非常重要的工作——它可能会忘记它对别人说的话,或者犯其他人类可能不会犯的错误——但它具有竞争力是非常了不起的。

现在 AI 可以在 Stratego 和 Diplomacy 上战胜你by Devin Coldewey最初发表于TechCrunch

原文: https://techcrunch.com/2022/12/01/now-ai-can-outmaneuver-you-at-both-stratego-and-diplomacy/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme