
在围棋板上放大/围棋棋子和规则手册。 (信用: 盖蒂图片社)
在深度学习 AI 的世界里,古老的棋盘游戏围棋大行其道。直到 2016 年,最优秀的人类围棋选手仍然可以击败最强的围棋 AI。 DeepMind 的AlphaGo改变了这种情况,它使用深度学习神经网络在人类无法匹敌的水平上自学游戏。最近, KataGo作为一种开源围棋 AI 变得流行,它可以击败顶级的人类围棋选手。
上周,一组人工智能研究人员发表了一篇论文,概述了一种利用 KataGo 盲点的对抗性技术击败 KataGo 的方法。通过在 KataGo 的训练集之外下出意想不到的动作,一个弱得多的对抗性围棋程序(业余人类可以击败)可以诱使 KataGo 输掉比赛。
为了了解这一成就及其影响,我们采访了该论文的一位合著者,博士亚当格利夫。加州大学伯克利分校的候选人。 Gleave(与合著者 Tony Wang、Nora Belrose、Tom Tseng、Joseph Miller、Michael D. Dennis、Yawen Duan、Viktor Pogrebniak、Sergey Levine 和 Stuart Russell 一起)开发了人工智能研究人员所谓的“对抗性政策”。在这种情况下,研究人员的策略使用神经网络和树搜索方法(称为蒙特卡洛树搜索)的混合来寻找围棋走法。