资讯正文

Facebook成功打破纸牌游戏Hanabi的AI体系得分纪录

放大字体  缩小字体 2019-12-11 01:29:23  阅读:3414 来源:雷锋网 作者:责任编辑NO。魏云龙0298

据外媒Venture Beat报导,Facebook人工智能研讨院(Facebook AI Research,FAIR)称,他们推出了一个与纸牌游戏Hanabi相关的最新...

据外媒Venture Beat报导,Facebook人工智能研讨院(Facebook AI Research,FAIR)称,他们推出了一个与纸牌游戏Hanabi相关的最新AI项目。AI体系的得分是24.61分(满分为25分),而之前最好的体系得分是23.92分。

本年2月,来自Google、DeepMind、卡内基梅隆大学和牛津大学的研讨人员提出了Hanabi基准,并提出了更多的人工智能能够玩这个游戏,以完成“人工智能研讨的新应战”。参加该项意图研讨人员以为,弄清楚怎样玩好Hanabi,这关于人工智能来说可能是一个严重前进,而且有助于其在聊天和无人驾驶等运用场景中与人类进行愈加流通的互动。

与国际象棋或围棋这些AI应战人类的其他游戏不同,Hanabi是一种协作游戏,参加者能够一起尽力,朝着一个一起的方针尽力。这款游戏最大的特色在于,牌是向着他人握的,玩家看不见自己的牌,但一切其他人都看得见。咱们的方针是下牌到桌面上让五种颜色的牌都顺着从1到5摆放出来。

从前宣布过相关论文的牛津大学研讨员Jakob Foerster说,“Hanabi是一个关于交流和协作的游戏,人工智能现在还没有深化这一游戏范畴。”

“其间一件十分令人兴奋的工作是,咱们所调查到的改善,与经过深度强化学习所调查到的改善,是彻底正交的:你能够在任何战略之上加上这个,作用会愈加强壮。”Facebook AI研讨员Noam Brown在电话采访中这样告知VentureBeat。“咱们正真看到的成果远远超出了咱们或其他研讨人员的预期。实际上,咱们从查找中取得的优点,要强于曩昔运用的一切深度强化学习算法所取得的优点。”

据了解, 这次Facebook的Hanabi AI项目学习了Pluribus的一些查找技能,Pluribus是Facebook于本年早些时候推出的一款玩扑克的AI,打败了一些人类冠军。

报导称,Facebook的AI团队经过将查找技能与深度强化学习结合起来完成了这一豪举。查找算法把一个署理之外的一切署理履行商定的战略将问题转换为单个署理设置,这是一种被称为“蓝图”(blueprint)的强化学习算法。依据一篇题为“经过在协作部分可调查的游戏中查找来改善战略”的论文,这一算法答应查找署理“将其他署理的已知战略作为环境的一部分做处理,并根据其他行为来保护对躲藏信息的信仰。”