首页 -- >> 新闻频道-- >> 国际-- >> 国际新闻
APP下载

探秘:人工智能是如何击败人类称霸德州扑克的?

发布时间:2017-12-20 11:22 来源:环球网 作者:心月

  【环球网智能12月20日报道 记者心月】掌握你的面部表情,选择什么时候虚张声势,什么时候举牌——扑克游戏不仅仅是靠运气,更是一种技巧和战术的游戏。然而在人工智能面前,再高明的玩家也会感到自己战术的不足。

  在《科学》杂志上发表的一篇研究报告中显示,美国卡内基梅隆大学的研究人员详细介绍了他们的AI如何通过将游戏分解为可计算的可控部分来实现超人的表现,并根据对手的游戏情况,找到其潜在的弱点制定相应的竞争战略。

  熟悉AI领域的人都清楚,该程序已经在跳棋、棋牌和围棋中击败了人类中的顶级人物,但所有的游戏都是一种能看到对手棋路的情形。相比之下,扑克玩家则不同,他们需要面对不同的情况,需要与隐藏的信息进行对抗,也不清楚对手实力如何,是否在虚张声势。

  在上个月举行的单挑无限注德州扑克人机对战中,由卡耐基梅隆大学研发的AI程序Libratus以每100手14倍大盲(缩写为14bb/100,意为玩100手牌,平均能赢对手14倍大盲注)完胜世界级人类玩家团队,震惊所有在场人员。

  比赛共打12万手,最后Libratus赢得了1,776,250个筹码,近90个买入。虽然人类玩家输惨了,但幸运的是他们并不需要真的自掏腰包把输掉的钱给赢家Libratus(虽然他们来参加这场对战也需缴纳费用)。

  Libratus是“AI扑克界的圣杯”,CMU博士Noam Brown这样评价道。Libratus由 Noam Brown和 CMU教授Tuomas Sandholm共同研发,并且是CMU这一系列扑克机器人里面最新的一款。此前,还没有任何机器人能在单挑无限注德州扑克中打败世界级人类选手。

  在Brown看来,Libratus尚有很大发展空间:“从理论上来讲,升级版Libratus能达到50bb/100”(即升级后的Libratus每100手能赢人类对手50倍大盲,也就是还有3.5倍的潜力可挖)。

  Libratus主要包括三个主要模块,其中第一个模块可以计算出比游戏中的所有可能的决策点(大约10乘以161倍)都更小且更容易解决的游戏。

  在游戏的最后一轮,第二个模块根据游戏的状态构建一个新的,更精细的抽象。

  第三个模块旨在随着竞争的进行而改进蓝图战略。通常,AI使用机器学习来发现对手策略中的错误然后在游戏的过程中利用它们。

  但是,如果对手转移战略,那么这也会使AI得到进一步开发。

  相反,Libratus的“自我改进模块”会分析对手的赌注大小,以检测Libratus蓝图战略中的潜在漏洞。

  Libratus然后添加这些缺少的决策分支,为他们提供计算策略,并将其添加到蓝图中。

  除了击败人类职业选手之外,Libratus还针对之前最好的扑克AI选手进行评估。其中包括由Sandholm和Brown开发的bot Tartanian8,它赢得了与人工智能年会高级协会联合举办的2016年度电脑扑克大赛。

  “我们开发的技术在很大程度上是独立于域的,因此可以应用于其他战略性的不完美信息交互,包括非娱乐应用。”Sandholm和Brown总结道,“由于现实世界战略互动中隐藏的信息无处不在,我们相信Libratus中引入的范例将对人工智能的未来发展和广泛应用至关重要。”

来源:环球网

【责任编辑:杨奕钊】
相关文章
你可能还喜欢看
中青在线版权与免责声明
图片阅读更多>>