公众号:环球解密(点击复制)微信
当前位置: 未解之谜网 > 未解之谜 > 人工智慧刚打败了世界上最顶尖的扑克牌玩家们,吓唬能力超强!

人工智慧刚打败了世界上最顶尖的扑克牌玩家们,吓唬能力超强!

2017-2-7 未解之谜网

必须要知道什么时候盖牌。

4名世界顶尖职业扑克牌游戏玩家在一场盛大的20天竞赛中被彻底打败,因为一套人工智慧(artificial intelligence,AI)系统在掌控无限下注的德州扑克(no-limit Texas Hold’em)12万副牌之后,赢得巨大胜利。

这套人工智慧,称为Libratus,在比赛结束时赢了人类玩家将近180万美元的筹码。对仅仅两年前来说,这是一个鲜明的对比,当时一套不同的程式只是在设法与4名人类职业玩家达到技术上的平手。在2017年的复赛,人类甚至连一点机会都没有。

由卡内基美隆大学(Carnegie Mellon University,CMU)的电脑科学家所开发的Libratus,紧跟在之前比赛胜过人类的人工智慧之后,像是谷歌(Google)的DeepMind,拥有一些世界上最杰出的围棋冠军。

但是学习扑克牌游戏是更微妙的,就心理领域而言,是能够精通吓唬对手的艺术,同时还察觉他们的暗示,显示惊人复杂的人工智慧正在挑战成功依靠的不仅仅是精通牌桌上的规则。

卡内基美隆大学的电脑科学主管法兰克‧普芬宁(Frank Pfenning)说:如果电脑无法做到吓唬,电脑就不能在扑克牌游戏获胜。

发展一套能够做到吓唬的人工智慧,在科学上是向前迈进的一大步,而且有许多的应用。想像一下,你的智慧型手机有一天能为你的新车洽谈到最好的价格;这只不过是刚开始而已。

Libratus的扑克牌战略是在比赛开始之前,磨练相当于1,500万小时的比赛玩法。人工智慧被安装在每秒执行1.35拍浮点运算( petaflop,1 peta = 1×1015)和274兆位元组(terabyte,1 tera = 1×1012)记忆体的超级电脑上。

这些规格意味着超级电脑的执行速度大约是高阶笔记型电脑的7,250倍,记忆体大约是17,500倍。

但是,人工智慧的杀手特色是向人类职业玩家学习,作为竞争的提升,并且当其他参赛者取得优势时,适应性地修补自己的战略和比赛风格。

首席研究员托马斯‧桑德霍姆(Tuomas Sandholm)说:每天比赛结束后,一个整合演算法(meta-algorithm)会分析这些职业玩家在Libratus的战略中所发现到和利用的漏洞。

然后,每天晚上利用超级电脑排出漏洞的优先顺序,并且在演算法上修补排名前3的漏洞。通常,研究人员发展演算法是要尝试利用对手的弱点。对照之下,每天在这里的改善是有关于在演算法上修补我们自己战略中的漏洞。

这种方法是成功的,即使它在人类对手之间造成一些绝望。他们不得不在20天的马拉松式比赛期间,不断地调整自己的战术。

比赛中途,职业玩家之一的Jimmy Chou说:这个机器人每天都在进步,它就像是我们更强大的版本。

Chou的竞争伙伴之一Dong Kim附和这些观点。

在比赛的第10天,他告诉连线杂志(Wired)的卡德‧梅茨(Cade Metz):我没有注意到它有多好,直到今天。

我觉得像是在跟一名正在作弊的人比赛,好像它可以看到我的牌,但我不会指控它作弊,它就是那么好。

您可以在下面的图表中看到Libratus的适应性如何有效率:

虽然人工智慧在比赛的前5天取得初步领先,但在第6天,所有参赛者的筹码大致相同。

但之后Libratus脱颖而出,在接下来9天筹码大幅增加大约1百万美元,而人类玩家一直处于不利地位而无法扳回局势。

现在,比赛结束了,卡内基美隆大学的研究人员表示将分享这项人工智慧的秘密,从本月人工智慧进展协会(Association for the Advancement of Artificial Intelligence)在旧金山举行的会议的简报开始。

预计学术论文讨论程式设计将在未来的几个月。

除了高风险的纸牌游戏世界,研究小组表示,Libratus的决策能力可能最终在商业谈判、网络安全、甚至医学治疗中发挥作用。

至于参赛者,尽管挫败,还不值得为这些职业玩家感觉太糟,因为他们每个人都会在这场比赛分享20万美元的共同奖金。

也就是说,他们或许不会想再和人工智慧玩20天的直接扑克(straight poker)。在比赛的最后一天,职业玩家之一的丹尼尔‧麦考利(Daniel McAulay)转向一名观众,提出一个可能是半开玩笑的问题。

他问:我要付你多少钱来玩最后50副牌?呃,这太残酷了。

共有491阅 / 0我要评论

发表你的评论吧返回顶部

!评论内容需包含中文


请勾选本项再提交评论