连“石头剪刀布”,人类也玩不过AI了

内容速读:

人们普遍认可 “石头-剪刀-布” 三者之间的克制关系。在和 52 名人类玩家分别大战 300 回合之后,AI 击败了 95% 的玩家。在与 AI 对战之前,参与者知道获胜会获得金钱奖励,总分越高,赢的钱越多。在最悬殊的一场较量中,AI 获得了 198 次胜利,55 次平手,仅输了 47 次,胜率超过人类对手 4 倍。如果猜拳胜负真的是随机概率,那么从统计学的角度来讲,15600 场比赛下来,AI 获得如此大优势的概率非常低。

如果说有一种解决问题的方法能跨域文化、种族和地域,那么除了抽签这种纯靠运气的方式,恐怕只剩下猜拳了。
人们普遍认可 “石头-剪刀-布” 三者之间的克制关系。“公平+随机” 的特性使其不仅是活跃气氛的小游戏,更能作为一种相对公平的解决问题的手段,广泛应用在解决分歧,决定顺序,或者确定归属的关键时刻。

更不用说,在谁洗碗、谁拖地、谁做饭之类的家务活上,猜拳自带的 “愿赌服输” 可以有效维系家庭和睦,堪称随叫随到的家庭关系调解员。

在大多数人的认知里,猜拳是随机事件,玩家获胜的概率应该是一样的且恒定在三分之一,但事实可能并非如此。

近日,浙江大学何赛灵教授的研究团队开发了一个基于马尔可夫链的 AI 模型,专门用来玩猜拳游戏。在和 52 名人类玩家分别大战 300 回合之后,AI 击败了 95% 的玩家。

连“石头剪刀布”,人类也玩不过AI了

图 | AI 模型净胜场数变化

对于人类玩家来说,规则是赢 +2 分,平 +1 分,输不得分。在与 AI 对战之前,参与者知道获胜会获得金钱奖励,总分越高,赢的钱越多。因此玩家故意放水或者随便乱选的概率极低。

即便如此,AI 仍然大胜人类。在最悬殊的一场较量中,AI 获得了 198 次胜利,55 次平手,仅输了 47 次,胜率超过人类对手 4 倍。全部 15600 回合详尽的原始博弈数据,在论文的补充资料中给出(详见参考文献)。
如果猜拳胜负真的是随机概率,那么从统计学的角度来讲,15600 场比赛下来,AI 获得如此大优势的概率非常低。

拥有“智囊团”的Multi-AI模型

本质上来看,猜拳属于博弈问题,其背后蕴藏着经典的纳什均衡,而每个个体的习惯、认知、策略和策略变化都会影响实际胜率。比如你和对手很熟悉,那么你可能知道他/她经常出布,因此可以多出剪刀来克制。

浙江大学何赛灵教授团队提出的 AI 模型就是利用了类似的方法,证明了猜拳真的存在针对不同个体的长期制胜策略,可以有效提高胜率。
这套 AI 模型基于 n-阶马尔可夫链设计,拥有记忆性,能够向前追溯最多 n 个历史状态并加以利用。
为了在实战中应对人类玩家的不同性格和策略,研究团队还发明了一套 Multi-AI 模型。
“建立对每个人都有效的单一模型很困难,因此我们决定将单个模型结合起来,使其能够区分和适应更多不同的竞争策略。” 研究人员在论文中解释称。
在与人类对战的第一 Multi-AI 模型中,他们放入了 1-5 阶马尔可夫链,即 5 个独立的 AI 模型,分别参考之前 1-5 个动作。Multi-AI 会从整体上参考 5 个 AI 模型各自的决策,至于选择哪个,还要看它们最近 5 次的表现。
这里的 “最近 5 次” 被定义为一个超参数,名为 Focus length,可以视情况调整大小,实现进一步优化。在与人类对战的第二套 Multi-AI 模型中,该参数就被设为了 10。

连“石头剪刀布”,人类也玩不过AI了

图 | Multi-AI 模型的决策逻辑
打个比方,每一个 n 阶马尔可夫链模型就像是一位军师,各自有不同的决策标准。而 Multi-AI 模型就是司令,手底下有好多名军师组成的智囊团。做决策时,每个军师会提交自己的出拳建议,司令会根据他们过去几次(Focus Length)的表现,采纳综合分数最高的人的建议,以提高长期胜率。
如果人类玩家连续胜利,就会促使 Multi-AI 转向选择其他 AI 模型的更优解。如果人类玩家连续失败,大概率会转换策略,或者打破之前的出拳规律,这时 Multi-AI 也可以随之调整。
最终的社会实验结果反映出了这个想法的有效性。在 52 名志愿者中,只有不到 5 人击败了 AI。很多人都在最初 20-50 个回合里处于领先,但随后就被 AI 捕捉到了隐藏的行为模式,饮恨败北。
那些击败 AI 的人,胜率也只是稍微高出一些,并未拉开太大差距。

6 年前被质疑的研究

值得一提的是,在开发 AI 模型背后的算法,研究团队阅读了 6 年前另一个浙大团队的研究成果,但使用了另一种不同的博弈策略。
相较于之前对于所有玩家数据整体以统计学的方式进行研究,这里的 Multi-AI 模型更强调针对不同玩家之间的个性差异、出拳策略,来及时的进行调控,选取当下最适宜的博弈策略。
2014 年 5 月,很多媒体都报道了一项以 “石头剪刀布” 游戏为对象的科研成果。

这项研究课题原本是 “可控实验社会博弈系统中一些非平衡统计物理问题”,但媒体和舆论关注的重点大多是 “如何提高猜拳胜率”,因此还被质疑是浪费经费。

其实不然。这项研究还被《麻省理工科技评论》评为 2014 年最佳成果(预印本)之一。

连“石头剪刀布”,人类也玩不过AI了

图 | 2014 年《麻省理工科技评论》的报道
论文揭示了猜拳游戏背后蕴藏着不同的行为模式,比如赢家倾向于下一轮出同样的手势,而输家倾向于改变;人们更愿意出石头等等。但更深层的主旨是探讨纳什均衡在真实博弈中是否成立,研究现实中的博弈模型框架,并且分析游戏中的宏观周期现象与微观行为基础。这其中用到的基础理论涉猎博弈论、心理学和神经科学等多个领域。
类似的,2020 年这项关于 “石头剪刀布” 的最新研究,成果不仅仅是一个很厉害的猜拳 AI,还是一个很厉害的循环制衡模型分析师。未来有望拓展到其他博弈场景,比如预测竞争对手的下一步举动,规划更有效的竞选策略,或者制定更有利的定价方案等等。

“(我们发现)人类的竞争行为确实有规律可循,通过使用适当的简单模型就能利用这些规律,”研究人员在论文中总结道,“对于竞争行为模式以及如何利用它们的研究,有望让我们更好地建模,预测和适应不同的竞争模式。”

相关推荐

炉石传说:迷你拓展打脸期待,玩家无奈,这环境有啥意思?

炉石传说小拓展包“暗月竞速赛”已经上线快一周了,本来设计师和玩家们指望的是能够为暗月马戏团的环境注入活力和变化,结果上线的结果却打了所有人的脸:25张新卡中只有一小部分加入了标准的构筑,整个环境也迅速僵化,几乎要演变成“石头剪刀布”的态势。目前来看,如果这套卡组不削弱,势必对标准环境产生极大影响。而...

新老野王对决,这个新晋野王让韩涵都吃瘪,或成梦之队的最大对手

回顾拉风队和TUT的对决,那真的是看点多多,可以说是新老野王的对决了,韩涵和昧昧。果真如此,现在昧昧,不简单啊,拉风队的绝对核心,让韩涵都吃瘪的人。当昧昧拿出招牌镜之后,韩涵的澜可是被完美压制了,能够在韩涵身上占到便宜,昧昧也是对得起新晋野王的称号了。如今拉风队势头正猛,或许会成为梦之队的最大对手,...

公认史上最“丑”七款皮肤,廉颇第二,网友:第一是男人绝对不买

被玩家公认为史上最“丑”的七款皮肤,廉颇的“地狱岩魂”勉强排第二,网友:第一,是个男人绝对不会买!不过这款战令1级的皮肤是真的“丑”,石头人就算了,连身体和头都“绿”了。第一款:吕布“野性能量”这款皮肤虽然便宜只要6元,但是网友们却表示:是个男人都不会买它!

皇室战争:为何石头人玩家抱怨?它们是最大天敌,想上分太难

很多卡组玩家都会哭弱,看似抱怨卡牌强度不够,实则是在希望设计师能够给些关怀。不过有些卡组似乎是真的版本逆风,比如最近很多石头人玩家深感无力。随着环境的调整和各种天敌的出现,石头人卡组已经明显没有了当年的风采。那么到底哪些卡牌克制石头人呢?只需要3费就能够让8费的卡牌失去作用,从效果上来说就已经让很多...

冒泡赛大舅子太惨!KT连禁带抢7个AD,Smeb还补了石头人

前言:由于越南赛区不参加S10,原本的24张门票变为22张,LCK三号种子也不用去打入围赛了,LOL全部赛区夏季赛都已经结束,21张门票已经确定,最后一张没确定的是LCK三号种子,他们将通过3天的冒泡赛决出最后一个名额,AF、KT、T1、GEN四进一,第一轮冒泡赛由AF对阵KT,第一场KT上来就很有...

梦幻西游:人品爆炸的一天!连拿9颗附魔宝珠,老王笑得合不拢嘴

石头工毅39:小毅合成附魔提取机,制作附魔书的神器!梦幻西游里,帮战周的周一、周三都可以开帮派迷宫,在非帮战周的周五也能额外再开一次。迷宫之主在结束后会获得一个祈愿宝箱,其中附魔宝珠和高级兽决的箱子经验奖励是最高的!这天,老王弄了11个箱子开附魔宝珠、灵饰晶石,想试试手气如何。不然无缘附魔宝珠DNF...

石头工毅37:我合成了全自动钓鱼机,只要有电就能钓鱼!

视频加载中...167联武神坛小组赛第二场,成也谛听败也谛听,钓鱼岛惜败紫禁城167联武神坛小组赛第二场,成也谛听败也谛听,钓鱼岛惜败紫禁城比官方手段还管用!国外大神设计PUBG假外挂钓鱼 网友:舒服了石头工毅37:我合成了全自动钓鱼机,只要有点就能钓鱼!《终极钓鱼模拟器》新追加DLC推出!本篇更新...

英雄联盟:熔岩巨兽不如熔岩巨羊,羊头人到底比石头人强在哪儿

为什么不如熔岩巨羊呢?好了,我们直接进入正题,对这个英雄感兴趣起源于某次集锦里letme奥恩满血单杀大虫子(好像是),看不懂的技能机制和连招让我一度产生兴趣;这里也很感谢@Vivela大胖脸的信息提供嗷,大部分内容都是他告诉我的。奥恩通常和什么词联系在一起呢?凭借着一手毫不讲理的抗压手段和团战无脑冲...

回归侏罗纪!《方舟:生存进化》手游"盘中餐"人类挑战恐龙霸主

作为人类的一员,小编深深的感受到了人类最强大的并不是肉体,而是那不断前进的思想与科学。远古时期的人类只不过会使用木棍和石头打猎而已,而现在的人类早已形成大型养殖场,连打猎都不需要就能够提供自己的食物需求了。对于这样的进化历程,沙盒手游《方舟:生存进化》手游就完美的展示了,在《方舟:生存进化》手游中,...

势头正盛?两大强势打野的对决

虽然前期联赛刚开始遭遇了一波连跪,但是最近选手状态找回来了,在最近三场比赛中都取得了胜利。而BLG这边目前成绩2胜5负,排名第13。虽然在上场比赛中1-2输给了IG,但是可以看出选手状态都还可以,特别是打野国豪,状态是十分的好。从双方交手记录来看,OMG略胜一筹,但本场比赛我更看好BLG。

DNF:剑魔的大又白回来了,红眼啥时能摆脱石油大王的称号

DNF的和谐是个永不过时的老传统了,从以前的红眼,到后来的血法,最后所有的女性NPC都加了一层布料,甚至连三觉动画都给你和谐了,比如剑魔,再比如女柔道。最近更新之后,剑魔喜迎“大”加强,本来剑魔三觉实装到国服后是经过和谐的,好好的大白兔不给你看了,当时国服更新三觉的时候,不知道多少剑魔玩家伤心欲绝。...

韩服大爹!宁王重回下路,原来你才是IG最强AD

虽然目前IG战队势头正猛一路高歌,但是前段时间却表现十分挣扎,连季后赛都有点危险。少关注赛场外信息,专心投入到成绩上后的IG队员真的猛。难道IG战队的选手都很喜欢玩ad?试想一下,如果IG最后一场收官战不影响战绩的情况下,IG对VG会不会来个全队大换位,比如宝蓝上,ningAD,shy中,RK打野 ...

“吃鸡”游戏不会压枪怎么办?教你三招,让“吃鸡”变得更容易

最近势头正火的手游“吃鸡”游戏自开发以来,其操作方法就让很多玩家受到了困扰,尤其是习惯了电脑游戏的朋友们。常常连最基础的压枪都做不好,今天就来教你几招,让“吃鸡”变得更容易。“吃鸡”也就变得很容易了。

山海镜花:端午节活动收益

本文作者:NGA-wwwxk2019一天刷30次第五关,40%的加成拿满,可以拿到2100分,也就是6体换70分,6体等价于8.1万经验,等于6龙玉,等于7500金币。因此商店中120分十万经验和140分三星狗粮略亏,其他经验金币还有1280分的四星狗粮都赚。灵器强化石头和冲灵材料不换的情况下,每天...

LOL-LPL:“教主”韦鲁斯后期团战输出爆炸,RW 2:1送给RNG三连败

北京时间4月11日,LPL春季赛第六周的赛程进入尾声,第三场比赛为RNG对阵RW。装备成型的佐伊和韦鲁斯凭借poke伤害先后秒杀赛娜和石头人,皇子无压力击杀第二只先锋,作为交换瑟提控下火龙。中期RW全部外塔告破,自家两片野区毫无视野,RNG顺利收获三条小龙。开局RW入侵RNG蓝buff野区,塞......

盒子游戏,游戏玩家专属个性阅读社区


©CopyRight 2010- 2020 BOXUU.COM Inc All Rights Reserved

鄂公网安备 35020302000061号- 鄂ICP备2020015574号-1