为了研究蜘蛛纸牌的规则,我玩了200局!

内容速读:

单人蜘蛛接龙是人们经常在电脑上在线或者离线玩的一款很受欢迎的游戏。蜘蛛纸牌中含有两套标准扑克牌玩家们一直在抱怨说不同的软件存在偏差。这一点也可以作为一个很好的练习,来看看一个人是如何使用在现实世界观察到的数据并配合统计学手段来判断一个假说是真的还是假的。基础知识从本文的角度出发,我们这里假设玩家在玩蜘蛛纸牌的时候不使用“撤销”“重来”“加步”,这样玩家就不用考虑计分、花费的时间以及移动的步数了。

认真阅读下面的文章,并思考文末互动提出的问题,严格按照 互动:你的答案格式在评论区留言,就有机会获得由机械工业出版提供的优质科普书籍《天才与算法》一本。

单人蜘蛛接龙(以下简称为“蜘蛛纸牌”)是人们经常在电脑上在线或者离线玩的一款很受欢迎的游戏。由名字可以看出,这个游戏是只有一个玩家的。游戏中一共有两套标准扑克牌,玩家需要按顺序把扑克牌排列成完整的八组(两套牌,各四种花色),从而进一步把它们从台面上消除。牌可以从牌组中提取或者按照特定规则从一列移动到另一列。我们这里不再详细地讨论游戏规则,假设我们的读者已经了解游戏的规则了。要是你需要回忆一下,可以看这里。在这里我们只讨论这个游戏的四组的版本。

为了研究蜘蛛纸牌的规则,我玩了200局!

蜘蛛纸牌中含有两套标准扑克牌

玩家们一直在抱怨说不同的软件存在偏差。具体来讲,就是如果程序探测到了玩家的胜率很高,它可能就暗中操纵后面的牌的次序来降低胜率。玩家本身也有可能被偏向从而发挥出最好水平。不过,通过一些基本的统计学手段,我们有可能对这种“偏向的指控”进行证实或者驳斥。这一点也可以作为一个很好的练习,来看看一个人是如何使用在现实世界观察到的数据并配合统计学手段来判断一个假说(比如“蜘蛛纸牌程序是有偏向性的”)是真的还是假的。

基础知识

从本文的角度出发,我们这里假设玩家在玩蜘蛛纸牌的时候不使用“撤销”“重来”“加步”(把游戏削减为一个简陋的初始版本),这样玩家就不用考虑计分、花费的时间以及移动的步数了。很多人都认为在这样的条件下游戏几乎赢不了,但是加州州立大学长滩分校的史蒂夫·布朗在他出色的著作《蜘蛛纸牌获胜策略》中给出了一些详细的策略,并且提到在306局游戏中可以取得48.7%的胜率。同时他也指出自己的玩法还不是完美的,那些专业玩家可以做得更好,甚至达到超过60%的胜率。我利用了布朗的这些策略进行了实验,结果表明确实能够达到超过48.7%的胜率。

理想情况下,电脑端蜘蛛纸牌游戏能够模拟真实情况下且洗牌充分的纸牌游戏。如果在游戏的任何一个节点,有 N 张牌还没被看过,那么每张牌都有 1/N 的可能性作为下一张翻面的牌出现(为了叙述的方便,我们忽略了具有相同花色和大小的纸牌之间的等价性)。举个例子,在起始位置我们知道有 10 张牌被亮了出来。因为总共的 104 张牌里一共有 8 张 K,所以单张亮出来的牌是 K 的概率是 8/104=1/13,因此亮出来的牌是 K 的期望张数是 10×1/13=10/13。如果在玩了相当多局数的游戏之后,我们发现亮出来K的数目平均下来接近 11/13,我们就有理由相信这款蜘蛛牌程序是有偏向性的。

测试数据

对于每一局游戏来说我们都希望记录一组能够反映牌运气好坏的数据,数值越高,证明获胜的几率越大。我们想到的一个方案是评估在一局绝对公平、无偏袒性的游戏里,这些测试数据的取值,再和我们怀疑可能存在偏向性的游戏中记录的数据值进行比较。

一旦最初的十张牌都确定下来,我们就能计算出“保证轮数(guaranteed turns,GT)”,即玩家在被迫更换至另一排之前能够确定亮出的牌的最少数目。无论何时,当新的一排的十张牌已经确定下来后,我们都可以做一个类似的计算,假装它是新的一局游戏的开始。这样一来我们就可以计算出GT的平均值(AGT)。如果几轮下来GT的值很小,那么玩家就要有麻烦了。要说明的是AGT和玩家本身无关,所以很容易通过进行很多次实验(即确定很多排)来模拟出AGT的概率分布。

经验来谈,如果卡牌的整体分布比较糟糕的时候,玩家同样会陷入麻烦。比如说有七张Q但是只有两张J没有打出来的时候,即使你有一列或者多列已经清空,仍然会有问题出现。因此在这里定义一个整体方差(total square variation,TSV),取值为相邻大小的牌的数目的负的平方之和。在刚才的例子里,七张 Q 和两张 J 在求和时会贡献出 -(7-2)2=-25 一项。这里取负值是为了确保 TSV 的增减性与获胜概率的增减性一致,就和AGT一样。每亮出一张新牌我们就计算一下TSV,这样我们可以算出来单局游戏的平均TSV(ATSV)。要提起注意的是ATSV同样与玩家无关,我们假定玩游戏的玩家会按照一个随机顺序把所有扣着的牌都亮出来(尽管玩家可以选择先亮哪张牌,但是亮出的每张牌概率是一样的)。幸运的是这一点可以通过模拟很容易就做到。

为了研究蜘蛛纸牌的规则,我玩了200局!

蜘蛛纸牌的典型散点图(○=获胜,×=落败)

一个典型的散点图如上图,这里蓝色圆圈和红色叉叉依次表示获胜和落败。

模拟结果显示对于没有偏袒的游戏程序而言,在大量局数的游戏之后,AGT应该等于3.96而ATSV应该等于-32.29。在下面这个示例的起始位置中,GT=1,TSV=-42,因为这局游戏还没结束,我们还不知道AGT和ATSV的值是多少。

为了研究蜘蛛纸牌的规则,我玩了200局!

示例,起始位置GT=1,TSV=-42

计算如下:

为了研究蜘蛛纸牌的规则,我玩了200局!

假设检验

为了检验一个蜘蛛纸牌游戏是不是有偏向性,我们采用一种叫假设检验的手段。我们先制定一个零假设(意思就是我们怀疑的效应可能不存在),在我们这里是指“蜘蛛纸牌程序并不存在偏向性”,那互补的假设就是“蜘蛛纸牌程序故意使绊子使得玩家的胜率下降”。

首先选取一个较大的数N作为待检测的蜘蛛纸牌游戏的局数,然后每一局我们计算一次AGT和ATSV。接下来的总体思路是求出我们要比对的观察结果的概率(即P值),或者更极端一点说,零假设为真(即程序没有偏向性)的概率。如果概率低于某一个阈值(即显著性水平),一个没有偏向性的程序就不太可能产生我们在N局游戏中观察到的这种AGT和ATSV值,那我们就拒绝零假设并且得到“游戏有偏向性”的结论。

那我们如何计算得到 p 值,即观察到我们已经观察到的AGT和ATSV值(这证明游戏没有偏向性)的概率呢?在模拟中我们已经得到了在无偏向性的游戏中AGT和ATSV的期望值,依次是3.96和-32.9。更有意思的是,概率论会告诉我们,在无偏向性的游戏中AGT和ATSV的值是如何分布的,换句话说,它可以帮助我们计算出观察到某一特定AGT和ATSV值的概率。所谓的“学生 t 检验”可以把所有这些数值考虑进去并得出我们想要的p值。详细内容这里略过,有兴趣的可以参照概率与统计的相关内容。

从本文的角度出发我们选择 N=100 作为我们玩这个待检验的游戏程序的局数,得到了显著性水平值为 0.05。

胜率估计

除了AGT和ATSV之外,我们也想评估一下对于“无偏向性”的蜘蛛纸牌程序来讲,“真正的”获胜概率。一个明显的困难在于胜率是和玩家有关的,所以很难验证“一个玩家能赢50%的游戏”这种说法。另一个情况是我在不同的蜘蛛纸牌游戏程序中得到了从45%到60%的胜率,而且没有证据显示我在使用这些程序的过程中胜率有所提高(也就是说,我的胜率并不随着时间增加而呈现出正相关)。

一个比较有意思的免费在线纸牌游戏网站 Pipkin's Idiot's Delight Solitaire Server,这里面包含了许许多多的纸牌游戏。它允许玩家在从1到999999的数字中指定一个“种子数”。举例来说,如果种子数为142857,起始的10张牌就总是2J56J9JQ59这几张,但是组合方式会不同。要注意的是,要是玩家在游戏之前随机生成一长串种子数,那么程序就不能根据玩家的胜率来调整难度水平了。正是因为这个原因,可以选择这个网站来估计胜率。

为了研究蜘蛛纸牌的规则,我玩了200局!

在零假设为真的时候拒绝零假设被称为第一类错误,它出现的概率等于显著性水平。假说检验中的另一类错误被称为第二类错误,它是指在零假设为假的情况下接受零假设。

我在Idiot's Delight上玩了100局游戏,使用了从1到100的种子数。最终我赢了59局,输了41局。所以我估计我在玩“无偏向性”的蜘蛛纸牌游戏的时候胜率会在59%左右。

估计值

我在Free Spider Solitaire上玩了100局蜘蛛纸牌游戏。虽然选择了在这里玩游戏但是试验之后,这里的游戏体验真的很“糟糕”:尽管可以赢,但是就算高手玩家玩起来也会很困难。每一局游戏记录下游戏的输赢结果以及AGT和ATSV数据。我观察到AGT和ATSV的p值依次是 0.115 和 0.201。这意味着AGT和ATSV的数据都要低于预期(也就是说,玩家会吃亏),但是因为这两个数值都高于我们的0.05的阈值,它们在统计上都不显著:这可能是因为偶然变化导致了较低的值的出现

不幸的是我只赢了其中的46局,比预期少了13局。这说明可能还需要进一步测试验证。然而要知道每个玩家的胜率都不一样,我很有可能在这100局里还没有发挥出最佳状态。

从中我给出的结论是没有足够的证据证明Free Spider Solitaire上的程序是有偏向性的。46局的胜局数是有一点让人沮丧,但是确实,这次这个程序经受住了考验。然而其他的蜘蛛纸牌程序可能就没这么幸运了。

作者:Trevor Tao

翻译:Dannis

审校:Nuor

原文链接:

https://plus.maths.org/content/spider-solitaire

tian

tian

xiang

shang

今天我们将送出由机械工业出版社提供的优质科普书籍《天才与算法》

为了研究蜘蛛纸牌的规则,我玩了200局!

美、英两国双料院士马库斯·杜·索托伊先生巅峰作品。我们即将进入一个由算法主导世界,AI将在绘画、音乐、写作等向人类发起挑战,作者用数学帮我们理解算法及创造力的本质,帮助人类去创造一个人与机器共存的美好未来。

阅读本书,你将会惊叹思维之美妙、见识之广博,更会惊叹人类的创造力有着如此严密的逻辑和音符般的节奏。

【互动问题:你在生活中还运用过哪些具体的统计学知识?

请大家严格按照 互动:问题答案的格式在评论区留言参与互动,格式不符合要求者无效。

*本活动仅限于微信平台

编辑:aki

↓ 点击标题即可查看 ↓

1. 套娃吗?你先看这个岛中湖中岛中湖中岛

2. 都靠这位天才科学家20岁时的论文,你才能用手机拍照发朋友圈

3. 朝天空开枪,子弹掉下来还有杀伤力吗?| No.206

4. 乐高还能悬浮在半空中?上百万人已看懵!

5. 古装片的射箭动作把物理学家看笑了,导演咱能不能专业点?

6. 即使被它淹没也不会窒息,这是什么神奇液体?

7. 数学课上捡了个橡皮,勾股定理就看不懂了

8. 物理学写给你的情书

9. 唯一两次获得诺贝物理学奖的人,你却不一定认识他

10. 妈妈问我的桌子为什么这么乱!

相关推荐

魔兽世界前瞻:9.0新手村海底游历

作者:NAG-woc1840 一、海滩上古怪的螃蟹和奇怪的海底新手村一些红色螃蟹的背部有一个蓝色宝石的标记,和周围的普通螃蟹形成了鲜明的对比,为了研究这是怎么回事,我就跑去没有任务指引的海底游了一趟。

剑与远征:重度氪金卡牌游戏,养成一张白卡需13608元人民币

说在最前面今天给大家带来的是,大胖处心积虑准备了很长时间的良心分享。大胖化身会计,给战友们核算核算抽卡概率及其成本!所以为了研究《剑与远征》这个抽卡概率,大胖养了个小号(零氪)。月桂酒馆我们都知道在剑与远征里是有一个“月桂酒馆玩法”,玩家在消耗钻石后可以进行游戏英雄卡池的抽取,每次都有一定几率获得普...

《恐龙快打》:漫画、原画和游戏动态图,带你边看漫画边玩游戏

没错,这就是你曾经屡试不爽、在街机厅风靡一时的《恐龙快打》。漫画和游戏设定《恐龙快打》经历了漫画-动画-游戏的过程。1993年恐龙类题材广受欢迎,这款游戏成功搭上了“恐龙”的热度。而《恐龙快打》游戏,就是设定在这样的背景下:邪恶的费森顿博士一伙,为了能够统治世界,以研究将恐龙基因与人体结合,从而制造...

热血传奇:传奇游戏各职业间的平衡如何做到?

在传奇游戏中,各个职业的极致平衡大伙儿是都知道的。微信公众号这应该就是传奇最能挽留玩家的地方吧,给普通玩家活路。微信公众号每个时代都会有一个代表作的巅峰游戏,虽然那个时代已经过去,但小编最近发现一款游戏,把之前传奇的所有形式百分之百的还原并且经过合理的研究后改进,目的就是为了让曾经的玩家找到当初的那...

六倍压枪很简单,十指操作未被禁止,为何职业赛场无人使用?

由于“吃鸡”的键位众多,为了能够在同一时间内打出多种精彩操作,一些职业选手和游戏主播通过自己的练习研究出了三指操作,为了让自己的实力得到进一步的提升,在三指的基础上诞生了四指、五指甚至六指操作,也正是因为这些长相“精致”的操作,职业选手在“吃鸡”比赛中打出了一次又一次的高光时刻。从实际效果来看,十指...

炉石战棋:酒馆黔驴技穷了?为了卖礼遇,不断出强力新英雄

捞金,这是每一个网络游戏都在研究的课题,毕竟游戏公司本身也要挣钱。只不过呢,在捞金的动作中,会根据方式区分吃相是否难看。比如DNF的捞金能力虽然强大,但是因为玩家可以看到氪金实打实的提升,所以得到的吐槽还算不多。反观某些游戏,比如BUG石这种,充了钱确实不能看见直观的提升。要说如今炉石三大模式哪个最...

我们很认真地研究了下“抽卡该拜谁”

现在,这种话题和讨论已经不仅仅局限在抽卡手游之中,任何涉及到开宝箱和随机出货机制的游戏,都可以套用玄学之争。也别轻易下结论说抽卡没有玄学,先不说有的公司为了大R玩家专门设定了保底机制,这可以是写明在账面上,也可能只是隐性数值。作为一个写过程序的人,我可以明确地说,目前但凡是程序实现的抽卡都是伪随机,...

他是LOL手游圈的大司马,研究出阿克尚同心圆玩法,还有详细图解

苦瓜原创,翻版必究!提到现如今大热的手游,那一定要有LOL手游一个位置,等待了这么久,随时随地玩LOL的梦想,终于是实现了,玩家们也是很激动,不少LOL端游的玩家也是来感受了一下手游的魅力,还好官方没有让玩家们失望,手游的制作和游戏体验感,真的很不错,人气也是越来越高哦。为了更好的同步端游,在英雄更...

他是LOL手游圈的大司马,研究出阿克尚同心圆玩法,还有详细图解

苦瓜原创,翻版必究!提到现如今大热的手游,那一定要有LOL手游一个位置,等待了这么久,随时随地玩LOL的梦想,终于是实现了,玩家们也是很激动,不少LOL端游的玩家也是来感受了一下手游的魅力,还好官方没有让玩家们失望,手游的制作和游戏体验感,真的很不错,人气也是越来越高哦。为了更好的同步端游,在英雄更...

魔兽9.0前瞻:五人本“通灵战潮”地图武器道具效果研究

与此同时原本作为四大守护之地之一的玛卓克萨斯势力突然对晋升堡发动了突袭,攻陷了一处神圣的格里恩圣殿。不少格里恩守护者加入防御和重新夺回圣殿据点的战斗,英勇地牺牲在通灵战潮之中,而且据说这些纯净而强大的勇士虽身死但所遗留下的心能或武器仍然具有极强的战斗力。为了守护我们晋升修行的秩序,笔者也参加了一只据...

天才老哥以假乱真,花式制裁作弊玩家

为了制裁游戏里的外挂玩家,国外的一位天才老哥直接做了一个“假外挂”!这些外挂玩家以为自己吃鸡稳了,但实际上迎接他们的却是三个“惊喜”~ 反向操作最为致命!当交通工具时速超过85公里,第一重“惊喜”自动触发。这次不仅游戏体验极差,场外的兄弟情谊可能也要直接出局咯~ 在研究出绝地求生的伪外挂后,这位天才...

什么时候开始,我们浮躁到连游戏都不会玩了

玩游戏不是为了快乐吗,为什么我们反而感受到压力?如是,移动竞技玩家死盯胜负还好理解,段位攀升带来的喜悦并不亚于游戏内容。2019年1月份,THEO KARASAVVAS发布了一篇研究相似问题的文章,名为“Tales of an aging gamer: Why don’t I pick up a c...

经典街机游戏中让玩家哭笑不得的抱摔,甚至连桑吉尔夫都黯然失色

不过也正是因为抱摔这一技巧越来越受到玩家们的欢迎,因此许多游戏厂商为了吸引玩家,便针对抱摔研究了许多别出心裁的设计,其中有的确实能给玩家的游戏体验带来不少增益,但有些却常常让玩家哭笑不得,甚至连投技的代言——桑吉尔夫的梅花大坐,在它们的面前都会黯然失色!

蛮荒神途——在神途幻境里,有一个迷宫

大家都知道,在神途幻境里,有一个迷宫,刚开始的时候,大家为了能闯过这个迷宫,花费了大量的时间,都在研究怎么闯过这个迷宫,我也闯过N次迷宫,但都没有找出方法,后来也是借鉴了别人的方法,才顺利闯过去的,真不知道,这个迷宫出现的真正用意是什么?为什么不直接在幻1的时候就出现迷宫呢?这全部都是因为够狡猾,只...

8.2争霸艾泽拉斯:法师职业火焰专精之一键爆发指南

前言首先必须进行说明,手打一定比用一键宏更好,分享这个宏仅为了帮手一些老年休闲玩家提升爆发质量,稳定爆发伤害,但是会浪费一定的资源,降低上限。本文不涉及理论研究,只涉及具体打法和实现方式。

盒子游戏,游戏玩家专属个性阅读社区


©CopyRight 2010- 2020 BOXUU.COM Inc All Rights Reserved

鄂公网安备 35020302000061号- 鄂ICP备2020015574号-1