天才一秒记住【梧桐文学】地址:https://www.wtwx.net
表3-3是从莫里亚蒂的视角出发总结出的损益得失表。
无论是莫里亚蒂还是福尔摩斯,都有两种行动方案可以选择,分别是“在多佛下车”
和“在坎特伯雷下车”
。
如果双方在同一车站下车,莫里亚蒂就能实现自己的阴谋,成功拦截并杀害福尔摩斯。
因此,在这种情况下,莫里亚蒂的收益值是100,而福尔摩斯则相反,收益值为-100。
与之相对,如果莫里亚蒂在坎特伯雷下车,而福尔摩斯在多佛下车,那么福尔摩斯就可以从多佛前往欧洲大陆,从而顺利逃亡。
因此,在这种情况下,莫里亚蒂的收益值是-50,而福尔摩斯的收益值是50。
此外,如果福尔摩斯在坎特伯雷下车,而莫里亚蒂在多佛下车,那么莫里亚蒂虽然无法抓住福尔摩斯,但是可以阻止他逃往欧洲大陆。
因此,从这个角度来看,双方打了个平手,各自的收益值均为0。
如表3-3所示,关于莫里亚蒂的保底值,在多佛下车时为0,在坎特伯雷下车时为-50,因此其最大保底值为0。
另一方面,关于福尔摩斯的保底值,在多佛和坎特伯雷下车时均为100,因此最小值为100。
由此可见,两者之间的保底值是不一致的,无论采取哪种行动组合,都无法实现博弈均衡。
但是,即使面对这种局面,只要能够合理采用概率组合的方式,依然可以实现均衡。
关于这一点,或多或少会引起争议,下面,我将试着进行论证。
福尔摩斯究竟应该怎么办?
我们先从结论开始说起。
按照最大最小准则,莫里亚蒂应该采用的策略是“按照0.6的概率在多佛下车,按照0.4的概率在坎特伯雷下车”
;按照最大最小准则,福尔摩斯应该采用的策略是“按照0.4的概率在多佛下车,按照0.6的概率在坎特伯雷下车”
。
也就是说,在这一策略下,福尔摩斯应该准备10张纸,在其中的4张纸中写上多佛,在剩余的6张纸中写上坎特伯雷,然后,将这10张纸混合在一起,从中随机抽取1张,作为自己最终的决定,可以说,这是一种均衡的策略。
下面,我们将对这一结论进行分析论证。
为了更加具体直观地进行说明,我们假设莫里亚蒂在多佛下车的概率为0.1,在坎特伯雷下车的概率为0.9。
然后,在这一条件下,尝试计算保底值,如表3-4所示。
对此,我们只要从福尔摩斯的策略中,选择对于莫里亚蒂而言最差的一组即可。
假设福尔摩斯在多佛下车的概率为p(与之相应,在坎特伯雷下车的概率自然就是1-p),那么,针对四种结果,出现的概率具体如表3-4所示。
表3-4 莫里亚蒂的收益值表
这样一来,莫里亚蒂的收益的期望值(基于概率计算的平均值)就等于概率乘以收益值相加之和:
0.1×p×100+0.1×(1-p)×0+0.9×p×(-50)+0.9×(1-p)×100=90-125p
由此可见,福尔摩斯在多佛下车的概率越大,莫里亚蒂的收益的期望值就越小。
也就是说,对于莫里亚蒂而言,福尔摩斯在多佛下车的概率为1时,其承受的损失是最大的,此时的保底值最小,为-35(90-125)。
下面,我们再计算一下莫里亚蒂在多佛下车的概率为0.9,在坎特伯雷下车的概率为0.1(与刚才的情况正好相反)时的期望值:
0.9×p×100+0.9×(1-p)×0+0.1×p×(-50)+0.1×(1-p)×100=10+75p
在这种情况下,福尔摩斯在多佛下车的概率越小,则莫里亚蒂的收益的期望值就越小,因此,当p=0时,保底值最小,为10。
有鉴于此,莫里亚蒂的保底值变化情况,具体如图3-1所示。
图3-1 莫里亚蒂的保底值变化情况
只要观察一下,就会发现莫里亚蒂的保底值是随着在多佛下车的概率而变化的,当概率从0增加至0.6时,保底值也随之增大,当概率大于0.6后,保底值开始持续下降。
因此,莫里亚蒂的最大保底值就是在多佛下车的概率为0.6时计算得到的数值。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!