第三章洞察充满不确定性的未知世界的决策方法最大最小准则（第8页）

天才一秒记住【梧桐文学】地址：https://www.wtwx.net

表3-3是从莫里亚蒂的视角出发总结出的损益得失表。

无论是莫里亚蒂还是福尔摩斯，都有两种行动方案可以选择，分别是“在多佛下车”

和“在坎特伯雷下车”

。

如果双方在同一车站下车，莫里亚蒂就能实现自己的阴谋，成功拦截并杀害福尔摩斯。

因此，在这种情况下，莫里亚蒂的收益值是100，而福尔摩斯则相反，收益值为-100。

与之相对，如果莫里亚蒂在坎特伯雷下车，而福尔摩斯在多佛下车，那么福尔摩斯就可以从多佛前往欧洲大陆，从而顺利逃亡。

因此，在这种情况下，莫里亚蒂的收益值是-50，而福尔摩斯的收益值是50。

此外，如果福尔摩斯在坎特伯雷下车，而莫里亚蒂在多佛下车，那么莫里亚蒂虽然无法抓住福尔摩斯，但是可以阻止他逃往欧洲大陆。

因此，从这个角度来看，双方打了个平手，各自的收益值均为0。

如表3-3所示，关于莫里亚蒂的保底值，在多佛下车时为0，在坎特伯雷下车时为-50，因此其最大保底值为0。

另一方面，关于福尔摩斯的保底值，在多佛和坎特伯雷下车时均为100，因此最小值为100。

由此可见，两者之间的保底值是不一致的，无论采取哪种行动组合，都无法实现博弈均衡。

但是，即使面对这种局面，只要能够合理采用概率组合的方式，依然可以实现均衡。

关于这一点，或多或少会引起争议，下面，我将试着进行论证。

福尔摩斯究竟应该怎么办？

我们先从结论开始说起。

按照最大最小准则，莫里亚蒂应该采用的策略是“按照0.6的概率在多佛下车，按照0.4的概率在坎特伯雷下车”

；按照最大最小准则，福尔摩斯应该采用的策略是“按照0.4的概率在多佛下车，按照0.6的概率在坎特伯雷下车”

。

也就是说，在这一策略下，福尔摩斯应该准备10张纸，在其中的4张纸中写上多佛，在剩余的6张纸中写上坎特伯雷，然后，将这10张纸混合在一起，从中随机抽取1张，作为自己最终的决定，可以说，这是一种均衡的策略。

下面，我们将对这一结论进行分析论证。

为了更加具体直观地进行说明，我们假设莫里亚蒂在多佛下车的概率为0.1，在坎特伯雷下车的概率为0.9。

然后，在这一条件下，尝试计算保底值，如表3-4所示。

对此，我们只要从福尔摩斯的策略中，选择对于莫里亚蒂而言最差的一组即可。

假设福尔摩斯在多佛下车的概率为p（与之相应，在坎特伯雷下车的概率自然就是1-p），那么，针对四种结果，出现的概率具体如表3-4所示。

表3-4　莫里亚蒂的收益值表

这样一来，莫里亚蒂的收益的期望值（基于概率计算的平均值）就等于概率乘以收益值相加之和：

0.1×p×100+0.1×（1-p）×0+0.9×p×（-50）+0.9×（1-p）×100=90-125p

由此可见，福尔摩斯在多佛下车的概率越大，莫里亚蒂的收益的期望值就越小。

也就是说，对于莫里亚蒂而言，福尔摩斯在多佛下车的概率为1时，其承受的损失是最大的，此时的保底值最小，为-35（90-125）。

下面，我们再计算一下莫里亚蒂在多佛下车的概率为0.9，在坎特伯雷下车的概率为0.1（与刚才的情况正好相反）时的期望值：

0.9×p×100+0.9×（1-p）×0+0.1×p×（-50）+0.1×（1-p）×100=10+75p

在这种情况下，福尔摩斯在多佛下车的概率越小，则莫里亚蒂的收益的期望值就越小，因此，当p=0时，保底值最小，为10。

有鉴于此，莫里亚蒂的保底值变化情况，具体如图3-1所示。

图3-1　莫里亚蒂的保底值变化情况

只要观察一下，就会发现莫里亚蒂的保底值是随着在多佛下车的概率而变化的，当概率从0增加至0.6时，保底值也随之增大，当概率大于0.6后，保底值开始持续下降。

因此，莫里亚蒂的最大保底值就是在多佛下车的概率为0.6时计算得到的数值。

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第三章 洞察充满不确定性的未知世界的决策方法 最大最小准则（第8页）