梧桐文学

第三章 洞察充满不确定性的未知世界的决策方法 最大最小准则(第4页)

天才一秒记住【梧桐文学】地址:https://www.wtwx.net

可以说,这是从社会上存在的纷繁复杂的各种博弈或者带有博弈色彩的事物中,抽象剥离出本质性的内容,并进行归纳总结的精髓。

在这一基础上提出的博弈论是对各种玩家应该选择怎样的行为进行阐释的理论。

在决定应该选择怎样的行为时,玩家要面对一个非常棘手的问题,那就是每位玩家的收益并不仅仅是由自己选择的行为决定的,还要受到其他玩家所选行为的影响。

如果玩家一个人的行为就能决定自己收益的大小,那么自然应该选择对自己而言收益最大的行为。

但是,如果考虑到其他玩家的行为会对最终收益造成影响,每一名玩家就必须认真思考其他玩家究竟会采取怎样的行为,并做出有针对性的决策。

令人感到困扰的是,这一理论同样适用于其他玩家。

其他玩家也要思考自己之外的玩家会采取什么样的行为。

这样一来,各位玩家之间就会交织产生“相互依赖”

的复杂关系。

因此,在这种环境下,想要明确每位玩家应该采取的行为绝非一件易事。

博弈论的难度可想而知。

零和博弈[6]的机制

由冯·诺依曼和奥斯卡·摩根斯特恩最先提出的博弈,本质上是指两个人的零和博弈。

顾名思义,在这一理论中,两个玩家展开博弈时,无论哪一方取胜,他们的收益总和始终都是零。

也就是说,如果一位玩家的收益是x,那么另一位玩家的收益必定是-x。

可以说,这是博弈当中最为简单也是最为典型的基本机制。

一般来说,两支球队的体育比赛大都是典型的零和博弈。

为了更好地理解零和博弈,下面将举一个具体实例进行说明。

假设有两支队伍参加比赛,分别是队伍1和队伍2。

我们将这两支队伍的比赛视为博弈。

每支队伍只能从三种策略(上场队员、阵形、防守和进攻战术等综合在一起形成的方案)中选择一种。

队伍1从a、b、c中选择一种,队伍2从d、e、f中选择一种,并运用所选策略进行实际比赛。

这样一来,共有九种策略与得分组合。

把这九种组合以表格的形式列出来,我们可以了解队伍1在各种策略组合下能够得到的分数(或得失分差),如表3-1所示。

比如当队伍1选择策略a、队伍2选择策略d时,如表3-1所示,队伍1可以得到4分,根据零和博弈理论,队伍2的得分自然是-4分。

此外,当队伍1选择策略b、队伍2选择策略d时,如表3-1所示,队伍1的得分是-3分,与之相应,队伍2的得分就是3分。

那么,在上述机制下,两支队伍究竟应该采取怎样的策略呢?下面,我们将根据博弈论理论,分析参赛队伍的心理,并进行论述。

如果静下心来思考一下,就会切实地感受到这是一个非常棘手的问题。

如表3-1所示,队伍1肯定希望获得尽可能多的分数,因此拼命想扩大这一数字。

与之相对,队伍2则希望这一数字越小越好。

然而,由于彼此是竞争对手,要想同时满足双方的愿望,不另辟蹊径,采取特殊的解决方式是根本办不到的。

也就是说,假如队伍1单纯想拿到表中所列举的最大得分4分,那么队伍1应该选择策略a。

但是,这种想法的目的性太过明显,很容易被队伍2猜透。

如果队伍2提前判断到队伍1会选择策略a,那么队伍2肯定会有针对性地选择策略f。

这是因为在队伍1选择策略a的前提下,队伍2选择策略f时可以得到2分(根据表3-1,当队伍1选择策略a而队伍2选择策略f时,队伍1的得分为-2分)。

但是,对于队伍2的这种想法,队伍1肯定也能猜到。

如果队伍1提前预测到队伍2可能会做出这样的判断选择策略f,那么队伍1可能就会将计就计选择策略b,拿到3分。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

宠宠欲动,总裁缠上小甜妻我成了前女友的上门姐夫漫威世界的武神绝地求生之全能战神穿越之郡主玩转古代我靠和霍少恋爱续命异界蛮族之王快穿:宿主她危险又撩人穿书反派逃命守则女配在线娇弱空间福女好种田我要名垂千古帝少追缉令,天才萌宝亿万妻女尊世界的白莲花诛仙日常异世界设定师空间之大佬的农家妻超级玉钱系统我在快穿里死遁功夫萌崽四岁半,17个哥哥团宠我封妖的灯火投胎了重生成狗,开局被文才放血前任他什么都不好全球巨星从龙套开始娇软美人在年代文里被甜宠了