饭饭TXT > 学习管理 > 《博弈生存》作者:潘天群【完结】 > 博弈生存.txt

文章简介

作者:潘天群 当前章节:15281 字 更新时间:2026-6-18 20:53

小说下载尽在http://bbs.txtnovel.com---书香门第整理

附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!

基本术语(1)

前面已经指出,博弈论研究的对象是理性的行动者或参与者如何选择策略或如何作出行动的决定。理性的人是对现实的人的基本假定,即假定参与者努力用自己的推理能力使自己的目标最大化。“理性的”与“道德的”不是一回事,理性的与道德的有时会发生冲突,但是理性的人不一定是不道德的。我们在第八章会阐述理性的人怎么会产生道德的行为。

博弈涉及哪些内容呢?

第一,博弈涉及至少两个独立的博弈参与者(player)。

每个参与者通过采取行动,努力使自己的效用或利益最大化。但是,他的行动的好处或支付的获得取决于另外的参与者。下文有时将参与者称为行动者。

“囚徒博弈”或“囚徒困境”是一个被广泛谈论和研究的博弈。两个共同作案偷窃的小偷被带进警察局单独关押,如果一方与警方合作,招认并供出自己与对方以前所做违法之事,而对方不招认,招认方将不受重刑,无罪释放,另一方则会被判重刑10年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不承认有罪,因警察找不到其他证明他们以前违法的证据,则只能对他们的小偷行为进行惩戒,各判刑3个月。这两个小偷如何作出选择?

在这个囚徒困境中,囚徒的最后结果——是当场释放还是被判刑(10年、5年、3个月),不仅取决于该囚徒的决定,而且还取决于另外一个囚徒的决定。

而在买卖的交换行为中,买东西的人要尽量以低的价格买到,但是他是否能买到取决于卖者是否能卖;卖东西的人尽量想以高的价格将东西卖出去,但价格太高,买者不接受,因此卖东西的人能否将物品卖出去取决于买者。

第二,博弈涉及行动者存在着策略(strategy)选择的可能,博弈论用策略空间来表示参与者可以选择的策略。

赤壁一战,曹兵大败,曹操落荒而逃,在选择是走通往华容道的小路,还是选择大路时,他面临着在两个策略之间进行选择。囚徒困境中的小偷面临着“不招认”还是“招认”的选择。每个参与者从策略空间中选取他的策略,如果没有选择的可能,理性的人是无法作出计算的,对自己的目标也就无能为力。从这个意义上来讲,我国改革开放走向市场经济,就是使得每个经济主体发挥其理性的作用,使之发挥主动性,而在计划经济下则没有可选择的余地。

第三,参与者在不同策略组合下会得到一定的支付(payoff)。

我们往往用支付矩阵来表示参与者在各种策略组合下的支付,有时用函数来表示。囚徒困境的支付矩阵为:

甲乙不招认招认不招认各判刑3个月乙:判刑10年,

甲:当场释放招认甲:判刑10年

乙:当场释放各判刑5年我们再来分析一交易过程的支付矩阵。在一卖主甲和一买主乙之间的“买—卖”博弈中——这是一讨价还价过程,假定通过讨价还价后确定了一价格。在此价格下,卖者卖成后获得的效用为6,卖不成的效用为0;买者买成的效用为4,买不成的效用为0。而如果他们之间的交易不成功,无论是买主还是卖主都要等待和进行讨价还价,假定等待和讨价还价的成本均为1,则支付矩阵为:

乙甲买成买不成卖成(6,4)(5,0)卖不成(0,3)(0,0)

第四,对于博弈参与者来说,存在着一博弈结果。

所谓结果是参与者最终对策略的选择造成的确定性的支付。如在曹操败走华容道的博弈中,诸葛亮在“埋伏大路”与“埋伏通往华容道的小路”之间进行选择,而曹操在“走大路”和“走通往华容道的小路”之间进行选择。在这个博弈中,双方猜测对方的行为,看谁猜得准。博弈的最终结果是,诸葛亮派关羽埋伏在通往华容道的小路,而曹操选择走小路,被诸葛亮抓住。这就是曹操与诸葛亮之间的博弈的结果。

第五,博弈涉及均衡。

均衡是经济学中的重要概念。那么什么是均衡,它的含义是什么?

均衡即是平衡的意思,在英文中是equilibrium。在经济学中,均衡意即相关量处于稳定值。在供求关系中,如果在某一商品市场的某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经济学中的重要分析。

那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一种结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。

纳什均衡是一种最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。

在上面的“买—卖”的博弈中,(卖出,买进)是一纳什均衡,这个博弈可以解释为什么在现实中讨价还价后买卖能做成,因为这对双方来说都是最优选择。同时在“买—卖”博弈中,其均衡对双方来说是全局最优的。

第六,重要的均衡——纳什均衡。

纳什均衡(Nash Equilibrium)是博弈分析中的重要概念。1950年身为研究生的纳什写了一篇论文——《n人博弈的均衡问题》,该文只有短短一页纸,可就是这短短一页纸成了博弈论的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,这样的均衡被人们称之为纳什均衡。

基本术语(2)

那么什么是纳什均衡呢?简单说就是,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在惟一的纳什均衡点,即两个囚犯均选择“招认”,这是一稳定的结果。

有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”(或称性别之战)中有两个纳什均衡点。丈夫帕特和妻子克里斯商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚,双方的支付矩阵如下:

丈夫妻子歌剧拳击歌剧(2,1)(0,0)拳击(0,0)(1,2)

在这个“夫妻博弈”中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。

是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点——所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略(mixed strategy)均衡点——所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的一种概率分布。这就是纳什于1950年证明了的纳什定理。我们下面将在“警察与小偷的故事”例子中给出混合策略的说明。

我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达了纳什均衡含义:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。这就是说,双方在对方的策略下自己现有的策略是最好的策略。即:此时双方在对方给定的策略下不愿意调整自己的策略。这里的策略包括混合策略。

纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞(Kandori)引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义同样重大。我在书后的附录中用数学语言给出了纳什均衡及纳什均衡存在定理。

博弈的类型

根据参与者能否形成约束性的协议,以便集体行动,博弈可分为合作性博弈和非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。

所谓合作性博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟,其结果对联盟方均有利;而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动就是合作性的博弈,而囚徒困境以及在第八章讨论的公共资源悲

剧都是非合作性的博弈。

博弈又分静态博弈和动态博弈。静态博弈指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。

从知识的拥有程度来看,博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。完全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有“完全的了解”,否则是不完全信息博弈。严格地讲,完全信息博弈是指参与者的策略空间及策略组合下的支付,是博弈中所有参与者的“公共知识”的博弈。对于不完全信息博弈,参与者所做的是努力使自己的期望支付或期望效用最大化。

这只是对博弈论的简单介绍。关于其中的详细内容,读者需参阅有关书籍。

博弈案例(1)

1囚徒博弈与我国应试教育的困境

囚徒困境可以用来说明许多现象。我国目前的应试教育就是一个囚徒困境。

囚徒博弈是完全信息下的静态博弈,两个小偷各种策略组合下的支付是他们之间的“公共知识”(我们在下一章中将讨论什么是“公共知识”)。

我们上面已经分析了囚徒对局下各个策略下的结果或支付,以及它的均衡。它的均衡是双方均选择“招认”的策略。

可以这么说,最近10多年来,我国基础教育的问题是如何摆脱应试教育的困境问题。目前给中小学生“减负”不仅是学生家长的呼声,也是教育专家和教育管理部门的呼声,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微,并没有从根本上解决问题。学校不断给学生增加负担是目前教育的实际状况。

大家普遍认为应试教育是扼杀学生的创造性,无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论是专家,还是意识到教育问题的普通老百姓以及没有意识到教育问题的老百姓,其小孩都在接受着这种教育。

在现有的教育体制下,学生(或学生家长)有两个可选择的策略:“减负”和“增负”。学生的精力是有限的,如果选择“减负”策略,意味着学生有更多的时间学习课本以外的东西,这样学生的素质得到提高,因此,“减负”策略往往与素质教育联系在一起;而如果选择“增负”策略,则意味着学生花大量的时间做大量的习题,以“学透”、“学精”课本规定的东西,此时,学生没有时间学习课本以外的没有规定的内容。“减负”的结果是学生的全面发展;而“增负”的结果是学生获得高的分数。

在这样的博弈结构下,学生(或学生家长)如何选择呢?每个学生这样想:其他人采取的是“增负”教育策略的话,如果我采取“减负”教育策略,我的考试分数不如他人,在求学方面我会落后,接受不了好的教育,在未来求职时我也赶不上他人。在他人采取“增负”的策略下,我也应当采取“增负”策略。如果其他人采取的是“减负”策略,我应当采取什么策略呢?还是应当采取“增负”策略!因为,如果其他人采取的是“减负”策略的话,如果我采取的是“增负”策略,我的考试分数会比其他人高,我会上好的学校,在未来的职业竞争中我会处于优势。因此,无论其他人采取的是什么策略,我采取“增负”策略都是最好的。当每个学生都这样想的时候,全社会便进入了应试教育这样一个囚徒困境之中。

如果我国现有的考试制度没有改变,现在假设所有的学生都选择“减负”策略,即除了做少量的巩固性的作业外,不补课、不做其他的练习题,情况会是什么样子?

假设这种状态会出现,我们说,这种状态会很快消失,而立即会出现所有学生都进入“增负”的这样一个状态。可以说,均选择“减负”策略的状态是不稳定的,而“增负”的状态是稳定的均衡。原因就是,目前的教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。在这个博弈中,对于教师来说,学生的升学率高意味着其成绩大、奖金高,对自己的学生采取“增负”策略,对于自己而言是占优策略。

我国基础教育的博弈与囚徒困境有共同的结构,大家均选择“增负”策略构成基础教育博弈的纳什均衡。纳什均衡是一个稳定的博弈结果,这也是为什么我国目前的应试教育难以改变的原因。

2.斗鸡博弈与古巴的导弹危机

试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退。支付矩阵如下:

鸡乙鸡甲前进后退前进(-2,-2)(1,-1)后退(-1,1)(-1,-1)

上表中的数字的意思是:两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进的公鸡获得1的支付,赢得了面子,而后退的公鸡获得-1的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得-1的支付。当然表中的数字只是相对的值。

这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进谁退?一博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则任何人无法预测出一个结果来。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。

用这个博弈来解释20世纪60年代初发生在美苏两个超级大国之间的一场导弹危机,是最合适不过的了。

二战结束后,形成了对峙的两个超级大国,美国和苏联。这两个超级大国是两个核心,在其周围有各自的盟友,它们一起组成了两大敌对的阵营。1962年赫鲁晓夫偷偷地将导弹运送到加勒比海上的岛国古巴,卡斯特罗政权是苏联这个超级大国的盟友,是美国的敌人。苏联的目的是将导弹部署在美国的眼皮底下,以对付美国。然而苏联的行动被美国的U-2飞机侦察到了,美国发现古巴建立了导弹发射场。此事震动美国,肯尼迪总统指责苏联,并发出严重警告,而苏联方面矢口否认。美国决定对古巴进行军事封锁,派遣了舰艇、空军及航空母舰,并集结了登陆部队。美国进入戒备状态,,美苏之间的战争一触即发。

博弈案例(2)

面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择?而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择?也就是说,这两只“大公鸡”均在考虑采取进的策略还是退的策略?

战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了

“不退的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争——这是美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。

这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。3.骑虎难下博弈与美苏武器竞赛

我们经常碰到的一类博弈是,行动者进也不是,退也不是。笔者将这样的博弈称为骑虎难下博弈。

有一个拍卖,其规则是:轮流出价,谁出得最高,谁就将得到该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的价付给拍卖方。

假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想,如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品,但是,随着出价的增加,他的损失也可能越大。每个人面临着两难:是继续叫价还是退出?

你会说,这个拍卖的规则不合理,在实际中这样的拍卖不会出现。当然这只是一个模型,但我们经常会看到此类型的博弈案例。这个博弈有一个纳付均衡:第一个出价人叫出100元的竞标价,另外一个人不出价(因为在对方叫出100元的价格后,他继续叫价将是不理性的),出价100元的参与人得到该物品。

在冷战期间,美苏为争夺霸权拼命发展武器,无论是原子弹、氢弹等核武器的研制,还是如隐形战斗机这样的常规武器的研制,双方均不甘落后。20世纪80年代,里根在位时准备启动“星球大战”计划,此举意味着两个超级大国的武器竞赛将进一步升级。美苏之间的武器竞赛就相当于拍卖中轮番出价,双方均不断出更高的价,如果一方没有出最高的价钱,退了下来,即没有继续竞赛下去,那么意味着它在军备上的投入没有效果,而对方将赢得整个局面。但如果继续竞赛下去,一旦支撑不住,损失也就越大。

1991年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上,而民用建设无法跟上,国力不济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。

一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常碰到。20世纪60年代,美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是肯定赢的。从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒肯定输的,因为赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输的;如果你的资源无限大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像葡京这样的赌场要设定赌博数额的限制。

博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。

4.警察与小偷的故事——混合策略问题

纳什在《n人博弈的均衡点》这篇论文中,给出了均衡存在的简单证明,纳什说,在n个人的博弈中至少存在着一个均衡,在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为纳什定理。

什么是混合策略?

警察部门负责一城市中某一区的治安。警察要对该区的A、B两地进行巡逻。假定该区有一群小偷,要实施偷盗。警察要防止小偷的偷盗,但因为设备有限,只有一部警车,因此,警察只能一次在一个地方巡逻。而对于小偷而言,他们也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地巡逻而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才能使效果最好?

博弈案例(3)

一个明显的做法是,警察对A地进行巡逻,小偷去B地,这样,警察可以保住2万元的财产不被偷窃,小偷的收益为1万元。但是这种做法是警察的最好做法吗?有没有对这种策略改进的措施?

我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地,偷盗者在该地无法实施偷盗,假定此时小偷的得益为0(没有收益),此时警察的得益为3(保住3万元)。

这个博弈也是常和博弈,它没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的最优(混合)策略选择。

由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略是参与者在各种备选策略中采取随机选取的。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。

当博弈是零和博弈与常和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。

5《三国演义》中的空城计与信息不对称的博弈

如果我们用博弈论的眼光看《三国演义》,三国演义完全是一部记载着许多博弈案例的著作。当然,罗贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》,这个词就是“计”。计,即计策或策略也。用计,即用策略赢对方。用计算敌,不仅要自己选择恰当的计策,而且要算准对方用什么计策,这不就是博弈?现在让我们看《三国演义》中著名的空城计博弈。

诸葛亮误用马谡,致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只剩二千五百军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开城门,每一门用二十军士,扮作百姓,洒扫街道。而孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于城上敌楼前凭栏而坐,焚香操琴。司马懿自飞马上远远望之,见诸葛亮焚香操琴,笑容可掬。司马懿顿然怀疑其中有诈,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之”,我兵只有二千五百,若弃城而去,必为之所擒。

这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。

这里,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮是知道的,他们对博弈结构的了解是不对称的,诸葛亮拥有比司马懿更多的信息,当然有。这种信息的不对称完全是诸葛亮“制造出来的”。因此这是一个信息不对称的博弈。

在这里,孔明可以选择的策略是“弃城”或“守城”。无论是“弃”还是“守”,只要司马懿明确知道他自己的支付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。他的空城计是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。

司马懿孔明进攻后退守城(被擒,大胜)(逃脱,不胜不败)弃城(被擒,大胜)(逃脱,不胜不败)

在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的“期望支付(或效用)”最大。比如:如果让你在“有50%的可能获得100元”与“有10%的可能获得200元”两者之间进行选择,你当然选前者,因为前者的“期望所得”为:50%×100=50元,而后者为:10%×200元=20元。理性的人是选择前者的。

在孔明—司马懿的博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用。即:司马懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。

司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可能如此镇定自若,焚香操琴。此时,司马懿觉得“退”比“进攻”更合理,或者说期望效用更大。于是后军变前军,前军变后军,后退而去。结果是诸葛亮得以逃脱。

司马懿对局势的判断不是没有道理的,他对诸葛亮的判断是基于以前的认识,这就是“归纳法”,我们会在第六章中讨论归纳法在博弈中的作用及其局限。

空城计博弈是不完全信息博弈,我们说过《三国演义》是一本博弈实战教材,在该书中有完全信息博弈实例吗?当然,曹操与诸葛亮的华容道博弈就是一个完全信息博弈。

曹操亲领八十万大军进攻东吴,孙权和刘备联合破曹,曹军大败。曹操引兵而逃。经过一路厮杀,来到一处,军士报:前方有两条道路,请问丞相走哪条路?曹操问:哪条路近?军士说:大路稍平,却远五十余里。小路投华容道,却近五十多里。曹操令人上山观望,回报:小路山边有数处狼烟,大路并无动静。曹操叫走华容道。诸将问:烽烟起处必有军马,何故反走这条路?曹操说:岂不闻兵书有云:“实则虚之,虚则实之”。诸葛亮多谋,故使人于山僻放烟,使我军不敢从这条路走,他却伏兵于大路等着。吾已料定,偏不教中他计。诸将皆曰:丞相妙算,人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华容道等着曹操,于是关羽上演了一场“只为当初恩义重,放开金锁走蛟龙”的捉放曹的义举。逃过华容道大难,曹操只剩二十七骑!

博弈案例(4)

在曹操与诸葛亮之间的这一华容道博弈中,曹操的策略是在走华容道还是走大路之间进行选择,而诸葛亮派关羽埋伏时,要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。

华容道博弈曹操诸葛亮华容道大路——0.1华容道(捉住曹操,被捉)(白等,逃脱)大路(白等,逃脱)(捉住曹操,被捉)

这个博弈如同猜硬币的游戏一样,是一“零和博弈”所谓“零和博弈”是指双方的得益之和为一常数零,一方所得增加,另一方所得便减少。而“变和博弈”是指博弈双方的所得之和为一变数。,它没有纳什均衡点。双方对博弈有完全的信息,各种策略下的博弈支付是公共知识——我们下一章将说明什么是公共知识。但双方无法知道对方的策略选择,而只能进行猜测。曹操要选择走诸葛亮的军队不在的路,这是他的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。

诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。这里关键是谁能真正猜到对方的策略,谁就是赢家。诸葛亮胜曹操一筹。这个博弈不存在纯策略纳什均衡点,博弈结果是:曹操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。

公共知识与博弈

博弈专家们发现在博弈中存在着公共知识的问题。让我们来看一下什么是公共知识。

要弄清什么是公共知识,首先要弄清什么是知识。

所谓知识是人对真的信念。知识是人们对自然中某个事实的认识,我们说某人拥有某种知识,意指某人知道某个事实。“地球绕着太阳转”是个事实,但哥白尼之前的人们并不知

道这个事实,而今天这个事实已几乎被所有人熟知,并且人们相信这个事实,于是“地球绕着太阳转”构成人们的知识。因此知识涉及三个因素:

第一,人们了解的事实对象要是真的,假的事实不能成为知识。人们可能相信虚假的东西,但它们不能构成相信它们的人的知识。在偏僻的乡村,人们相信,人的病是由鬼怪引起的,巫婆通过某些迷信活动能够驱除鬼怪从而达到治病的目的,这当然只是错误的信念,而不是知识。再比如:在古代,中国人认为雷电是由掌管雷电的雷公行云布雨的结果,这当然也不是真的事实。假的信念有时对信念拥有者有一定的效果,但不构成相信者的知识。

第二,某个人要知道这个真的事实。许多存在着的真的事实我们并不知道,它们并不能构成我们(人类)的知识。我们常说知识如大海一样,我们知道的只是知识海洋中的一滴水。我们不知道的东西太多了。

第三,人们要相信他所知道的事实。如果他不相信某些事实,尽管他知道,也不构成他的知识。哥白尼提出地球围绕太阳转的日心说观点,那时许多人知道了这个事实,但并不相信,因此“日心说”就不能构成他们的知识。

逻辑学家研究人的“知道”的结构,他们发现,当某人知道某个事实时,这意味着:他知道他知道该事实,他知道他知道他知道该事实……这是一个无穷的过程。将这个结构推广到某一人群就构成公共知识的概念。

公共知识这个概念最初由逻辑学家刘易斯提出,之后由经济学家阿曼等用于博弈分析。公共知识是一个群体人们之间的对某个事实“知道”的关系。

假定一个人群由A、B两个人构成,A、B均知道一件事实f,f是A、B的知识,但此时f还不是他们的公共知识。当A、B双方均知道对方知道f,并且他们各自都知道对方知道自己知道f……此时我们说,f成了A、B间的公共知识。

这个人群是由两个人组成,如果由多人组成,这不仅指任意两个人这样一个双方“知道”的过程,而且指,其中任何一个人知道其他人知道其他人知道……事实f。

因此,公共知识涉及一群体的对某个事实“知道”的结构。

在日常生活中,许多事实是公共知识,如:“所有人均会死”、“所有鸟均能飞(鸵鸟除外)”,对于它们,所有人均知道(智力有障碍者及婴儿除外),并且所有人知道其他人知道,当然其他人也知道别人知道他知道……

有许多知识只有一些人知道。科学家知道的知识是其他人所不知道的,而且科学家之中各个科学家知道的知识不同。可以这么说,知识的分布在各个人那里是不同的。

在博弈中,“每个参与者是理性的”,这是公共知识。为什么?因为这是博弈前提——当然也是我们的假定。在具体博弈中,参与者知道对方是理性的,同时知道对方知道自己知道对方是理性的,等等。参与者知道自己是理性的,他知道自己知道自己是理性的……同时参与者知道对方知道自己知道自己是理性的……

对博弈来说,“参与者是理性的”是起码的公共知识要求。对于像囚徒困境这样的博弈,双方的不同策略下的支付也是公共知识;曹操和诸葛亮在华容道上的博弈双方的策略下的支付也是公共知识。

在有些博弈中,各种策略下的支付不能成为公共知识。比如在商战中,相互竞争的双方不知道对方在各种产量下的利润,此时,策略下的支付不是公共知识。

这里不分析社会行动者的知识的结构,因为这非常困难。只是想说明,知识的不同是非常重要的。

一个群体中的每个人的知识是其现实行动的因素。在社会中知识分布决定了社会的结构,当然权力的分布和信息的分布是另外的决定行动的因素。在一群体的行动中,公共知识改变了,群体的均衡便发生了改变。

上述分析有些抽象,读起来令人乏味,现在让我们来看看公共知识的具体应用例子,通过这些例子,读者就能明白什么是公共知识,并且可以用它来分析身边的社会现象。

一个寓言——村庄里的大屠杀

在一个偏僻的山里,有一个村庄。这里是女人掌权,女人对一切事务说了算。村里有100对夫妇。

在这个村里已经形成了约定俗成的规定。如果女人发现自己的丈夫对自己不忠的话,就会毫不犹豫地将他杀死,而且就在当天执行。当然,她必须有确切的证据来证明她丈夫不忠。由于这个因素,某个女人发现某个男人不忠,她不会将之告诉那个不忠男人的妻子。但是

,她会告诉其他人的妻子,并且女人们会相互传递这一信息,因此最后,一个男人不忠,除了其妻子不知道外,其他女人都知道。

而事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她知道的事实告诉不忠男人的妻子,每个女人都不知道自己的男人不忠。因此,该村子一直很稳定,而没有发生妻子杀死丈夫的行为。

村子里有一个辈份很高的老太太,她德高望重,诚实可敬。每个人都向她汇报村里的情况,因此她对村里的情况了如指掌,她知道每个男人都不忠,当然,其他女人不知道她所知道的。

一天,这位老人对这100个女人说了一句很平常的话:“你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个事情:前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀,所有的女人都杀死了她们的丈夫。

故事就是这样的。

为什么会这样?

公共知识与行动均衡的打破这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不杀死他。这是女人的策略。

在老太太作了宣布之后的第一天,如果村里只有一个男人是不忠的话,这个男人的妻子在老太太宣布之后就能知道。因为,她会作这样一个推理:如果其他男人不忠的话,她应当事先知道,既然不知道并且至少有一个男人不忠,那么这个不忠的男人肯定就是她的丈夫。因此,村里如果只有一个男人不忠的话,老太太宣布之后,当天这个男人就会被杀死。

如果村里有两个男人不忠,那么,这两个男人的妻子第一天都不会怀疑到自己的丈夫,因为她知道另外一个女人的丈夫不忠。但是当第一天过后她没有发现那个不忠诚的男人被杀死,那么她会想,肯定有两个男人是不忠的,否则她知道的那个不忠的男人会被他的妻子当天杀死的。既然有两个男人不忠,但这两个不忠的男人的妻子想,她只知道一个,那么另一个不忠的男人肯定是她的丈夫!……

事实上这个村子里的100个男人不忠,那么,这样推理会继续到99天,就是说,前99天每个女人都没怀疑到自己的丈夫,而当第100天的时候,每个女人都确定地推理出她的丈夫不忠,于是村子里便发生了一场大屠杀,所有的男人都被他们的妻子杀死。

这里,在老太太宣布“至少一个男人是不忠的”这样一个事实时,每个女人其实都知道这个事实(村子里的规则她们也知道),老太太对这个事实的宣布似乎并没有增加这些女人的知识——关于村里男人不忠行为的知识。但为什么老太太的宣布使得村里的女人产生了对她们丈夫的屠杀行为呢?这是因为,老太太的宣布使得这个群体里的女人的知识结构发生了变化,本来“至少一个男人是不忠的”对每个女人都是知识,但不是公共知识,而老太太的宣布使得这个事实成为公共知识。

所谓公共知识是指,一群体的每个人不仅知道这个事实,而且每个人知道该群体的其他人知道这个事实,并且其他人也知道其他的每个人都知道这个事实……这涉及一个无穷的知道过程。

在上述例子中,老太太未宣布之前,对村子里的女人来说,“至少一个男人是不忠的”不是一个公共知识。设想一下,假定共有3个女人A、B、C,那么在未宣布之前,A想:由于自己不知道自己的丈夫不忠,其他两个女人B、C也同样不知道,那么A想B不知道C是否知道“至少有一个男人是不忠的”。而当老太太宣布了“至少一个男人是不忠的”之后,“至少一个男人是不忠的”便成了A、B、C之间的公共知识。

在这个100人组成的小村里,老太太的宣布使得“至少一个男人是不忠的”成了公共知识。于是,推理与行动便开始了。这是大屠杀的原因!

帽子:红色的还是白色的?(1)

与上述故事相同结构的一个事例是“帽子的颜色问题”。在“帽子的颜色问题”中,同样是公共知识不断公布,推理不断进行的过程。

有一群人围坐在一起,为了便于分析,假定只有4人(这与人数多少无关,可作同样分析)。每个人头戴一顶帽子,帽子为红色的还是白色的红色和白色两种,每个人看不到自己帽子的颜色,但能看到别人帽子的颜色。因此此时他不能判定出自己头上的帽子的颜色。

为了分析的方便,我们假定这4个人均戴的是红色的帽子。这时候,一个局外人来到他们的群体当中,对他们说:“你们其中至少一位头戴的是红色的帽子。”当他说了这句话后,他问:“你们知道你们头上的帽子的颜色吗?”4个人都说“不知道”;这个局外人第二次问:“你们知道你们头上的帽子的颜色吗?”4个人又都说“不知道”。局外人第三次问:“你们知道你们头上的帽子的颜色吗?”4个人又说“不知道”。局外人又问第四次:“你们知道你们头上的帽子的颜色吗?”这时4个人均说:“知道了!”

你能知道为什么吗?

当局外人未宣布“至少一个人戴的是红帽子”时,这个事实其实每个人都知道了,因为每个人看到其他3个人的帽子都是红色的,但每个人不知道其他人是否知道这个事实,即这个事实没有成为公共知识。而当这个局外人宣布了之后,“至少一个人帽子是红色的”便成了公共知识。此时不仅每个人知道“至少一个人的帽子是红色的”,每个人还知道其他人知道他知道这个事实……

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体大小
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
首 页 < 上一章 章节列表 下一章 > 尾 页