饭饭TXT > 学习管理 > 《博弈游戏(出书版)》作者:白波【完结】 > 博弈游戏.txt

第1章 囚徒困境

作者:白波 当前章节:8814 字 更新时间:2026-6-22 22:08

人类的自私天性,使他们陷入“囚徒困境”难以自拔。社会生活和商业竞争中的许多逻辑都与这一困境密切相关。

合作是可能的吗

在什么条件下才能从没有集权的利己主义者中产生合作?这个问题已经困惑人们很长时间。大家都知道人不是天使,他们往往首先关心自己的利益。然而,合作现象到处可见,它是文明的基础。那么,在每一个人都有自私动机的情况下,怎样才能产生合作呢?我们对这个问题的回答极大地影响了我们在与他人的社会、政治、经济交往时的思维和行为。

最著名的回答是由托马斯·霍布斯给出的。他悲观地认为,在有政府存在之前,自然王国充满着由自私的个体的残酷竞争引发的矛盾,生活显得“孤独、贫穷、肮脏、野蛮和浅薄”。按照他的观点,没有集权的合作是不可能产生的。因此,一个有力的政府是必要的。

曾经有一位人类学家写了一个关于伊克人的故事:伊克人从前是在乌干达北方山谷里采集、打猎的游牧民族,政府决定在那里开辟一个国家公园,于是,他们为法律所迫,不再在山谷间打猎,而成了耕种于山岭薄地的农民。

生活环境和生活方式的变化,摧毁了他们原有的社会规范,伊克人因此把自己变成了一群不可救药的、让人讨厌的人,他们六亲不认、极端自私、毫无爱心。

这些人似乎生活在一起,聚集在密集的小村子里,但他们实际上是孤寂的、互不联系的个人,没有明显的互相利用。他们也说话,但说出的只是些粗暴的强求和冰冷的回绝。他们什么东西都不共享,从来不歌唱。孩子一旦能走路了,就把他们赶出家门去抢劫。只要可能,随时都会把老年人抛弃,让他们饿死。行劫的孩子从无能为力的老人嘴边抢走食物。

他们生儿育女时毫无爱心,甚至连粗疏的照顾都没有。他们在彼此的大门口排便。他们对邻居幸灾乐祸,只是见到别人不幸时他们才笑。他们常常笑,也就是常常有人倒霉。

伊克人因此成为文学上的一个象征,用来代表整个人类失去信心、失去人情味后的命运将是什么。

今天,世界各个国家在没有统一领导(联合国只是个协调机构)的情况下交往。因此,产生合作的必要条件就与国际政治的许多中心问题有关。最重要的就是安全困境:国家往往通过那些威胁到其他国家安全的手段来寻求自身的安全。这个问题体现在区域冲突和军备竞赛上。

在日常生活中,我们会问自己还要请多少次那些从来不回请我们的客人来就餐。一个机构中的管理者为了得到一些回报而给另一位管理者提供帮助。一个得到绝密消息的新闻记者为了得到进一步的消息而对来源保密。如果只有两个公司同时生产一个产品,一个公司定较高的价格是为了期望另一个公司也能保持高价,因为这样,双方都能得到好处(当然消费者吃亏了)。

合作中存在着一个根本问题,两个工业国家之间相互设置贸易壁垒便是一个很好的例子。由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。

这个根本问题就是:个体对自身利益的追求会损害整体的利益。为进一步了解大量的具有这类性质的情况,需要有一个方法来表示这些情况的共同点,同时避免陷于每个情况的具体细节,即著名的“囚徒困境”游戏。

启示:一只河蚌正张开壳晒太阳,不料,飞来了一只鹬鸟,张嘴去啄它的肉,河蚌急忙合起两张壳,紧紧地钳住鹬鸟的嘴巴。鹬鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”河蚌说:“今天不放你,明天不放你,就会有死鹬鸟。”谁也不肯松口。有一个渔夫看见了,便走过来把它们一起捉走了——在对手的背后,往往还有更大的、共同的敌人。

“囚徒困境”的故事

1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后类似的博弈问题便有了一个专门名称——“囚徒困境”。

借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。

所谓的“囚徒困境”,大意是这个样子的。

甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):

如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;

如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;

如果两人都招供,则两人都会因罪名各判10年。

这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了,甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。

甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。

自然,乙也同样精明,也会如此推理。

于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是本问题的惟一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点,比如两人都拒认的场合,都有一人可以通过单方面改变选择,来减少自己的刑期。

也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。

为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。

“囚徒困境”这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说方式,产生不良结局的原因是因为囚犯二人都基于自私的角度开始考虑,这最终导致合作没有产生。

在这个游戏中,你将如何做呢?设想你认为对方将合作,你可以选合作,那么你将得到“对双方合作的奖励”。当然,你也可以选背叛,得到“对双方背叛的惩罚”。

换言之,如果你认为对方合作,那么你背叛将能得到更多的好处。反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是“笨蛋”;你选择背叛,就会得到“对双方背叛的惩罚”。因此,对方背叛,你也背叛将会更好些。这就是说,无论对方如何行动,你背叛总是好的。到现在为止,你似乎知道该怎样做;但是,要知道相同的逻辑对另一个人也同样适用。

因此,另一个人也将背叛而不管你如何做。这样,你们将是双方背叛,只能一起坐牢很久,这比你们双方合作所能得到的“奖励”(只需短期服刑)差很多。个体的理性导致双方得到的比可能得到的少,这就是“困境”。

启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。

启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。

选1还是选2

这个问题不仅让商人们苦恼不堪,也同样折磨着商学院的学生们。一位教授让自己班上的27名学生进行一个博弈,而这个博弈会把他们带入“囚徒困境”。

假设每一个学生都拥有一家企业,现在他必须决定自己应该1,生产高质量商品来帮助维持较高价格,还是2,生产假货来通过别人所失换取自己所得。根据愿意选择1的学生总数,将收入分给每个学生。

这是一个“事先设计好”的博弈,目的是确保每个选择2的学生总比选择1的学生多得50美分,这个设定当然有现实意义,生产假货成本要比高质量商品低。不过,选择2的人越多,他们的总收益就会越少,这个假设也有道理:假货太多,就会使市场混乱,产品信誉降低。

假设全体27名学生一开始都打算选择1,那么他们各得1.08美元。假设有一个人打算偷偷改变决定,选择2,那么,选择1的学生就有26名,各得1.04美元比原来少了4美分,但那个改变主意的学生就能得到1.54美元比原来多了46美分。

实际上,不管最初选择1的学生总数是多少,结果都是一样,选择2是一个优势策略。每一个改选2的学生都会多得46美分,同时会使他的26个同学分别少得4美分,结果全班收入会少得58美分。等到全体学生一致选择自私的策略,尽可能使自己的收益达到最大,他们将各得50美分。反过来,假如他们联合起来,协同行动,不惜将个人的收益减至最小,他们将各得1.08美元。你会怎么抉择?

演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成“合谋”,结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择1的学生总数是4,全体学生的总收益是15.82美元,比全体学生成功合作可以得到的收益少了13.34美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么,他自己又是怎么选择的呢?“噢,我选了2。”他答道。

政治家们也会变成同样的困境中的囚徒。1984年,大多数人都很明白,美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行,因此,大幅增税应该是不可避免的。不过,谁愿意担当政治领导角色带头主张这么做呢?民主党总统候选人沃尔特·蒙代尔想要在自己的竞选活动当中为这么一个政策转变制造声势,却被罗纳德·里根打得落花流水,因为里根许诺绝不加税。里根当选之后,这个议题陷入僵局,无论你怎么划分政治派别,民主党对共和党,众议院对参议院,还是政府对国会,各方都希望把提出加税的主动权推给对方。

双方都知道,联合起来共同倡议加税和削减开支,可以共同分享荣誉,分担谴责。这么做与同时坚守被动,眼看巨额赤字上升而无所作为相比,显然会对整个国家更有利,即便对他们自己的政治生涯从长期而言也会有好处。反过来,假如自己提出这样的政策,而对方坚守被动局面,并不附和,自己就会落得最糟糕的下场。从各方的角度看,最好的结果在于,对方有人提出加税和削减开支,并因此不得不付出政治代价。

我们可以将这个情况变成一个博弈。双方分别是民主党和共和党。为了表示谁更加倾向于怎么做,显而易见,对每一方而言,保持被动是一个优势策略。而这正是真实发生的情况:这一届国会根本没有作出任何加税决定。这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因。

启示:这些情景使我们回想起尤塞里安在约瑟夫·海勒的小说《第22条军规》当中的境遇。故事的背景是:第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地提高下属的任务定额,弄得所有人都人心惶惶。投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务。他的上级军官问:“可是,假如我方士兵都这么想呢(意思是“你不扛枪,我不扛枪,谁来保卫家”)?”可尤塞里安答道:“那我若是不这么想,岂不就成了一个大傻瓜?”

学生与囚犯

“囚徒困境”不仅可以解释政治、经济领域的竞争,在广阔的社会生活中,这一困境的影响也随处可见。例如,我国目前的基础教育,可以说就是一个“囚徒困境”。

最近10多年来,应试教育的弊端已经为社会公认,目前要求“减负”的不仅是中小学生和学生家长,也是教育专家和教育管理部门,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微,并没有从根本上解决问题。

很少有人否认,学校不断给学生增加负担是目前教育的实际状况。同样,大家普遍认为呆板僵化的应试教育扼杀了学生的创造性。无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论你是否意识到教育有问题,你的小孩都必须接受这个教育。如果没有改变整体性的教育体制,个别人、个别学校、个别地方单独改变都可能使其付出代价。每个家长都会这样想:尽管这种教育不好,但是其他小孩采取的是这种教育,衡量标准(如中考、高考)也是依据这种教育,我的小孩如不这样做,在竞争方面就会吃亏。因此,每个孩子和家长已经不知不觉地进入了一个囚徒困境。

如果我国现有的考试制度没有改变,“减负”就是空谈。现在假设国家严格规定:所有的学生都“减负”,少留作业,不补课、不做其他的练习题,是否能解决问题?可以肯定的是,规定即使一时有效,但效果会很快消失,最终极可能的结果是规定成了一纸空文,学生还是要背大书包、拼命做课外作业和各种练习题。

可以说,减负的状态是不稳定的,而“增负”的状态是稳定的均衡。原因就是,目前教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。而对于老师和学校来说,学生的升学率高意味着名利双收、饭碗牢靠;如果整个规则都倾向“增负”,“负”又如何减得下来?

从理论上说,摆脱“增负”的囚徒困境的惟一办法是改变教育的博弈结构,即改变博弈规则或游戏规则,让“全面发展”的学生获得更多的机会。可是要在实践中达到这个效果,却又困难重重,除了教育投入不足、师资水平不高等现实问题,最大的难点,是如何找到一个更科学、合理,同时又能保证公平的新的“游戏规则”。

至少在现在,这还是个没有答案的问题。

启示:管理的目的不是让每个人做到最好,而是避免内耗过多。

烟草商为何不反对禁止烟草广告

从上面的例子来看,一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。那么,有什么办法可以使我们逃脱“困境”?稍后将详细讨论这个问题,这里只说一个外力干预打破困境的例子,它具有一些背谬甚至滑稽的色彩。

1971年,在“禁烟运动”的声势下,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。而且,后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。

你是否知道烟草公司为什么不反对、甚至可能还欢迎这项法律?因为这个禁令使他们从“囚徒困境”中解放了出来。

烟草行业同样竞争激烈,为了争夺市场,各大烟草公司都必须大做广告。为此,它们每年都要花费巨额广告费用,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告,它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走。这正是一个囚徒困境:你合作,对方不合作,你就吃亏了。在这种情况下,做广告就是优势策略。那么,烟草公司能否达成都不做广告的协议呢?不能,因为谁遵守协议,就很可能被对手耍弄。

现在好了,烟草公司做不到的,国家为它做了:法律起到了协议的作用,而政府承担了监督的成本,借用过去的一句话说,是“起到了阶级敌人想起而起不到的作用”,烟草公司又何乐不为呢?

你可能会说:广告不但有竞争的作用,也有开拓市场的作用,在这方面,烟草公司不是也有损失吗?当然如此。但是注意这个法律是有限的,被禁止的只是电视广告,而不包括其他媒体;而且只禁止在美国做电视广告,而不包括其他国家。(几年前,我们不是都看过气势不凡的“这里就是万宝路的世界”这个电视广告吗?)对于已经比较成熟的市场,像香烟这样的商品,广告的开拓作用是有限的。现在,美国烟草公司已经把开拓的目标放在了广大的国外市场。

一定是坏事吗

“囚徒困境”确实揭示了自私对合作的破坏作用,但是正如“有一利必有一弊”这句话,“囚徒困境”给我们带来的也并不全是坏消息。

作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。如果两个危险的罪犯通过合作逃脱了法律制裁,一定会给社会造成更大的危害。

同样,如果商家通过合谋控制物价,我们就不能享受合理的价格,这也会大大增加人们的消费成本,降低人们的生活水平。

从经济的角度来看,如果几个大企业联手或勾结起来形成对行业的垄断,谋求最大利润,那么它们结成的联盟称为“卡特尔”。卡特尔因为由自主的企业组成,所以很不稳定。以产量竞争来说,组成卡特尔,就要讨价还价,达成限制产量的协定,总产量因为协定的限制降低了,价格也就会上去,可能比结成卡特尔以前高出很多。这时候,谁要是偷偷地扩大产量,他可能占到很大的便宜。卡特尔联盟和组成联盟的成员之间的关系,不是上下级的关系,不是谁服从谁的关系。卡特尔的成员都是独立的经济主体,只不过为了利益关系走到一起来了。偷偷违反协议增加产量或提供优惠会捞到很大的便宜,这就促使一些成员违反协议。所以说,卡特尔本身就提供了瓦解卡特尔的激励。

在人类经济活动中,除了石油输出国组织欧佩克一度比较成功以外,卡特尔成功的例子实在很少。

欧佩克之所以比较成功,很大的原因在于它的最大的成员国沙特阿拉伯“自律”较严。石油产量最大的沙特阿拉伯自律严了,在一段时间内就可以避免其他成员违反协议,造成危害卡特尔的结果。沙特阿拉伯为什么自律较严,我们在后面将会谈到。

从政府管制的角度来看,卡特尔在许多情况下是非法行为。例如近年来的“家电”大战,电视、空调等价格一路下跌,残酷的价格战让家电企业吃不消,几年前,9家企业曾经一起协议制定最低价格,规定什么类型的家电至少要卖多少钱,不许把价格降到比协议规定的价格还低的水平,其目的无非是不要竞相降价,以免大家的利润都下降。这就是卡特尔行为。很快,国家计委就发出文件,指出该决议非法。这主要是不许企业联手抬高商品价格损害消费者的利益。发达国家对垄断现象和卡特尔现象的限制往往更加严厉。最典型的例子是20世纪80年代,经过多年的辩论和漫长的立法程序,美国把原来垄断电话通讯市场的AT&T公司强行分割为几个公司。分割以后,由于公司之间的竞争,电话服务的价格很快就下降了一半,再加上竞争激励出来的技术进步,现在用电话卡从美国往中国打电话一分钟只要几美分。

从原则上说,政府鼓励企业之间的竞争,因为企业竞争会给广大消费者带来很大的好处。比如我国电话服务市场长期是垄断的,所以直到前几年,在我国许多地方,装一部电话不仅要花三四千元,而且还要排队等待不少时间才能装上。但是在许多发达国家,如果你要装电话,只需通知电话公司,马上就会给你装好,完全不用缴纳什么安装费。由于竞争,如果你把选择的电话服务从原来的公司撤出来转到另一家公司,新的公司还会给你奖励,比如说奖励你30分钟的国内长途电话费,再加一件T恤什么的。现在,我国电话服务市场开放竞争,消费者固然马上得到实惠,服务水平也在明显上升。再如过去我国移动电话市场原来基本上是一家垄断,当时购置、使用一部移动电话的费用高达一两万元,是典型的“奢侈品”。后来打破了这一垄断,允许几家企业共同经营,移动电话的费用很快就降到千元左右,几乎成了人手一部的“必需品”。

初看起来,鼓励竞争似乎对企业不利,使企业不容易赚钱。但是只有这样,才能激励企业改善管理,开发技术,努力以较低的成本生产质量较好的产品。提高企业的市场竞争力。竞争力不是天生就有的,它本身就是竞争的结果。若不首先让我们的企业在国内市场好好竞争,他们在国际市场就不可能有强大的竞争力。

启示:曾经有两个饥饿的人,他们从一位智者那里得到了一根鱼竿和一篓鲜鱼,得到那篓鲜鱼的人就在原地把鱼煮熟了一口气吃完,解决了饥饿问题,可是很快就又感到肚内空空,最终饿死在了空空的鱼篓旁。而另一个得到鱼竿的人则提着鱼竿向遥远的大海走去,当他终于来到了大海边的时候,他也用尽了自己的最后一点力气。不久之后,同样是两个饥饿的人,他们也从智者那里得到了同样的一根鱼竿和一篓鲜鱼。不同的是他们并没有分头行动,而是一起去寻找遥远的大海。每到饥饿的时候,他们就会从鱼篓中拿出一条鱼来吃。当他们终于来到了大海边的时候,这两个人就拿着那根鱼竿开始了靠捕鱼为生的日子。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体大小
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
首 页 < 上一章 章节列表 下一章 > 尾 页