饭饭TXT > 学习管理 > 《博弈游戏（出书版）》作者：白波【完结】 > 博弈游戏.txt

第15章决策的艺术与科学.2

作者：白波当前章节：11815 字更新时间：2026-6-22 22:08

这不仅是对博弈论的考验，更是对人类智慧的考验。

启示：你也许已经发现一个悖论：解决公用地悲剧的方法(通过私有化使人们从保护中获得利益)却是更大的公用地悲剧的根源(个人和国家追逐利益，破坏地球环境)。这其实也并不奇怪，"人类社会学三定律"其中有这样一条：一个系统内的解决之道，将成为更大系统的难题。

尾声

什么是最佳策略

故此，尔等须知晓自身宿命，故此，尔等须把稳船只......置欲求于动机之后，尔须奋力以搏。

故此，且容好奇心为尔等指南。追寻天上真理，如同在大地寻觅。

所不敢为者，为之；所不敢至者，往之。

道路千万条，宜选阳光道。聪明择路，正派为人，公平行事。

故此，尔须多有智识，勤于创造。

--《爱因斯坦的圣经》

很抱歉，这本谈策略的书要以布道告终。但是正如我们看到的：好多人失败，不是因为他们傻，而是太聪明。

一个聪明人的麻烦是他总希望比别人多得一些，或者说，他总面临这样做的诱惑。因为他比别人聪明，他是有能力这样做的，按照我们对人性的了解，人普遍追求利益的最大化，聪明人这样做，也是很自然的。

然而，这种自然的行为却引起了一系列无法控制的变化，其中最关键的就是：生活越来越复杂了。

比如，你要做成一件事情，希望达到某种目的，但是你不能仅仅考虑这件事本身，还要考虑它可能造成的各种影响。要不要与人合作？利益如何分配？它会不会得罪某些人？等等。你不得不考虑它们，因为这些问题确实存在。这样你就不得不花费大量的精力和智慧去处理它们，而这些花费对你本来想做的那件事并无多大益处。也就是说，它们大大提高了你做事的成本。这种多余的花费似乎是我们的宿命。

如果大家都考虑得少一点，都傻一点，不是对每个人都好吗？所有美好的东西都是傻子创造的：埋头苦干的是傻子，助人为乐的是傻子，推己及人的是傻子，满怀希望的还是傻子，傻子创造了世界，傻子享有世界。

很遗憾，我们已经懂得，世界不会因愿望(不管多么良好，多么合理)而改变，"傻子"在这个世界一定是无法生存的，因为在一个资源稀缺的世界，可以说"利他"的机会成本就是"损己"，而"损己"的极至便是让出你的生存空间给别人。但是，我们还是有可能改变一些东西的，只要你懂得：聪明可能并不像看起来那样聪明，傻也不像看起来那样傻。

"囚徒困境"中，人们越聪明，结果越糟糕。而打破这一困境的办法很简单：一报还一报。也就是所谓"人不犯我，我不犯人；人若犯我，我必犯人"。它能够清晰表明我们的立场，用最明了的方式告诉对方：为了自己的利益，他该怎样去做。

从"一报还一报"的胜利中，我们可以得到以下结论：你的策略越简单，越清晰，也就越有效。相反，如果你的策略无原则的复杂，将永远面临考验。

书店里有很多书指导你如何生活、如何与人相处、如何应付这样那样的问题，杂志上也连篇累牍地告诉你如何说话、如何察言观色、如何八面玲珑。不用说，这些人生指南常常是相互矛盾，甚至是自相矛盾的。你应该诚实，但又不能太老实；你应该友善，但也要偶尔发发脾气；你应该能干，但又不要弄到被别人嫉妒的地步；你应该聪明，但要装得傻一点；你要讨领导的欢心，但不要被认为是个马屁精；你要多交朋友，但未可全抛一片心......即使你没让这些东西弄糊涂，也不免感到，想好好活下来真是不容易，你得学会踩钢丝才行。

人生有无数答案，我们很难确知哪个最标准。如果你想把答案弄得很复杂，那是你的权利，但不是惟一的解决之道，其实你也完全可以用简单的方法对付它，那就是：不管周围如何，你为自己制定几条原则，并照此行事。

这很愚蠢吗？其实未必。环境是无法选择的，也是无法完全控制的，你在上面花费的心思，就不一定划算。

因此，我们再次重复强调一些通则，不过这么做有点儿冒险，因为人们倾向于过度简化生活，尤其是在这个头条标题取代新闻、记录片取代真实故事、书摘取代书籍的年代里更是如此。所以别忘了另外两句没有列入这些通则中的话：怀疑是权利的保证；要"拿来"，不要"接受"。

策略的优劣，取决于游戏规则。个人的最佳策略是尽可能利用规则，社会的最佳策略是通过规则引导人们的行为趋向群体福利的提高。

对合作或冒犯，都要给予回报。"以德报德，以直报怨"。如果你惩罚对方的报复，这种反应就会一直延续下去。如果你宽恕了对方，你就得冒被欺负的风险。

不要把赢作为惟一目标，也不要总是追求最好结果。在许多类似"囚徒困境"的博弈中，双方的关系并不是简单的"你赢我输"的对抗关系。双方可以都做得很好，也可能都做得很糟。制胜不是靠打击对方、压倒对方，而是靠引导对方采取对双方都有利的行为，即合作的行为。

如果有几种选择，选择最直的路。清晰、简单、有连续性、让合作方明白易懂的策略往往是最优的。公开声明自己所持的态度，并在任何时间、任何利益诱惑下都始终如一地坚持下去，才会使自己立于不败之地。朝令夕改会令对方无所适从。复杂的规则并不比简单的规则做得更好。

你不可能永远控制局面，也不必永远控制局面，人类最理智的时候，往往是别无选择的时候。

知识就是力量。至少在某些情况下，拥有一定程度的知识对理性决策助益匪浅，而且知道得越多，你的决策就越可能接近正确。在博弈中，你的地位常常取决于你是否拥有信息并在此基础上作出理性决策。各种层次、领域的决策都可以通过知识的增长而改善。

除非能在一开始就很清楚自己的既定目标，或想要避免的事，不然永远无法作出理性决策。这适用于个人与团体决策，只是对后者而言，显然困难得多。如果能同时设定可能后果的价值，不论正负，再加上发生的机率，就更能帮你做不理智的抉择。

即使是全然理性的决策也可能是错的，反之亦然。因此，若结果出乎意外地糟，也没有必要自责或自暴自弃；同样地，如果运气好，结果也不错，更不必沾沾自喜。如果是不确定的，那就是不确定，你只能与机运斗法，但若能以智慧来与机运抗衡，则获胜的机会就会比失败大出许多。

无论你想做什么，不管是赌博、运动、投资股市、择偶，甚或发动战争，之前你最好弄清楚自己在做什么。

合作与双赢并不意味着完全的公平。所有好的策略，都不过是在公平与效率之间找平衡。

注定会产生坏决策的一个方法，就是把决策者和受益者分离，决定人和被决定人分开；虽然一般人大谈对社会福利的关切，但这种关切只有在和个人利益没有切身关系时才看得到；一旦社会福利造成个人损失，利他主义就消失了。

团体决策基本上比个人决策更难保持理性，在团体决策过程中有很大的操弄和使诈的空间。目前已知的各种选举制度都无法避免这个现象，只不过有些制度的表现比较好而已。

至今仍找不到令人满意的方法，能在不产生不良结果的情形下，同时顺利地把各人偏好转换成团体偏好。阿罗不可能原理告诉我们：任何制度都有缺陷，而最好的制度就是造成损害最少的制度。内耗不可避免，明智的人把内耗控制在可接受的限度内。

据此推论，"若每个人的行为都以理性的自利为出发点，则其结果仍会对社会有利"，这个乐观想法仍旧是个误区。更不幸的是，它反而掩饰了无知自利的影响。

再以此推论，至今人类仍未发明出一种政府形态，完全令人满意、可以作出造福社会的团体决策。我们真的不知道该往何处去，所以要常怀谦逊之心。

博弈论"不是"大力丸"

　"博弈论"不是"大力丸"

作者：摸鱼儿

现在，"博弈论"正在成为一门"显学"，坊间这类著作颇多。对于普通读者来说，《博弈游戏》似乎是个不错的选择。

"博弈"这个词听起来高深莫测，其实它就是"游戏"的意思。如果直译就是"游戏理论"。更准确点说，是可以分出胜负的游戏。

我们生活在这个世界上，就不可避免地要与他人打交道，这是一个利益交换的过程，也就无可避免地要面对各种矛盾和冲突。所谓博弈论，简单说来就是研究在这种背景下，人们如何进行决策、以及这种决策的如何达到均衡问题。每个对弈者在决定采取何种行动时，都必须考虑到他的决策行为对其他人的可能影响，以及其他人的反应行为的可能后果，通过选择最佳行动计划，来寻求收益或效用的最大化。

可以说，只要你是一个"社会人"，你就离不开博弈论。

关于"生活智慧"的著作大致可分两种：一是"照方抓药"式的，告诉你在某种情况下应该怎么做；二是"思想教育"式，从林林总总的生活现象总结一般规律，并以此指导生活中的种种选择。前者之弊在于浅陋，后者之弊在于空泛。这本书比较好地避免了这两种陷阱：它介绍了许多特定情况下的决策原则，但并不是什么"策略大全"；它告诉读者：人们在进行选择时遵循的一般规律，但都言之有物。

"深入浅出"也是本书的一个特点：它摈弃了同类作品中常见的(同时也是令读者望而却步的)图表、公式等"专业"模式，而是通过一些有趣的例子和谜题(如"囚犯困境"、"约会游戏"、"枪手决斗"、"强盗分金"等)解释生活中的种种现象，告诉你为什么有时我们会在优势情况下输掉比赛；为什么群体理性决策如此困难；为什么社会公德难以提高，为什么"聪明人"不象他看起来那样聪明......这些揭示都不是流于表面的、情绪化的和止于道德判断的，而是通过清晰、客观的分析，让我们理解人们思想和行动的逻辑。

如同许多理性而诚实的著作一样，本书并没有给我们一个"包治一切"的现成的"答案"(尽管它提供了许多很有启发性的思考方式和选择原则)，而是指出我们理性的并不完美。在这个问题成堆的世界上，单纯地"予智自雄"或"以力压人"都终非坦途，我们只有怀着谦逊、合作的态度，才可能取得比较理想的结果。

纳什与博弈论

1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。然而，纳什天才的发现却遭到冯·诺依曼的断然否定，在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性，使纳什坚持了自己的观点，终成一代大师。要不是30多年的严重精神病折磨，恐怕他早已站在诺贝尔奖的领奖台上了，而且也绝不会与其他人分享这一殊荣。

纳什是一个非常天才的数学家，他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而，他的天才发现--非合作博弈的均衡，即"纳什均衡"并不是一帆顺的。

1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯......等全都在这里。博弈论主要是由冯·诺依曼(1903-1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论，而且发明了计算机。早在20世纪初，塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达，直到1939年，冯·诺依曼遇到经济学

家奥斯卡·摩根斯特恩(Oskar Morgenstern)，并与其合作才使博弈论进入经济学的广阔领域。

1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版，标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如，1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，片断的研究，带有很大的偶然性，很不系统。

冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，诺依曼的博弈论的局限性也日益暴露出来，由于它过于抽象，使应用范围受到很大限制，在很长时间里，人们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响力很有限。正是在这个时候，非合作博弈--"纳什均衡"应运而生了，它标志着博弈论的新时代的开始！

纳什不是一个按部就班的学生，他经常旷课。据他的同学们回忆，他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课，但纳什争辩说，至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者，可是，没上几次课，纳什就认定这门课不符合他的口味。于是，又走人了。然而，纳什毕竟是一位英才天纵的非凡人物，他广泛涉猎数学王国的每一个分支，如拓扑学、代数几何学、逻辑学、博弈论等等，深深地为之着迷。纳什经常显示出他与众不同的自信和自负，充满咄咄逼人的学术野心。

1950年整个夏天纳什都忙于应付紧张的考试，他的博弈论研究工作被迫中断，他感到这是莫大的浪费。殊不知这种暂时的"放弃"，使原来模糊、杂乱和无绪的若干念头，在潜意识的持续思考下，逐步形成一条清晰的脉络，突然来了灵感！这一年的10月，他骤感才思潮涌，梦笔生花。其中一个最耀眼的亮点就是日后被称之为"纳什均衡"的非合作博弈均衡的概念。

纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为"非合作博弈"的长篇博士论文，1950年11月刊登在美国全国科学院每月公报上，立即引起轰动。说起来这全靠师兄戴维·盖尔之功，就在遭到冯·诺依曼贬低几天之后，他遇到盖尔，告诉他自己已经将冯·诺依曼的"最小最大原理"(minimax solution)推到非合作博弈领域，找到了普遍化的方法和均衡点。盖尔听得很认真，他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况，而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表，以免被别人捷足先登。

纳什这个初出茅庐的小子，根本不知道竞争的险恶，从未想过要这么做。结果还是盖尔充当了他的"经纪人"，代为起草致科学院的短信，系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多，就那么几篇，但已经足够了，因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授，要求在"核心的刊物"上发表多少篇文章。按照这个标准可能纳什还不一定够资格。1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章，特殊的人才，必须有特殊的选拔办法。

纳什在上大学时就开始从事纯数学的博弈论研究，1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域，他做出了划时代的贡献，是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献，都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

大原理的普遍应用

孙健

从"纳什均衡"的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于"囚徒的两难处境"这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

价格战博弈：

现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战......这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会"没事儿偷着乐"。在这里，我们可以解释厂家价格大战的结局也是一个"纳什均衡"，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个"纳什均衡"。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或"纳什均衡"可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对

博弈论(vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则："把你自己的战略建立在假定对手会按其最佳利益行动的基础上"。事实上，完全竞争的均衡就是"纳什均衡"或"非合作博弈均衡"。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

污染博弈：

假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入"纳什均衡"状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个"看不见的手的有效的完全竞争机制"失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。

贸易自由与壁垒：

这个问题对于加入WTO不久的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个"纳什均衡"，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。

博弈论中的"囚徒困境"问题

分类：社科

　博弈论中的"囚徒困境"问题

莉香叶子

学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例--囚徒困境，非常耐人回味。

"囚徒困境"说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

当然，在现实世界里，信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。

促使生物体和人类相互合作的策略

莉香叶子

尽管合作与信任是如此难得统一，但是，无论在自然界还是在人类社会，"合作"都是一种随处可见的现象。那么，问题就出现了：到底是何种机制促使生物体或者人类进行相互合作呢？

这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家，对合作的问题久有研究兴趣。为了进行关于合作的研究，他组织了一场计算机竞赛。这个竞赛的思路非常简单：任何想参加这个计算机竞赛的人都扮演"囚徒困境"案例中一个囚犯的角色。他们把自己的策略编入计算机程序，然后他们的程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩"囚徒困境"的游戏。他们每个人都要在合作与背叛之间做出选择。

但这里与"囚徒困境"案例中有个不同之处：他们不只玩一遍这个游戏，而是一遍一遍地玩上200次。这就是博弈论专家所谓的"重复的囚徒困境"，它更逼真地反映了具有经常而长期性的人际关系。而且，这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合，则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次，则双方就建立了各自的历史档案，用以记录与对手的交往情况。同时，它们各自也通过多次的交手树立了或好或差的声誉。虽然如此，对方的程序下一步将会如何举动却仍然极难确定。实际上，这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗？或者，它能总是采取背叛行动吗？它是否应该对对手的举动回之以更为复杂的举措？如果是，那会是怎么样的举措呢？

事实上，竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是，竞赛的桂冠属于其中最简单的策略：一报还一报(TIT FOR TAT)。这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。一报还一报的策略是这样的：它总是以合作开局，但从此以后就采取以其人之道还治其人之身的策略。也就是说，一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方，从这个意义上来说它是"善意的"。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它)，从这个意义上来说它是"宽容的"。但它会采取背叛的行动来惩罚对手前一次的背叛，从这个意义上来说它又是"强硬的"。而且，它的策略极为简单，对手程序一望便知其用意何在，从这个意义来说它又是"简单明了的"。

当然，因为只有为数不多程序参与了竞赛，一报还一报策略的胜利也许只是一种侥幸。但是，在上交的14个程序中，有8个是"善意的"，它们永远不会首先背叛。而且这些善意的程序都轻易就赢了6个非善意的程序。为了决出一个结果来，爱克斯罗德又举行了第二轮竞赛，特别邀请了更多的人，看看能否从一报还一报策略那儿将桂冠夺过来。这次有62个程序参加了竞赛，结果是一报还一报又一次夺魁。竞赛的结论是无可争议的。好人，或更确切地说，具备以下特点的人，将总会是赢家。

1.善意的；

2.宽容的；

3.强硬的；

4.简单明了的。

一报还一报策略的胜利对人类和其他生物的合作行为的形成所具有的深刻含义是显而易见的。爱克斯罗德在《合作进化》一书中指出，一报还一报策略能导致社会各个领域的合作，包括在最无指望的环境中的合作。他最喜欢举的例子就是第一次世界大战中自发产生的"自己活，也让他人活"的原则。当时前线战壕里的军队约束自己不开枪杀伤人，只要对方也这么做。使这个原则能够实行的原因是，双方军队都已陷入困境数月，这给了他们相互适应的机会。

一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。这样的例子很多：真菌从地下的石头中汲取养分，为海藻提供了食物，而海藻反过来又为真菌提供了光合作用；金蚁合欢树为一种蚂蚁提供了食物，而这种蚂蚁反过来又保护了该树；无花果树的花是黄蜂的食物，而黄蜂反过来又为无花果树传授花粉，将树种撒向四处。

更广泛地说，共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。那么，只要这些个体能互相遇见，足够在今后的相逢中形成利害关系，他们就会开始形成小型的合作关系。一旦发生了这种情况，他们就能远胜于他们周围的那些背后藏刀的类型。这样，参与合作的人数就会增多。很快，一报还一报式的合作就会最终占上风。而一旦建立了这种机制，相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意，一报还一报政策强硬的一面就会狠狠地惩罚他们，让他们无法扩散影响。

现在，对博弈论的研究是如此地广泛，以致于有些人说最新的经济学和管理科学都已经利用博弈论的理论和工具重写过了。博弈论中有很多有趣而富于哲理的案例，善意、宽容、强硬、简单明了的合作策略无论对个人还是对组织的行为方式都有很大的指导意义。

设置

手机

书架

书页

第15章 决策的艺术与科学.2

第15章决策的艺术与科学.2