饭饭TXT > 学习管理 > 《博弈游戏（出书版）》作者：白波【完结】 > 博弈游戏.txt

第2章优势、劣势与均衡

作者：白波当前章节：12619 字更新时间：2026-6-22 22:08

当你身处类似"囚徒困境"这样的同时行动的博弈中，你的最佳策略是什么？决定胜负的因素又是什么？双方的策略选择往往是有迹可遁的，并形成某种"定式"--即均衡。

新闻大战与博弈策略

势者，因利而制权也。--《孙子兵法》

前面所引的这句话的意思就是：所谓(有利的)形势，即根据对我有利的情况采取措施和行动。

当你身处类似"囚徒困境"这样的同时行动的博弈(跟棋牌之类的交替行动博弈不同)你的最佳策略是什么？决定胜负的因素又是什么？双方的策略选择往往是有迹可循的，并形成某种"定式"--即均衡。

为了说明博弈如何达到"均衡"的结果，我们可以通过两份杂志(以美国的两大杂志《时代》和《新闻周刊》为例)来演示这一过程。

每个星期，《时代》和《新闻周刊》都会暗自较劲，要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面，可以吸引站在报摊前的潜在买主的目光。因此，每个星期，《时代》的编辑们一定会举行闭门会议，选择下一个封面故事。

他们这么做的时候，很清楚在此时《新闻周刊》的编辑们也在关起门来开会，选择下一个封面故事。反过来，《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情，而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点......这两家新闻杂志投入了一场策略博弈。由于《时代》与《新闻周刊》的行动是同时进行的，双方不得不在毫不知晓对手决定的情况下采取行动。等到彼此发现对方做了什么，再想做什么改变就太迟了。当然，这个星期的输家下个星期很可能竭力反扑，不过，等到那时，说不定已经出现了一个完全不同的新的故事模式，开始了一场完全不同的博弈。

要注意这种同时进行的博弈与相继(一先一后)行动的博弈所要用到的策略思维和行动是完全不同的。对于像下棋这样的一人一步的相继行动的博弈，每个参与者都必须向前展望，估计对手的意图，从而倒后推理，决定自己这一轮应该怎么走。这是一条线性的推理链："假如我这么做，他就会那么做--若是那样，我会这么反击"，依此类推。也就是说，你怎么走，完全取决于对手的上一步行动。

而在同时行动的博弈里，没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下，互动推理不是通过观察对方的策略进行，而是必须通过看穿对手的策略才能展开。要想做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便你那样做了，你只会发现，你的对手也在做同样的事情，即他也在假设自己处于你的位置会怎么做。因此，每一个人不得不同时担任两个角色，一个是自己，一个是对手，从而找出双方的最佳行动方式。与一条线性的推理链不同，这是一个循环--"假如我认为他认为我认为......"，诀窍在于怎样破解这个循环。

启示：有一个著名的寓言：两个人都在喝水，都喝了半杯水，一位说："我已经喝了半杯。"另一位说："我还有半杯水没有喝。"他们好像说的是一回事，然而聪明人都可以听出他们说的又不是一回事，就像有些人说："我的钱已经用了一半。"而另一些人说："我的钱还有一半没有用。"

同时行动的优势策略

你怎样才能看穿所有那些错综复杂而又看不见的策略呢？首先，你不要把其他参与者的未知行动视做像天气那样，具有与个人无关的不确定性。上班之前，你可能收听天气预报，知道今天是否下雨，你会利用这个信息去决定要不要带一把雨伞去上班。当然，你带不带伞，丝毫不能影响天下不下雨。但为封面故事而作决定的概率则完全是另外一回事。

区别在于，《时代》的编辑对《新闻周刊》有一个非常中肯的了解--另一个杂志的编辑与天气不同，他们是策略的博弈参与者，就跟《时代》的编辑自己一样。即便一个编辑不可能真的观察到另一个杂志的决定，他也可以通过另一个杂志的视角思考这个问题，尝试确定它现在一定在做什么。

我们可以提供一个单一的、统一的原理，为相继行动(即有先有后)的博弈确定最佳策略。这就是向前展望，倒后推理。在这里，事情不会那么简单。不过，关于同时行动必不可少的思维方式的思考可以总结为指导行动的三个简单法则。反过来，这些法则又基于两个简单概念：优势策略与均衡。

举个简单的例子：你是一名足球前锋，你和队友形成了二打一的局面，你面对着对方的后卫，你可以选择带球突破，也可以选择传球给队友，一般情况下，传球过人的成功率更大，那么传球就是你的优势策略。即某些时候它胜于其他策略，且任何时候都不会比其他策略差。一般而言，假如一个球员有某一做法，无论其他球员怎么做，这个做法都会高出一筹，那么这个球员就有一个优势策略。假如一个球员拥有这么一个策略，他的决策就会变得非常简单；他可以选择这个优势策略，完全不必担心其他对手怎样行事。因此，寻找优势策略是每一个人的首要任务。

回到《时代》对《新闻周刊》的例子，假定本周有两个大新闻：一是国会就预算问题吵得不可开交；二是发布了一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候，首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻封面故事都会买这本杂志)。在报摊前的买主当中，假设30%的人对预算问题感兴趣，70%的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志；假如两本杂志用了同一条新闻做封面故事，那么感兴趣的买主就会平分两组，一组买《时代》，另一组买《新闻周刊》。

现在，《时代》的编辑可以进行如下推理："假如《新闻周刊》采用艾滋病新药做封面故事，那么，假如我采用预算问题，我就会得到整个'预算问题市场'(即全体读者的30%)；假如我采用艾滋病新药，我们两家就会平分'艾滋病新药市场'(即我得到全体读者的35%)，因此，艾滋病新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问题，那么，假如我采用同样的故事，我会得到15%的读者，假如我采用艾滋病新药，就会得到70%的读者；这一次，第二方案同样会为我带来更大的收入。因此，我有一个优势策略，就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个，这一策略都会比我的其他策略更胜一筹。"

启示：一家尖端科技公司的某部经理，询问副总工程师新产品的市场成功率。他得到的答案是"大约50%"，这位经理回答说："太高了，最好设定在30%，否则，我们会因太保守而不敢放手做。"

当对手有优势策略时

在这个博弈里，双方都有一个优势策略。

以策略观点来看，各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动，却有一个可以预见的结局：全体参与者都会选择自己的优势策略，完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。

在囚徒困境中，两个参与者都有一个优势策略，只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题：参与者怎样合作才能取得一个更好的结果？

有时候，某参与者有一个优势策略，其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子，就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事，喜欢这个新闻的潜在买主当中有60%的人选择《时代》，40%的人选择《新闻周刊》。

对于《时代》，艾滋病新药仍然是优势策略，但对于《新闻周刊》就不再是了，因为《时代》的优势策略是选择艾滋病新药这个主题，如果它也做同样选择，那么只能得到28%的读者，小于选择预算问题的30%。

换言之，《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择艾滋病新药，《新闻周刊》选择预算问题就能得到更好的销量，对于《新闻周刊》，预算问题市场总比新药市场要大。

《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么，不过他们可以分析出来。因为《时代》有一个优势策略，那一定就是他们的选择。因此，《新闻周刊》的编辑们可以很有把握地假定《时代》已经选了艾滋病新药，并据此选择自己的最佳策略，即预算问题。

由此可见，只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略，另一方则针对这个策略采用自己的最佳策略。

优势策略与对手策略无关

现在，既然我们已经介绍了优势策略的概念，就有必要强调可用来确定什么不是优势策略的两点特征。

人们很容易就会弄错，不知道优势策略的优势究竟是对什么而言的。"优势策略"的优势是指你的这个策略对你的其他策略占有优势，而不是对你的对手的策略占有优势，无论对手采用什么策略。

某个参与者如果采用优势策略，就能使自己获得比采用任何其他策略更好的结果。回顾封面大战的例子，《时代》和《新闻周刊》都有一个优势策略，但双方都不可能得到比对方更高的销量。

另一个常见的误解在于，一个优势策略必须满足一个条件，即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹。在前面讲到的例子里，所有优势策略凑巧都满足这个条件。按照最初设定的条件，《时代》假如采用艾滋病新药做封面故事，最坏的结果是得到35%的市场份额；他们若采用预算问题做封面故事，可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。

现在让我们想像一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是l美元，且售价只有两个可能的价位选择，分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为l美元)。假设顾客永远倾向于选择价格较低的杂志，且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候，读者总数是500万；杂志价格降到2美元，读者总数将升到800万。这时，你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润，即如果你们都是3美元，利润都是500万；一方降价至2美元，独得800万，另一方分文不得；如果双方都降，每一方利润都是400万。

有点像"囚徒困境"是不是？的确，在囚徒困境中，双方的优势策略都是招供，在这里都是降价。

《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是，采用另外一个策略可能得到的最佳结果将超过这一数字，达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的；不过，假如这时《时代》把价格降到2元，利润还会更高，达到800万美元。

我们可以把这些例子归纳为一个指导同时行动的博弈的法则。即：假如你有一个优势策略，请照办。

不要担心你的对手会怎么做。假如你没有一个优势策略，但你的对手有，那么就当他会采用这个优势策略，相应选择你自己最好的做法。

提醒一句：我们已经确立了同时行动的博弈的优势策略的概念。若是换了相继行动的博弈，采用优势策略的时候就要格外留神。因为策略互动的本质已经改变，优势策略的概念也会完全不同。假设我们说你有一个优势策略，无论你的对手选择怎么做，你按照这个策略做都比采用其他策略更好。若是相继行动，而你的对手先行，你就应该一直选择自己的优势策略。正如我们已经说过的那样，这是你对你的对手每一个行动的最佳对策，因此也是对现在他选择的这个特定行动的最佳对策。但是，假如你先行，你就不会知道你的对手将会采取什么行动。他会观察你的选择，同时作出自己的决定，因此你有机会影响他的行动。某些情况下，若是采用优势策略以外的策略，你可能更有效地施加这种影响。

启示：马太效应：凡是少的，连他仅有的也夺过来；凡是多的，就加给他，让他更多。在各个领域，马太效应畅行无阻--你不在上面，就在下面。而一旦成功地利用它，就可以达到事半功倍的效果。

追求最佳，避免最差

不是所有博弈都有优势策略，哪怕这个博弈只有一个参与者。实际上，优势与其说是一种规律，不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则，但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。

一个优势策略优于其他任何策略，同样，一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。

假如你只有两个策略可以选择，其中一个是劣势，那么另一个一定是优势策略。因此，与选择优势策略做法完全不同的规避劣势策略做法，必须建立在至少一方拥有至少三个策略的博弈的基础之上。

在你没有优势策略的情况下，你要做的就是剔除所有劣势策略，不予考虑。如此一步一步做下去。

假如在这么做的过程当中，在较小的博弈里出现了优势策略，应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终，那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终，它也会缩小整个博弈的规模，降低博弈的复杂程度。

利用优势策略方法与劣势策略方法进行简化之后，整个博弈的复杂度已经降到最低限度，不能继续简化，而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础，反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧，最终走出这个循环。

博弈的均衡--纳什均衡

我们已经找到了一个策略组合，其中，各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学者把这么一个结果称为"均衡"。这个概念是由普林斯顿大学数学家约翰·纳什(也就是电影《美丽心灵》的主人公)提出的，因此被称为"纳什均衡"。

纳什均衡是博弈分析中的重要概念。1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。在这篇论文中，纳什给出了博弈均衡的定义，即纳什均衡。

那么，什么是纳什均衡呢？简单说就是，一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在惟一的纳什均衡点，即两个囚犯均选择"招认"，这是惟一稳定的结果。

有些博弈的纳什均衡点不止一个。如下述"夫妻博弈"(或称性别之战)中有两个纳什均衡点。丈夫和妻子商量晚上的活动。丈夫喜欢看拳击，而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚。在这个"夫妻博弈"中有两个纳什均衡点：(歌剧，歌剧)，(拳击，拳击)。在有两个或两个以上纳什均衡点的博弈中，其最后结果难以预测。在"夫妻博弈"中，我们无法知道，最后结果是一同欣赏歌剧还是一起去看拳击。

纳什均衡是博弈论中的重要概念，同时也是经济学的重要概念。

诺贝尔经济学奖获得者萨缪尔森有一句幽默的话：你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词：供给与需求。博弈论专家坎多瑞引申说：要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是"纳什均衡"。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大，对其他社会科学意义也同样重大。

启示：通俗地说，纳什均衡含义就是：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。

纳什均衡有什么用

纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。

我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢？我们可以说出好几个理由。没有一个理由本身就有足够的说服力，不过，只要把几个理由结合起来，就能形成一个有力的答案。

首先，存在避免循环推理的必要，因为循环推理帮不上忙。均衡在没完没了的"我知道他知道我知道......"的循环里是稳定不变的，这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动，并且确定自己的最佳对策。

均衡策略的第二个好处出现在零和博弈中。在这种博弈里，参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。

第三个理由是，均衡方法注重实效。要想知道梨子的滋味，就要吃一吃。我们将会利用均衡方法讨论许多博弈。希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。相信这么做会使我们的分析更有意思，比抽象地讨论均衡方法的优点更有意义。

最后，可能存在一个对均衡概念的误解，希望各位可以避免。当我们说博弈的结果是均衡，并不一定是对参与者最有利的结果，更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题，答案视各个案例的具体情况而各有不同。

在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能将商品卖出去，此时我们就说，该商品的供求达到了均衡。此时的价格可称之为均衡价格，产量称之为均衡产量。均衡分析是经济学中的重要分析。

那么什么是博弈论的均衡呢？所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。

纳什均衡是一最常见的均衡。它的含义是：在对方策略确定的情况下，每个参与者的策略都是最好的，此时没有人愿意先改变自己的策略。

在上面的"买--卖"的博弈中，可以解释为什么在现实中讨价还价后买卖能做成的原因，因为这对双方来说都是最优选择。同时在"买--卖"博弈中，其均衡对双方来说是全局最优的。

警察与小偷

是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点--所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点--所谓混合策略是指参与者采取的不是惟一的策略，而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。我们下面将在"警察与小偷"的博弈中给出混合策略的说明。

在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安。现在我们假定，小镇的一头有一家酒馆，另一头有一家银行。再假定该地有一个小偷，要实施偷盗。因为分身乏术，警察一次只能在一个地方巡逻；而小偷也只能去一个地方。假定银行需要保护的财产价格为2万元，酒馆的财产价格为1万元。若警察在某地进行巡逻，而小偷也选择了去该地，就会被警察抓住；若警察没有巡逻的地方而小偷去了，则小偷偷盗成功。警察怎么巡逻才能使效果最好？

一个明显的做法是，警察对银行进行巡逻，这样，警察可以保住2万元的财产不被偷窃。可是如此，假如小偷去了酒馆，偷窃一定成功。这种做法是警察的最好做法吗？有没有对这种策略改进的措施？

这个博弈没有纯策略纳什均衡点，而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的最优(混合)策略选择。

对于这个例子，对于警察的一个最好的做法是，警察抽签决定去银行还是酒馆。因为银行的价值是酒馆的两倍，所以用两个签代表银行，比如如果抽到1、2号签去银行，抽到3号签去酒馆。这样警察有2／3的机会去银行进行巡逻，1／3的机会去酒馆。而小偷的最优选择是：以同样抽签的办法决定去银行还是去酒馆偷盗，只是抽到1、2号签去酒馆，抽到3号签去银行，那么，小偷有l／3的机会去银行，2／3的机会去酒馆。

警察与小偷之间的博弈，如同小孩子之间玩"剪刀石头布"的游戏，在这样一个游戏中，不存在纯策略均衡，对每个小孩来说，自己采取出"剪刀"、"布"还是"石头"的策略应当是随机的，不能让对方知道自己的策略，哪怕是"倾向性"的策略。如果对方知道你出其中一个策略的"可能性"大，那么你在游戏中输的可能性就大。因此，每个小孩的最优混合策略是采取每个策略的可能性是l／3。在这样的博弈中，每个小孩各取三个策略的1／3是纳什均衡。由此可见：纯策略是参与者一次性选取的，并且坚持他选取的策略；而混合策略是参与者在各种备选策略中采取随机方式选取的。在博弈中，参与者可以改变他的策略，而使得他的策略选取满足一定的概率。当博弈是零和博弈时，即一方所得是另外一方的所失时，此时只有混合策略均衡。对于任何一方来说，此时不可能有纯策略的占优策略。

启示1：没有把真正的问题找出来就盲目采取行动，是最愚蠢的做法。能够找出问题，已经可以说是把问题解决一半了。

启示2：解决问题的公式：

(1)找出问题发生的原因；

(2)分辨情报的价值；

(3)彻底推行解决方案；

(4)观察事情进行得是否顺利。

任何事情都看似很难，实质不难；任何事情都比你预期的更令人满意；任何事情都能办好，而且是在最佳的时刻办好--麦可斯韦尔定律有助你走出阴霾。

斗鸡博弈的难局

试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来双方则打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败；如果两只公鸡都前进，那么则两败俱伤。因此，对每只公鸡来说，最好的结果是，对方退下来，而自己不退，但是此时面临着两败俱伤的结果。

两者如果均选择"前进"，结果是两败俱伤，两者均获得-2的支付；如果一方"前进"，另外一方"后退"，前进的公鸡获得1的支付，赢得了面子，而后退的公鸡获得-l的支付，输掉了面子，但没有两者均"前进"受到的损失大；两者均"后退"，两者均输掉了面子获得-1的支付。当然这些数字只是相对的值。

这个博弈有两个纳什均衡：一方前进，另一方后退。但关键是谁进、谁退？一个博弈，如果有惟一的纳什均衡点，那么这个博弈是可预测的，即这个纳什均衡点就是一事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点，则无法预测出一个结果来。因此，我们无法预测斗鸡博弈的结果，即不能知道谁进谁退，谁输谁赢。

用这个博弈来解释美苏两个超级大国之间的古巴导弹危机，是最合适不过的了。

面对美国的反应，苏联面临着是将导弹撤回国还是坚持部署在古巴的选择？而对于美国，则面临着是挑起战争还是容忍苏联的挑衅行为的选择？也就是说，这两只大公鸡均在考虑采取进的策略还是退的策略？

战争的结果当然是两败俱伤，而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来，做了丢面子的"撤退的鸡"。美国坚持了自己的策略，做了"不退的鸡"。当然，为了给苏联一点面子，同时也担心苏联坚持不退而发生美苏战争--这是美国不愿意看到的，美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。

这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说，退下来的结果是丢了面子，但总比战争要好；对美国而言，既保全了面子，又没有发生战争。这就是这两只"大公鸡"博弈的结果。

启示：任何事情都看似很难，实质不难；任何事情都比你预期的更令人满意；任何事情都能办好，而且是在最佳的时刻办好--麦可斯韦尔定律有助你走出阴霾。

左边还是右边

前面我们已知，在博弈中纳什均衡点如果有两个或两个以上，结果就难以预料。这对每个博弈方都是麻烦事，因为后果难料，行动也往往进退两难。一个小例子就是两个骑自行车的人对面碰头，很容易互相"向住"：因为不知道对方会不会躲、往哪边躲，自己也不知该如何反应，于是撞到一起。

自行车相撞一般不会造成什么大麻烦，可是如果换成马车、汽车，就可能出现伤亡。所以，应该有一个强制性的规定，来告诉人们该怎么做。

开车的时候你应该走哪一边？假如别人都靠右行驶，你也会留在右边。套用"假如我认为他认为"的框架进行分析，假如每个人都认为其他人认为每个人都会靠右行驶，那么每个人都会靠右行驶，而他们的预计也全都确切无误。靠右行驶将成为一个均衡。

不过，靠左行驶也是一个均衡，正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡，所有参与者必须就应选择哪一个达成共识，否则就会导致困惑。

海上航行也要面临同样的问题，尽管大海辽阔，但是航线却是比较固定的，因此船只交会的机会很多，这些船只属于不同的国家，如何调节谁进谁退的问题呢？先来看一个小笑话：

一艘军舰在夜航中，舰长发现前方航线上出现了灯光。

舰长马上呼叫："对面船只，右转30度。"

对方回答："请对面船只左转30度。"

"我是美国海军上校，右转30度。"

"我是加拿大海军二等兵，请左转30度。"

舰长生气了："听着，我是'列克星顿'号战列舰舰长，这是美国海军最强大的武装力量，右转30度！"

"我是灯塔管理员，请左转30度。"

即使你官阶、舰船再大，灯塔也不会给你让路。那么，如果是两条船相遇，又如何决定呢？

谁先让不能等待临时谈判，也不是由官阶说了算。海上避碰也有像许多国家规定车辆在马路上靠右走那样不容谈判的规矩。人们规定，迎面交会的船舶，各向右偏一点儿，问题就解决了。十字交叉交会的船舶，则规定看见对方左舷的那艘船要让，慢下来或者偏右一点儿都可以。这就从制度上规定了避让的方式。

这十字交叉交会时如何避免碰撞的规矩，就是上述博弈的两个纳什均衡中的一个。究竟哪一个纳什均衡真正发生，现在就看两船航行的相互位置。如果甲看见乙的左舷，甲要让乙原速直走，就是右上角那个纳什均衡；如果乙看见甲的左舷，乙要让甲原速直走。

谁打电话

上面的例子是通过规定解决了问题，不过，若是遇到电话打到一半突然断了的事，你该怎么办？

假如你正在和女友通话，电话断了，而话还没说完。这时有两个选择，马上打给对方，或等待对方打来。注意：如果你打过去，她就应该等在电话旁，好把自家电话的线路空出来，如果她也在打给你，你们只能听到忙音；另一方面，假如你等待对方打电话，而她也在等待，那么你们的聊天就没有机会继续下去。

一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡：一个是你打电话而她等在一边，另一个则是恰好相反。

一个解决方案是，原来打电话的一方再次负责打电话，而原来接电话的一方则继续等待电话铃响。这么做的好处是原来打电话的一方知道另一方的电话号码，反过来却未必是这样。

另一种可能性是，假如一方可以免费打电话，而另一方不可以(比如你是在办公室而她用的是住宅电话)，那么，解决方案是拥有免费电话的一方应该负责第二次打电话。还有一种比较通常的解决方法是，由较热切的一方来打电话，如一个煲电话粥成瘾的家庭主妇对谈话的热情很高，而她的同伴就未必这样，这种情况下通常是她打过去。再如恋爱中的男女遇到这种情况，通常也是由主动追求者打电话。

假如不考虑以上因素，那么打这个电话又得用到这种"混合策略"了：设想双方都投硬币决定自己是不是应该给对方打电话，根据前面给出的条件，两人这种随机行动的组合成为第三个均衡。

假如我打算给你打电话，我有一半机会可以打通(因为这时你恰巧在等我打电话)，还有一半机会发现电话占线；假如我等你打电话，那么，我同样会有一半机会接到你的电话，因为你有一半机会主动给我打电话。

每一个回合双方完全不知道对方将会采取什么行动，他们的做法实际上对彼此都最理想。因为我们只有一半机会重新开始被打断的电话聊天，我们知道我们(平均来说)要尝试两次才能成功接通。

需要再次强调的是：均衡不一定是博弈的最优结果。在"囚徒困境"中，惟一的均衡是一起招认，站在群体的角度，这是最坏的结果。均衡只是博弈的最"稳定"结果，或者说是最可能出现的结果。那么，这就需要我们思考一个问题：如果这个"稳定"结果效果不佳，我们能否找到合理的策略打破这个"均衡"？

启示：在同时行动的博弈中，有三个行动法则：一是寻找和运用优势策略；二是寻找和避免劣势策略，同时假定你的对手也在这么做；三是寻找和运用均衡。

设置

手机

书架

书页

第2章 优势、劣势与均衡

第2章优势、劣势与均衡