饭饭TXT > 学习管理 > 《博弈生存》作者：潘天群【完结】 > 博弈生存.txt

第 2 页

作者：潘天群当前章节：15100 字更新时间：2026-6-18 20:53

局外人第一次问时，由于每个人面对的其他3个人都是红色的帽子，每个人当然不能肯定自己头上的帽子是什么颜色，于是均回答“不知道”。此时，如果只有1个人戴红色的帽子，那么这个人因面对3个戴白色的帽子，他肯定知道自己的帽子颜色。因此，当4个人均回答“不知道”时意味着“至少有2人戴的是红色的帽子”，而且这也是公共知识。

当局外人第二次问时，如果只有2人戴的是红色的帽子，这2人就会回答说“知道”——因为他们各自面对的是1个戴红色帽子的人。由于每个人面对的是不止一个戴红色帽子的人，因此当局外人第二次问时，他们只能回答“不知道”。——此时的“不知道”，意味着“至少3个人戴红色的帽子”，并且它成为公共知识。

同样，局外人第三次问时，他们均回答“不知道”，意味着4个人均戴的是红色的帽子。因此，当局外人第四次问时，他们就知道宣布每个人头上均戴的是红色的帽子，于是，他们回答“知道”。

在这个过程中，当局外人首先宣布“其中至少一个人的帽子是红色的”，以及第二、第三、第四次回答的时候，无论是回答“知道”还是“不知道”——它们构成公共知识——构成所有人推理的前提，在这个过程中，每个人均在推理。

这就是“帽子的颜色问题”。本人将这个问题简化了。原来的问题比较复杂。它是这样的：

有一个游戏，有一个主持人和一群人(假定有n人)，戴了两种颜色的帽子，每个人的帽子的颜色或者是红色或者是白色，但每个人不能看到自己的帽子的颜色却看得到其他人的帽子的颜色。游戏的主持人说：“你们中至少一个人的帽子是红色的。”主持人开始一次次地问：“你们知道不知道自己的帽子的颜色?”现在的问题是：当主持人问到第几次时，才有人说“知道”?并且多少人说“知道”？

据说，这个问题在20世纪曾风靡欧美。四、皇帝新装的新解读

我们都熟悉安徒生的童话《皇帝的新装》。

从前，一个皇帝爱穿漂亮的衣裳，有两个骗子对皇帝说，他们能做出世界上最漂亮的衣服，这衣服不仅华丽，而且穿上它后能知道谁是愚蠢的人，因为愚蠢的人是看不见这衣服的。皇帝相信他们的话，给了他们许多金子，让他们开始织布。两个骗子在织机旁煞有其事地忙碌着。皇帝派他的宠臣去看看工作的进度，然而他们惊呆了：天啊，我什么也看不见！他们想，难道我是愚蠢的人？我不胜任自己现有的权位？这是多么可怕的事啊！但好在其他人不知道。于是他们装着看见的样子，称赞布是多么多么的漂亮，骗子向他们描述衣服的色彩和图样，他们点头称是。回去后，他们将骗子的话汇报给皇帝。皇帝亲自来看衣服制作的进度，他也同样被眼前的情景惊呆了，因为他什么也没看见！事实上确实什么也没有。皇帝也怀疑自己是愚蠢的人，但他想，千万不能让别人知道我看不见衣服，千万不能让我的臣民知道我是愚蠢的人，于是他也同样夸赞起衣服来。

全城庆典的那天，骗子装模作样地赶好了衣服，皇帝脱掉了他原来的衣服，骗子做出给他穿衣服的样子。当骗子给皇帝穿好所谓的“新衣服”后，皇帝步出宫殿向他的臣民致意。皇帝什么也没穿，在大街上被他的臣子们簇拥着，他的臣民们都看着没穿衣服的皇帝，然而他们不敢承认，怕别人知道自己是愚蠢的人，他们不说自己看不到皇帝的衣服。

这时，一个小孩突然说：“其实皇帝什么也没穿啊！”这一声无疑是晴天霹雳。于是，老百姓私下传着这个天真无邪的小孩的话，人们开始相信小孩说的话是对的。皇帝也知道了老百姓们的窃窃私语，他想老百姓的话可能是对的，但他没办法就此回头，他坚持把游行进行下去，于是他更加高傲地向前走去。

帽子：红色的还是白色的？(2)

在这个童话中，骗子们所谓的皇帝的新衣服其实什么也没有，每个人都知道这是事实。也就是说，对每个人来说，“皇帝什么都没穿”是知识。但是，每个人不知道其他人是否知道这个事实，即每个人不知道其他人拥有这个知识。同时每一个人知道，只要他不说，其他人不知道他知道这个事实。即“皇帝什么都没穿”不是皇帝、大臣及老百姓之间的“公共知识”。

这里有一个虚假前提：如果我没看见皇帝的新衣服意味着我是愚蠢的。因此，每个人尽量地不让其他人了解自己没看见皇帝的新装。此时，每个人，包括皇帝都在说着假话，硬说自己看见了新衣服。每个人都在谎言下生活。这就是一个均衡，一个大家都“说谎的均衡”。

然而，小孩说出“其实皇帝什么也没穿”，小孩意味着不会说假话。当小孩的话传到每个人那里时，“其实皇帝什么也没穿”便成了公共知识。原来的均衡打破了。安徒生的这个童话里让小孩子说出真话有他的用意，小孩子是最真诚的和不受污染的。这个故事中的说真话的小孩与村庄里的大屠杀里的老太太起着相同的作用：使一个知识成为公共知识。

“教—学”均衡的公共知识条件

——教育的知识结构分析我们每个人都有老师，上小学时有小学教师，中学有中学教师，大学有大学教师，等等。并且在同一时候有不同的教师，如在中学有数学教师、语文教师、物理教师、化学教师，等等。这是众所周知的事情，没有什么特别的地方。

然而，如果我们对学生—教师的知识结构作一分析，我们会发现，教育有着特别的知识结构。

教育有什么样的结构？我们每个人都知道，学校的教师知道他或她应该知道的知识，学生知道他们的老师知道他们想学的知识，老师也知道学生知道他或她拥有某些知识，即：老师知道某些要求的知识是公共知识。我们用K1表示“教师知道某些学科的知识”，K1为公共知识。

同时，学生不知道教师知道的学科性知识，学生对这些知识的无知也成为公共知识。即：教师知道学生对这些知识的无知，成为学生和老师间的公共知识，同时也是全社会的公共知识。我们用K2表示“学生不知道某个学科的知识”，K2也是公共知识。

K1和K2不仅是老师和学生间的公共知识，同时也是社会的公共知识。

因此，我们看到，之所以教师站在讲台上，处于“教”或“传授”的位置，而学生坐在课桌前处于“学”或“聆听”的位置，就是因为有这样的公共知识存在。“教—学”或“讲授—聆听”构成一博弈均衡。如果没有这样的知识构成，“教—学”或“讲授—聆听”的均衡便不会形成。

这样的均衡何时会打破呢？

我们说，既然“教—学”的均衡依赖于公共知识K1和K2，一旦这样的知识构成被打破，“教—学”之间的关系将被终结。这里有两种可能情况：一是K1不是公共知识，或者因为教师不具有这些知识，或者教师具有这些知识但没有成为公共知识，也就是说学生或社会不知道。那么，“教—学”的均衡不能形成，这个教师便不能站在讲台上。第二种情况是，通过一定时间的学习，教师将知识教给了学生，学生也知道了教师讲授的东西，此时“教—学”均衡也被打破了。

当然，K1和K2只是“教—学”均衡形成的必要条件，而非充分条件。

诸葛亮、周瑜的掌中之“火”

《三国演义》描写了这样的故事：曹操带领大军进攻东吴，诸葛亮来到东吴，劝说东吴与刘备一起抵抗曹操大军，都督周瑜向诸葛亮请教如何破曹操的百万大军。周瑜说，我昨天察看曹操水寨，极为严整、有章法，不是一般人所能够攻破的。我想了一个计策，不知道是否可行，请先生为我决策。孔明则说：都督暂不要说，我们各自写在手上，看一看是否一样。

瑜大喜，教取笔砚来，先自暗写了，却送与孔明；孔明亦暗写了，两人移近坐榻，各出掌中之字互相观看，皆大笑。原来周瑜掌中字，乃一“火”字；孔明掌中亦一“火”字。瑜曰：“既我两人所见相同，更无疑矣。幸勿漏泄。”

在诸葛亮和周瑜未在掌中写出“火”字之前，或者尽管他们在掌中写出“火”字但没有互相观看之前，火攻曹操为一个致胜的妙计是他们两个人所知道的，但不是公共知识。因为周瑜不知道诸葛亮知道这个策略。此时很有可能的是，诸葛亮知道周瑜知道这个策略，但周瑜以为诸葛亮不知道他知道这个策略。而当两人在手中写出“火”字，并“互相观看”之后，这个策略可以取胜为他们的公共知识。

诸葛亮与周瑜将“火”字写在掌中，并互相观看，这样的行为使他们的知识结构发生变化。在这个过程，知识结构发生变化的群体只有诸葛亮和周瑜两个人，而无其他人，“诸将皆不知其事”。如果其他（尤其是曹操）知道火攻为诸葛亮和周瑜之间的公共知识，那么火攻策略便不能战胜曹操，赤壁一战便会出现另外的结果。知识的分布关系到战争的成败。

将军的困境

我们在生活中经常见到某些场合下，两个人为某件事情会心一笑，此时两人达到了默契。

如果用公共知识的概念来解释，就是两人都知道了将军的困境——协同攻击难题识，而且他们知道对方知道自己知道了该事情,即该事情是他们的公共知识。他们不通过语言传达了这些信息。

两个默契的双方不用语言就可形成某个公共知识，而在有些时候，即使用语言多次传递某个信息，该信息也难以成为公共知识。我们看一个“协同攻击难题”。

两个将军各带领自己的部队埋伏在相距一定距离的两个山上，等候敌人。将军A得到可靠情报说，敌人刚刚到达，立足未稳。如果敌人没有防备，两股部队一起进攻的话，就能够获得胜利；而如果只有一方进攻的话，进攻方将失败。这是两位将军都知道的。A遇到了一个难题：如何与将军B协同进攻？那时没有电话之类的通讯工具，而只有通过派情报员来传递消息。将军A派遣一个情报员去了将军B那里，告诉将军B：敌人没有防备，两军于黎明一起进攻。然而可能发生的情况是，情报员失踪或者被敌人抓获。即：将军A虽然派遣情报员向将军B传达“黎明一起进攻”的信息，但他不能确定将军B是否收到他的信息。事实上，情报员回来了。将军A又陷入了迷茫：将军B怎么知道情报员肯定回来了？将军B如果不能肯定情报员回来的话，他必定不会贸然进攻的。于是将军A又将该情报员派遣到B地。然而，他不能保证这次情报员肯定到了将军B那里……

这就是“协同攻击难题”，它是由格莱斯（J.Gray）于1978年提出。更为糟糕的是，有学者证明，不论这个情报员来回成功地跑多少次，都不能使两个将军一起进攻。

问题在于，两个将军协同进攻的条件是：“于黎明一起进攻”是将军A、B之间的公共知识，然而，无论情报员跑多少次，都不能够使A、B之间形成这个公共知识！如果你是这两位将军中的一个，你有什么办法？

什么是公平分配？

分配是任何时代、任何社会的重要问题。在中国传统中有这样的思维：“不患贫，而患不均”，即是说，人们能够忍受贫穷，而不能忍受社会财富分配的不均等。微观经济学通常涉及三个方面的内容：“生产什么”、“如何生产”以及“如何分配”，即：分配是经济学的一个重要内容。

公平分配是人们追求的目标。然而，什么是公平的分配？

首先要确定一个分配的公平标准，某种分配符合这个标准，它就是公平的，否则便是不公平的。

公平的并不是平均的，尽管有时是平均的。一个公平的分配是，各方之所得是其“应该”所得的。但什么是“应该”所得的？

作为理性人，每个人均想多分配一点。现实中的许多争吵，大到国家间的领土争端，小到人与人之间的鸡毛蒜皮的小事，很大一部分是由于分配不公平造成的。这种争吵或者由于一方认为不公平造成的，或者由于双方均认为不公平造成的。

8个金币的故事

有这样一个故事。

约克和汤姆结对旅游。约克和汤姆准备吃午餐。约克带了3块饼，汤姆带了5块饼。这时，有一个路人路过，路人饿了。约克和汤姆邀请他一起吃饭。路人接受了邀请。约克、汤姆和路人将8块饼全部吃完。吃完饭后，路人感谢他们的午餐，给了他们8个金币。路人继续赶路。

约克和汤姆为这8个金币的分配展开了争执。汤姆说：“我带了5块饼，理应我得5个金币，你得3个金币。”约克不同意：“既然我们在一起吃这8块饼，理应平分这8个金币。” 约克坚持认为每人各4块金币。为此，约克找到公正的夏普里。

夏普里说：“孩子，汤姆给你3个金币，因为你们是朋友，你应该接受它；如果你要公正的话，那么我告诉你，公正的分法是，你应当得到1个金币，而你的朋友汤姆应当得到7个金币。”

约克不理解。

夏普里说：“是这样的，孩子。你们3人吃了8块饼，其中，你带了3块饼，汤姆带了5块，一共是8块饼。你吃了其中的1/3，即8/3块，路人吃了你带的饼中的3-8/3=1/3；你的朋友汤姆也吃了8/3，路人吃了他带的饼中的5-8/3=7/3。这样，路人所吃的8/3块饼中，有你的1/3，汤姆的7/3。路人所吃的饼中，属于汤姆的是属于你的的7倍。因此，对于这8个金币，公平的分法是：你得1个金币，汤姆得7个金币。你看有没有道理？”

约克听了夏普里的分析，认为有道理，愉快地接受了1个金币，而让汤姆得到7个金币。

在这个故事中，我们看到，夏普里所提出的对金币的“公平的”分法，遵循的原则是：所得与自己的贡献相等。

这就是夏普里值的意思。

所罗门的智慧：公平不是平均

所罗门是历史上以色列国的国王，是大卫王的二儿子。他十分具有智慧。

据传说，有两个妇人争夺一个孩子，让所罗门王来裁决。所罗门王说：“既然你们都说，孩子是自己的，然而你们均没有足够的证据证明孩子确实是自己的，那么就将孩子劈成两半，你们一人一半，这样不就公平了？”所罗门的话是严肃的。此时，所罗门的手下要执行所罗门的命令。其中一个妇人同意这个分法，认为所罗门王英明；而另一个妇人大哭，说：

“亲爱的所罗门王，我不要孩子了。整个孩子归她吧。”此时，所罗门对大哭的妇人说：“你才是孩子的母亲。母亲是爱孩子的，宁愿不要孩子，也不要孩子死啊。”所罗门命令手下把那个争孩子的假母亲抓了起来，重重惩罚。

这里，结果是公平的——孩子归他的母亲，而获得这个结果的方式则是充满智慧的。

所罗门王所用的策略是不可重复的，这只有在特殊情况下才能得到：那两个妇人均是在不知道所罗门王的真正意图的情况下表达出自己的偏好的：真母亲首先希望孩子活着，其次才是孩子回到自己的身边；假母亲首先关心的是不要输掉官司，孩子的归属是次要的。

我们看到，这里的公平的分配不是指平均的分配，也不是双方均满意的分配，而是合理的分配。

分小孩——公平不是平均

从分蛋糕到财产分割与边界争端的解决：

双赢的分配两人分一个蛋糕，用什么方法才能分配得公平？一个公平的分法是：由其中一人持刀来分，分者后取。这样，分的人因担心后取而吃亏，他所能采用的最好办法是尽量将蛋糕分平均，即使他后拿，也不会吃亏。

分蛋糕只是对同质的东西所进行的一个简单的分配，对不同质的东西能否建立一个像“你分我先取”分蛋糕那样的一个程序，从而做到公平分配吗？美国纽约大学政治系的勃拉姆

兹（S. Brams）教授给出了肯定的回答。他提出了一个“双赢”的分配办法。

我们来看一下一个离婚的财产分割的例子。假定一对夫妇，安娜和汤姆，感情破裂，不想在一起过日子了。他们到法院进行财产分割。

法官看了他们的财产：冰箱、电脑、缝纫机、烟斗、自行车、书桌。一共有6件。法官叫他们对这6件物品进行轮流选择，所选择的归其所有。当然是女士先选。选择顺序是：安娜，汤姆，安娜，汤姆，安娜，汤姆。

选择的结果是什么呢？我们假定安娜与汤姆对不同物品的偏好不同，比如，安娜作为家庭主妇最喜欢冰箱，认为它也最值钱；而汤姆由于工作的关系更喜欢电脑，认为它更有用。他们对物品的“评价”见表4-1。

离婚分东西表4-1

排序安娜汤姆1冰箱电脑2缝纫机烟斗3自行车书桌4书桌自行车5电脑冰箱6烟斗缝纫机

于是，选择的结果是：安娜选了冰箱、缝纫机和自行车，而汤姆选了电脑、烟斗和书桌。

安娜得到了6件物品中她认为价值最高的3件物品，汤姆同样得到了他希望得到的价值在前3位的物品。两人对分配均满意。

这是一个双赢分配。

这里所实现的“双赢”分配，其基础是：我们假定了他们对不同的物品的估价“差别较大”，或者说不同物品在不同的人那里其“效用”是不同的。为了分析这里的分配是双赢的结果，我们设定他们对每件物品进行打分，假定满分为100分，安娜和汤姆分别将这100分分配给不同的物品。见表4-2：

表4-2

排序安娜汤姆1冰箱28电脑302缝纫机22烟斗253自行车20书桌204书桌15自行车155电脑10冰箱56烟斗5缝纫机5

这样，安娜总共得到了70分，而汤姆得到了75分。两人分配得到的结果大大超过了50分。勃拉姆兹在《双赢解》一书中还提出了分配的“无嫉妒原则”。这里，安娜的所得为70分，汤姆的所得为75分。安娜嫉妒汤姆，认为他的所得超过自己。勃拉姆兹提出，可以让汤姆补给安娜2.5分值的东西，这样，安娜的心理就平衡了。此时双方都不会产生嫉妒心理。如此看来，这样的分配确实是双赢的。

在上述的分配中，我们假定了安娜和汤姆对不同物品的估价或者排序是不同的。如果他们的估价差不多，情形又将如何？

假定安娜和汤姆对不同物品估价后进行的排序为表4-3。与前面一样，同样是安娜先选择，然后是汤姆，接着是安娜……

在这样的选择中，如果每个人进行的选择是诚实的，即每个人进行选择时，都是从剩下的物品中选择自己认为价值最高的物品，那么结果是：安娜选择了冰箱、自行车和缝纫机；而汤姆选择了电脑、烟斗和书桌。

表4-3 诚实的选择

排序安娜汤姆1冰箱电脑2电脑烟斗3自行车书桌4书桌自行车5缝纫机冰箱6烟斗缝纫机

在这个分配中，安娜获得了她认为的价值“第一”，“第三”和“第四”的物品，而汤姆获得了他认为价值“第一”、“第二”和“第六”的物品。

这样的分配对双方来说，虽然不是最好的结果，但是双方应该对这个分配结果感到满意的。

在这个例子中，聪明的读者会想到：安娜第一次不选择冰箱，而先选择电脑，情形会怎样呢？即：安娜的选择是策略性的，而不是诚实的。因为，安娜知道在汤姆那里电脑排第一，而冰箱排倒数第二。安娜第一次选择了电脑，轮到汤姆选择时，汤姆不会选择冰箱，而选择了烟斗。结果见表4-4。

在表4-4中，安娜得到了她认为的最值钱的前三位东西。汤姆得到了他认为的第二、第三及第六位价值的物品。

表4-4 策略选择

排序安娜汤姆1冰箱电脑2电脑烟斗3自行车书桌4书桌自行车5缝纫机冰箱6烟斗缝纫机

在这个例子中，如果汤姆对自己的分配所得的结果不满意，他同样可以采取策略行为。当他看到安娜采取策略性行为而选择了电脑时，论到他选择时，他先选择冰箱！尽管冰箱在他看来价值最低，但他知道冰箱在安娜那里价值最高，当他选择了冰箱后，他可以用它与安娜交换电脑！这样一来，情形就较复杂。读者不妨自己分析此时的结果。

如果双方对物品的估价一样，此时的分配便无法做到双赢了。这样的分配问题演变成一个“常和博弈”：双方所得之和为一个常数，一方如果分配所得多了，另外一方的所得便少了。我们这里不对这个问题进行探讨。

有意思的是，勃拉姆兹教授认为，他的这种方法可以用于解决南沙群岛争端问题。勃拉姆兹首先将南沙争端各方分成两方：以中国（包括中国台湾）为一方，以声称拥有主权的东盟四国（越南、菲律宾、马来西亚、文莱）为一方。然后将超过230个小岛和暗礁分成“南部”、“西南部”、“中南部”、“东部”和“中北部”五部分，让双方就“政治利益”、“军事重要性”和“经济利益”给出分值，然后进行分配，这样可以实现双赢。本人在纽约大学做访问学者时，他问：“你看这个方法能够解决南沙争端吗？”我说：“不可能！” 他问： “为什么？”我说：“每个国家都希望得到更多！”他说：“只要各方理性地坐下来谈，这便是一个双赢的分配方案。” 对勃拉姆兹的解决有兴趣的读者请参见勃拉姆兹1999年出版的《双赢解》（The WinWin Solution）。

知识与博弈

对一博弈来说，肯定存在着某些公共知识，均衡的产生依赖于这些公共知识的条件，只不过不同博弈的公共知识是不同的。如：“参与者是理性的”是公共知识，“博弈结构或支付函数”是公共知识。

新的公共知识的出现会使原来的均衡打破，而形成新的均衡，如“村庄里的大屠杀”中的“至少有一个男人是不忠的”，“皇帝的新装”中的“皇帝没有穿衣服”，成为公共知识

后，原来的均衡便打破了。

然而在一博弈中，公共知识不是参与者知道的惟一知识，也就是说，对参与者来说，存在着非公共知识。即：有些知识不是公共知识。

这里有两种情况，一是有些知识，博弈双方知道，但不知道对方知道不知道，当然也不知道对方是否知道自己知道不知道，最明显的例子是小孩说出真相之前每个人都知道“皇帝没有穿衣服”。这时也形成均衡。

第二种情况是，有些知识是博弈的一方知道的，而另外一方不知道，即一方拥有的知识多一些，而另外一方拥有的知识少一些。现在的问题是，拥有知识多的一方更有利还是拥有知识少的一方有利？

惯常的想法是知识越多越好，事实是不是这样呢?让我们看一个例子。

假定同一种商品只有两个商家生产，它们构成寡头垄断。

商家博弈它们之间面对同一个市场，它们要决定生产多少。有很多经济学家在研究这个问题，而且有很多模型，如库若模型、斯坦伯格模型，等等。这个问题是西方经济学家关心的问题。

我们这里不用模型来分析(有兴趣的读者可找有关文献)，只是定性地给予解释。

在双方互相不了解对方的情况下，每个商家力图调整自己的产量以使得自己的利润最大，在调整的过程中我们会发现对方也在调整，当对方调整时自己还得调整……这是一个动态的过程。理性的厂商会这样想：我何不预测对方在我调整时将得出的产量？双方都这样想，这就是博弈过程。或者碰巧猜测对了对方的产量，或者真的了解了在自己产量给定的情况下对方的最优产量。这时，纳什均衡产量就达到了。这时双方对对方的支付结构都不了解。这里，“无知”是对称的。

在这个调整过程中假定一方通过某种方法了解到对方的调整策略，这个方法或者是从调整中得来的，或者通过商业间谍获悉的，或者两种并用。此时，我们可以说，知识是非对称的，一方比另外一方拥有更多的知识。拥有更多的知识将处于有利的局面：它因为准确预测对方的产量而可以确定使自己利润最大的产量。这也可以解释企业为什么尽量获取对方内部的信息，而尽量不让对方了解自己内部的信息。这也就是商业间谍存在的原因。由此可见，商战的双方感兴趣的不仅仅是对方的技术机密，企业产量与利润、成本之间的关系均是战略决策的决定因素。商业间谍侦查和反侦查是商场上竞争的手段，它决定着商战的成功。

信息与战争博弈

国际上国与国之间外交上的较量何尝不是这样呢？国与国之间的外交行为是地地道道的博弈行为，而战争是一种特殊的博弈。为了达到本国的利益，其策略选择要使自己的目的最大化，然而任何国家在决定自己的策略时要充分考虑对方的行为，间谍的目的之一就是弄清对方变动的可能性。因此，信息在博弈中发挥着重要的作用。

我们可以用一个例子来说明。

二战结束后，朝鲜沿三八线被划分为南北朝鲜。1951年南北朝鲜发生战争，美国介入。对于美国来说，它预计中国不会介入到朝鲜战争中去。因为，在美国看来，新生的共和国刚刚成立，内战消耗太大，经济百废待兴，不可能卷入战争。并且美国认为，美国武器装备优良，军费充足，即使中国参战，也无力与之抗衡。因此美国得出结论：朝鲜战争因美国的介入很快就会结束，而中国不会介入。当时美国有一家叫德林的咨询公司，在美国未出兵之前，深入地研究了中国的情况、朝鲜与中国的关系，研究的结论是：如果美国介入到朝鲜战争中去，中国将出兵。他们想将研究报告以500万美元卖给政府，而美国政府未予理睬。最终，美国这个军事大国在朝鲜战场上丢了脸面，损失的财产以几百亿美元计，伤亡数十万人，

各国均有派往他国的间谍，间谍的信息可供本国的决策者作出利己的决策。而为了自己在决策中的胜利，反间谍是一国安全的主要内容。因此间谍与反间谍是国与国之间永久的话题。

冷战时期，美国与苏联的间谍战已众所周知，驱逐间谍和交换间谍也是常有的事情。苏联解体后，俄罗斯与美国之间的敌对关系不存在了，取而代之的是战略伙伴关系。然而间谍战并没有因此而消失。

那么，他国间谍的存在对自己本国的战略全是坏事情吗？

未必。为什么这样说？获取情报是间谍的任务，而足够的情报是战争胜利的保证，因此间谍的存在是胜利的条件。但是一场战争只能有一方胜利，如果了解到对方足够的情况而知道自己肯定会输的话，该国还能打吗？此时战争还能打得起来吗？

战争胜败大体上取决于实力、信息、战略与人心。如果其中一方各方面均优于另外一方，并且弱的一方知道的话，理性的弱者是不会参与战争的，此时战争便打不起来。间谍就具有传递这个信息的作用。

应当说，双方之间若要进行战争，足够理性的双方应当知道谁会胜利，谁会失败。这是惟一确定的。因此很多情况下，国与国之间的战争往往是由于不完全了解局势造成的。如果不考虑战争的所谓正义与非正义——因为这个问题是伦理学的内容，而不是科学的考虑对象，应当看到，有足够理性的双方之间是不可能发生战争的。

一般来说，战争是两败俱伤的，尤其是双方力量对比差不多的时候。战争往往是双方没有足够的信息造成的。当然现实中很难做到信息充分，因而战争也不可能未打之前就能定胜负。弱者可以胜强者，以弱胜强的例子太多了，中国共产党的军队在解放战争期间打败无论是军队的装备上还是军队的数量上均居于优势的国民党军队。尽管毛泽东对自己的才能及自己的军队有足够的自信，然而在1945年重庆谈判时未必能预知他的军队能这么快就胜利。而蒋介石更不知道他会失败，否则他在谈判桌上不会毫无谈判诚意，不让共产党有生存空间，并且边谈判边开战。

从理论上讲，具有足够理性和具有足够知识与信息的人能预知战争的结果。但现实中的人或者因为没有足够的知识和信息，或者不具有足够的理性（或算计）的能力，而往往不能做到这一点。战争的结果不能预知，这也是战争的魅力所在。

一般来说，获取对方的信息而不让对方知道己方的情况是合理的。然而这不是绝对的。

如果一方要将虚假信息传递出去，对方间谍的存在是最好的。另一方面，如果弱小的一方因不了解对方的情况而开战，则对双方都是不利的。强国也不愿意发生战争，它通过媒体表达自己的态度，然而弱小的一方会以为对方是因弱而害怕，更加大了开战的决心。此时，强国最好的办法是将自己的情况让对方的间谍知道。当弱势方知道对方的真实情况时，一场对谁都不利的战争便避免了。

其实，早在2000多年前我国著名的《孙子兵法》中就强调了间谍的作用。在第13篇《用间篇》中讨论了间谍的种类、作用及用法。

“先知者不可取于鬼神，不可象于事，不可验于度，必取于人，知敌情者也。”了解敌情不能求神问鬼，不能类推，不能臆测，只能从知道敌情的人那里获得。孙子提出五间：乡间——利用敌方的本地人做间谍；内间——用地方的官吏做间谍；反间——迫使敌方的间谍为我所用；死间——散布假情报并通过我方的间谍告诉敌方；生间——让我方的间谍回来报告情报。而五间中，孙子认为，关键是反间。

孙子说：“故三军之事，莫亲于间，赏莫厚于间，事莫密于间。”军队的各种事务中，最亲信的是间谍，赏赐最多的是间谍，行动最机密的还是间谍。由此可见，信息在战争博弈中的作用。

声称的策略与实际的策略：言语博弈问题

有些博弈是“无声的”，而有些博弈是“有声的”。这有声的博弈可称之为言语博弈。如各国的外交声明，战争中或战争之前各方发布的真假策略（如在海湾战争中，伊拉克对美国说：如果你打我们的话，我们将向以色列发射导弹），都是言语博弈。在博弈论中有学者称之为信号博弈。

言语博弈涉及实际的策略决定和声称的策略决定。

如：当有人说“人不犯我，我不犯人；人若犯我，我必犯人”时，这含有什么意思呢？

如果“别人犯我，我不犯别人”的话，别人会不断地犯我，我将不断地受到侵犯——这是我所不希望的；如果“别人不犯我，我犯别人”的话，我不犯人的时候别人也会来犯我——这也不是我所期望的。因此，“人不犯我，我不犯人；人若犯我，我必犯人”的策略是我的好的策略。其价值是由理性的我出于利己的动机来规定的。这是策略决定。

同时，这个策略的说出本身有“传达”的功能：你不要犯我，否则我肯定犯你；你不犯我，我也不会犯你。语言哲学中有人认为，语言本身就是行动（speech act）。这里行动者就是将行动的可能策略告诉对方，目的是使双方避免出现不希望的结果，而首先是为了自己的目的。

如美国声称，如果中国武力攻打台湾的话，美国将介入。这是美国声称的策略。美国通过这言语上的声明，目的是为了恐吓中国政府。而中国政府同样以言语回击：是否以武力收复台湾是中国的内政，美国无权干预。言下之意，如果美国干预的话，美国和中国将发生战争。如果中国政府真的武力攻打台湾以实现国土统一，美国真的会介入吗？这是中国政府所要考虑的问题，即要弄清美国届时实际的策略是什么。而美国也要考虑，一旦战争打起来，美国如果干预的话，中国会向美国开战吗？

因此要分清行动者真正的策略决定与声称的策略决定。真正的策略决定，我们说是规定真的，因为它是行动者从利己的角度确定的，行动者没有理由确定对自己不利的策略决定。而声称的策略决定本身也是一种策略，或者说本身是一种决定了的行动。行动者通过这个行动来达到某种目的。

可以这么认为：“人不犯我，我不犯人；人若犯我，我必犯人”是一种声称的策略决定。而“如果天下雨，我将带伞”则是真正的策略决定。

怎么区分这两种决定呢？

声称的策略决定首先是一种语言行动，而真正的策略决定不是一种语言行动。声称的策略决定是行动者向其他行动者说出去的一种行为，它是行动者的一种行动。而真正的策略决定是不是需表达出来的，其他行动者有可能知道也有可能不知道，并且有时这种真正的策略决定是保密的。

其次，声称的策略决定与真正的策略决定可以相同也可以不同。行动者的真正的策略决定是利益最大化得来的，只要社会的逻辑结构或博弈结构给定，行动者就会有自己的策略决定。囚徒困境中，被警察抓到的囚徒——行动者或博弈方，在警察给了他们的支付矩阵后，他们就会分析出自己的策略决定，即：无论对方招认还是不招认，他的最优策略是招认。

言语博弈中的“威胁”与“承诺”

在现实中，我们经常看到声称的策略决定，但是这些声称的策略可信吗？

声称的策略包括“威胁”与“承诺”。美国和中国在台湾问题上的言语博弈就是威胁的。而在国际核武器问题上，我国及其他一些国家承诺“不首先使用核武器”就是一种言语承诺。

博弈论中，经常用“可置信”和“不可置信”的“威胁”或“承诺”来区分行动者说出来的策略，我们在对动态博弈的分析中会分析什么样的策略是可置信的，什么样的策略是不可置信的。而分析“威胁”或“承诺”是可置信的还是不可置信的方法是倒推法。

倒推法（backward induction）也叫逆向归纳法。那么什么是倒推法？

要理解什么是倒推法，先来看一下商界里经常见到的博弈。

在某个城市假定只有一家房地产开发商A，我们知道任何没有竞争下的垄断利润是很高的，假定A此时每年的垄断利润是10亿元。

现在假定有另外一个企业B，准备从事房地产开发。面对着B要进入其垄断的行业，A想：一旦B进入，A的利润将受损很多，B最好不要进入。所以A向B表示，你进入的话，我将阻挠你进入。假定当B进入时A阻挠的话，A的利润降低到2，B的利润是-1。而如果A不阻挠的话，A的利润是4，B的利润也是4。

现在让我们回到房地产开发商之间的博弈问题。A的最好结局是“B不进入”，而B的最好结局是“进入”而A“不阻挠”。这两个最好的结局不能构成均衡。那么结果是什么呢？

A向B发出威胁：如果你进入，我将阻挠。而对B来说，如果进入，A真的阻挠的话，它将受损失-1（假定-1是它的机会成本），当然此时A也有损失。对于B来说，问题是：A的威胁可置信吗？

B通过分析得出：A的威胁是不可置信的。原因是：当B进入的时候，A阻挠的收益是2，而不阻挠的收益是4。4>2，理性人是不会选择做非理性的事情的。也就是说，一旦B进入，A的最好策略是合作，而不是阻挠。因此，通过分析，B选择了进入，而A选择了合作。双方的收益各为4。

在这个博弈中，B采用的方法为倒推法，或者说逆向归纳法，即：当参与者作出决策时，他要通过对最后阶段的分析，准确预测对方的行为，从而确定自己的行为。

在这里，双方必须都是理性的。如果不满足这个条件，就无法进行分析了。

这个例子只是简单的两阶段博弈，而三阶段或更多阶段的博弈，可用同样方法加以分析。

在动态博弈中，涉及“威胁”与“承诺”是不是可信的问题。静态地看，一博弈存在许多均衡。

因此，阻挠，不进入的纳什均衡点得以淘汰，在动态博弈中一个新的均衡——子博弈精练纳什均衡——得以实现。子博弈精练纳什均衡的定义及分析，归功于另一位诺贝尔经济学奖获得者塞尔屯（Selton）。

这里分析的是完全且完美信息下的动态博弈。所谓完全信息是指：博弈的支付函数是“公共知识”（我们在第一部分叙述了公共知识的含义）。本书中未涉及不完全信息的博弈问题，如囚徒困境这样的静态博弈也是完全信息博弈。完美信息是针对动态博弈而言的，指参与者知道博弈的所有历史。

倒推法是动态博弈中有用的工具，它可以说是理性的人自然的推理方式。然而倒推法面临着一个困难，这就是蜈蚣博弈的悖论。（参见第六章）

上面我们分析了“威胁”是否可信，下面我们可分析“承诺”是否可信。“不首先使用核武器”的承诺可信吗？这个承诺是针对常规战争而言的，即：只要大家都运用常规武器进行战争，那么承诺者将不首先使用核武器。在常规战争下不涉及国家生死存亡的时候，这个承诺是可信的。因为如果承诺者首先使用核武器，将使他国也对它使用核武器，这样一来，它会因首先使用核武器而带来更大的灾祸。但是，如果在常规战争中某国面临着被消灭的危险时，它还不首先使用核武器吗？在这种情况下，使用核武器有可能挽救这个国家，而不使用，则该国肯定灭亡，即使用的好处大于不使用的好处。因此，这个承诺在一个国家面临灭亡的时候将是不可信的。

空口声明博弈

在博弈论中存在另外一种言语博弈，英文叫cheep talk。cheep talk 可翻译成“空口声明”，它是一口头表态，发话者说出某些话语无需某些成本，也无须承担某些责任，它不是“威胁”也不是“承诺”，但发话者说出它是有目的的。听者要分析他话中的含义，即要分析cheep talk是真还是假。

如：某人应聘某职位时，他会说“我的能力很高”，这就是cheep talk。他的目的是为

了能应聘得上或者说是为了获取高工资，他说出这样的话是无需成本的，每个应聘者都可以这么说。而雇主则要弄清这些应聘者的cheep talk中哪个是真的哪个是假。

明天太阳必然能升起吗？

——归纳推理的合理性问题人有两种推理方式：一是演绎的，二是归纳的。

由前提真必然地推出结论真就是演绎推理。这是逻辑或传统逻辑研究的对象。古希腊哲学家亚里士多德确定了三段论推理形式如：

大前提：所有人皆要死；

小前提：张三是人；

结论：张三要死。

再比如：

大前提：所有的爬行动物是用肺呼吸的。