饭饭TXT > 学习管理 > 《博弈生存》作者：潘天群【完结】 > 博弈生存.txt

第 3 页

作者：潘天群当前章节：15117 字更新时间：2026-6-18 20:53

只要前提真，推理过程无误，演绎推理的结论就是真的。演绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论其内容不会超过前提蕴含的内容。数学就是演绎性的。

不仅有演绎推理，同时还有归纳推理。如：

前提1：张三要死；

前提2：李四要死；

结论：所有人都要死。

又如：

前提1：蛇是用肺呼吸的；博弈生存博弈生存博弈生存博弈生存归纳推理的合理性问题前提2：鳄鱼是用肺呼吸的；

结论：所有的爬行动物都是用肺呼吸的。

这种由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。

归纳出来的普遍性的结论不是必然真的，而是归纳真的，或者说是“或然真的”，即：结论可能是真的，也可能是假的。

归纳推理是跳跃的，结论的内容超出前提的内容。当然，这种跳跃性的过程是可质疑的。大哲学家休谟批判人们的归纳没有合理性，只是人的习惯联想而已。因为没有逻辑的理由来证明归纳法。

演绎与归纳在人的认识与行动中起着重要作用，哲学家在研究它们的作用。

人的行动很大一部分建立在归纳推理之上。那么什么是归纳推理呢？

我们每天看到太阳从东方升起而得出结论说“太阳每天从东方升起”，我们看到了几只天鹅是白色的，我们说“所有的天鹅是白色的”。

归纳推理就是从少数的观测的事例中概括出普遍性的命题。如果用逻辑学的话语说，就是从特称命题得出全称命题。所谓全称命题是指这样的命题形式：“所有的……具有某种性质”，而特称命题是指“某某具有什么性质”。当然这是一种不严格的说法。今天非经典逻辑的归纳逻辑就是研究证据与全称命题之间的支撑关系的。

从特称命题到全称命题的过程是归纳过程，这个过程中存在着跳跃。这样的跳跃合理吗？

归纳法是科学家的常用工具，而对归纳法的合理性哲学家一直在探讨。培根说过“知识就是力量”，他竭力倡导归纳法，认为知识的来源是经验。

知识来源于经验，这不容怀疑。然而人们通过经验得出知识的方法令人怀疑。18世纪英国哲学家休谟认为，归纳法其实是人的习惯联想。

我们怎么从过去每天观测的太阳从东方升起得出“太阳将每天从东方升起”的结论？根据休谟的看法，答案只能是习惯联想。我们以前观测到甲现象出现时，乙现象也出现，当我们以后看待甲现象时，我们便期待着乙现象出现，并且我们把甲现象称之为原因，把乙现象称之为结果。然而我们的结论合理吗？甲与乙之间的所谓因果联系是必然的吗？休谟的回答是否定的。

我们可设想一下：主人每天给猪喂食，当猪看到主人来时，意味着食物送来了，然而猪不能必然性地得出，主人来必然给它喂食物。因为，很可能的是，一天主人拎着刀杀它来了。这就是归纳法的困难。

哲学家无法证明归纳法的绝对合理性，如果要证明，肯定要引入其他的假定，假定自然是有规律的，但是这样的假设是无法证明的。

虽然归纳法的合理性存在疑问，但归纳法在科学中的作用则不可低估——当然这不是我们上面所举的例子中的简单的枚举归纳法，以至于有人说，归纳法是科学家的荣耀，哲学家的耻辱。

尽管如此，人们在日常生活中也是用归纳法来生活、工作的，归纳法是很有用的工具。如当我们看到有乌云时，我们会想到要下雨了，因为以前有这样的现象，然而是否肯定下雨，则难说，但下雨的概然性大，对我们来说，这就足够了。因此，归纳法是我们思维工具箱中的一个非常有用的工具，尽管不能时时有效。

归纳法在人的互动行动中作用如何呢？这是我们下面要讨论的问题。

归纳的暴力：偷东西的人应该叫小偷吗？

对事物规则性的归纳得出的结论叫规律，规律以所谓命题的形式出现——所谓命题即是有真假的句子。命题与事实的关系是上世纪哲学研究的一个重要内容，上面对归纳法的怀疑是对得出真命题的方法的怀疑。这里我们不讨论这个问题。我们来分析人们是如何用归纳法对人的行动进行归纳从而决定自己的行动的。

在现实中人们经常用归纳法来对人下结论。如果我们看到某人几次做出同样的错事，我

们肯定会认为他的能力有问题；如果我们看到某人做出几件不好的事情，我们很容易怀疑他的道德。对他人归纳性的看法会得出对方在同样的情形下会做出同样的事情的结论，因而我们会制定出自己的策略。但是，我们这样做往往陷入误区。

不能说偷过东西的人永远会偷东西，因而叫他们是小偷或贼是不正确的，犯了错误的人不一定永远犯错误。但我们往往这么思维。我们把偷了东西的人叫小偷的话，那么这种称呼本身就将他们归类，他们成为另类，这样称呼本身就等于我们用语言在他们与我们之间划了一条横沟，因而，此时语言成了一种不道德的暴力。从这一点来讲，我们的语言是不宽容的，或者说我们的语言存在着问题。

我们这里的讨论带有思辨的特点，然而我们在社会中确实是这样使用语言和思维的。我们正是通过对认识的人的几次接触而对他们得出一个结论的，这个结论构成我们对之采取“回应行动”的基础。这个回应行动包括“友好相处”、“防范对方的侵犯”、“追求从而成为恋人”、“冷漠”，等等，并根据不同情况将周边的人分类成：可以成为朋友的、有可能成为敌人的、可以成为恋人或情人的、没有任何交往的，等等。这样的归纳会发生错误，随着交往的深入，归纳会发生改变。当然有些归纳因某种现实的或偶然的原因而永远得不到改变。

一个群体在长时间的交往接触中，分化出各种固定的关系来，有些成为固定的朋友，有些成为一般的朋友，有些成为永远的敌人，当然也会出现恋人或爱人，还有一些形同陌路。即一均衡态出现了：周边的人基本上被定了位，形成了固定的关系。而这一切从归纳开始，并且在不断的交往中对所归纳的看法给以改正。这是一个博弈，在这个博弈中存在着一个对周边的人不断认识的过程，在博弈中称之为学习过程。

行动中的两种推理：归纳与演绎

博弈论是研究人的行为的，在博弈论中参与者一方面猜测其他参与者的策略，同时计算各种策略可能性下的支付（得益）。然而在实际中，一般情况下，人们是很难计算得益的。此时人们往往准备了各种备选策略，当其他参与者采取一确定策略时，自己将决定采取某种策略。

“人不犯我，我不犯人；人若犯我，我必犯人”。这是毛泽东的外交方针。一旦别人采

取某种策略，如敌人采取侵犯的策略，根据这个方针，可以推理出“我”将采取“犯”的策略。这就是逻辑推理与行动之间的关系。

我们经常用逻辑推理的方法来确定自己的行动。

“如果天下雨，我将带伞”，这是我们日常的行动决定；“如果上证指数跌破1500点，我将大量买进股票”，这是股民的决定，当然具体的股民的方案是不同的；而外交方面更是靠逻辑推理来确定自己的行为，如：我国在台湾问题上采取“如果其他国家和台湾建交，中国政府将强烈抗议并与之断交”的策略。因此，逻辑推理在社会行动中是确定策略的工具。

其实参与者在计算支付时，也是一样确定自己的策略，即确定：一旦别人采取什么策略，我将采取什么策略更好——支付更大。

“如果天下雨，我将带伞”，“人不犯我，我不犯人；人若犯我，我必犯人”，这些是行动者制定的行动规则，它们构成行动推论的大前提。如：

前提1：如果天下雨，我将带伞；

前提2：今天下雨；

结论：我要带伞。

又比如：

前提1：人不犯我，我不犯人；人若犯我，我必犯人。

前提2：张三犯我。

结论：我犯张三。

这两个推理是演绎的。

通过分析，我们看到，在人的行动中演绎推理发挥着重要作用。因此我们可以认为，逻辑是社会行动的基础。这也是我们为什么分析社会行动主题的原因。

然而，行动中逻辑推理与认识中的逻辑推理的关系如何？行动中的演绎推理的结论肯定是真的吗？

在上一部分中我们说了，演绎性推理只要前提是真的，推理形式正确，结论肯定是真的。我们并没有说，演绎推理分行动的和认识的两种。所以这个看法在行动的推理中同样正确。

然而人们的行动中的推理前提其正确性如何呢？这是问题所在。我们认为，人的认识中普遍性的命题是真的，逻辑就是揭示这些普遍性的命题与个别性结论之间的关系。而人的行动中的前提是“某种条件下的策略决定”，它为真吗？如果为真的话，是什么意义上的真？

这就涉及社会行动的本质问题。

首先，决定行动者的行动的前提是真的吗？如：“如果天下雨，我将带伞”是真的吗？对于这个命题，其真值取决于“天下雨”与“我带伞”两个命题的值的组合，当“天下雨，我没有带伞”，此时命题就假了。然而天下雨与我带伞之间的联系是由行动者“我”来规定的。因此我们可以说，前提真是“规定真的”。

当然，这里的“规定的真”不是没有理由的，它是由行动者的理性与行动结构所决定的，如果是博弈的话，这个结构就是博弈的结构。一旦行动者的结构给定了，理性的行动者的策略决定就确定了。

对于日常非博弈的情况，理性的行动者总是最大化自己的利益而制定策略的。试想一下，下雨时在不带雨伞与带雨伞之间，行动者会选择后者，如果没有其他方便的避雨的手段的话。因为，不带雨伞会使自己淋湿——被淋湿是任何人所不希望的。

酒吧问题与“百花奖”的评选(1)

酒吧问题（bar problem），是美国人阿瑟（W.B.Arthur）1994年在《美国经济评论》发表的《归纳论证和有界理性》一文中提出的，后来在1999年的著名的《科学》杂志上发表的《复杂性和经济学》一文中阐述了这个博弈。

阿瑟是斯坦福大学经济学系教授，同时是美国著名的圣塔菲研究所（Santa Fe Institute）研究人员。他不满意经济学中认为的，经济主体或行动者（agent）的行动是建立在演绎

推理的基础之上的，而认为其行动是基于归纳的基础之上的。酒吧问题就是他为了说明这个问题而提出的。

该博弈是说：有一群人，比如总共有100人，每个周末，均要决定是去一酒吧活动还是呆在家里。酒吧的容量是有限的，比如空间是有限的或者座位是有限的，如果人去多了，去酒吧的人会感到不舒服，此时，他们留在家里比去酒吧更舒服。我们假定酒吧容量是60人，或者说座位是60个，如果某人预测去酒吧的人数超过60人，他的决定是不去，反之则去。这100人如何做出去还是不去的决策呢？

假定每个参与者或决策者面临的信息只是以前去酒吧的人数，每个参与者只能根据以前去的人数的信息归纳出策略来。没有其他信息，他们之间更没有信息交流。

这是一个典型的动态博弈问题，这是一群人之间的博弈。如果许多人预测去酒吧的人数多于60，而决定不去，那么，酒吧的人数将很少，这时候作出这些预测则错了。如果有很大一部分人预测去酒吧的人数少于60，因而去了酒吧，则去的人很多，多过60，此时他们的预测也错了。因此一个作出正确的预测的人应该能知道其他人如何作出预测的。但是在这个问题中每个人的预测的信息来源是一样的，即都是过去的历史，而每个人不知道别人如何作出预测，因此，所谓正确预测是没有的。每个人只能根据以往历史“归纳地”作出预测，而无其他办法。阿瑟教授提出这个问题也是强调在实际中归纳推理与行动之间的重要性。

因此，对于这样的博弈的参与者来说，问题是他如何才能归纳出合理的行动策略。

例如，如果前面几周去酒吧的人数如下：

44，76，23，77，45，66，78，22

不同的行动者可作出不同的预测，例如预测：下次的人数将是前4周的平均数（53），两点的周期环（78），与前面隔一周的相同（78）。

这样的预测种类会很多。在2000年9月中国科技大学主办的一个“经济物理学”国际讨论会上，香港中文大学物理系的许伯铭博士说，他讲了这个问题后，叫研究生回去写出能想到的策略，研究生写出了400多条策略！

行动者根据这些预测来行动，然而这些预测是归纳性的。

通过计算机的模型实验，阿瑟得出一个有意思的结果：不同的行动者是根据自己的归纳来行动的，并且，去酒吧人数的数字没有一个固定的规律，然而，经过一段时间以后，去酒吧的平均人数很快达到60。即经过一段时间，这个系统中去与不去的人数之比是60∶40，尽管每个人不会固定地属于去酒吧或不去酒吧的人群，但这个系统的这个比例是不变的。阿瑟说，预测者自组织地形成一个生态稳定系统。

这就是酒吧问题。对于下次去酒吧的确定的人数，我们是无法作出肯定的预测，这是一混沌现象。

首先，混沌系统的行为，是不可预测的。对于酒吧问题，由于人们根据以往的历史来预测以后去酒吧的人数——我们假定这个过程是这么进行的，过去的人数历史就很重要，然而过去的历史可以说是“任意的”，未来就不可能得到一个确定的值。

其次，这是一个非线性过程。所谓非线性的过程是说，系统未来对初始值有强烈的敏感性。这就是人们常常说的“蝴蝶效应”：在北京的一只蝴蝶煽动了一下翅膀，美国的华盛顿下了一场大暴雨。

在酒吧问题中，同样有这样的情况。假如其中一个人对未来的人数作出了一个预测而决定第n天去还是不去酒吧，他的行为反映在下次去酒吧的人数上，这个数目对其他人的预测及第n+1天去和不去的决策造成影响，即第n+1天中去酒吧的人数中含有他第n天的决策的影响。而他对第n+2天人数的预测要根据n+1的人数，这样，他第n天的预测及行为给其他人造成的影响反过来又对他第n+2天的行为造成影响。随着时间的推移，他的第n天的决策的效应会越积越多，从而使得整个过程是不可预测的。

人们总是根据过去的经验来归纳从而得出策略，这没有错，因为人们没有其他办法，在实际生活中人们确实是这样的。我们在第一节分析过，归纳法在认识中是没有绝对合理性的，即没有任何办法来证明它。在人们的行动中归纳法又是怎么样的呢？

归纳法在对人的行动的预测中更是没有合理性可言。尽管有很多预测办法，但没有理由认定其预测是在合理的基础之上的。现在问题还没有结束。如果说，预测的办法没有合理的基础，那么存在一个合理的学习机制吗？也就是说，错误的预测不要紧，但有没有办法改进这个预测，以至于下次能作出更好的预测？在酒吧问题上，可以说没有这样的一个改进机制。

酒吧问题所反映的是这样一个社会现象，正像阿瑟教授说的那样，我们在许多行动中，要猜测别人的行动，然而我们没有更多关于他人的信息，我们只有通过分析过去的历史来预测未来。

生活中有很多例子与这个模型是相同的。比如社会上经常举行的所谓大众评选活动，如全社会进行的“十佳运动员”评选活动，电影爱好者的“百花奖”的评选活动。在这些投票过程中，对于每个投票者的激励是：他如果“正确地”选中某些人，比如“十佳运动员”的评选，不仅要选中10个人，而且顺序也要正确，那么投票者将获得某种奖励。但是如何才能选中“正确的”人选呢？有“正确的”人选吗？得票多的就是“正确的”吗?严格地说：得票最多的是第一名（比如“十佳运动员”中的第一），得票次之的是第二名（如“十佳”运动

员中的第二名），等等。因此，投票者能够选中的话，或者说被他提名的能够当选的话，关键是猜测到别人的想法。猜测对了，你就能获奖；猜测错了，你则不能获奖。在这里，我们可以看到没有正确与否，或者谁应该选上、谁不应该选上的问题，而是投票的人相互猜测的结果（在这个过程中当然舆论的导向作用是很大的，它似乎告诉人们某某人是其他许多人所要选的）。这个例子与酒吧问题的结构是大众评选活动一样的，只不过在评选上是一次性的，没有过去的历史让我们来归纳而已。这明显是博弈问题。另外一个例子是，每年高校招生或研究生报名都呈现出混沌现象，考生通过各种渠道弄清以往专业的报名情况，因为一个简单的道理是：如果报名的人太多，竞争太强，被录取的可能性就低。考生一般根据以往几年的情况来推测当年报名的情况，然而这会造成不准确预测。当考生看到以往几年报名的人很多时，他会想下次人还很多，因而他不敢报名。一旦大多数考生这么想，下次报名的人反而少了；反之，则又多。这与酒吧问题有一致的结构。

少数者博弈及其应用：

股票买卖与交通拥挤问题在本书的导言中我们给出了少数者博弈（Minority Game）的简单模型：失火时面对两个门，你将如何选择。现在我们来介绍这个模型。

少数者博弈是改变了形式的酒吧问题，是由一位定居瑞士的名叫张翼成的中国人在1997年提出的。张教授祖籍河南，科大毕业后80年代初去了瑞士，现在瑞士的弗莱堡大学（University of Fribourg）任教。他提出的少数者博弈影响很大，现在很多物理学家、博弈论专

家研究这个问题。比如，2000年9月在中国科技大学召开的“经济物理学高级研讨班及金融复杂性国际学术讨论会”上许多学者作的报告就是围绕这个问题的。

少数者博弈可以运用于股票市场。每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于“卖”股票的位置，而你处于“买”的位置，股票价格低，你就是赢家；而当你处于少数的“卖”股票的位置，多数人想“买”股票，那么你持有的股票价格将上涨，你将获利。而股民采取什么样的策略则多种多样，而策略的得出完全是根据他们以往的经验归纳出来的，因而类似于这里的少数者博弈的情况。但是物理学家对少数者博弈研究的结论能否用来指导股民在股票市场上搏杀，本人不得而知。

不过本人认为，少数者博弈中一个特殊的结论不具有普遍意义，即：记忆长度长的人未必一定具有优势，因为，如果确实有这样的方法的话，在股票市场上，人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是，这样一来，人们将争抢着去购买存储量大即硬盘空间大以及计算速度快的计算机了，在实际中人们还没有发现这是一个炒股票必定赢的方法。

交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越来越拥挤，选择行车路线也是不断的博弈过程。在交通高峰期间，司机面临两条路的选择时，往往要选择没有太多车的路线行走，此时他宁愿多开一段路程而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验来判断哪条路更好走，而所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择必须考虑其他司机的选择。这也是一个少数者博弈问题。

当然在司机行车的少数者博弈问题中，司机经过多次的选择和学习，许多司机往往能找到规则性，这是以往成功和失败的经验教训给他的指引，但这不是必然有效的规则性。在这个过程中，司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段；有的司机经验不足，往往不能有效避开高峰路段；有的司机喜欢冒险，宁愿选择短距离的路线；而有的司机因为保守而宁愿选择有较少堵车的较远的路线，等等。最终的路线的拥挤程度就由不同特点和不同经验的司机的选择所构成。

对称的人群为什么会出现破缺性的行动？

——盲目的学习人们拥有的知识是其行动的基础。在上面的酒吧问题中，每个行动者面对的信息是一样的，但每个人所用的预测方法是不同的，即他们所归纳出的预测公式是不同的（这也就是为什么我们说这种归纳没有合理的基础的原因）。然而，尽管如此，对整体人群来说，平均去酒吧的人数占总人数的60%。对每个人来讲，他的预测与行动独立于其他人将要作出的选择——因为假定他们之间没有信息交流。可以这么说，60%两边是对称的。

还有另外一种非对称的情况。我们假定，人们没有足够的知识以支撑自己的行动。如果对可选择的策略或行动没有任何知识，此时行动者的行为就会出现盲目性。但是由于人本身具有学习的天性，快速的学习过程就发生了。让我们看一个例子。

这是一个心理学上的例子：有一群人鱼贯进入一个房间，拿一瓶饮料喝。在他们面前有多种饮料，假定是3种，房间很黑，每个人无法通过视觉判定饮料的质量，当然更无法看清品牌，也就是说，3种饮料给他们呈现的是同样的视觉图像。此时的选择会是怎样的结果呢？

通过实验发现，人们会将特别“偏爱”一种饮料，即几乎所有人都选择一种饮料，而不是3种饮料平均被选取。这里他们所“偏爱”的并非是特定的，在不同的人群中做同样的实验，出现的情况是一样的，只不过每一次被大多数人选取的饮料会不同。此时被选取的饮料具有非对称性。

按通常的情况，假定饮料给每个人呈现同样的视觉图像，人群会出现对称性选择，即每个人会在所给定的几种饮料中随机选取。而由于群体的存在，即使不同的人对某种颜色有偏爱——我们假定人们可看到颜色，每个人的偏爱也会被抵消掉。对群体来说，每种饮料被选取的可能性是一样的。

出现选择的非对称性完全是由于人们的选择行动之间的相互作用。其实这是微妙的，同时是不合理的学习过程。第一个人选取饮料可以说是随机的，在备选的几种饮料中选取完全是任意的，但是接着的人对饮料的选取则不是任意的。由于看到第一个人选择了某种饮料，他会认为第一个人的选取是有根据的，从而也会选择第一个人所选取的饮料。后面的人也会这样想。于是第一个人对某种饮料的选取会传递下去，并且这个过程中越到后面的人越有理由相信选择该种饮料是有根据的。这就是为什么所有的人都倾向于选择一种饮料。

这就是为什么出现非对称的选择结果了。这种传递不是通过语言，而是通过对前面人的选择行动的观察。这是一个学习目的学习过程，并且是一个没有理由的学习过程，也就是说这样的学习过程是没有根据的。

这个心理学上的实验。反映了人们之间互动的情况。这个盲目的跟随现象或者说盲目的学习现象在现实生活中处处可见。

蜈蚣博弈的悖论

倒推法是分析完全且完美信息下的动态博弈的有用工具，在第四章我们分析言语博弈中“威胁”或“承诺”是否可信时，已给出了一个倒推法例子。我们看到，倒推法符合我们的直觉。然而，通过下面的蜈蚣博弈的悖论，我们将看到倒推法存在致命的缺陷。

蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈：两个参与者A、B轮流进行策略选择，可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选，然后

是B，接着是A，如此交替进行。A、B之间的博弈次数为有限次，比如100次。假定这个博弈各自的支付给定如下：

合作合作合作合作

A B A …… A B （100，100）

背叛背叛背叛背叛

（1，1）（0，3）（2，2）（99，99）（98，101）

现在的问题是：A、B是如何进行策略选择的？

这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。

这个博弈的奇特之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间作出选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，在99步，A考虑到B在100步时会选择“背叛”——此时A的收益是98，小于B合作时的100，那么在第99步时，他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去，最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。

根据倒推法，结果是令人悲伤的。从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告诉我们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可能获取的收益为100。当然，A一开始采取合作性策略的收益有可能为0，但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看，一开始A应取不合作的策略。我们不禁要问：是倒推法错了，还是直觉错了？

这就是蜈蚣博弈的悖论。

什么是悖论？悖论(paradox)来源于希腊语，para意即“超越”，doxos的意思是“相信”。Paradox的意思是：本来可以相信的东西不能相信，而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真，就推出它假，由肯定它假，就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论，“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论，“一个理发师说：‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论，等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。

对于蜈蚣悖论，许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验［目前通过实验验证集体的交互行为已成时尚，正如博弈论专家英国的宾莫（Ken Binmore）所言，诺贝尔奖也无疑在考虑这方面的先驱者］，实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略，从而走向合作。这种做法违反倒推法，但实际上双方这样做，要好于一开始A就采取不合作的策略。

倒推法似乎是不正确的。然而，我们会发现，即使双方开始能走向合作，即双方均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用，合作便不能进行下去。

这个悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略。

最后通牒博弈中理性的困境

有这样一个博弈：

两人分一笔总量固定的钱，比如100元。方法是：一人提出方案，另外一人表决。如果表决的人同意，那么就按提出的方案来分；如果不同意的话，两人将一无所得。比如A提方案，B表决。如果A提的方案是70∶30，即A得70元，B得30元。如果B接受，则A得70元，B得30元；如果B不同意，则两人将什么都得不到。

A提方案时要猜测B的反应，A会这样想：根据理性人的假定，A无论提出什么方案给B——除了将所有100元留给自己而一点不给B留这样极端的情况，B只有接受，因为B接受了还有所得，而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是：留给B一点点比如1分钱，而将99.99元归为己有，即方案是：99.99∶0.01。B接受了还会有0.01元，而不接受，将什么也没有。

这是根据理性人的假定的结果，而实际则不是这个结果。英国博弈论专家宾莫做了实验，发现提方案者倾向于提50∶50，而接受者会倾向于：如果给他的少于30%，他将拒绝；多于30%，则不拒绝。

这个博弈反映的是“人是理性的”这样的假定在某些时候存在着与实际不符的情况。

理论的假定与实际不符的另外一个例子是“彩票问题”。

我们说理性的人是使自己的效益最大，如果在信息不完全的情况下则是使自己的期望效益最大。但是这难以解释现实中人们购买彩票的现象。

人们愿意掏少量的钱去买彩票，如买福利彩票、体育彩票等，以博取高额的回报。在这样的过程中，人们自己的选择理性发挥不出来，而惟有靠运气。在这个博弈中，人们要在决定购买彩票还是决定不买彩票之间进行选择，根据理性人的假定，选择不买彩票是理性的，而选择买彩票是不理性的。

彩票的命中率肯定低，并且命中率与命中所得相乘肯定低于购买的付出，因为彩票的发行者早已计算过了，他们通过发行彩票将获得高额回报，他们肯定赢。在这样的博弈中，彩票购买者是不理性的：他未使自己的期望效益最大。但在社会上有各种各样的彩票存在，也有大量的人来购买。可见，理性人的假定是不符合实际情况的。

当然我们可以给出这样一个解释：现实中人的理性的计算能力往往用在不符合实际情况的“高效用”问题上，而在“低效用”问题上，理性往往失去作用，对于人来说，存在着“低效用的区决策陷阱”。在购买彩票问题上，付出少量的金钱给购买者带来的损失不大，损失的效用几乎为零，而所能命中的期望也几乎是零，这时候，影响人抉择的是非理性的因素。比如，考虑到如果自己运气好的话，可以获得高回报，这样可以给自己带来更大的效用，等等。彩票发行者正是利用人存在着“低效用区的决策陷阱”而寻求保证赚钱的获利途径。

陈水扁上台与民主选举的

不可根除的缺陷蜈蚣博弈的悖论反映了单个参与者博弈的困难，个体难以在“利己”和“利他”之间找到一个合理的策略。蜈蚣博弈悖论是单个决策者的决策悖论，它反映了个体理性的局限。

在集体进行决策时同样也面临着理性的局限。2000年台湾所谓“总统”选举可以说是中国发生的一件大事。对于中国大陆来说，谁来做台湾新的领导人意味着台湾的未来走向，即

：独立还是统一。而对于台湾人民，新的领导人的未来政策意味着给他们带来灾难还是福祉。

选举的结果是民进党的陈水扁上台，陈水扁成了台湾第一任“民选总统”，国民党自1949年逃到台湾51年后，终于交出了政权。现在大家不禁要问：作为台湾第一大党的国民党为什么输给了弱小的民进党？陈水扁上台真的意味着台湾的“民意”吗？

大家知道，这次选举的结果是李登辉“弃连保扁”的阴谋得逞。李登辉是国民党主席，国民党跑到台湾，其政治主张是一个中国，长期抱着反攻大陆的思想。随着共产党在大陆的渐渐强大，国民党认识到反攻大陆是不可能的，然而有大陆情结的国民党虽然与共产党势不两立，一山不能容纳二虎，但因其坚持“一个中国”的立场，所以国民党执政期间，不存在台独泛滥问题。

然而到了李登辉时代，情形发生了变化，在国民党内部分裂成主张统一的“统一派”和主张独立的“独派”。骨子里主张台独的李登辉，由于是国民党主席，无法施展他内心的政治主张。他只能从所谓理论上“论证”台湾与大陆的不同、台湾独立的合理性，这就是臭名昭著的“两国论”、“七国论”。在理论上他要阐述他的“政治思想”，以成为台湾所谓的“国父”；在行动上他找到了与他内心政治主张一致的人，这就是主张台湾独立的民进党主席陈水扁。因而作为国民党主席的李登辉，在实际行动上支持陈水扁。

可以说，国民党被李登辉“玩残”，他真独立的主张使国民党发生分裂。主张统一的宋楚瑜被李登辉开除出党。宋楚瑜原来是李登辉政治上坚强的合作伙伴，因为他的资历，他得到大批的国民党党员的拥护。李登辉与宋楚瑜分道扬镳使得宋楚瑜另立山头，成立了新党。国民党被李登辉肢解。

此次台湾选举是所谓的“民主选举”，各党派“平等竞争”。从理论上讲，弱小的党派获得选举胜利可能吗？我们将在下一节从理论上简单地阐述这是可能的，但是需要一定的条件。我们先来看一下陈水扁是如何上台的。

李登辉推出连战作为国民党的“总统”候选人，但是身为国民党主席却在不同场合下支持陈水扁，使得民进党得以快速发展。“总统”的竞争最后在宋楚瑜、陈水扁、连战以及独立候选人李敖四者之间角逐。最后，陈水扁以微弱优势获胜，而宋楚瑜和连战均告失败。

大家想一想，如果李登辉不耍“弃连保扁”的政治伎俩，或者维护国民党的统一而不使其分裂，使得国民党只有一人参加竞选，那么支持宋楚瑜加上连战的总票数肯定超过陈水扁。

另外一种情况是，假如台湾选举不是直选，选举规则是先角逐出两个而不是多个候选人，然后再在这两个候选人之间进行竞选，会出现什么结果呢？我们可以看一下，假定陈水扁能顺利过第一关而成为两个候选人之一，而宋楚瑜、连战有一个成为候选人，假定是连战，在连战与陈水扁之间的最后角逐中，支持宋楚瑜的选民这次会支持连战——因他们的政治主张相近，那么连战获胜的机会肯定大于陈水扁。但是事实上不是这样，选举中各候选人同时竞选，国民党因分裂而使陈水扁得以上台。

现在我们来看一下中国申办2000年奥运会失败的例子。北京1992年开始大张旗鼓地申请主办2000年奥运会的工作。申办奥运会的投票规则是逐步淘汰制，具有投票权的委员在参加申请的城市里进行投票，得票最少的城市便被淘汰。前两轮投票中北京一直领先。经过两轮投票，最后剩下3家：德国的柏林、澳大利亚的悉尼以及中国的北京。在第三轮投票时，北京获得最多的票，悉尼第二，柏林第三。

这一轮投票结束后，柏林被淘汰掉。如果就这一次投票，北京就获胜。但问题是还得再投一次票。当在北京与悉尼之间角逐时，北京肯定会再次获得胜利吗？

事实是，北京输了，悉尼获得了举办2000年奥运会的主办权。为什么会这样？原来支持柏林的投票人大多数转而支持悉尼。这就是悉尼获胜的原因。

由此看来，民主投票不能得出惟一的结果，其选举结果取决于民主投票的程序安排以及每次确定的候选人的多少，即投票规则。不同的投票规则将得出不同的选举结果。这就是说，民主投票有内在的缺陷。我们将用著名经济学家阿罗提出的“不可能性定理”来说明，民主制度存在着缺陷。四、通过民主的方式能使少数人

支持的候选人赢吗？读者会问，能不能通过所谓民主选举而得出任意结果呢？

可以这样说：假定一次性选举时所有人都选某一个人，那么在任何的选举规则下，即通过任何的选举（无论独裁的还是不同民主规则下的选举），这个人肯定当选。在这种极端情况下，无论什么制度对选举人都一样，独裁制度也会得出这个结果。当然如果所有人都不选某一个人，什么制度的设计也都一样，无论是民主的还是独裁的都会得出同样的结果，并且无论设计什么样的规则，结果都一样。这就是为什么历史上的独裁者认为，他是人民的代表，他的决定代表着民意，因为代表着民意意味着你们对所有的决定不要再表达自己的意见了，我的意见就是你们的意见，即使通过民主的方式，也是同样的结果。这就是独裁者经常强奸民意的理论根据。

而当人们的偏好不同时，民主选举程序的规则设计就极大地影响着选举结果。

我们举一个例子。一由n人组成的社会，假定n取300，对候选人A、B进行选举，并假定进行一次性投票，此时有2/3的人反对A而选举B，1/3的人选A而不选B。我们有没有办法设计一个结构，通过“民主的”投票规则使A能够当选呢？我们说这是可能的。

假定大家都同意服从大多数原则，但程序可以商量。我们把这300人构成3组——这3组既可以天然地形成，也可以设计。每组中候选人获得该组的大多数选票，他就赢得这组的选举，3组中赢得2组即赢得大多数，就算赢了。我想，在实际中这些是任何候选人都能同意的，并且也认为是公平的。我们假定每组的人数不是一样的：第一组是50人，第二组是100人，第三组是150人——我们这里人数的确定完全是随意的。假定第一组中有30人赞成A而反对B，第二组中有60人赞成A而反对B，第三组中10人赞成A而反对B。即：第一组A与B的比例是：30∶20；第二组A与B的比例是：60∶40；第三组A与B的比例是：10∶140。

在这样一种规则下进行投票，A获得了3组中2组的赞成票。A获胜。

在这个例子中，如果不分组就选一次，那么B肯定获胜。

这个例子中，使B获胜的是直选机制，使A获胜的是间接选举机制。台湾采取的是前者，美国采取的是后者。

布坎南在《同意的计算》布坎南，塔洛克：《同意的计算》，中国社会科学出版社，2000年版，第242页。中举了另外一个例子。一个25个人组成的社会，只需要9个人同意某个议案就可使得它通过。具体地说，可以将这25个人分成5个区，每个区5个人，这样，只要有3个区（5个区中的多数）中的多数同意，即每个区有3个人同意就能使一项议案通过。

具体地，我们可将25个人分成A、B、C、D、E共5个区。同意者分在A、B、C三区，见下表。

ABCDE***************

这完全可以在“大多数”原则下使一项议案得到通过，尽管可以有16人不同意。如果是36961人（199×199）的一个社会，只需10000人就可使一项议案获得通过，只比总数的1/4多一些，而无须多于1/2的人同意。即用此方法对两个候选人或候选议案进行选举或进行表决，可以使其中本来获得少数人同意的当选。

设置

手机

书架

书页