若警察在a区巡逻,而小偷去b区偷盗,此时,警察的得益为2(保住a区建设银行2万元财产),小偷的得益为1(成功偷盗b区首饰店1万元财产),记作(2,1)。若警察在b区巡逻,而小偷去a区偷盗,此时,警察的得益为1(保住b区首饰店1万元财产),小偷的得益为2(成功偷盗a区建设银行2万元财产),记作(1,2)。警察与小偷之间的支付可写成如下的支付矩阵。由上面分析,我们可以得出这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。在混合策略均衡点下,双方的策略选择是其最优策略(混合策略)选择。此时,对于警察的一个最佳选择是,警察用抽签的方法决定去a区巡逻还是去b区巡逻。因为a区建设银行的财产价值是b区首饰店的两倍,所以用两个签(比如1、2)代表去a区巡逻,一个签(比如3)代表去b区巡逻。如果抽到1、2号签,就去a区巡逻,若抽到3号签就去b区巡逻。这样警察就有2/3的几率去a区巡逻,1/3的几率去b区巡逻,其几率的大小与去巡逻地的财产价值成正比。而小偷的最优选择也是以同样抽签的办法决定去a区行窃还是去b区偷盗,只是与警察的去向相反,小偷抽到1、2号签去b区行窃,抽到3号签去a区行窃,那么,小偷就有1/3的几率去a区偷盗,2/3的几率去b区偷盗。上面所说的警察与小偷所采取的策略便是混合策略。按上述混合策略,警察的期望得益是7/3万元,与得2万元收益的只巡逻a区的策略相比,明显得到了改进。原因如下:当警察去a区巡逻时,小偷有1/3的几率去a区偷盗,2/3的几率去b区偷盗,此时,警察巡逻a区的期望得益为7/3(1/3×3+2/3×2=7/3)万元。当警察去b区巡逻时,小偷同样有1/3的几率去a区偷盗,2/3的几率去b区偷盗,此时,警察巡逻b区的期望得益为7/3(1/3×1+2/3×3=7/3)万元。警察的总的期望得益为7/3(2/3×7/3+1/3×7/3=7/3)万元。同理,我们也可得出小偷采取混合策略的总的期望得益为2/3万元,比得1万元收益的只偷盗b区的策略(前提是警察只巡逻a区)要好。因此,当博弈中一方所得为另一方所失时,对于博弈双方的任何一方而言,此时只有混合策略均衡,而不可能有纯策略的占优策略。一、自私的纳什均衡纳什均衡对亚当·斯密的看不见的手原理提出了挑战:亚当·斯密的理论认为,在市场经济中,每一个人都是从利己的目的出发的,但最终全社会会达到利他的效果。但是纳什均衡理论却告诉我们,每一个人都是从利己的目的出发,但结果却是损人不利己,既不利己也不利他。它反映了个人理性和集体理性的矛盾。囚徒困境是如此,快餐店定位也是如此。为了进一步证明纳什均衡的这种损人不利己的结果,我们来看下面这些例子。