饭饭TXT > 学习管理 > 《掌控你的人生：生活中的博弈》作者：徐文【完结】 > 《掌控你的人生：生活中的博弈》.txt

第23节：第二篇纳什均衡：谁都不能改变策略

作者：徐文当前章节：1115 字更新时间：2026-6-28 06:36

若警察在a区巡逻，而小偷去b区偷盗，此时，警察的得益为2(保住a区建设银行2万元财产)，小偷的得益为1(成功偷盗b区首饰店1万元财产)，记作(2，1)。若警察在b区巡逻，而小偷去a区偷盗，此时，警察的得益为1(保住b区首饰店1万元财产)，小偷的得益为2(成功偷盗a区建设银行2万元财产)，记作(1，2)。警察与小偷之间的支付可写成如下的支付矩阵。由上面分析，我们可以得出这个博弈没有纯策略纳什均衡点，而有混合策略均衡点。在混合策略均衡点下，双方的策略选择是其最优策略(混合策略)选择。此时，对于警察的一个最佳选择是，警察用抽签的方法决定去a区巡逻还是去b区巡逻。因为a区建设银行的财产价值是b区首饰店的两倍，所以用两个签(比如1、2)代表去a区巡逻，一个签(比如3)代表去b区巡逻。如果抽到1、2号签，就去a区巡逻，若抽到3号签就去b区巡逻。这样警察就有2／3的几率去a区巡逻，1／3的几率去b区巡逻，其几率的大小与去巡逻地的财产价值成正比。而小偷的最优选择也是以同样抽签的办法决定去a区行窃还是去b区偷盗，只是与警察的去向相反，小偷抽到1、2号签去b区行窃，抽到3号签去a区行窃，那么，小偷就有1/3的几率去a区偷盗，2／3的几率去b区偷盗。上面所说的警察与小偷所采取的策略便是混合策略。按上述混合策略，警察的期望得益是7／3万元，与得2万元收益的只巡逻a区的策略相比，明显得到了改进。原因如下:当警察去a区巡逻时，小偷有1／3的几率去a区偷盗，2／3的几率去b区偷盗，此时，警察巡逻a区的期望得益为7/3(1／3×3+2／3×2=7／3)万元。当警察去b区巡逻时，小偷同样有1／3的几率去a区偷盗，2／3的几率去b区偷盗，此时，警察巡逻b区的期望得益为7/3(1／3×1+2／3×3=7／3)万元。警察的总的期望得益为7/3(2／3×7／3+1／3×7／3=7／3)万元。同理，我们也可得出小偷采取混合策略的总的期望得益为2／3万元，比得1万元收益的只偷盗b区的策略(前提是警察只巡逻a区)要好。因此，当博弈中一方所得为另一方所失时，对于博弈双方的任何一方而言，此时只有混合策略均衡，而不可能有纯策略的占优策略。一、自私的纳什均衡纳什均衡对亚当·斯密的看不见的手原理提出了挑战:亚当·斯密的理论认为，在市场经济中，每一个人都是从利己的目的出发的，但最终全社会会达到利他的效果。但是纳什均衡理论却告诉我们，每一个人都是从利己的目的出发，但结果却是损人不利己，既不利己也不利他。它反映了个人理性和集体理性的矛盾。囚徒困境是如此，快餐店定位也是如此。为了进一步证明纳什均衡的这种损人不利己的结果，我们来看下面这些例子。

设置

手机

书架

书页

第23节：第二篇 纳什均衡：谁都不能改变策略

第23节：第二篇纳什均衡：谁都不能改变策略