蜈蚣博弈的悖论

2019年5月28日　　来源：博弈论的诡计：日常生活中的博弈策略　作者：王春永　提供人：我不存在吗

一个人打算向邻居借斧子，但又担心邻居不肯借给他，于是他在前往邻居家的路上不断胡思乱想：“如果他说自己正在用怎么办？”“要是他说找不到怎么办？”想到这些，这人自然对邻居产生了不满：“邻里之间应该和睦相处，他为什么不肯借给我？”“假如他向我借东西，我一定会很高兴地借给他。”“可是他不肯借斧头给我，我对他也不应该太客气”……

这人一路上越想越生气，于是等到敲开邻居的门后，他没有说“请把你的斧子借给我用一下吧”，却张嘴说道：“留着你的破斧子吧，我才不稀罕你的东西！”

从上面这个笑话中，可以想象一些喜欢以己度人者在生活中遇到的尴尬。但是笑过之后，我们却发现，这个借斧头的人所运用的思维方法，居然有着倒推法的影子。

难道倒推法真的有什么问题吗？答案是肯定的，这种悖论在博弈论中被称为“蜈蚣博弈悖论”。很多学者已经用科学的方法推导出：倒推法是分析完全且完美信息下的动态博弈的有用工具，也符合人们的直觉，但是在某种情况下却存在着无法解释的缺陷。

如下面这样一个博弈。两个博弈方A、B轮流进行策略选择，可供选择的策略有“合作”和“不合作”两种。规则是：A、B两次决策为一组，第一次若A决策结束，A、B都得n,第二次若B决策结束，A得n-1而B得n+2;下一轮则从A、B都得n+1开始。假定A先选，然后是B,接着是A，如此交替进行。A、B之间的博弈次数为一有限次，比如198次。如图13-1所示。

由于这个博弈的扩展形很像一条娱蚣，因此被称为“蜈蚣博弈”。

现在的问题是：A、B是如何进行策略选择的？我们用一对情侣之间的爱情博弈来说明。

图13-1 蜈蚣博弈

爱情就其本质来说是一种交往，人交往的目的在于个人效用最大化，不管这个效用是金钱，还是愉快的感觉、幸福的感觉。只要追求个人效用，就必定存在利益博弈。因而，我们的爱情交往是一个典型的双人动态博弈过程，不过爱情的效用随着交往程度的加深和时间推移有上升趋势。

假定小丽(女)和小冬(男)是这个蜈蚣博弈的主角，这个博弈中他们每人都有两个战略选择，一是继续，一是分手。他们的博弈展开式如图13-2所示。

图13-2爱情博弈

在图中，博弈从左到右进行，横向连杆代表继续交往战略，竖向连杆代表离开她(他)战略。每个人下面对应的括号代表相应的人与对方分手，导致爱情结束后各自的爱情效用收益。括号内左边的数字代表小丽的收益，右边代表小冬的收益。

可以看到，小冬和小丽的分手战略分别对应的括号数字每个都不同，这是因为爱情效用在不断增加，这里假设爱情每继续一次总效用增加1，如第一个括号中总效用为1+1=2,第二个括号则为0+3=3,只是由于选择分手战略的人不同，而在两人之间进行分配。由于男女生理结构和现实因素不同，小丽分手战略只能使效用在二人之间平分，即两败俱伤；小冬选择分手战略则能占到3个便宜。显然，分手对于被甩的一方来说是一种欺骗行为。

请看，首先，交往初期小丽如果甩了小冬，则两人各得1的收益，小丽如果选择继续，则轮到小冬选择。小冬如果选择分手，则小丽属受骗，收益为0,小冬占了便宜收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后，双方了解程度加深，两人爱情总效用在不断增长。这样一直博弈下去，直到最后两人都得到10的圆满收益，为大团圆的结局——总体效益最大。

遗憾的是这个圆满结局很难达到！因为娱蚣博弈的特别之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间做出选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，在第99步，A的收益是98,A考虑到B在第100步时会选择“背叛”，那么在第99步时，A的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……按这样的逻辑推论下去，最后的结论是令人悲伤的：在第一步A将选择“不合作”，此时各自的收益为1!

把这种分析代人上面的爱情博弈当中，我们可以发现，当双方博弈到达如果分手小丽可得收益为10的阶段，小冬是很难有动力继续交往下去，继续下去不但收益不会增长，而且有被小丽甩掉反而减少收益的风险。小丽则更不利，因为她从来就没有占先的机会，她无论哪次选择分手策略，都是两败俱伤，而且还有可能被小冬欺骗而减少收益。在爱情过程中，女人总体来讲处于不利地位。因此，每一次交往，无论小冬还是小丽都有选择分手来中止爱情的动机，更详细的数学可以证明，爱情圆满的结局不可能达到。当然，我们在生活中会发现，踏人婚姻殿堂的情侣数量，并不像上面的推论得出的那样令人绝望。这是怎么回事呢？

从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告诉我们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可能获取的收益为100。当然，A—开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看，一开始A应取不合作的策略。我们不禁要问：是倒推法错了，还是直觉错了？这就是蜈蚣博弈的悖论。

对于蜈蚣悖论，许多博弈专家都在寻求它的解答。西方博弈论专家通过实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略。这种做法违反倒推法，但实际上双方这样做，要优于一开始就采取不合作的策略。

倒推法似乎是不正确的。然而我们会发现，即使双方开始能走向合作，即双方均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定会在某一步采取不合作策略。倒推法肯定在某一步，要起作用。只要倒推法在起作用，合作便不能进行下去。

也许下面这个观点显得更为公允：倒推法悖论的产生其实是源于其适用范围的问题，即倒推法只是在一定的条件下和一定的范围内有效。忽略了这一点，笼统去谈论倒推法的有效性是不科学的。

倒推法的成立是有条件的，在一定的条件下它成立的概率比较高。由于倒推法在逻辑上和现实性方面都是有条件成立的，因此它的分析预测能力就有局限性，它就不可能适用于分析所有动态博弈；如果不恰当地运用了倒推法，就会造成矛盾和悖论。同时，我们也不能因为倒推法的预测与实际有一些不符，就否定它在分析和预测行为中的可靠性。只要分析的问题符合它能够成立的条件和要求，倒推法仍然是一种分析动态博弈的有效方法。

蜈蚣博弈 / 以终为始

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。