• 精选
  • 会员

蜈蚣博弈的悖论

2019年5月28日  来源:博弈论的诡计:日常生活中的博弈策略 作者:王春永 提供人:我不存在吗

一个人打算向邻居借斧子,但又担心邻居不肯借给他,于是他在前往邻居家的路上不断胡思乱想:“如果他说自己正在用怎么办?”“要是他说找不到怎么办?”想到这些,这人自然对邻居产生了不满:“邻里之间应该和睦相处,他为什么不肯借给我?”“假如他向我借东西,我一定会很高兴地借给他。”“可是他不肯借斧头给我,我对他也不应该太客气”……

这人一路上越想越生气,于是等到敲开邻居的门后,他没有说“请把你的斧子借给我用一下吧”,却张嘴说道:“留着你的破斧子吧,我才不稀罕你的东西!”

从上面这个笑话中,可以想象一些喜欢以己度人者在生活中遇到的尴尬。但是笑过之后,我们却发现,这个借斧头的人所运用的思维方法,居然有着倒推法的影子。

难道倒推法真的有什么问题吗?答案是肯定的,这种悖论在博弈论中被称为“蜈蚣博弈悖论”。很多学者已经用科学的方法推导出:倒推法是分析完全且完美信息下的动态博弈的有用工具,也符合人们的直觉,但是在某种情况下却存在着无法解释的缺陷。

如下面这样一个博弈。两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。规则是:A、B两次决策为一组,第一次若A决策结束,A、B都得n,第二次若B决策结束,A得n-1而B得n+2;下一轮则从A、B都得n+1开始。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为一有限次,比如198次。如图13-1所示。

由于这个博弈的扩展形很像一条娱蚣,因此被称为“蜈蚣博弈”。

现在的问题是:A、B是如何进行策略选择的?我们用一对情侣之间的爱情博弈来说明。


图13-1 蜈蚣博弈

爱情就其本质来说是一种交往,人交往的目的在于个人效用最大化,不管这个效用是金钱,还是愉快的感觉、幸福的感觉。只要追求个人效用,就必定存在利益博弈。因而,我们的爱情交往是一个典型的双人动态博弈过程,不过爱情的效用随着交往程度的加深和时间推移有上升趋势。

假定小丽(女)和小冬(男)是这个蜈蚣博弈的主角,这个博弈中他们每人都有两个战略选择,一是继续,一是分手。他们的博弈展开式如图13-2所示。


图13-2爱情博弈

在图中,博弈从左到右进行,横向连杆代表继续交往战略,竖向连杆代表离开她(他)战略。每个人下面对应的括号代表相应的人与对方分手,导致爱情结束后各自的爱情效用收益。括号内左边的数字代表小丽的收益,右边代表小冬的收益。

可以看到,小冬和小丽的分手战略分别对应的括号数字每个都不同,这是因为爱情效用在不断增加,这里假设爱情每继续一次总效用增加1,如第一个括号中总效用为1+1=2,第二个括号则为0+3=3,只是由于选择分手战略的人不同,而在两人之间进行分配。由于男女生理结构和现实因素不同,小丽分手战略只能使效用在二人之间平分,即两败俱伤;小冬选择分手战略则能占到3个便宜。显然,分手对于被甩的一方来说是一种欺骗行为。

请看,首先,交往初期小丽如果甩了小冬,则两人各得1的收益,小丽如果选择继续,则轮到小冬选择。小冬如果选择分手,则小丽属受骗,收益为0,小冬占了便宜收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后,双方了解程度加深,两人爱情总效用在不断增长。这样一直博弈下去,直到最后两人都得到10的圆满收益,为大团圆的结局——总体效益最大。

遗憾的是这个圆满结局很难达到!因为娱蚣博弈的特别之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间做出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在第99步,A的收益是98,A考虑到B在第100步时会选择“背叛”,那么在第99步时,A的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……按这样的逻辑推论下去,最后的结论是令人悲伤的:在第一步A将选择“不合作”,此时各自的收益为1!

把这种分析代人上面的爱情博弈当中,我们可以发现,当双方博弈到达如果分手小丽可得收益为10的阶段,小冬是很难有动力继续交往下去,继续下去不但收益不会增长,而且有被小丽甩掉反而减少收益的风险。小丽则更不利,因为她从来就没有占先的机会,她无论哪次选择分手策略,都是两败俱伤,而且还有可能被小冬欺骗而减少收益。在爱情过程中,女人总体来讲处于不利地位。因此,每一次交往,无论小冬还是小丽都有选择分手来中止爱情的动机,更详细的数学可以证明,爱情圆满的结局不可能达到。当然,我们在生活中会发现,踏人婚姻殿堂的情侣数量,并不像上面的推论得出的那样令人绝望。这是怎么回事呢?

从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A—开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?这就是蜈蚣博弈的悖论。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。西方博弈论专家通过实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略。这种做法违反倒推法,但实际上双方这样做,要优于一开始就采取不合作的策略。

倒推法似乎是不正确的。然而我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定会在某一步采取不合作策略。倒推法肯定在某一步,要起作用。只要倒推法在起作用,合作便不能进行下去。

也许下面这个观点显得更为公允:倒推法悖论的产生其实是源于其适用范围的问题,即倒推法只是在一定的条件下和一定的范围内有效。忽略了这一点,笼统去谈论倒推法的有效性是不科学的。

倒推法的成立是有条件的,在一定的条件下它成立的概率比较高。由于倒推法在逻辑上和现实性方面都是有条件成立的,因此它的分析预测能力就有局限性,它就不可能适用于分析所有动态博弈;如果不恰当地运用了倒推法,就会造成矛盾和悖论。同时,我们也不能因为倒推法的预测与实际有一些不符,就否定它在分析和预测行为中的可靠性。只要分析的问题符合它能够成立的条件和要求,倒推法仍然是一种分析动态博弈的有效方法。

蜈蚣博弈 / 以终为始

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000