• 精选
  • 会员
博弈论-博弈论的诡计+第1章 走近博弈论:一场游戏一场梦-战争是怎样发生的-博弈的构成要素-相互依存与均衡-负和、零和与正和-博弈论的局限性+第2章 囚徒困境:自愿坐牢的嫌疑人-克格勃们的小花招-不背叛就会被淘汰-把对方陷入困境中-倒霉是因为太聪明+第3章 重复博弈:一夜情与地老天荒-没有未来必然背叛-如何破解迟到困局-带剑的契约才有效-用道德来保证均衡+第4章一报还一报:出来混迟早要还的-地老天荒的胜利者-向合作进化的棘轮-在一在二不在三-以直报怨的人生哲学+第5章人质困境:多个人的囚徒困境-束手无策的人群-两种理性的矛盾-威力巨大的武器——逐个博弈-是竞争也是劫持-与对手联合起来+第6章酒吧博弈:混沌系统中的策略-一加一未必等于二-混沌世界里的临界点-谁颠覆了社区的平衡-策略的多米诺骨牌-“少数者”的红衣服-让开那架独木桥+第7章 枪手博弈:先发优势与后发制人-同时出招的策略-相继出招的策略-陆逊为什么回兵-进攻方向的选择-置身事外的智慧+第8章猎鹿博弈:走上集体优化之路-“看不见的手”失灵-从合作走向共赢-猎人的帕累托效率-猎鹿中的公平问题+第9章智猪博弈:多劳并不多得-比比皆是的智猪-猪圈里的跟随策略-后发制人的策略-汽车在哪扇门后面+第10章警察与小偷博弈:猜猜猜与换换换-当电话打到一半时-乱拳打死老师傅-不可预测的算计-纯粹的随机策略+第11章斗鸡博弈:狭路相逢的策略-把对手变成朋友+第12章协和谬误:欲罢不能的困局-认赔服输的智慧-不要去看碗背面-要考虑机会成本-有勇气咬断后腿-放弃愚蠢的坚持-第13章蜈蚣博弈:从终点出发的思维-人生的倒后推理-蜈蚣博弈的悖论+第14章:分蛋糕博弈:革命就是讨价还价-蛋糕在不断融化-坚定不移的力量-减少你的等待成本-保护讨价还价能力-外部机会的算计+第15章:鹰鸽博弈:进化中的路径依赖-栅栏上的路径依赖-胜出的未必是好的-孙叔敖与超速均衡-香蕉可以从两头吃-成名发财都要趁早+第16章:脏脸博弈:共同知识的车轱辘-别人的信封更诱人-1天与100天的博弈-共同知识的作用+第17章:信息不对称:买的不如卖的精-只许佳人独自知-不确定性带来风险-信息决定博弈结果-信息披露的策略-应该传递什么信号-清官为什么被淘汰+第18章:信息传递:好酒也怕巷子深-信息传递的模型-标王背后的博弈-信息传递有成本+第19章:信息甄别:分离均衡的筛子-票价为何如此低-所罗门王的智慧-老虎的信息甄别+第20章:策略欺骗:假作真时真亦假-被人耍弄的杨修-别拿别人当笨蛋-不要暴露了自己-策略欺骗的步骤+第21章:承诺与威胁:胡萝卜加大棒的艺术-威胁与许诺要适度-无条件的回应规则-保护好自己的武器-西点军校的规矩-策略意义的可信度-陆象先的边缘政策-小步慢行的策略+三天读懂博弈学-博弈论——让你成为赢家的理论-博弈的构成要素:对手、出招与收益-博弈论的基本假定:大家都是明白人-博弈论就是教你与人“斗心眼儿”-零和博弈与非零和博弈-谁说数学很差就不能学习博弈论-囚徒困境-军备竞赛-旅行者困境:聪明反被聪明误-“撑死胆儿大的”与“饿死胆儿小的”-美忠啊,你慢些跑来慢些跑-如何使对手陷入囚徒困境?-胜利大逃亡:带你走出囚徒困境-重复博弈-天长地久有没有?-诚信来自重复博弈-为什么“毕业了,就说分手”?-你打我一拳,我是否应该马上踢你一脚?-没有惩罚机制的契约不过是一纸空文-从“投名状”看道德规则在博弈中的力量-纳什均衡-强硬形象会给你带来现实的好处-自私自利一定不好吗?-胆小鬼博弈:勇敢者最终获胜的游戏-秦始皇的帕累托最优和汉高祖的纳什均衡+生活中的博弈论-《美丽心灵》的博弈解读-无处不在的博弈-博弈是一种竞合游戏-从围棋定式谈纳什均衡-从爱情故事谈起:优势策略-房地产开发博弈、警察捉小偷与混和策略-位置博弈的策略-猎鹿模型的合作哲学-“囚徒困境”的深刻哲理-“囚徒困境”的破解:合作的约束-威胁、承诺、作弊与惩罚-猴子的故事与道理约束-为什么要有法律-爱克斯罗德试验中的针锋相对策略-利他主义与爱克斯罗德试验的局限-“智猪博弈”的故事-“智猪博弈”与激励机制设计-企业战略与“智猪博弈”-证券市场中的“智猪博弈”-“斗鸡博弈”与“骑虎难下”-银行会垮掉吗?-以弱战强的制胜之道-“海盗分金”的正解-公共地悲剧与和谐社会-房地产市场的多方博弈-酒吧问题与少数人博弈-彩票、赌博与投资-现在与未来的博弈,“时间价值”与利率博弈-如何理解“风险越高,收益越高”-“”超级女声“”、凯恩斯、“”美女投票论“”与泡沫经济-随机游走(Random Walk)、正反馈与庞氏骗局-博弈论不能包治百病-“知识就是力量”的另类解释:信息有价-从出老千谈道德风险-逆向选择的困境-武林高手、信号传递与声誉-所罗门故事与制度设计-未婚者必读:“”约会博弈“”与“”麦穗理论“”-人类为什么会有男人和女人-情侣博弈的讨论-先发优势与后发优势-谈判的要诀-理性、最后通牒游戏与独裁者博弈-管理需要建立预期-强强之间如何有效联合?-奖罚分明的博弈原理-如何争取到一个项目?-民主的悲剧:非排序式投票-孔多塞投票法则、Borda法则及其他-投票操纵的方法:民主的悖论-阿罗不可能定理-帝国的衰落:短视的群体博弈-“幸存者游戏”的人生启示-经济现象的心理分析-21世纪的博弈论:行为博弈论-博弈论思想,科学家模拟上万次“囚徒困境”,找到了最成功的决策

蜈蚣博弈的悖论

2019年5月28日 字数:2195 来源:博弈论的诡计:日常生活中的博弈策略 作者:王春永 提供人:我不存在吗

一个人打算向邻居借斧子,但又担心邻居不肯借给他,于是他在前往邻居家的路上不断胡思乱想:“如果他说自己正在用怎么办?”“要是他说找不到怎么办?”想到这些,这人自然对邻居产生了不满:“邻里之间应该和睦相处,他为什么不肯借给我?”“假如他向我借东西,我一定会很高兴地借给他。”“可是他不肯借斧头给我,我对他也不应该太客气”……

这人一路上越想越生气,于是等到敲开邻居的门后,他没有说“请把你的斧子借给我用一下吧”,却张嘴说道:“留着你的破斧子吧,我才不稀罕你的东西!”

从上面这个笑话中,可以想象一些喜欢以己度人者在生活中遇到的尴尬。但是笑过之后,我们却发现,这个借斧头的人所运用的思维方法,居然有着倒推法的影子。

难道倒推法真的有什么问题吗?答案是肯定的,这种悖论在博弈论中被称为“蜈蚣博弈悖论”。很多学者已经用科学的方法推导出:倒推法是分析完全且完美信息下的动态博弈的有用工具,也符合人们的直觉,但是在某种情况下却存在着无法解释的缺陷。

如下面这样一个博弈。两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。规则是:A、B两次决策为一组,第一次若A决策结束,A、B都得n,第二次若B决策结束,A得n-1而B得n+2;下一轮则从A、B都得n+1开始。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为一有限次,比如198次。如图13-1所示。

由于这个博弈的扩展形很像一条娱蚣,因此被称为“蜈蚣博弈”。

现在的问题是:A、B是如何进行策略选择的?我们用一对情侣之间的爱情博弈来说明。


图13-1 蜈蚣博弈

爱情就其本质来说是一种交往,人交往的目的在于个人效用最大化,不管这个效用是金钱,还是愉快的感觉、幸福的感觉。只要追求个人效用,就必定存在利益博弈。因而,我们的爱情交往是一个典型的双人动态博弈过程,不过爱情的效用随着交往程度的加深和时间推移有上升趋势。

假定小丽(女)和小冬(男)是这个蜈蚣博弈的主角,这个博弈中他们每人都有两个战略选择,一是继续,一是分手。他们的博弈展开式如图13-2所示。


图13-2爱情博弈

在图中,博弈从左到右进行,横向连杆代表继续交往战略,竖向连杆代表离开她(他)战略。每个人下面对应的括号代表相应的人与对方分手,导致爱情结束后各自的爱情效用收益。括号内左边的数字代表小丽的收益,右边代表小冬的收益。

可以看到,小冬和小丽的分手战略分别对应的括号数字每个都不同,这是因为爱情效用在不断增加,这里假设爱情每继续一次总效用增加1,如第一个括号中总效用为1+1=2,第二个括号则为0+3=3,只是由于选择分手战略的人不同,而在两人之间进行分配。由于男女生理结构和现实因素不同,小丽分手战略只能使效用在二人之间平分,即两败俱伤;小冬选择分手战略则能占到3个便宜。显然,分手对于被甩的一方来说是一种欺骗行为。

请看,首先,交往初期小丽如果甩了小冬,则两人各得1的收益,小丽如果选择继续,则轮到小冬选择。小冬如果选择分手,则小丽属受骗,收益为0,小冬占了便宜收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后,双方了解程度加深,两人爱情总效用在不断增长。这样一直博弈下去,直到最后两人都得到10的圆满收益,为大团圆的结局——总体效益最大。

遗憾的是这个圆满结局很难达到!因为娱蚣博弈的特别之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间做出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在第99步,A的收益是98,A考虑到B在第100步时会选择“背叛”,那么在第99步时,A的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……按这样的逻辑推论下去,最后的结论是令人悲伤的:在第一步A将选择“不合作”,此时各自的收益为1!

把这种分析代人上面的爱情博弈当中,我们可以发现,当双方博弈到达如果分手小丽可得收益为10的阶段,小冬是很难有动力继续交往下去,继续下去不但收益不会增长,而且有被小丽甩掉反而减少收益的风险。小丽则更不利,因为她从来就没有占先的机会,她无论哪次选择分手策略,都是两败俱伤,而且还有可能被小冬欺骗而减少收益。在爱情过程中,女人总体来讲处于不利地位。因此,每一次交往,无论小冬还是小丽都有选择分手来中止爱情的动机,更详细的数学可以证明,爱情圆满的结局不可能达到。当然,我们在生活中会发现,踏人婚姻殿堂的情侣数量,并不像上面的推论得出的那样令人绝望。这是怎么回事呢?

从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A—开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?这就是蜈蚣博弈的悖论。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。西方博弈论专家通过实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略。这种做法违反倒推法,但实际上双方这样做,要优于一开始就采取不合作的策略。

倒推法似乎是不正确的。然而我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定会在某一步采取不合作策略。倒推法肯定在某一步,要起作用。只要倒推法在起作用,合作便不能进行下去。

也许下面这个观点显得更为公允:倒推法悖论的产生其实是源于其适用范围的问题,即倒推法只是在一定的条件下和一定的范围内有效。忽略了这一点,笼统去谈论倒推法的有效性是不科学的。

倒推法的成立是有条件的,在一定的条件下它成立的概率比较高。由于倒推法在逻辑上和现实性方面都是有条件成立的,因此它的分析预测能力就有局限性,它就不可能适用于分析所有动态博弈;如果不恰当地运用了倒推法,就会造成矛盾和悖论。同时,我们也不能因为倒推法的预测与实际有一些不符,就否定它在分析和预测行为中的可靠性。只要分析的问题符合它能够成立的条件和要求,倒推法仍然是一种分析动态博弈的有效方法。

蜈蚣博弈 / 以终为始

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000