• 精选
  • 会员

囚徒困境博弈

2020年7月9日  来源:财富的起源 作者:埃里克-拜因霍克 提供人:kangtao76......

囚徒困境博弈

囚徒困境博弈中的选择可以用一个给出不同决定组合结果的回报矩阵来描述(见图10-1)。结果显示,两名嫌疑人都有强烈的指证动机。如果你不知道同伴会做什么,并且没办法与他协调,最好的选择是去指证。具体来说,如果你的同伴保持沉默,那么你去指证更有利(你获得的回报是1︰0),而如果你的同伴指证了,指证仍对你更有利(你得到的回报是-2︰-5)。因为两名玩家都面临着相同的选择条件,游戏中会出现一个均衡的解决方案,两名嫌疑人都像小鸟唱歌那样指证对方,然后都进入监狱。从嫌疑人的角度来看,这当然不是最佳结果,因为如果他们能以某种方式协调行动,那么他们都能获得自由。

图10-1 囚徒困境博弈中的回报

囚徒困境博弈代表着一种典型的均衡:是追求狭隘的个人利益,还是尽量和他人合作获取更大的利益?这种权衡经常出现在核武器控制、商业战略和婚姻关系等多种情况下。囚徒困境是博弈论问题的一个例子。顾名思义,博弈论适用于研究这样的情况:一个人可以定义一组玩家(例如两个嫌疑人)、一个目标(获得奖励或避免坐牢)、一个决定(指证或不指证)以及一组能将决定反映到玩家回报中的规则。

囚徒困境特别有趣,因为它是一个非零和博弈的例子。在一个非零和博弈中,两个或两个以上的人合作会给群体带来更大的收益。在囚徒困境中,两个玩家总回报的最大化要通过彼此的合作来实现。也就是说,如果两个玩家都保持沉默,他们的总回报是0,而不是另一种选择中的-4。“如果你帮我梳毛,那么我也帮你梳毛”这句话就展示了一个非零和博弈的例子,因为合作能使我们获得自己无法获得的收益。相反,在一个零和博弈中,对于每一个赢家而言,一定有一个输家,一个人的收益就是另一个人的损失。例如,两个人对足球比赛的结果打赌,一个赢了,另一个就会输,不可能两个人都是赢家。我们将看到,非零和博弈的存在以及由此产生的利己与合作之间的矛盾在复杂经济学中起着核心作用。

囚徒困境给我们带来了一个难题。经济依赖于合作活动,人们需要一起工作来生产东西,进行贸易。然而,当人们只能看到狭隘的自身利益时,他们会产生一种在工作中懈怠、在贸易中欺骗的动机。即使人们并没有真正的欺骗,在不知道别人会做什么的情况下,率先为更大的利益伸出合作之手仍有可能面临风险。在《微观经济学》(Microeconomics)一书中,圣塔菲研究所的经济学家塞缪尔·鲍尔斯(Samuel Bowles)用他与印度小村庄帕兰普尔(Palanpur)的农民进行过的一次讨论说明了这个问题:

帕兰普尔的农民会在预计能达到最高产量的播种日期之后几周再播种冬季作物。农民并不怀疑早些播种会有更好的收成,但没有人愿意成为第一个播种的,因为种在空荡荡的土地上的种子会被鸟吃掉。我询问是否有一大群农民或亲戚同意早些播种,然后都在同一天播种来减小损失。“如果我们知道如何做的话,”他抬头看着我说,“我们就不会这么穷了。”3

这种困境被称为协调问题。当人们不合作时,博弈论者称之为背叛者。那么我们应该如何在经济学中实现协调,如何避免背叛陷阱呢?

如果嫌疑人作出了决定,看到了他们的结局,然后又有了重新做决定的机会,结果会不会改变呢?你可能会认为,两名嫌疑人在监狱里待了几次之后,最终会发现他们可以通过相互合作并保持沉默来做得更好。同样,如果帕兰普尔的农民尽量协调他们的种植,而一些农民没有守信,那么这些背叛者将在下个种植季受到惩罚或制裁。

事实上,这个逻辑是有问题的。如果游戏是重复的,并且有固定的回合数,那么两名参与者就又会回到背叛的状态。在囚徒困境中,如果两名玩家都知道,第五轮是最后一个回合,逻辑就会迫使他们把这当成一个单轮游戏去玩。第五轮之后就没有了,所以在第五轮,两名玩家都会自动背叛。同理,他们在第四轮也面临着同样的困境。既然知道无法在第五轮中获得合作的奖赏,那为什么不在第四轮也背叛呢?如此一来,第一轮也会发生同样的情况。

但在现实世界,我们通常无法准确地提前得知一场游戏会进行多少回合。要是游戏的回合数有限但未知该怎么办呢?一个帕兰普尔的农民知道他一生中的种植季有限,但又不知道会有多少季。在这种情况下,游戏就会失去均衡,传统经济学分析也没有告诉我们最佳策略是什么,我们必须要用不同的方式来思考这个游戏。

商业设计

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000