互惠式利他主义
对为何我们在实验室内外会观察到这么高的合作程度,目前的一项相当流行的解释催生了互惠式利他主义机制。这项解释大部分是由阿克塞尔罗德(Axelrod,1984)提出来的,它的产生基于观察到人们有互惠的倾向——仁慈对待仁慈,合作对待合作,敌意对待敌意,以及背叛对待背叛。因此,当考虑到其他人对自己的合作或背叛将来可能做出的回应时,搭便车可能在实际上是收益较少的策略。合作的做法本身(或是身为一个合作者的名声)比较有可能获得他人互惠式的合作回应,因此符合合作者的最终利益。
基于互惠式利他主义的原则,最系统性的策略是最先由阿纳托尔·拉波波特(Anatol Rapoport)提出的“一报还一报”策略。在这个策略中,一位参与者由合作开始,然后选择对方上一次博弈时采用的策略作为自己的依据。这个解释真正的力量在于,反复式的社交两难交互式计算机游戏以及理论分析都显示,采取这种互惠式利他主义的个人或小团体,比不采用这种策略的个人或团体,“长期而言”在统计上都倾向于得到更高的报酬。事实上,在两场阿克塞尔罗德设计的计算机模拟博弈中,由博弈理论家提出的各种策略,经过多次重复的配对比较后,结果一报还一报策略“胜出”。因为这类长期概率现象和“演化”有关,我们可以推断出,互惠型的人比非互惠型的人有更强的“内在适应性”。因此,这样的倾向有一定的遗传根据,它应该是为适应社交世界演化而来的。
互惠式利他主义的内涵之一是,当你的对手在未来没有互惠回馈的可能性时,例如在匿名或是只玩一次的互动状态下,个人在两难的情况下是无法合作的。然而,即使在单次博弈实验中,我们也观察到有50%的合作率。所以,互惠式利他主义无法直接用来解释上述的实验结果。同时,在重复的两难状况下,当有超过两个人以上的参与者时,要用一报还一报策略或是根据互惠式利他主义的其他策略都有困难。如果一个群体中有些成员在第t回合选择合作,而其他人选择背叛,那么想要采取一报还一报策略的参与者,在下一回合时应该怎么做。
有一个相关的假说,似乎符合重复博弈实验观察到的贡献率逐渐下降的现象,是由克瑞普斯、米尔格罗姆、罗伯茨以及威尔逊(Kreps, Milgrom, Roberts, and Wilson, 1982)提出的。他们研究了有限次数的囚徒困境博弈,发现如果两位参与者都是理性的,那么两人的占优策略是在每一回合都选择背叛。虽然一报还一报”策略在无限次数反复的囚徒困境博弈(或是在给定的某次实验之后,博弈结果变动的概率极小)中已经显示出是有效的,但在已知结束次数的博弈中,则是另一回事。在任何有限的博弈中,两位参与者都知道,他们应该在最后一回合选择背叛,所以在倒数第二回合就没有理由选择合作。以此倒推,合作从来都不会有利益。克瑞普斯等人的研究显示出,如果你的对手是你认为不理性的人(即在一个有限次数的博弈中也可能采取一报还一报策略),那么在博弈的初期阶段选择合作,就可能是理性的行为(这可以诱导你不理性的对手也选择合作)。由于公共产品博弈也具备类似的架构,可以说,参与者是按照克瑞普斯等人所解释的方式理性的行动的。然而,实验的结果再一次排除了这个解释。即使是合作完全不符合自私理性的单次博弈或是重复博弈的最后一回合,合作率也从未降到零。
除此之外,安德烈奥尼(Andreoni,1988)设计的另一个实验也提供了反驳互惠假说的其他证据。第一组有15位受试者,分成3组,每组5人,进行重复博弈,另一组有20位受试者,分成4组,每组5人,进行同样的博弈,但是每个小组的成员每次都不同,同时受试的主体不知道在哪个回合会遇上其他19个人中的哪4个人。在这个条件下,合作不具有策略优势,因为下一回合的参与者实际上会是不认识的人。如果在这些实验开始的几个回合中观察到有合作的情形,就可以排除是策略性的合作。安德烈奥尼发现,在陌生人的情境中,合作率确实略高于参与者不变的情境。(这个比例虽然小,但在统计上是显著的。)
通过这些实验我们可以得出一个结论,就是人们有合作的倾向,除非经验告诉他们互动对象在占他们的便宜,合作才会停止。这个“合作准则”(norm of cooperation)在无限次反复的博弈中,与互惠式利他主义有共同点,但是就如我们所看到的,这个行为在互惠利式他主义不适用的状况下也能观察得到。罗伯特·弗兰克(Robert Frank, 1987)对这类行为提出了一种解释。弗兰克的主张是,那些采取合作原则的人可以借由诱导其他人的合作,以及吸引其他合作者的互动来获得好处。弗兰克论点的关键在于,一个人无法一直成功地假装是合作者来诱导他人——就像一个人无法一直让别人相信他的谎言一样。[4]更进一步说,正是因为合作者按照定义能够彼此辨识,所以他们能够选择性地互动并排除背叛者。