几年前,在一个论坛上,我与一位年轻的进化心理学家同台演讲。我在既定时间内粗略地介绍了一下人类是如何在“不相干”的群体间进行大规模合作的,并把这个主题作为一个进化难题提了出来。对此,那位进化心理学家说:“关于合作的进化,存在两种解释:亲缘选择和互惠利他主义。基于此,互惠利他主义必然可以解释人类的所有合作行为。”那些试图从进化的角度来理解人类行为的人们也持有类似观点,尽管没有直截了当地表达出来。
这位进化心理学家的观点听起来似乎是正确的,但实则不然,除非你把互惠利他主义看成是:个体基于其社会同伴的过往行为,于当前所做出的行为选择。然而,许多对人类进化感兴趣的人都将互惠利他主义看成是条件性合作(contigent cooperation):如果你过去与别人有过合作,那现在我就跟你合作。不难看出,这种定义下的互惠利他主义只适用于小规模群体中的合作。大规模群体中的合作需要通过第三方来监管和执行相关的规范和制度。由此可见,这种带有强制性的规范与互惠利他主义是截然不同的。那么,从条件性合作的角度来看,为何互惠利他主义无法解释从合作伙伴那里观察到的合作行为的进化过程?对于这一问题的理解是非常重要的。
与互惠利他主义有关的进化理论最初出现在美国进化学家罗伯特·特里弗斯(Robert Trivers)的一篇缺少数据支撑的文章。[46]这篇文章的基本观点非常简单:我帮你,希望你将来也能帮我;如果在我需要帮助的时候,你没有提供帮助,那么我就再也不会帮你了。只有当长期合作所带来的收益超出短期欺骗性合作所带来的好处时,合作行为才会受到自然选择的青睐。然而,只有当个体通过频繁的交往对合作伙伴有所认知,并清楚合作伙伴以往的行为时,合作才行得通。显然,互惠利他主义其实不具有丝毫的利他性,如果合作成功,那是因为合作者从中获得了长期的回报。因此,在这里,我将使用更为确切的术语:互惠。特里弗斯在其文章的最后提到,应该利用重复博弈的“囚徒困境”来建立互惠模型。
10年之后,美国博弈论专家罗伯特·阿克塞尔罗德(Robert Axelrod)和英国生物学家W. D.汉密尔顿(W. D. Hamilton)将特里弗斯的设想付诸实践。[47]他们采用了进化博弈论的研究取向,从人群中随机选取了许多参与者,经过配对后让参与者不断地进行互动。在每一轮互动中,参与者都可以选择合作或背叛。在生物学家所青睐的“囚徒困境”模型里,选择合作的人要付出适合度代价(fitness cost)-c,同时也会为对手创造一个适合度收益(fitness benefit)b,而选择背叛的人既不用付出任何代价,也不会为对手创造丝毫收益。在每一轮中,无论你的对手做出怎样的选择,背叛对你来说都是最好的选择。如果对方选择合作,则b>b-c;如果对方没有选择合作,则0>-c。如此一轮一轮地重复选择,而条件性行为使合作得以维持下去。
例如,假设有个体利用某种规则,也就是博弈论所说的“策略”,以牙还牙:在第一轮中,个体选择合作,而后根据对手在上一轮中的行为做出选择。当两个讲究策略的个体碰到一起时,他们都会选择合作,直到互动结束。当一个讲究策略的个体和一个经常选择背叛的个体相遇时,在第一轮结束之后,讲究策略的个体就会终止合作。如果讲究策略的个体普遍存在于人群之中,那么讲究策略者的主要交往对象也会是讲究策略者,而且会从持续的合作中获得长期的回报。尽管背叛者能够得到更大收益,但这种收益只是一时的,因为别人不会再与其合作了。只要合作时间足够长,长期收益一定会大于短期收益;与背叛相比,讲究策略的合作能获得更多收益。
阿克塞尔罗德与汉密尔顿的论文引发了大量有关重复博弈“囚徒困境”的研究,相关文献以“互惠的进化”为核心,从以下4个方面进行了论述:[48]
1. 当不相关的个体进行互动,且互动时间足够长时,在条件性合作普遍存在的群体中,个体可以避免由背叛带来的危害。这类策略被称为“进化稳定策略”,也就是进化博弈论中的ESS。时间足够长,并非指非常长的时间。例如,如果b÷c=2,那么个体平均只需进行两轮即可做出决策。尽管存在各种各样的合作策略,但如果互动能够持续进行,那么双方所采用的大部分合作策略就都具有进化上的稳定性。
2. 当不相关的个体进行互动时,非合作行为付出了代价,此时c>0,那么互动也会在进化过程中稳定下来。
3. 如果进行互动的个体是有关联的,但关系不一定非常密切,那么在一个无条件背叛普遍存在的群体中,也会出现条件性合作。例如,如果b÷c=2,双方进行8次互动,只要r>1/16,条件性合作就会取代无条件背叛。其中,r指的是阿齐部落各团队内部的平均相关度。
4. 用一种合作性策略取代另一种合作性策略往往会更加困难。与取代背叛性策略相比,取代合作性策略通常会比较低效。[49]这就意味着,虽然人际间的相关性能够确保原始的互惠策略在缺乏合作的社会中持续存在,但互惠策略并不会因此而得到进一步的进化,从而变得更有效。
运算结果验证了罗伯特·特里弗斯根据语言学推理所得的结论:在社会性哺乳类动物和鸟类中,个体之间存在频繁的交往;个体能够识别每个群体成员,并且具有复杂的认知能力,因而互惠行为是非常普遍的。