冠军的锦标赛
20世纪70年代末,罗伯特·阿克塞尔罗德尝试用一种不寻常的方法来回答如何重复地玩未知次数的囚徒困境游戏。他决定进行一个实验,这个实验自那之后变得十分出名。5阿克塞尔罗德没有用数学分析来解决这个问题,相反,他举行了一场比赛。阿克塞尔罗德让来自世界各地的14名社会科学研究者提交一个拥有最佳策略的候选人,然后在一场循环锦标赛中让不同的参赛者相互对决。其中一些策略非常精细,采用了复杂的数学公式。但是赢得比赛的策略非常简单。它是由多伦多大学心理学和数学教授阿纳托尔·拉波波特(Anatol Rapoport)提交的。拉波波特的战略被叫做“以牙还牙”,它的第一步是合作,从那之后,参赛者只是简单地观察对手的最后一步,然后重复对手的动作。如果对手合作,那他也合作;如果对手背叛,那他就背叛。阿克塞尔罗德对这一简单策略的成功感到惊讶,并举办了第二次更大的比赛来进一步测试它。这一次有来自经济学、数学、物理学、计算机科学和进化生物学领域的62名参赛者,“以牙还牙”又赢了。
阿克塞尔罗德十分好奇:这样一个简单的策略怎么能接连打败那些更为复杂的设计呢?“以牙还牙”真的是最好的,还是有其他更好的策略等着被发现呢?此外,虽然“以牙还牙”的策略总体上是成功的,但它在应对某些策略上的性能也存在不如其他策略的情况。从某种意义上讲,它相当脆弱。想象两个采取“以牙还牙”策略的玩家相互对抗,事情进展得非常顺利,突然一名玩家犯了一个随机错误,展现了背叛行为,他们就会陷入恶性循环,永远相互背叛。这个灾难性的结果仅仅是因为一个简单的错误,它给阿克塞尔罗德感兴趣的领域——核武器控制,带来了令人担忧的影响。
阿克塞尔罗德还想探索其他策略,但又不想举办另一场更大的锦标赛。随后,阿克塞尔罗德在密歇根大学的同事约翰·霍兰德向他介绍了20世纪70年代中期霍兰德发明的在计算机上模拟进化的技术。阿克塞尔罗德决定尝试霍兰德的模拟进化算法,看看他是否可以简单地在计算机上模拟进化策略,而不必让人类为囚徒困境博弈提建议,然后让大自然主导最适者生存的战争。