本章从榔头和钉子的比喻开始。钉子是我想解决的问题,榔头是我想尝试使用的工具,它看起来非常适合敲打我的钉子。现在这个成问题的钉子就是:一报还一报策略(TIT FOR TAT)在我的计算机竞赛中的成功,是否很大程度上取决于递交策略的人预先对于其他人的策略内容有所考虑?换句话说,人们对他人行为的信念,会影响到竞赛的结果吗?或者,如果竞赛环境中不存在任何对其他人倾向甚或响应性的先入成见,一报还一报的相互作用这种情况还会成功吗?
要回答这个问题,需要一种产生新策略的方法,它不能涉及人类的先入成见。密歇根的计算机科学家约翰·霍兰研究出来的工具正可以执行这个功能。我和霍兰很熟,因为我们都是一个小型研究小组多年的成员。它就是BACH小组,以最早一批成员的名字命名:阿瑟·伯克斯(Arthur Burks),我自己,迈克尔·科恩和约翰·霍兰。霍兰发明的遗传运算法则技术(Holland,1975),其灵感来自于发现适应性解决方法以对付难题的能力。到20世纪80年代中期已证明,可以有效地运用遗传运算法则技术,在极度复杂的计算机问题中发现有效的解决方法(Goldberg,1989;Mitchell,1996)。
我本人对演化模拟的兴趣可追溯到1960年。当时我在读高中,做了一个科学项目,内容是假设的生命形式和环境的计算机模拟。后来我就读芝加哥大学时,专业是数学。但我曾花费一个夏天的时间在数理生物学委员会阅读进化生物学的资料。尽管我对计算机、数学和进化论有兴趣,但我最终却选择了政治科学专业继续深造。当时我最想研究的问题是国家间的冲突如何避免,尤其要避免核战争。获得耶鲁的博士学位后,我在伯克利大学教授国际政治,后来转到密歇根大学,同时在政治科学系和现在的公共政策学院任教。
在密歇根,迈克尔·科恩是与我关系最密切的同事。他一直建议,我应该见见约翰·霍兰并了解他的研究。最终我同意了,为此我感到十分庆幸,获益极多。即便是在复杂的环境寻找高度适应性的反应,约翰·霍兰的遗传运算法则也是非常有潜力的一种方法。因此,当钉子是需要研究囚徒困境策略的演化时,榔头就应该是遗传运算法则,两者看起来非常匹配。
我做的第一件事就是检验遗传运算法则,看看它是否能在我自认为熟知的环境中——即我的竞赛中第二轮所递交的规则——表现良好。结果这个法则的表现比我最热切的期望还要好,它发展的策略,其有效性大大超过我本以为此环境中可能达到的水平。当确信这的确是可以敲打钉子的榔头之后,我开始把它运用于我的实际研究。我从许多完全随机的策略出发(选自大量没有合作或互惠倾向的可能策略),然后用遗传运算法则让这些策略演化发展。在很短的时间里,群体演化的方向就表现为非常类似于一报还一报的策略,而且群体的确在互惠的基础上达成了合作。这就表明,人们在两轮竞赛中递交的规则,其互惠的成功并不取决于某些对他人递交规则的先入成见,它的成功绝不是侥幸得来的。
早先对互惠的看法,其坚实程度超过我的想象,对此我感到满意。而且我不再需要像一些人所要求的那样致力于开展更多轮次的计算机竞赛,对此我也感到高兴。
研究结果的论文第一次发表时,是作为一本书的一个章节。那本书主要研究遗传运算法则和相关的计算机技术。遗传运算法则的计算机科学文献广泛引用这篇论文,主要是因为囚徒困境提供了一个易于理解的任务,而且遗传运算法则在这个任务中的表现令人印象深刻。此外,这也是遗传运算法则第一次被用来发展互动环境中的策略。不幸的是,该论文只是在计算机科学文集中出现,这就意味着社会科学家们不容易读到它。
该项目的后续工作也很有意思,它被用于研究有性繁殖的适应性价值。这个故事与威廉·D.汉密尔顿(William D.Hamilton)有关,在此之前我曾与他合作研究囚徒困境研究成果在生物学上的应用(Axelrod and Hamilton,1981)[1]。在我写遗传运算法则的论文时,汉密尔顿把他的理论告诉我,他认为性是为了抵抗寄生虫而产生的适应结果。汉密尔顿是世界上最著名的进化生物学家之一,因此当他提出新奇理论时,不管初听之下多么奇怪,我都应该认真对待。他指出几乎所有的大型动物和植物都是有性繁殖,虽然这样做成本可能很高。例如,在哺乳动物中,当半数成年哺乳动物——雄性不分娩,有性繁殖的成本可能高达2比1。性提供何种优势来弥补这个巨大的成本,这是进化生物学中未解决的大难题之一。汉密尔顿粗略地表达了他的想法。他说所有大型动物和植物都有这样的问题:它们依靠一种能力抵抗寄生虫,即区分自身的细胞和不断进化去欺骗细胞的寄生虫。寄生虫小得多,比寄主繁殖更快,因此它们可以比寄主更快地进化。汉密尔顿推断,性使得寄主的后代不同于父母,因此已经适应寄主的寄生虫难以很好地适应寄主的后代。通过改动父母的基因,性使得一种寄主种类得以抵抗快速进化的寄生虫。
这个想法很吸引人。但是,汉密尔顿认为做出一个可解的数学模型有困难。问题在于,该模型必须包含许多基因,但是当互动基因超过两个时,遗传学的数学模型通常变得难以控制。我说:“没问题。”我当时有一种技术基于霍兰的遗传运算法则,它可以容易地处理许多互动基因。而且,它能容易地表述寄主和寄生虫之间的竞争。于是我和汉密尔顿找到一位计算机科学研究生赖可·塔尼斯(Reiko Tanese)合作。我们改编了遗传运算法则,目的是测试:相对于也要应付不断进化的寄生虫的无性繁殖寄主,是否寄主的有性繁殖确实可以克服2比1的不利成本。我们的方法果然奏效了。研究成果写成论文,评论其他性起源的解释,并证明汉密尔顿的解释在理论上是合理的(Hamilton et al.,1990)。一个政治科学家能修改来自计算机科学的工具并因此有贡献于进化生物学,直到今日我仍为此感到高兴。而且居然是性起源的问题!很明显,霍兰的“榔头”对好几种钉子都有效。
最近,用遗传运算法则研究策略的发展有许多其他应用途径。以下两个是我最喜欢的:
我的工作开始时,先从极其丰富的囚徒困境策略之中随机挑选。克里斯坦·林格伦(Kristan Lindgren,1991)的做法则不然。他从最简单的策略出发,然后使用遗传运算法则的一种延伸方式演化出越来越复杂的可能性。结果是随着一种策略主导模式最终受到另一种模式的侵袭,出现了稳定期和不稳定期的交替周期。因为存在较长的暂时性(transient)和断续性平衡,群体的动态表现十分复杂。这是我最喜欢的一种遗传运算法则用途,因为它体现了策略从简单到较复杂的演化过程。
完全不同的条件下,史密斯和戴克(Smith and Dike,1995)使用遗传运算法则研究一种新型战斗机的空中战术。研究出来的策略使X-31试验飞机开发出以下能力:在对常规战斗机对手的模拟战斗中失速后可能控制住飞机。该项目表明,无需成本高昂的原型测试飞行,遗传学习系统就能发现有效新策略的规则。
遗传运算法则非常有效,而且它发展为囚徒困境群体中的互惠,这两点有助于证实互惠作为有效策略的稳健性,它并不取决于其他参与者的先入之见。
注释:
[1]我们的论文修改后也在第五章中有所体现,参见Axelrod,1984。
参考文献
Axelrod,Robert.1984.The Evolution of Cooperation.New York:Basic Books.
Axelrod,Robert,and William D.Hamilton.1981.“The Evolution of Cooperation.”Science 211:379-403.
Goldberg,David E.1989.Genetic Algorithms in Search,Optimization,and Machine Learning.Reading,Mass.:Addison-Wesley.
Hamilton,William,Robert Axelrod,and Reiko Tanese.1990.“Sexual Reproduction as an Adaptation to Resist Parasites(A Review).”Proceedings of the National Academy of Sciences(USA) 87:3566-3573.
Holland,John H.1975.Adaptation in Natural and Artificial Systems.Ann Arbor,Mich.:University of Michigan Press.2d ed.,1992.
Lindgren,Kristain.1991.“Evolutionary Phenomena in Simple Dynamics.”In Artificial Life Ⅱ,ed.C.G.Langton,C.Taylor,J.D.Farmer,and S.Rasmussen,295-313.SFI Studies in Complexity,vol.10.Reading,Mass.:Addison-Wesley.
Mitchell,Melanie.1996.An Introduction to Genetic Algorithms.Cambridge,Mass.:MIT Press.
Smith,Robert E.,and Bruce A.Dike.1995.“Learning Novel Fighter Combat Maneuver Rules Via Genetic Algorithm.”International Journal of Expert Systems 8:247-276.