如果没有外部强制力,囚徒困境中的参与者怎样才可以维持合作呢?
这是一个非常实际的问题。比如在国际事务上,国家与国家之间经常就某些问题达成一定的协议,这种协议我们在前面解释过,由于不存在一个世界性的政府,约束力往往很小。
对于这个问题,有这样一种答案。如果一方采取不合作的策略,另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略。
如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。
但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。
美国密西根大学罗伯特•爱克斯罗德教授那个著名试验,给出了这个问题更好的答案。爱克斯罗德邀的这些人都是政治学家、数学家、经济学家、社会学家。获胜者是加拿大多伦多大学的拉波波特写出的针锋相对(tit-for-tat)策略。说穿了,所谓针锋相对策略,就是胡萝卜加大棒的原则。
爱克斯罗德在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有任何权威干预每个人的决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。
这个游戏共进行了两轮。在第一轮游戏中,共有14个程序参加竞赛,并附加上爱克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),总共运转了200次。结果得分最高的程序是加拿大学者罗伯布编写的针锋相对策略程序。
这个程序的特点是:第一次对局采用合作的策略,以后每一步都紧紧跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。爱克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即“善良的”;第二,对于对方的背叛行为一定要报复,不能总是合作,即“可激怒的”;第三,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作,即“宽容性”。
为了进一步验证第一轮游戏得到的结论,爱克斯罗德邀请了更多的人再做一次游戏。这时游戏进入了第二轮。第二次爱克斯罗德征集到了62个程序,同样也附加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是针锋相对策略。
爱克斯罗德总结这次游戏的结论是:第一,针锋相对方法仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是“不善良的”,后15名中,只有1个总是合作的是“善良的”。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是“清晰性”,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。
针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择“善行”,只因为合作是自我利益最大化的一种必要手段。
比如在爱情中的博弈原则应该是:善意而不是恶意地对待恋人;宽容而不是尖刻地对待恋人,关键是能够彼此宽容,既宽容对方的缺点;强硬而不是软弱地对待恋人,就是要在我永远爱你的善意的前提下,做到有爱必报,有恨也必报,以眼还眼,以牙还牙,以其人之道,还治其人之身。
比如对于恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁的回报。简单明了而不是山环水绕地对待恋人,在博弈中过分复杂的策略使得对手难于理解,无所适从,因而难以建立稳定的合作关系,明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。
在生活中一样可以运用这种方法。当一个人伤害了你的时候,你知道即便报复了他也并不能消除已对你形成的伤害。如果你还希望两个人的关系能够继续,那么最好是宽恕他。但是,若他知道即便伤害了你也会获得宽恕的时候,他就可能一直有意无意地不停伤害你。
就像我们在一些影片中看到某些心地善良却遇人不淑的女子。那些女子一次又一次原谅胡作非为的丈夫,希望用真情感动他回心转意;但结果丈夫反而得寸进尺,因为他知道无论如何只要一些花言巧语扮可怜就会获得宽恕。
所以有时候,人们会对伤害选择报复。当别人打你一拳,你若打回一拳,这本身并不能减轻你已挨那一拳的疼痛,而且用力打回一拳通常也得不到快感。那为什么还会回击呢?原因在于,你知道打不还手只会让对手更加猖狂,而选择回击是遏制对方进一步侵犯的方式。
所以,有些时候宽大为怀不一定好,有些时候毫无回旋余地也不见佳。这就是奇妙的人类互动世界。