• 精选
  • 会员

利他主义与爱克斯罗德试验的局限

2019年5月28日  来源:生活中的博弈论 作者:余治国 提供人:xinggai42......

在爱克斯罗德试验中,选手策略有一定的演化趋向。就像物种遗传一样,对策者所组成的策略群体也是一代一代进化下去的。这种进化的规则包括:

1.试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。这就是试错法;

2.遗传。一个人如果合作性好,他的后代的合作基因就多;

3.学习。比赛过程就是对策者相互学习的过程,针锋相对策略好,有的人就愿意学。

在爱克斯罗德的试验中,第一轮比赛中的63个对策者,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。

试验结果很有趣。针锋相对策略原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个不善良的“哈灵顿”程序,它的对策方案是:首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。

这个程序一开始发展很快,但等到除了针锋相对之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。

进化试验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。针锋相对在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的。因为它让对方得到了高分。

哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的成功者也要被淘汰。

那么,在一个极端自私者所组成的不合作者的群体中,针锋相对策略能否生存呢?爱克斯罗德发现,在得分矩阵和未来的折现系数一定的情况下,可以算出,只要群体的5%或更多成员是针锋相对策略的,这些合作者就能生存。

而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的趋势是不可逆转的,群体的合作性越来越大。

在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要作出回报,否则不会有人跟他长期合作的。

那么,提高团队合作性必须要做到以下8点:

1.要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作;

2.要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了;

3.要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作;

4.能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度;

5.不要嫉妒人家的成功,针锋相对策略正是这样的典范;

6.不要首先背叛,以免担上罪魁祸首的道德压力;

7.不仅对背叛要回报,对合作也要作出回报;

8.不要耍小聪明,占人家便宜。

爱克斯罗德在《合作的进化》一书结尾提出这么几个结论:

1.友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。

2.预见性也不是合作的前提,爱克斯罗德举出生物界低等动物、植物之间合作的例子来说明这一点。但是,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。

当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛时,以修正的针锋相对策略,即以一定的概率不报复对方的背叛,和“悔过的针锋相对策略”,即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,悔过的针锋相对策略效果越好,宽大的针锋相对策略效果越差。

爱克斯罗德所发现的针锋相对策略,从社会学的角度可以看做是一种利他主义。这种行为的动机是个人私利,但它的结果是双方获利,并通过互惠式利他有可能覆盖了范围最广的社会生活,人们通过送礼及回报,形成了一种社会生活的秩序。

这种秩序即使在多年隔绝、语言不通的人群之间也是最易理解的东西。比如,哥伦布登上美洲大陆时,与印第安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为,比如无偿损赠,也通过某些间接方式,比如社会声誉的获得,得到了回报。

但是,爱克斯罗德博弈试验的假设使其研究不可避免地与现实情况相脱节。

首先,《合作的进化》一书暗含着一个重要的假定,即个体之间的博弈是完全无差异的。一方面,在现实的博弈中,对策者之间绝对的平等是不可能达到的。另一方面,对策者在实际的实力上有差异,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0分,这样,弱者的报复就毫无意义。

其次,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取背叛的策略能占便宜。爱克斯罗德的得分矩阵忽视了这种情形,而这种赌徒心理恰恰在社会上大量引发了零和博弈。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000