建构新的政治行动者 为潜在的新的政治行动者设计的模型(1)
罗伯特·阿克塞尔罗德
[内容提要]无论是从国际安全事物还是国际政治经济的角度来看,政治行为体的集聚和分裂问题对于我们理解全球政治形态至关重要。我们提出一个基于个体贡献的模型,表现新的政治行动者是如何从小规模的政治行动者的集合中形成。进贡模型(the tribute model)证明了,在简单局部规则条件下,个体的行动者有可能在更高层次上组织成为新的行动者。特别地,这个模型表明,结合了相互增加或减少承诺的机制,“支付,否则……”模型的动力可以导致行动者分族,行为上已经很大程度地符合独立政治国家的标准。
引言
新的政治行动者是如何从一群小的政治行动者的集聚中形成的?这篇文章就试图提供一个模拟的模型来解决这个问题。如果以更广阔的视角来看,这项工作可以看作研究组织内部由下往上逐渐形成组织的过程。在这个过程中,很小的单位在局部区域相互作用从而形成规则,结果就是导致在新的组织水平出现了系统的特征。这项工作是很典型的“Santa Fe”式研究模式,用于处理复杂的自适应系统(Stein,1989;Fontana,1991;Holland,1992)。这种研究组织层次逐渐增加的过程,提醒我们想起生物系统的组织过程,从单细胞组织逐渐扩展到多细胞组织(Buss,1987)。也让我们想起大脑是如何协调管理它的机能,使得单个神经元能组成有意义的结构(Hebb,1949;Minsky,1985)。
现在手头的任务是研究新政治行动者出现的过程。这在后冷战时期是一个重要的问题。我们正处于这样一个时代,所有标准的政治单位——国家——现在不再是稳定的了。我们可以看到,一方面很多国家在分裂,比如苏联和南斯拉夫;另一方面,很多国家又在重新组织,比如欧洲共同体和其他区域联盟。政治行动者之间的集聚和内部的分裂是我们理解当下全球政治形态的一个重要方面,无论对于国家安全事务还是国家政治经济都是如此。
全世界如何置于一条持续发展的路径上,这是目前最紧要的问题。新的政治行动者的不断出现是持续发展的基础。保持稳定过程中的一个主要问题是公共地悲剧(Hardin,1968)。当存在很多独立行动者(人、村落、国家或者一切其他形式),又缺乏机制来保护集体利益抵制私人利益时,每个牧民都会选择在公共草地上过度放牧,从而导致公共地悲剧。这会产生资源耗尽、生物灭绝、人口膨胀、战争以及其他一系列社会问题。防止公共地悲剧的一个重要想法就是基于组织或者过去的独立行动者而产生高层次的新行动者。今天,我们的政治行动者都在国家层次上行动,可以管理边界以内的资源。但是我们还没有非常有效的、超越国界的政治行动者,所以无法在全球范围内管理资源。[1]
政治科学家使用不同的概念和理论来分析新政治行动者出现的过程。不幸的是,他们没有任何可以内生地研究这个问题的形式化模型。事实上,这个问题更像是一个生物学家容易感兴趣的问题:多细胞组织是如何形成的。我们已经习惯把复杂单元组成系统的事实看作理所当然的,并没有想过要发展一套严密的理论来研究系统第一步是怎么形成的(Buss,1987)。比如说,研究政治问题的正规模型范式主要是由博弈论提供的,博弈论首先就明确界定谁是一个特定环境里的行动者。与基于理性选择的博弈论不同,本文使用的方法是复杂性自适应理论。它承认存在不同层次的行动者,较低层次的行动者可以通过相互作用从而组合成更高层次的行动者。
我们的目标就是估计新政治行动者的出现过程,于是很重要的一点就是建立一组数据使得我们可以在新层次的行动者出现时据以鉴别它。下面就是我的判断标准,用以从过去存在的单元关系里鉴别是否有新层次的行动者出现:
1.控制下级的有效性
a.很低的反叛率
b.没有独立的“对外政策”
2.集体行动(“人人为我,我为人人”)
a.家长作风(强者保护弱者)
b.联合对外政策
3.被其他行动者认定为行动者
这个标准很大程度上受到历史和当代国际法的启发,也参考了联合国是怎样处理和承认一个新的国家的具体实践。比如说,当我们看到一个中央政府建立起来并具有以下特征时,我们可以承认十三个殖民地变成了一个新的称之为美国的国家:
1.有效控制各个州
a.很低水平的背叛(至少直到内战前还没有背叛)
b.禁止各个州与其他国家之间签订条约
2.在一些重要资源方面集体控制
a.承认联邦利益高于州的利益,至少在一些重要领域如此
b.承认在战争事务上施行一个共同的对外政策
3.其他一些国家,诸如法国和英国,应该承认它的独立地位
虽然美国独立这个案例很难说是最典型的,但是它的确刻画出许多小的政治行动者如何集聚涌现出新层次的政治行动者的过程。在美国这个案例中,集聚过程就是殖民地在革命阶段所拥有的短暂并且不稳定的自治权力。更典型也更形式化的案例,在这里就是,一个新出现的行动者往往是一个帝国,也就是有一个核心单元统治它的邻居。一个很好的代表是俄罗斯帝国的发展,它是以一个围绕莫斯科的小单元成长起来的。其他的例子还包括罗马和中国的疆域扩展。
常见的高压政治和强取豪夺在国家形成的几个世纪里起到了关键作用(Tilly,1985,1990)。出于这个理由,我们当前这个模型动态机制的核心就是“支付,否则……”。一个单独的行动者可以要求它的邻国支付报酬,威胁说如果不支付随之而来的将是战争。
在这个进贡模型里面,战争带来的结果是财富的变动(因而也是权力的变化),而不是彻底的领土征服。[2]这使得每一个领土所有者可以将自身保持为一个独立的行动者,也允许出现这样的情况,一些领土的所有者集合组成新的行动者。虽然领土不会换手,战争对双方也都有损害,但是对较弱的一方损害更大。于是模型的核心就是进贡模型,行动者可以通过进贡支付从其他人那里夺取资源,并且用这些资源再去争夺更多的资源。联盟也是允许的,所以行动者可以一同工作。独立的个体行动者集合是否会变成一个集聚的稳定的行动者,主要看进贡体系的动态:行动者的组是否表现出一个单独行动者那样的功能,也要看出现的联盟模式是否导向稳定的协调行动。
与我早期对囚徒困境模型的研究工作不同(Axelrod,1984),进贡模型主要是基于强取豪夺而不是合作。还有与早期工作的不同点是,它并不假设每个行动者都具备相同力量,力量差异是这个模型动态的关键,也是模型动态的直接后果。我们也不需要假设两个行动者同时行动。与我早期工作相同的是,它们都不是理性模型。进贡模型假设,行动者相互之间依据过去的行动建立起或多或少的承诺。这些承诺可以被视作是心理过程(比如说,你要支持那些过去帮助过你的人),或者是政治规则(比如说,支持那些以后会在你需要帮助时给你帮助的人)。行动基于简单的决策规则而不是博弈理论考量的最优选择。因为在如此复杂的环境里,理性计算几乎是不可能的。模型的一个重要的新特点是,行动者的行为会随着时间推移而变化,因为他们在交换作用中积累了历史经验,会把简单决策规则运用到这些积累的数据上。
这个模型很成功,因为它能解释很多现有正规理论所无法解释的重要现象,而且只需要很少的前提假设。模型的主要结果就是在更高的组织层面上产生新的政治行动者,我们的主要假设是关于个体行动者相互之间如何作用。我们将可以看到,模型不仅能自然地处理新行动者的产生过程,还可以用于解释国际政治中存在的一些有趣现象。
进贡模型
模型中最基本的单元是10个行动者,排成一行。这些行动者可以被看作是独立的政治单元,比如说国家。我们之所以只用如此少的行动者,只用如此简单的线性地理(而不是二维空间)就是为了尽可能地简化数值分析。只要保证没有失去重要的概念特征,简单化是最好的建模策略。为了避免武断地把直线首尾两端的行动者分开,我们把直线封闭成一个环。这保证了10个行动者的每一个都有两个邻居。
在模型里只有一种资源,即财富。每一个行动者在初始时都会分配到一点财富。初始财富从300到500均衡分配。这个参数与模型中其他一些参数一样有些武断,只是为了我们运算方便才这样选取。
模型最基本的周期设为一年。每一年里,有三个行动者一个接一个地被随机选中而激活。一个被激活的行动者,比如叫A,可以向另一个比如叫B的行动者索要进贡。最初,目标B必须是A的邻居。但随着以后联盟的产生,这个限制会逐渐被放松。这个模型建立在“支付,否则……”的动态机制上。目标B只有两种选择,要么向要求者支付进贡,要么选择战争。
我们选择一些行动者来激活,因为我们观察到世界上存在一些有野心的领导人,各种潜在分歧也会随机产生。但是我们给予行动者提出需求的机会,当它发现当前的环境不是很有利时,也不一定非得提出需求。
如果A提出一个需求,目标B就有两种选择:
如果B选择支付,财富直接从B转移到A。如果B的财富多于250,那么就转移250;否则,B所有的财富都转移向A。转移过程就代表B向A进贡以避免战争。[3]
如果B选择战争而不是进贡,那么每方都损失对方财富总额的25%(如果某一方不能支付那么多损失,那么根据它损失的情况,对方也同比例减少损失)。[4]这是一种简单的兰彻斯特摩擦动态(Lanchester attrition dynamic)(Lanchester,1916;Epstein,1985),它的思想是战争使双方受损,但更强的一方可以给较弱的一方施加更大的打击。[5]
三次激活以后,一年的周期结束,“收获”的季节到来,每个行动者的财富增加20%。这就向系统内注入一定的新财富。一次模拟将运行1000年。
下一个要考虑的问题就是,行动者面对需求做出反应的决策规则是怎样的。在进贡博弈中,要求行动者发展出完全理性的行动准则几乎是不可能的,因为时间和空间构成极大的复杂性。于是模型中就采用启发式决策规则,抓住博弈者短期考虑的一些关键特征:
被激活的行动者需要决定对谁施加需求。最理想的施加需求的对象最好足够弱,于是它会选择支付而不是战争;即使它选择战争也不可能造成很大的损害。另一方面,施加需求的对象又最好足够强,这样它就有可能提供尽量多的进贡。一种恰当的决策规则就必然结合了这些考虑,从潜在目标中挑选对象,最大化从攻击对象中所可能取得的收益。对象的薄弱性用(WA-WT)/WA表示,其中的WA和WT分别表示激活的行动者和它挑选对象的财富水平。对象的支付水平与对方情况有关,在财富的损失和进贡250之间,哪种损失更少。如果不存在正的攻击结果的潜在对象,比如说没有潜在的可供攻击的对象比需求者更弱,那么就不提出需求。
研究这个目标的决策规则很简单:战争,当且仅当它的成本比进贡低时。
当然我们的模型只研究两个个体之间的互动。但是为了研究新行动者出现的机制,我们必须能够促使行动者一同工作。这里的核心观念就是让行动者发展出相互之间不同程度的承诺。这些承诺由过去它们选择支付或者战争所决定,也对未来它们支付或者战争产生影响。最基本的想法是,如果两个个体行动者发生战争,相邻的行动者就会加入它给予承诺更多的一方。如果它对需求者和目标对象的承诺水平是一样的,它就会保持中立。如果它确实加入了一方或另一方,它就会按照自己承诺的比例贡献自己的力量(比如财富)。
最初,任何一方对另一方都没有承诺,每个行动者只对自己有完全的承诺。i对j的承诺在以下情况会增加:
a.i对j进贡(臣服)
b.i从j收取进贡(保护),或者
c.i与j在同一方作战(友好)
d.i与j在对立方作战(敌对)
承诺规则的动态变化是很简单的。当一个行动者向另一个行动者进贡的时候,它很有可能部分受到对方政治上的支配,从而在下一次被迫支持对方。一个国家经常要承诺帮助它的“守护者”,无论出于选择还是强迫,正如很多拉丁美洲国家在第二次世界大战珍珠港之役后纷纷参战一样。反过来,“守护者”国家提供保护也是很常见的事,因为它要保护未来的收益。另一个特点是,如果两方面曾在过去并肩作战,那么它们倾向于在未来也是如此,如美国与韩国在朝鲜战争之后的关系那样。反过来看,如果两国过去发生过战争,那么它们很少会在未来相互支持,典型例子是第一次世界大战之后的德国与法国。[6]
模型假设承诺的增加与减少是恒定的,也就是说,增减10%。而且,一个行动者对另一个行动者的承诺不可以超过100%,也不可以低于0。上面描述的承诺过程保持了承诺的对称性。因为两个行动者在初始时互相之间都没有承诺,而它们相互之间的承诺水平总是同时升高或降低。比如说,如果两个行动者在一场战争中站在了同一方,那么它们相互之间的承诺就增加了10%。
模型的最后部分处理行动者之间的协调,为了使得互动与土地竞争相一致,协调行动被假设需要相邻。于是,只有两个行动者之间的所有个体都加入了需求方,对于需求方来说,一个行动者才能成为合格的对象。其他方也可以根据双方承诺水平的高低来选择加入承诺方还是被需求方。比如说,第5号位置上的行动者,当且仅当行动者6和7都加入自己一族时,才可能对行动者8提出需求。这就要求行动者6和7对于行动者5的承诺高于对行动者8的承诺。那么,如果行动者5对行动者8提出需求,行动者10一定加入行动者8和9的阵营,为行动者8辩护。
承诺与财富都是公共知识。[7]于是,当一个活跃的行动者在估量合格对象的弱点时,它也会考虑到所有对立方面行动者的承诺和财富实力。同样的,被提出需求的对象可以计算对抗攻击联盟所造成的损失。计算防御者所遭受损失占财富的比例,应该用防御者联盟贡献给防御者的财富来计算。