支持规范的机制
对规范博弈和元规范博弈的模拟结果,使得我们可以解释规范动态中的一些重要过程。对规范博弈的模拟表明,依赖个人来惩罚背叛看起来不足以维持一种规范。于是,现在要考虑的问题是,什么机制可以部分地支持建立这样的规范?演化的进程帮助我们发展出这类过程的列表,在有些情况下,可以为描述支持规范的过程提供特殊的建模方法。
元规范
正如计算机模拟所表现的,元规范的存在是使得一种规范开始运作的动力。并且一旦它被确立,元规范就对它提供保护。通过把对不惩罚者的报复和对背叛者的报复联系起来,元规范提供了一种机制,使得针对背叛的规范变成自律。这里的关键就是把两种报复联系起来。没有这种联系,系统就会变得分裂。因为单独个人可以逐渐降低甚至停止元报复水平,但还保持着报复。等到别人也停止了元报复,那就可以停止报复了。
前面引用的例子指出,人们将惩罚那些不执行有价值规范的人。模型假设,规范就是认为,人们对那些违背特定规范和容忍违背规范的人,抱有相关程度的报复和愤怒心理。演化路径表明,元规范是一种可以帮助支持规范的机制,于是就出现一个有趣的实证问题,这两种类型的报复是不是真正相关的?我猜测它们确实具有相关性。我们对背叛行为的愤怒和对那些容忍背叛的人的愤怒很相像。但是现在,元规范还只是一种推测。
支配
另一种支持规范的机制是,一个组可能可以支配另一个组。比如说在美国南部,白人可以私刑拷打黑人,黑人却不能如此对待白人。白人具有两方面的基本优势:更强的经济能力和政治权力,还拥有大量的人口。
对于权力和数量所产生的影响,只要对研究现存两个不同组的基本模型做一些扩展就行了。两个组之间的竞争可以被假设为,博弈者的背叛行为只伤害到对方组里的成员,于是也只被对方组里的成员惩罚。类似的,在我们用这个模型研究元规范时,惩罚那些没有惩罚背叛者的行为只可能发生在同一个组里,正如我们上文所讨论过的一个白人用饮料瓶袭击另一个白人的私刑案例。而且,在决定下一代的策略时,两组成员被允许分别地适应改变成新策略,白人从白人处学习,黑人从黑人处学习。
为白人的两种优势分别建模。他们在经济和政治权力上的优势就表现为,他们被黑人惩罚时,付出的代价较小。我们假设对白人而言,p=-3,而对黑人而言,p=-9。白人数量上的优势直接反映在两组人群的规模不同,使得白人有很大的机会观察并惩罚黑人的背叛,反之反是。我们假设人群中有20个白人,10个黑人。
基于这些条件的分析表明,抵制惩罚和增加规模对一个组有好处,但仅仅是对存在元规范的环境而言。如果没有元规范,即使强组的成员也可以变成“搭便车者”,没有个人激励去承受执行成本。这将同时导致两个组都变成很低的报复水平和很高的冒失水平。增加了元规范以后,强组就相对容易地压制弱组,使得他们不敢冒失。但弱组不大容易迫使强组成员不背叛。
另一个潜在强大的规范可以用一个主要的实力大国与许多小国家的交互作用模型来表示。比如说,美国不仅在给定的双边互动中容易占据有利位置,它还比其他国家有着更多双边互动的机会。于是,它的行为比起其他小国来,对发展规范会产生更大的影响。利比亚希望修改12公里海岸线的国际规范,这样就可以包含整个锡德拉湾。美国舰队故意驶入海湾,击落了两架试图改变规范的飞机。很显然,不仅因为美国最强大,还因为他们有激励为了自己海军在世界另一端的利益而维护旧规范。
虽然经常由一个强大博弈者挑起的交互行为过程还没有进行模拟,但是很有可能这个过程会帮助建立起反对背叛的规范,因为核心博弈者会有很大的不对等的激励对背叛者实施报复。
规范也可以由极少数行动者的利益引起,比如美国和苏联都竭力延迟核武器的扩散。它们的行动不需要在细节上进行协调,因为它们是如此重要以至于其他行动者不得不接受这些主要行动者的选择。这里的逻辑和奥尔森在集体行动问题中论述的“特权集团”(privileged group)有相似之处(Olson,1965,pp.48-50)。
内化
规范常常会内化(Scott,1971),这就意味着违背已经建立的规范时,尽管直接的物质收益为正,但心理上会遭受痛苦。这经常可以在实验中观察到,受试者经常比他们应有的行为表现出更多的骑士风度。他们在解释自己的行为时往往会说:“你必须为了自己而活。”用规范博弈的术语来说,这种内化机制表明,背叛的诱惑T对他们而言是负的而不是正的。如果每个人都如此强烈地内化规范,那么就没有人有激励去背叛,规范会保持稳定。很显然,家庭和社会为了内化各种规范付出了极大的努力,特别是在儿童教育方面。他们这种行为的成败与否取决于很多因素,包括个人对集体的认同程度以及规范和它的倡导者本身的合法性程度。[3]
显然,很少有这样高度内化的策略,使得组内每一个成员背叛它的收益为负。接下来模型化工作中的问题就是,有多少人为了保持规范的稳定而将其内化?
规范博弈的逻辑认为,光是降低背叛的诱惑是远远不够的。毕竟,即使绝大多数人不背叛,但只要没有激励机制来惩罚那些坚持背叛的人,那么这种规范最终还是会崩溃。这就提醒我们要寻找内化机制,不仅仅是减少背叛的引诱,还要增加激励来惩罚那些背叛的人。
增加惩罚的激励,不论通过内化或者其他方式,都会使人们从惩罚背叛者中感受到收获。对他们来说,执行成本E事实上是正的。这些人经常被看作是有正义感、好管闲事的人,为那些现在或者过去喜欢背叛的人所不喜。如果有足够多的人来执行规范,那么规范是否能维持的问题就会变成规范中背叛行为高或是低的小问题了。
威慑
在规范博弈和元规范博弈中,博弈者并不一定要往前看。反过来,他们可以采取特殊的策略,从行动看结果,把他们的收益同别人的收益进行比较,如果他们的策略表现更差就换成别人的策略。虽然试错法是模型化有限理性博弈者的明智方法,但它并不要求博弈者通过与他人的前向计算和后向比较,完全理解当时的处境。特别地,一个人可能意识到,即使现在惩罚背叛者要付出一定的成本,但从长期来看可以获得以后背叛次数减少的贴现。
一个很好的例子就是美国对新西兰的一次强烈反应。1985年2月,新西兰拒绝一艘美国驱逐舰进入奥克兰港,除非它保证没有携带核武器。美国政府也许并不在乎携带核武器进入新西兰港口,但是他非常在乎“核敏感”作为一种新的规范在他的全球各地很多盟友之间扩散(Arkin and Fieldhouse,1985)。
社会认同
社会心理学的一个重要原则就是“社会认同”,特别是用在人们决策什么是准确行为时。如同查尔帝尼(Cialdini,1984,p.117)所解释的那样:
在一个特定的环境下,我们根据一种行为与他人行动的相符程度来评价它的准确性。无论这个问题是我们在电影院里应该如何处理空的爆米花盒子,我们在高速公路延伸段上驾驶速度应该多快,还是在宴会上应该如何吃鸡肉,周围人的行动对于确定我们的答案至关重要。
这类我们周围的行动有几种作用。首先,它们提供了其他人冒失水平的信息,并且间接地提供了人群的报复水平。因此,我们可以从中推断出一些结论,看冒失的行动是否有利可图。第二,其他人的行动包含了什么是最优行动的重要线索,即使不存在报复。比如说,人们也许在特定的一段高速公路延伸段上放慢速度,并不是因为那里有速度限制,只是因为前方路面铺设得很糟糕。无论哪种情况,其他人的行动可以提供关键信息,看整个人群是如何适应特定环境的。如果我们对于这个环境是新手,那么这些将是关于我们应该如何行为最有价值的信息(Asch,1951;Asch,1956;Sherif,1936)。他人的行为为我们提供合适行为的信息,即使我们不知道理由。最后,在很多情况下,通过遵从周围人的行动,我们可以满足心理上的需要,觉得是集体的一部分。
我们倾向于把社会认同原则看作一个支持规范的重要机制。当前的关于规范的模型已经包含了这种机制的一种形式:一个相对不成功的人会努力搜寻新的机制,而新机制则从人群中其他人已经使用过的机制而来。这是一种社会认同的形式,随着对那些在人群中实施得较成功的机制加上更多权重而被提炼出来。
人们在很多重要方面存在分歧,在这些例子里,社会认同的原则往往适用于那些和我们最接近的人。这也使得我们很容易把超过一个组的情况设计进入模拟中。在黑人与白人的模拟中,黑人在选择新策略时只关注其他黑人,而白人则只关注其他白人。这有着重要意义,因为对白人来说非常成功的策略,运用到黑人的身上也许会导致悲惨的结果。
成员身份
另一种支持规范的机制是在一个组内为一个共同目标工作的自愿成员身份。[4]社会团体中的契约、协议、联盟以及成员身份,都带有强迫个人服从的权力。这种成员身份的权力从三方面起作用。首先,它直接影响个人的效用函数。背叛不那么有吸引力,因为它违反了个人自愿接受的承诺,这会降低一个人的自尊。第二,组的成员身份使得思想接近的人互相接触,这种自我选择的机制使得成员更容易执行规范,通过绝对的同意来成立或者加入一个组。最后,一致同意成立一个组,可以帮助我们定义成员的预期是什么,从而廓清有成员背叛或者施加惩罚时候的目标是什么。
我们可以假设,一个冒失的人会很容易加入一个组,并且利用汇总起来的大家所预期的互相帮助的想法。事实上,这种情况很少发生,部分是因为上述的理由会隔离背叛者,其他人也变得相对容易倾向于报复——特别是在元规范的帮助下。另一个事实是,根据最近的实验环境,合作者比背叛者更容易待在组里(Orbell et al.,1984)。这是因为合作者比背叛者有更强的伦理约束或者对全组利益的考虑,这些因素使得他们首先选择合作。
元规范博弈可以扩展到这样的选择——是否选择加入组织。[5]一般来说,一个人加入组织的价值依赖于还有多少人加入同一个组。每一个博弈者在博弈开始时都会做出选择,与已经加入组的成员的互动开始,于是涉及背叛和惩罚的互动行为一如既往地发生了。举个例子,一个关于共同安全的联盟包含了许多怀着这个共同目的的国家。一个国家加入以后,一个背叛者就会想方设法在一些集体安全事务上不支持这个联盟。既然背叛者伤害了联盟其他成员的利益,一些国家就会惩罚背叛者,他们也会惩罚那些没有惩罚背叛者的国家。很典型的是,加入这个组的国家数量越多,它的成员合作的收益就越大。
在政治环境里,自愿的成员执行社会契约是支持民主政治形式的一幅有力图景。从效果上看,虚构的一致同意对真实法律和制度环境提供了合法性证明。
法律
规范常常先于法律,但随后为法律所支持、维护和扩展。举例来说,在公共场合吸烟的社会规范现在发生了变化。越来越多的人反对其他人在封闭地点点燃香烟,越来越少的抽烟者冒失得未经许可就在公共场所抽烟。这种规范被肯定下来,就会有更多的人支持通过公布法律来明确这种规范,哪些地方可以抽烟,哪些地方不可以。[6]
法律用几种不同的方式来支持规范。最明显的是它用国家的强制力量来规范私人空间。但是强制对于私人而言也许过于昂贵,它可能是一笔巨大的开支。从效率上看,法律下的公共品问题得以避免,因为可以对特殊的个人进行选择性的激励(间谍、警察、法官等等),从而发现并惩罚违背规范的人。
法律自身也有一种实质性的权力,与它是否被强制执行无关。许多人都认真地认为,一些特定的行为是由法律所规定的,无论它要求我们系安全带还是为资本收益交所得税。但是我们也知道,这种对待法律的态度有它的局限性,我们估计有很多人并没有完全缴纳他们所应缴纳的所得税。即使强制力是可能的并且做出努力,法律的力量还是有限的。在很多情况下,法律仅能作为非正式执行规范的补充(而不是替代)。禁酒令的失败是一个经典案例,在缺乏社会认同的情况下推行一种规范往往遭到失败。
除了执行力和受尊重,法律的第三种优势是清晰性。法律一般比其他非正式规范都更清楚地规定了义务。一种社会规范可以规定说,房主必须为租客提供安全的住处。但是《住房法》更有可能把安全定义为火灾时逃跑的可能。在法律的支配下,这种规范可以看得很清楚。然而,这种清晰是有代价的,法律规定也限制了一些人的社会职责。
对法律的权力和运作的模型化已经超出本文所研究的范围。但是我们仍然要强调,法律只是那些已经很强的社会或政治规范的正规化。一个重要的例子是公民自由,这也是民主系统的基础。法律和宪法为公民自由提供支持,比如说言论自由。但是法律只在那些人群可以容忍异议并且愿意保护那些异议者的环境下,才能保障言论自由。
简短地说,社会规范与法律常常相互支持。确实是这样,因为社会规范可以被正规化为法律,法律也提供了外部有效的规范。它们还是相互支持的,因为它们具有互补性的优势和劣势。社会规范经常被用于防止大量小型的背叛,因为执行成本比较低。而法律则正相反,经常被用于处理那些很少见但很重大的背叛行为,因为它有实质性的资源来强制执行。
声誉
一个重要的,而且常常占支配地位的执行规范的理由就是,违背规范就会给出一种关于你个人类型的信号。比如说,如果有一种规范,每个人必须穿着正式地去赴宴,你却没有这么做,那么其他人就可能对你做出许多一般化的推测。
正式着装的重要性,并不仅在于避免让别人因为你违背规范而惩罚你(比如说,向你投来鄙视的眼神),别人还可以推测出很多关于你的情况,然后用你所不愿意的方式来对待你。这是信号原理的一个例子:违背规范并不仅仅是让背叛者和其他人为这一行为付出代价;它还包含了重要的信息,关于背叛者未来在各种不同环境下的信息。[7]
信号原理对于规范的起源和持续性有好几层重要含义。一个关于个人的信号导致别人对此回报时,一种规范就有可能在这种形式的行为中诞生。比如说,一种特定的口音表示良好的教养,其他人就会更好地对待持这种口音的人。一旦这种情况发生,就有越来越多的人这样说话。最终,人们就会惩罚(比如看不起)那些没有这种口音的人。于是,刚开始只是关于个人背景的信号最终变成对所有人的规范。[8]
信号原理可以帮助解释“实然”(is)如何变成了“应然”(ought)。越来越多的人使用信号来取得其他人的信息。越来越多的人使用信号来获得他人的信息。慢慢地,信号从表示一个人的情况变到表示一个通用的人的情况。另一方面,由于缺乏信号,最初只包含很少的信息。可当信号变得通用时,信号就会承载实质性的信息。当几乎所有人的行为都肯定这种信号时,不发出这种信号的人就会被淘汰。这些人现在就会被看作是违背了规范——并因此受到惩罚。
要注意的是,习俗与合作行为有着重要的区别。习俗不会对别人产生直接或间接的收益影响(比如维系和一个人的关系)。但合作行为不同。违背了合作行为会导致对别人的伤害(比如排队)。一种没有直接收益影响的行为一旦发展出它有价值的信号,就有可能变成规范,比如领导时尚的人采用了一种新的式样(Veblen,1899)。一旦这种时尚产生了,违背这种式样就会被人瞧不起。于是时尚就变成了一种规范,个人总是会追随时尚,因为他们不想被人看不起,不想受到惩罚。