联合评估引发偏好逆转
“约翰高吗?”如果约翰高5英尺,你的回答就会取决于他的年龄。如果他6岁,他自然是很高;如果他16岁,这个身高就算矮的了。你的系统1会自动检索相关信息,同时,你对高的概念也会随之调整。你还会根据类别来匹配各项参数,比如回答:“在餐馆里吃饭,多少钱的一顿饭可以和约翰的身高相匹配?”你的回答会取决于约翰的年龄,即如果他16岁,这顿饭就比他6岁时更便宜。
但是,请看下面的说法:
约翰6岁,他身高5英尺。
吉姆16岁,他身高5.1英尺。
在单一评估中,由于每个人的参照标准不一样,大家都会觉得约翰很高,而吉姆不高。如果你需要对比,比如“约翰是和吉姆一样高吗”,你会回答不是。这个问题不会引起疑问,也没有模糊不清的地方。不过,在其他情况下,即事物和事件在它们各自的情境中进行比较时,会造成对重要事情的选择不一致。
你不应该形成单一评价和综合评价总是不一致的印象,也不应该认为判断完全是混乱的。我们生活的这个世界有多个范畴,因为我们有标准,例如,6岁的孩子或者桌子。判断和偏好在同一种类中是一致的,但当事物从属于不同的种类时,就是不一致的了。例如以下3个问题的答案:
你喜欢苹果还是桃?
你喜欢牛排还是炖菜?
你喜欢苹果还是牛排?
第一个问题和第二个问题中的事物属于同一个种类,你能立即回答出自己喜欢哪一个。此外,你可以从单一评估(“你有多喜欢苹果”和“你有多喜欢桃子”)中得到自己的喜好评价,因为苹果和桃子都是水果。由于不同的水果是通过相同的标准进行对比的,在单一评估和联合评估中,每种水果都可以直接进行对比,因而也就不存在偏好逆转了。与种类内的问题不同的是,苹果和牛排的对比没有固定的回答。
苹果和牛排与苹果和桃子不同,从本质上讲,它们是不可以相互替换的,它们也不能满足同样的需求。有时你会想吃牛排,有时又想吃苹果,但你很少会在想吃苹果时说吃牛排也一样,或者在想吃牛排时说吃苹果也一样。
假设你收到一封自己信赖的组织发来的电子邮件,要求你对某一事业作出贡献:
很多繁殖海豚的地方都受到了污染的威胁,这导致海豚的数量减少。一个由私人捐献的特殊基金会成立了,并给海豚提供无污染的繁殖区。
这个问题能引发什么样的联想呢?你是否意识到脑中闪现了相关事业的想法和记忆?你很可能会想起保护濒危动物的工程。你的系统1会自动评估其好坏,并对海豚在濒危动物中的排名生成一个大致的印象。海豚要比白釉、蜗牛或鲤鱼这样的动物更惹人喜爱,也就是说海豚比大脑自动进行对比的动物更受欢迎。
你必须要回答的问题不是你是否更喜欢鲤鱼,你需要对此进行美元价值评估。当然,你可以从以往的经验中知道你从没有对这种要求做出过回应。设想你就是对这种要求作出贡献的人。
和其他难题一样,对美元价值的评估可以用替代和强度匹配来解决。美元的问题是很难,但可以通过更简单的问题来回答。因为你喜欢海豚,你很可能会觉得拯救海豚是项善举。下一步(也正是自动进行的一步),你会将你对海豚的喜爱用贡献的大小来表达。你对以前对环境事业作出的贡献大小有意识,这份贡献与对政治或母校足球队的贡献有所不同。你知道对自己来说多大的贡献是份“巨大的贡献”,多大的贡献是“大贡献”或“一般贡献”,又或是“小贡献”。你对不同动物的态度也有所不同(从“非常喜欢”到“一点也不喜欢”)。因此你也能将自己的态度用美元价值来表达,自动从“非常大”到“较大”再到几美元。
在另一种情况下,你接手了另一种诉求:
雇农要在阳光下暴晒多个小时,他们患皮肤癌的概率要比一般人高很多。定期体检可以降低其风险。现要建立一个基金会支持面临患皮肤癌风险的雇农的体检项目。
这是个紧急的问题吗?你在评估紧急事件的时候,这件事属于哪种类别呢?如果你自主地将这件事归为公共卫生问题,你很可能会发现雇农患皮肤癌的风险在这些公共卫生问题中排名不是很靠前,它的排名相对于濒危动物中海豚的排名来说,肯定会靠后。若将皮肤癌问题的相关重要性用美元价值来表示的话,你对其作出的贡献就会比对濒危动物的贡献要小。在实验中,海豚在单一评估中吸引到的贡献量要比雇农吸引到的多。
其次,思考联合评估中的这两个例子。在这两种例子中,是海豚还是雇农应该得到更大的那笔捐款呢?联合评估中关注了单一评估中没有被注意到的一点特征,但其在被发现时,却被认为是有决定性的因素:雇农是人,海豚不是。你当然认识到了这一点,但这点在单一评估中判断时是不相关的。“海豚不是人”这一事实没有引起注意,是因为在脑中被激活的所有事情都具备这一特点。“雇农是人”这一事实没有在脑中浮现是因为所有的公共卫生问题涉及的都是人。单一评估的窄框架使得海豚有更高的强度得分,通过强度匹配,海豚会得到相应更多的捐款。联合评估改变了事情的表述:这一“人Vs.动物”的特点只有在将两者综合在一起看时才会凸显出来。在联合评估中,人们对雇农表现出偏好,并愿意捐献更多,比保护可爱的动物要捐得多。在打赌和抢劫案射杀人的例子中,单一评估和联合评估是不一致的。
芝加哥大学的奚恺元对下面这个同等类型中的偏好逆转例子作出了贡献。被评估的对象是二手音乐词典。
在单一评估时,词典A要更有价值,当然,偏向在联合评估中会改变。其结果正好表明了奚恺元的可评价性假设(evaluability hypothesis),即词条数在单一评估中没有价值,因为数量自身是没有价值的。而在联合评估中,这一点则显然使词典B更具吸引力,而且词条数比封皮状况更重要。
同类案件判罚的力度为何不一样?
我们有理由相信公正的管理在不同领域中受可预测的不一致性的影响。其中的证据部分可从实验中获得,比如对模拟陪审团的研究;部分可从对立法、管理和诉讼模式的观察研究中获得。
在一项实验中,从得克萨斯州的陪审团中挑出了模拟陪审员,并要求他们去评估几起民事案件的惩罚性赔偿。这些案件是两个为一组呈上来的,其中一个案件提出人身赔偿,另一个案件是经济损失。模拟陪审员首先评估了其中一个案件,然后给他们看了同组中的另一个案件,并要求他们进行对比。下面是关于一组案件的总结:
案例1:某个孩子在玩火柴时不小心点着了自己的睡衣,造成中度烧伤。生产这种睡衣的公司没有将这种睡衣制成耐燃的。
案例2:由于某家银行的不慎处理,另一家银行损失了1000万美元。
一半的受试者在将两个案例进行联合评估时,会先评判案例1(用单一评估)。其他的受试者在评估时,会将案件的顺序颠倒过来。在单一评估时,陪审员判给诈骗银行的惩罚性赔偿要比判给烧伤孩子的高,很可能是因为诈骗银行的案例中涉及的金额要大,是个高锚定。
然而综合来看案件时,对受害个体的同情心会比锚定效应占更大的影响比重,因而陪审员判给孩子的赔偿金要比判给诈骗银行的高。平均来看几组这样的案件,联合评估中人身伤害的受害者所得的赔偿是单一评估中得到的赔偿的2倍。只看到孩子烧伤案件的陪审员作出的决定和他们的感觉相匹配。他们不能预测到给那家金融机构的大笔赔偿金会使给孩子的赔偿金显得不够。在联合评估中,关于银行的惩罚性赔偿金仍然锚定在损失上,而给烧伤孩子的赔偿金却有所提升,这其中反映出了陪审员对因疏忽而导致孩子受伤的愤怒。
我们可以看到,理性通常会受到更广泛、更综合的框架的限制,而且联合评估显然比单一评估更广泛。当然,当能控制你所看到的人对你的选择有既定的兴趣时,你应该在联合评估时谨慎些。售货员很快就意识到改变购物环境能影响顾客的偏好。除了故意的改变外,你可以设想判断时用对比的方法(一定会包括系统2)会比单一评估更稳定,单一评估常会反映出系统1的情绪反应强度。我们希望任何想要得出周全判断的机构都能在评估单个案件时,为所作的判断提供更广泛的背景。我从卡斯。桑斯坦那儿了解到评估惩罚性赔偿的陪审员明显未能考虑到其他案例,这让我很惊讶。法律体系和心理学常识不同,法律判决更倾向于单一评估。
在法律体系另一项关于不一致性的研究中,桑斯坦对比了不同美国政府部门实施的行政处罚,包括职业安全与保健管理总署和环境保护局。他总结道:“在范畴内,惩罚似乎是理智的,至少更严重的伤害会受到更严厉的惩罚。对于违背职业安全与保健的行为,最重的惩罚是针对不断的违反行为,其次的惩罚是针对蓄意且严重的违反行为,最轻的惩罚是针对未能保持其良好记录的行为。”然而,如果不同部门惩罚的力度不一样,你也不会感到惊讶,因为不同部门的惩罚反映了其特有的政治和历史,而不是所有地方都关心的公正。工人“严重违反”安全原则最多罚款7000美元;而违反野生鸟类保育行动可导致最高25000美元的罚款。每个部门制定的罚款与该部门制定的其他罚款相比都是明智的,但将不同部门的罚款相对比就显得很奇怪了。就像此章中的其他例子那样,只有将两个案例放在一个大框架下时,你才能看出其中的奇怪之处。同种类间的行政处罚系统是具有一致性的,但与其他种类综合在一起来看,却是不一致的。
示例:逆转
“我对英国的热量单位没有什么概念,但在看到空调装置的改变后,我对此就有所了解了。联合评估非常重要。”
“你认为这个演讲非常成功,这是因为你将这个演讲和她的其他演讲作了对比。要是和其他人对比的话,她仍然不怎么样。”
“当你将框架放大时,你就会做出更明智的决策,事实往往如此。”
“当你单独看某件事时,你很容易受系统1的情感反应的支配。”
….文.…;
….人.…;
….书.…;
….屋.…;
….小.…;
….说.…;
….下.…;
….载.…;
….网.…;