关于判断与决策的有趣研究
本书展现了我对判断和决策的理解,这种理解受到近几十年来心理学领域新发现的影响。然而,本书中心思想的形成还要追溯到1969年那个幸运的日子。当时我在耶路撒冷希伯来大学的心理学系教书,那天有个研讨会,我请我的一位同事阿莫斯·特沃斯基(Amos Tversky)在会上发言。他当时被视为决策研究领域的一颗新星,不过我觉得在其涉足的任何领域中,他都是耀眼的新星,因此我知道我们那天一定会交谈甚欢。很多认识阿莫斯的人都认为,在自己所见过的人中他是最聪明的。他才华横溢,十分健谈,魅力非凡。他有着超强的记忆力,记得很多有趣的笑话。他还拥有一种超常的能力,那就是利用记住的那些笑话阐明自己的观点。有阿莫斯在,你永远也不会感到沉闷。那时,他32岁,我35岁。
那天,阿莫斯给同学们讲了密歇根大学正在研究的一个项目,这个项目试图回答这样一个问题,即人是否是优秀的直觉型统计者。我们都知道人是优秀的直觉型文法家:4岁的孩子虽然对世界上存在语法这件事完全没有概念,但她在说话时会努力遵循语法规则。人们对统计的基本原则是否也有这种直觉感受呢?阿莫斯指出,研究得出的结论是附条件的肯定(肯定,但是附有一定条件)。我们在研讨会上进行了激烈的讨论,最终认为较为稳妥的结论应当是附条件的否定(否定,但是附有一定条件)。
阿莫斯和我很喜欢这种交流活动,我们认为直觉型统计者是个很有意思的话题,要是一起探索的话会很有意思。那个周五,我们在里蒙餐馆吃午餐,那里是波西米亚人和耶路撒冷的教授们最中意的去处。我们两人打算对一些经验丰富的研究人员的统计直觉进行一番研究。在此前那场研讨会上我们曾得出结论:人的直觉是有缺陷的。虽然这些年来一直在教书,在运用统计学原理,但我们也没能培养出一种直觉,无法利用这种直觉感知从小样本中观察到的统计结果的可靠性。我们的主观判断是存在成见的:我们特别容易相信在没有足够证据的基础上得出的研究结果,而且研究中对观察样本的收集也不足。我们两人此番研究的目的,就是要看看其他研究人员是否也和我们一样有着同样的苦恼。
我们准备了一项调查,其中包括一些研究中出现的实际统计问题。阿莫斯收集了数学心理学协会与会的专家小组的回复,包括曾出版两本统计学教科书的几位作者的问卷。不出所料,我们发现那些专家同行也跟我们一样,总是夸大其词,他们认为一个实验的原创性结果可以被成功复制的概率很大,即使用一个小样本也可以做到这一点。关于实验要收集多少观察数据的问题,他们给一个假定的毕业生的建议也很糟糕。如此看来,即使是统计学家,也算不上是出色的直觉型统计者。
在撰写这些发现时,阿莫斯和我都觉得我们在一起工作是件很享受的事。阿莫斯总是很风趣,有他在的时候,我也变得幽默了,所以我们总会在轻松愉快的气氛中度过几个小时连续不间断的工作时光。工作中的乐趣使我们变得格外有耐心,人在放松惬意的情况下,更容易取得完美的结果。也许最重要的是,我们把批评的态度都抛在门外了吧。我和阿莫斯都是爱挑剔、好辩论的人,甚至比我更甚,但在我们合作的这些年里,我们从没有不假思索地否定对方。事实上,我发现我们在合作时,阿莫斯总能更清楚地看出我模糊的观点中要表达的意思。我们两人中,阿莫斯的逻辑思考能力更强,他的意见总是有据可依,言之凿凿,令人信服。我则凭直觉走,深受心理学的影响,我的很多观点也都是从心理学中得来的。我们俩有很多相似之处,因此很容易理解对方;我们也有很多不同的地方,这些差异常常令对方吃惊。我们重新安排各自的日程,这样就有很多工作日可以在一起工作,工作之余,我们常会一起散步。此后的14年里,共同合作就成了我们生活的中心,对我们两人而言,那些年里所作的研究是我们一生中最精彩的篇章。
我们很快便形成了固定的工作模式,并且一直多年保持这一模式。我们的研究采用的是对话形式,对话中的问题是我们自拟的,那些凭直觉做出的答案也是经过我们两人共同检验过的。研究中的每个问题都是一个小实验,仅一天中就会做很多实验。我们并没有刻意寻求自己提出的那些统计问题的正确答案,只是想确认和分析直觉的回答,大脑中最先出现的、即使知道是错的我们也愿意拿来分析的回答。当时,我们认为其他人也会有我们两个人都有的直觉,事实也正是这样。如此说来,直觉对判断的影响便显而易见了。
我们曾经很高兴地发现,我们俩对几个认识的孩子的未来职业的预想竟如出一辙。我们确信那个3岁大却善辩的孩子将来会做律师,那个有点呆板的孩子可能成为教授,那个体谅他人、循循善诱的孩子可以做个心理咨询师。当然,这些预测都是荒谬的,不过却很有意思。我们都清楚一点,那就是我们对这些孩子的直觉,来自他们自身的特点与特定职业特点的相似度。这种有趣的做法使我们当时就在脑海中创立了一种理论,即预测角色的相似度。此后我们做了许多实验来验证和详细阐述这个理论,下面便是一例。
在你思考下文中的问题时,请记住史蒂夫是从一个有代表性的样本库中被随机挑选出来的:
邻居如此描述这个孩子:“史蒂夫非常腼腆,少言寡语,很乐于助人,却对他人或者这个现实世界没有兴趣。他谦恭有礼,做事井井有条,中规中矩,关注细节。”请问史蒂夫更可能从事哪种职业,图书管理员还是农民?
很显然,史蒂夫的个性和典型的图书管理员有着惊人的相似,但这些与职业密切相关的统计学因素却很少有人关注。你们是否注意到,在美国,农民与图书管理员的比例超过20:1,由于农民数量要多得多,所以那些“谦恭有礼,做事井井有条”的人也常常只能成为坐在拖拉机上的农民,而不可能是坐在图书馆咨询台后的管理员。但是,我们发现实验对象往往忽略这些相关的统计数据,而仅仅依赖于相似度来作出判断。于是,我们提出如下观点:人们把相似度当成一种简单的启发手段(简单地说就是经验法则)来作艰难的判断。对这种启发性手段的依赖必然会造成其预测带有成见(系统性失误)。
还有一次,阿莫斯和我想知道我们这所大学的教授们的离婚率是多少。我们注意到这个问题立即勾起了我们脑海中的记忆,我们俩不由想起自己知道或听说的那些离了婚的教授。于是我们就凭着脑海中这些事例对这个离婚率问题作出判断。我们把这种依靠记忆作出判断的方法称为可得性法则。在一项研究中,我们让调查对象回答一个简单的问题,这个问题与指定的一篇英语课文中的单词相关:
请思考字母K。
请问字母K是更多地出现在单词的首字母位置上还是第三个字母位置上?
玩拼字游戏的人都知道,想起以某个字母开头的单词要比想起它在第三个字母位置上的单词容易得多。字母表中任何一个字母都适用于此法则。因此我们料到,尽管有些字母(比如K、L、N、R、V)出现在第三个字母位置上的频率更高,但是被调查对象的回答肯定会夸大所有字母出现在单词首字母位置上的频率。这种情形再一次表明,对经验法则的依赖必然会导致人们判断时的成见。例如,我曾一度认为通奸在政客中较普遍,在医生或律师中则没那么多见,但我最近对此产生了怀疑。我甚至曾为原来的那个“事实”作出若干解释,包括权力的催情效果、出门在外受到的诱惑等。而我最终意识到,政客的过错只不过更容易被曝光而已,而医生和律师的过错却少有人报道。我的直觉印象可以完全归咎于记者对主题的选择和我对可得性法则的依赖。
阿莫斯和我用几年的时间来研究并记录在不同任务中体现的直觉思考所存在的成见,这些任务包括对事件的概率赋值、对未来进行预测、对假设进行评估,以及对频率进行预估等。在合作的第五年,我们撰文将这项研究的主要发现发表在《科学》杂志上,这份杂志的读者包括很多领域的学者。那篇文章(本书的最后附有全文)描述了直觉思考的简单快捷,列出了在启发法中表现出的大约20种成见,还包括启发法在判定中的作用。
科学史学家常指出,某一特定领域的学者在任何时候都愿意和他人分享关于本学科的观点。社会科学家也是如此。他们把一切问题都归结为人性,认为大多数关于人类特有行为的讨论都应以此为背景,这一观点几乎从未受到质疑。关于人性,20世纪70年代的社会科学家广泛接纳了两种观点。第一,人大体而言都是理性的,其想法通常也是合理的。第二,恐惧、喜爱和憎恨这样的情感能够为人们失去理智的大部分情形作出解释。我们这篇文章虽然没有直接讨论上述观点,却是对这两种观点的挑战。我们记录下正常人思考时出现的系统性失误,认为这些失误是由认知机制的构造造成的,并非由情感引起的思想腐化导致的。
这篇文章所受到的关注远远超出了我们的预期,而且它至今仍是社会科学著作中被引用次数最多的文章之一(2010年有300多篇学术文章参考了这篇文章)。其他学科的学者也觉得这篇文章很有用处,启发法和成见等概念被广泛应用于众多领域中,包括医学诊断、法律判决、情报分析、哲学、金融、统计学和军事战略等。
例如,学习政策的学生就曾注意到,可得性法则能解释为什么有些事人们记得很清楚,而有的却被遗忘了。人们是根据从记忆中提取信息的容易程度来估测事情的重要程度的,而这往往也与媒体报道的广泛程度有关。常被提到的话题就在脑中变得鲜活,而其他的则会慢慢被遗忘。也就是说,媒体选择报道的内容和人们脑中存在的信息不谋而合,所以专制政体对独立媒体施压的现象也不是偶然的了。因为重大事件和名人很容易引起公众的兴趣,媒体能借此煽动狂潮也就见怪不怪了。例如,在迈克尔·杰克逊死后的几周里,电视台几乎未报道别的事。相反,媒体对那些带有批评性的、不能引起公众兴趣、掀不起大波澜的事往往很少报道,比如说去年日趋下滑的教育标准,还有医疗资源的投资过剩等。(我在写这篇文章的时候发现自己选择的“很少报道”的例子都是受可得性限制的。我选为例子的话题经常被提到,那些同等重要却不常被提到的事我往往想不到。)
有一点我们当时并没有充分意识到,即“启发法和成见”这样的心理学概念在其他领域中也具有广泛的启发作用,这便是我们这项研究的一个附带成果:我们总是把为自己和被调查者设计的全部问题都写进文章里,这些问题可以为读者提供范例,使其认识到自己的想法是如何受认知性成见牵绊的。我希望你在读到“史蒂夫是个图书管理员”这样的问题时能有切身的体验,这样能帮助你更好地体会到相似度在引导可能性上的力量,并且能体验到我们多么容易忽略相关事实的统计。
这些实证材料的使用可为不同领域的学者(主要是哲学家和经济学家)提供一次不寻常的机会,使他们关注自己在思考时可能出现的纰漏。看到自己的纰漏,这些学者才更有可能质疑当时普遍存在的那种武断想法,即人类很理性、很有逻辑性。方法的选择很重要:如果我们只报道传统实验的结果,这篇文章就不会那么令人关注,也不会令人如此难忘了。而且,那些持怀疑态度的读者会将自己的判断失误归咎于参与这些心理学研究的大学生,认为是这些学生一贯不负责任的做法使他们不愿相信实验结果。当然,我们摒弃传统的实验方法,采用事例展示的方式,并非只为影响那些哲学家和经济学家。我们采用这种方法,是因为将事例展示出来更有思。我们很幸运,因为我们选择了正确的方法,其他各方面的选择也做对了。本书重复出现的一个主题就是,幸运在每个成功的事例中都扮演重要角色。我们总能很容易地发现,这个事例中一个小小的改变就会将伟大的成就变得平淡无奇。我们展示的这些事例也不例外。
对我们研究的反馈也不全是正面的。我们对成见予以关注的做法受到非常多的批评,反对者认为我们过分否定了人类的思维能力。与对常规科学的反应一样,有些研究者对我们的观点加以改进,有些人则另外提出了一些貌似合理的见解,但有一个观点如今是得到普遍认可的,即我们的大脑容易受系统性误差的影响。我们关于判断(能力)的研究对社会科学产生的影响远远超出我们当时的预料。
研究完判断这一论题后,我们马上将目光转向面对不确定因素时的决策过程。我们的目标是创立一种心理学理论,研究人们在简单的赌博中如何作决定。例如:投硬币时如果是正面朝上你就能得到130美元,背面朝上就输掉100美元,你愿意打这个赌吗?这些简单的选择很久以来一直被用来检验各种与决策相关的问题,例如人们如何在确定的事物和不确定的结果之间进行权衡。我们的研究方法没有变:还是花很多天设计一些选择题,而后分析我们根据直觉进行的选择是否与通过逻辑判断作出的选择一致。在作判断时,我们会观察自己做出决策时出现的系统性成见,还会对一贯违背理性选择规律的直觉性选择进行观察。在《科学》杂志刊出那篇文章5年之后,我们又发表了《前景理论:风险下的决策分析》一文,据统计,该文中提出的决策理论比我们此前对判断的研究更具影响力,该理论也为行为经济学奠定了一定的基础。
在合作过程中,阿莫斯和我经常交流思想,两个人的智慧总要胜过一个人的想法,良好的关系也使我们的工作有趣且高效,这段时光是我人生中宝贵的财富。后来,我和阿莫斯离得远了,很难继续共同研究这一课题。我们在判断和决策制定方面的研究使我在2002年获得了诺贝尔经济学奖。如果阿莫斯没有于1996年去世(时年59岁)的话,他应该和我一起去领这个奖。