• 精选
  • 会员
偏见+你有偏见吗-靠偏见理解世界,我们离“乌合之众”有多远-如何向领导汇报“坏消息”-颠覆认知:常人都是情绪化的,圣人才有理性,为什么-意识与理性-意识的用智方式:模拟与类似以达成快速判断-作用于系统一的偏见-佛陀与老子-结果偏见一成功的人说什么都对-信息茧房时代:偏见、撕裂与群氓-思考,快与慢+《思考,快与慢》中人性七罪宗是什么-人性七罪宗是什么?-操控心灵的无形之手-《思考,快与慢》,深刻的让你恐惧+思考,快与慢——序言-关于判断与决策的有趣研究-快思考,慢思考+第一部分 系统1,系统2-第1章 一张愤怒的脸和一道乘法题-行为与注意力-系统1遇到麻烦,系统2会出面解决-两个虚拟出来的角色-第2章 电影的主角与配角-为什么我们看不见那只“大猩猩”-第3章 惰性思维与延迟满足的矛盾-脱口而出的错误答案-第4章 联想的神奇力量-启动效应:让人不知不觉微笑的铅笔-第5章 你的直觉有可能只是错觉-由记忆造成的错觉-创新是发生在能让人联想无限的环境中的-第6章 意料之外与情理之中-第7章 字母“B”与数字“13”-光环效应与群体的智慧-眼见为实的想法往往让我们仓促作出决定-第8章 我们究竟是如何作出判断的-第9章 目标问题与启发性问题形影不离+第二部分 启发法与偏见-第10章 大数法则与小数定律-小样本的出错风险可能高达50%-信任多于质疑的普遍性偏见-对随机事件作出因果解释必然是错的-第11章 锚定效应在生活中随处可见-对锚定值的调整常常是不足的-暗示就是一种锚定效应-锚定效应何时适用,何时不适用-第12章 科学地利用可得性启发法-可得性偏见会影响我们对自己或他人的看法-第13章 焦虑情绪与风险政策的设计-如何避免小概率的风险事件演变成公共危机-第14章 猜一下,汤姆的专业是什么-典型性启发的两宗罪-第15章 琳达问题的社会效应-少即是多的逻辑悖论-第16章 因果关系比统计学信息更具说服力-我们并没有自己想的那样乐于助人-第17章 所有表现都会回归平均值-回归现象的意义不亚于发现万有引力-第18章 如何让直觉性预测更恰当有效-对直觉性预测的偏见进行修正-第三部分 过度自信与决策错误+第19章 “知道”的错觉-后见之明的社会成本-真的存在能让企业基业长青的秘诀吗+第20章 未来是不可预测的-投资股票的技能错觉-专家预测的准确度比不上扔飞镖的猴子-第21章 直觉判断与公式运算,孰优孰劣-专家预测比不上简单运算准确-让许多业内人士烦恼的运算法-“闭上眼睛”的直觉判断比主观判断更可取+第22章 什么时候可以相信专家的直觉-直觉就在眨眼之间-专家型直觉的习得-环境有规律可循,直觉才可相信-直觉的对错评估+第23章 努力养成采纳外部意见的决策习惯-比起外部意见,我们更偏向内部意见-减少决策错误的有效方法+第24章 乐观主义是一柄双刃剑-是你太糟糕,而不是我太笨拙-“事前验尸”:部分克服乐观偏见的方法+第四部分 选择与风险-第25章 事关风险与财富的抉择-伯努利的财富效用理论错在哪里-第26章 更人性化的前景理论-损失厌恶:人们对亏损的反应比对盈余的反应大得多-前景理论无法应对令人失望的事-第27章 禀赋效应与市场交易-人们为什么不愿意割舍自己已拥有的东西-像商人那样思考和交易-第28章 公平性,经济交易的参照点-目标就是参照点-商人提价或降低员工工资的行为公平吗-第29章 对结果可能性的权衡-著名经济学家也难逃阿莱斯悖论的陷阱-决策权重的大小取决于人们的担忧程度-四重模式:可能性与决策权重的关系模型-可能性效应影响下的风险决策-第30章 被过分关注的罕见事件-画面感越强,决策权重越大-对风险的表述方式不同,所做决策可能截然相反-罕见事件又为何会被人忽视-第31章 能带来长远收益的风险政策-聪明的投资者不会每天都看股票行情表-风险政策可以抵消风险厌恶的偏见-第32章 心理账户是如何影响我们的选择的-哪种选择会让你更后悔-因为害怕将来后悔而作出不理性的选择-第33章 评估结果的逆转-联合评估引发偏好逆转-第34章 善用框架效应,让生活更美好-情感的框架效应很难抵挡-用框架性政策助推人们作出更好的选择+第五部分 两个自我-第35章 体验效用与决策效用的不一致-记忆自我夸大了痛苦体验-第36章 人生如戏-第37章 你有多幸福-第38章 思考生活-被放大了的幸福错觉+思考,快与慢——结语-经济人和人类-两个系统+思考,快与慢——致谢-附录A 不确定性下的判断:启发法和偏见-代表性-可得性-判断与锚定-附录A 不确定性下的判断:讨论-附录B选择、价值以及框架-风险性选择-结果的框架-概率的心理物理学-公式化效应-损失和成本

专家预测比不上简单运算准确

2020年9月10日 字数:2788 来源:思考,快与慢 作者:[美]丹尼尔·卡尼曼 提供人:jiaoqiao57......

专家预测比不上简单运算准确

奥利·阿申菲尔特(Orley Ashenfelter)是普林斯顿大学的经济学家,爱喝葡萄酒。对于简单的统计学方法的力量可以胜过世界著名学者的观点,阿申菲尔特曾经作过一个引人注目的论证。他想通过波尔多酒生产年所提供的相关信息来预测该酒的未来价值。这个问题之所以重要,是因为优质葡萄酒要想达到质量的顶峰需要很多年。出自同一个酒窖的酒,因其年份不同,在价格上有很大差异。生产时间相差12个月的酒,其价值会相差10倍或更多。预测未来价格的一项因素是它的本质价值,因为投资者买酒就像买艺术品一样,都希望它能够增值。

人们通常认为葡萄酒酿造期之所以能够决定酒的好坏是受生长期间天气多样性的影响,温暖干燥的夏季会酿就最好的葡萄酒,因此全球变暖貌似会惠及葡萄酒产业。湿润的春天也会使这一产业受益,这样的天气会在不影响质量的情况下增产。阿申菲尔特通过天气的三个特征,夏季生长期的平均温度、丰收期的降水量以及上一个冬季的总降水量,来估测出葡萄酒的特质及特定的年份,再将这些常识性知识转化成数据公式来预测葡萄酒的价格。他的公式给出了未来几年甚至几十年后的准确价格预测。事实上,他的公式所预测的葡萄酒期货价格比新酒的市价更准确。这个新的“米尔模式”向那些为前期价格定位提供建议的专家的估价能力发起了挑战。它还对经济理论发起了挑战,根据这些理论,价格应该能够反映出所有有用信息,包括天气因素。阿申菲尔特的公式非常精确,预测价格与真实价格的相关系数超过了0.9。

为什么专家预测不如简单运算准确?米尔猜测其中一个原因是这些专家试图变得聪明,总想跳出思维的框框,在预测时会考虑将不同特征进行复杂的结合。复杂化对稀奇古怪的事情是有影响的,但十有八九会降低其正确性,将这些特征简单地整合在一起反而会更好。有几项研究已经表明,即使人们知道公式给出的建议分数,人类决策制定者在面对预测公式时也会自叹弗如。他们认为自己比公式强大,因为人们拥有关于这一问题的其他信息,但他们往往是错的。在米尔看来,在极少数情况下,我们可以利用主观判断,其他时候用判断替代公式并不是个好主意。在一个著名的思维实验中,他描述了一个能够预测某人今晚会不会去看电影的公式,他指出,如果知道此人今天摔断了腿,不用这个公式也罢。于是就有了“断腿原则”。当然,关键问题是断腿的概率太小了,但一旦腿断了,结论也就很明确了。

专家判断不可取的另一个原因,是人们对复杂信息的最终判断很难达成一致。如果有人要求这些专家对同一信息进行两次评估,他们通常会给出不同的答案。这些不一致之处往往正是真正令人关切的地方。一个经验丰富的放射科医师在两个不同的场合看到同一张片子,这两次检查结果在“正常”与“异常”之间会有20%的偏差。一项让101名审计员独立评价企业内部审计业务可靠性的实验也反映出类似的不一致程度。此前曾有过对不同专业人士判断可靠性的41项研究,研究要求审计员、病理学家、心理学家、组织管理者等专业人士回顾自己原来的判断。尽管他们对每个案例的再次评估在几分钟内就完成了,但实验结果还是说明了判断的不一致性非常典型。不可靠的判断使人们对任何事物都不可能作出有效预测。

这种普遍的不一致性很有可能是由于系统1对极端条件的依赖所致。我们从那个主要实验可以得知,在我们的环境中有一种不被注意的刺激物在本质上影响着我们的思想和行为。这种影响会从这一时刻波及下一时刻。在炎热的天气里,短暂的凉风会使你感到心情舒畅,这个时刻无论评估什么都会相对更积极一些。对于一个将要获得假释的犯人来说,在假释审核期间的每一顿饭之间,他都会有很大的变化。由于我们对我们思想中的东西没有一个清晰的认识,我们永远不会知道在周围环境有微小的变化时,我们会作出不一样的判断。公式却不会有这样的问题,输入不变,输出也不会改变。可预见性很差,这是米尔和他的后继者们在研究中得出的,不一致性会破坏任何预测的有效性。

这项研究得出了一个惊人的结论:要提升预测的准确度,最终的结果应由公式给出,在低效的情况下尤其如此。例如,在医学院的学生录取工作中,最终决定一般由面试候选人的老师来做。这一依据是片面的,但他们的推测也有可靠的证据:如果面试官也参与最终的录取工作,面试的过程很可能会降低选拔过程的准确性。这是因为面试官过于相信自己的直觉,他们会很重视个人的喜好而忽略很多其他信息,从而降低了有效性。同样,专家在评估新酒的价格时会品尝酒,这种信息的反面作用大于正面。当然,即使清楚天气对酒质的影响,专家们也无法保证公式那样的一致性。

继米尔的最初研究之后,促进该领域最重要发展的要数罗宾。道斯所发表的著名论文《决定中非正当线性模型的稳定之美》了。社会科学中常用的数据统计分析是按照某一运算法则评估不同的预测因素,这叫做多次回归,且已经被运用于常用软件中。多次回归中体现的逻辑很有说服力:它找到了将各种预测因素权衡后再整合到一起的最理想公式。然而,道斯发现,这种复杂的数据运算没什么用处,人们也可以通过选取一组对于预测结果以及提升价值都很有效的数据作出类似的判断(使用标准数据或者是等级)。一个公式与这些预测因素以同样的权重结合起来预测新事物才有可能像使用多次回归处理原始样本一样取得理想的预测效果。更新研究则更深入地指出:均衡考虑各项预测因素的公式更有优势,因为它们不受样本突变的影响。

这种基于等权原则的计算方案的成功有着重要的实践意义:它可以在不作任何事前统计研究的基础上就能开发出有用的运算方法。这种基于现有数据或者常识的简单等权公式通常可以预测出意义重大的结果。在一个令人难忘的例子中,道斯指出了婚姻的稳定性可以通过一个公式来预测:

做爱的频率减去争吵的频率

你应该不会希望得到的结果是负数。

这个研究的重要结论是,在信封背面构思的一个运算公式通常可以和理想化的公式媲美,与专家的言论相比肯定更胜一筹了。这种逻辑适用于很多领域,从证券投资组合经理对股票的选择,到医生和病人对治疗方式的选择。

一项拯救了千万婴儿的简单运算法堪称对于这项研究的经典应用。妇产科医生清楚地知道,如果婴儿在出生后的几分钟内无法正常呼吸的话,他(她)就会有很大的脑损伤甚至夭折的风险。在1953年麻醉学家弗吉尼亚·阿普加(Virginia Apgar)介入之前,内科医生和接生人员一直在用他们的临床经验来判断婴儿是否处于危险状态,不同人员的依据也不尽相同。一些人侧重于观察孩子的呼吸情况,另一些人则观察婴儿的啼哭频率。由于没有一个标准,人们经常错过危险信号,导致许多新生儿不幸夭折。

一天早饭后,一个住院医生问阿普加医生如何对新生儿作系统评估。她回答道:“这很简单,你可以这样做。”阿普加快速写下了5个变量(心率、呼吸、反应、肌肉强度和颜色)以及3个分数(0、1、2分别代表各个变量的稳健度)。阿普加意识到自己可能会有所突破,而且这一突破还可能被应用到所有的产房中,她便开始用这种方法评估每一个出生一分钟的婴儿。一个得到8分以上的婴儿一般是肤色粉红、蠕动、啼哭、面部扭曲并拥有100次以上的脉搏,这样的婴儿外形很好。低于4分的婴儿一般是浑身青紫、肌肉松弛、不爱动且心跳微弱,这样的婴儿需要立即救治。应用了阿普加的评分原则后,产房的护士们终于在判断婴儿情况是否危险的问题上有了一套标准,人们认为这个公式对减少婴儿的夭折率起到了很重要的作用。现在,阿普加的方法依然应用于每一个产房中。阿图尔·甘德(Atul Gawande)近期的著作《一份清单宣言》(A Checklist Manifesto)也介绍了一些其他案例,以说明列表以及简单原则的优点。

直觉判断

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000