我曾经为以色列空军的飞行教练们讲授过关于高效训练的心理学课程,那次经历为我带来了职业生涯中最引以为豪的发现。当时我告诉他们关于技能训练的一条重要原则:对良好表现的嘉奖比对错误的惩罚更有效。不管是对鸽子、老鼠、人类,还是其他什么动物的研究,都给这个说法提供了证据。
就在我结束了激情洋溢的演说之后,经验最为丰富的一位教练举手示意,发表了一番自己的意见。他先是承认奖励对鸟确实管用,但他认为这不是训练飞行学员的最佳选择。他说道:“在很多情况下,我会赞许那些完美的特技飞行动作。不过,下一次这些飞行员尝试同样飞行动作的时候,通常都会表现得差一些。相反,对那些没执行好动作的学员我会大声怒吼,但他们基本上都会在下一次表现得更好。所以说,别告诉我们嘉奖有用而惩罚没用,因为事实恰恰相反。”
这条统计学原则我已经讲授了很多年,而这一次我从一个新的角度重新认识了它,这的确是一个顿悟的时刻。那个飞行教练是正确的,但同时他也彻彻底底地错了。他的观察是精明且到位的:被他表扬之后,很多学员很有可能会表现得很糟糕;惩罚反而会促使他们进步。但是就他的推断而言,奖励和惩罚之间是毫无关系的。他所观察到的就是众所周知的“回归平均值”现象,这种现象与表现质量的随机波动相关。一般来说,只有学员的表现远远超出平均值时才能得到这位教练的表扬。但也许学员只是恰巧在那一次表现得很好,而后又变差,这与是否受到表扬毫无关系。同样,或许学员某一次非同寻常的糟糕表现招来了教练的怒吼,因此接下来的进步也和教练没什么关系。这个教练把不可避免的随机波动与因果解释联系起来了。
这个提议确实引起了反响,不过这些教练对概率预测的代数方法没什么兴趣。所以,我用粉笔在地上画了一个靶子。我请房间里的每一位教练都转过身去,背对着靶子向里面接连扔两枚硬币。接着我们分别测量了靶子到两枚硬币的距离,并写在黑板上。然后,我们又将这些数据按第一次投掷的距离远近排列。很明显,第一次投掷得比较好的人第二次大都做得不好,而第一次没有投掷好的人第二次大都有了进步。我告诉这些教练,他们在黑板上看到的数据其实和飞行员的表现是一致的:糟糕的表现常常会有提高,而好的表现则会变得糟糕,这跟表扬与惩罚都没有关系。
那天,我的发现是,那些飞行教练陷入了一个偶然性困局之中:因为当飞行学员表现差时,他们就会受到惩罚,而接下来的进步则很可能为他们带来嘉奖,事实上惩罚根本就没有发挥什么作用。而且,处于这种窘境之中的不仅仅是那些教练。我曾无意中发现了人类环境中一个意义重大的事实:生活给予我们的反馈常常违背常理。因为当别人取悦我们时,我们也会对他好;当别人对我们不好时,我们也会对他产生厌恶之情。然而从统计学角度来看,我们却是因为对人友好而受到惩罚,因为举止无礼而得到嘉奖。
第二次的表现与第一次并无因果联系
几年之前,在线杂志《边缘》(Edge)的编辑约翰·布鲁克曼(John Brockman)请一些科学家讲述他们“最喜爱的公式”。以下是我提供的信息:
成功等于天赋加运气
巨大的成功等于更多的天赋加更多的运气
运气常常会促成成功,然而当我们把这个并不令人吃惊的想法用到高水平高尔夫锦标赛前两天的比赛中时,却出现了令人惊讶的结果。为了简单说明这个问题,我们假设这两天中参加比赛的选手平均绩点为72标准杆。我们关注了一位在第一天表现非常不错的选手,他在当天比赛结束时得分为66杆。我们从这个得分中能推断出什么?最直接的推断就是这个球员要比锦标赛中其他选手有更高的天赋。成功公式告诉我们另一个推断同样成立:第一天表现很好的高尔夫选手很可能在那一天有着非比寻常的运气。如果你能接受天赋和运气都能带来成功这种想法,那么“这个成功的高尔夫球手很幸运”这个结论肯定和“他很有天赋”这个结论一样可信了。
同样,如果你关注一个当天的成绩超过标准杆5杆的球员,就可以推测他技术很糟,而且那天运气也不好。当然,你也清楚这些推测不一定都成立。某个打了77杆的运动员很可能非常具有天赋但却遭遇了极其不走运的一天。下面的推测是根据第一天的得分作出的,尽管不确定,但这种推测通常是正确的。
第一天高于一般水平的成绩等于高于一般水平的天赋加第一天的好运气
第一天低于一般水平的成绩等于低于一般水平的天赋加第一天的坏运气
现在,假设你已经知道某个高尔夫球手第一天的得分,并且要对其第二天的得分进行预测。你希望这个选手第二天仍旧能够延续前一天的优异表现,所以你给出的最佳猜测就是第一个选手得分“高于平均水平”,而第二个选手得分则“低于平均水平”。当然,运气就很难说了。我们没办法预测出一名选手在第二天(或是任意一天)的运气如何,因此我们能作的最佳推测就是采用其平均值,既不好也不坏。也就是说,在没有其他任何相关信息的情况下,对于某选手在第二天的得分情况,我们能作出的最好推测就是:第一天的表现不会重演。你很有可能会这样说:在第一天表现很好的高尔夫选手在第二天也会表现得不错,但还是会比第一天稍差一点,因为他在第一天碰到的好运气不一定能在第二天再次碰到。在第一天表现不佳的高尔夫选手在第二天也许得分还会低于平均水平,但是会有些提升,因为他第一天的霉运不一定会持续。
尽管我们会猜测第一名选手在第二天的表现还是会优于第二名选手,但是他们之间的差距会缩小。
事实上,对选手第二天的表现最准确的预测通常是最保守、最接近平均值的,而不是基于第一天分数的预测。我的学生每次听到这样的结论都很惊讶。正因为如此,这种模式被称为“回归平均值”。原始数据越极端,我们所期待的回归就越明显,因为极好的分数常常表明这一天的运气很不错。这种回归式的预测是很合理的,但是准确度却得不到保证。有些高尔夫选手在第一天得了66杆的高分,如果第二天运气更佳的话,得分甚至更高。当然大部分人的表现都会变差,因为他们的运气不再处于平均值之上了。
现在我们将时间轴反过来,将选手按第二天的得分情况排序,来看看他们第一天的表现。我们仍旧会发现同样的模式,回归平均值。第二天表现出色的选手很可能是因为当天运气好,而最好的猜测就是他们第一天的运气不佳。当你根据后期的表现来推测早期表现时,也会发现回归平均值的现象,此时你便会相信这种回归并非巧合。
回归效应无处不在,很多可以说明这一效应的误导性因果事件同样司空见惯。有一个经典的例子,那就是“体育画报的诅咒”,凡是登上《体育画报》(Sports Illustrated)这本杂志封面的运动员都会在接下来的赛季中表现欠佳。一般来说,人们会认为过度自信以及人们对其期望过高的压力造成了这些人表现不佳。不过,这个诅咒可以用更简单的方式来解释:能够成为《体育画报》封面人物的运动员在前一赛季一定表现极为出色,也许这种出色的表现在很大程度上源于运气,运气是善变的,接下来他就没那么走运了。
当年和阿莫斯正在撰写一篇关于直觉预测法的文章时,我碰巧看了冬奥会的男子高空滑雪比赛。在这项比赛中,每个运动员都有两次机会,最终结果由两次得分决定。每当一名选手进行第二轮时,解说员常常会说“挪威选手第一轮表现很好,现在他一定很紧张,因为想要保持领先地位,估计他在第二轮会表现欠佳”,或者“瑞典选手第一轮表现很糟糕,他明白自己已别无选择,因此也没有什么压力,大概第二轮就会做得更好”。所有这些评论都令我感到很吃惊。很明显,这个评论员已经觉察到了回归平均值的概念,而且还在没有任何依据的情况下编出了一个有理有据的故事。也许他的解释是正确的,如果我们测一下运动员的心跳,可能会发现不佳的表现之后确实会放松,当然也可能不会。有一点我们要记住,运动员第一跳和第二跳的表现之间不存在因果关系。这只是一个数学问题,其中运气起了很大的作用。这个说法不太令人满意,我们都想得到一个有因果关系的解释,但事实的确如此。