双罐模型:运气的测算方法
假设你有两个罐子,里面装满了小球,每个小球都有数字标号。[5]一个罐子中的小球代表实力,另一个罐子中的代表运气,球上的数字越大越好。然后你从两个罐子中分别取出一个球,将球上的数字相加。图3-2显示的是,两个小球之和正好呈钟形曲线分布。这个模型能有助于我们更好地理解事件的本质。
图3-2
实力和运气的分布曲线图

来源:作者分析
如果用这一模型表示纯实力型活动的结果分布,只需将代表运气的罐子盛满标有数字“0”的小球,这样影响最后结果的就是实力罐子里的数字大小。要是表示纯运气型活动(如轮盘赌)的结果分布,那就将实力罐中的小球都标上“0”。大多数的活动结果要受实力和运气的综合影响。
举个简单的例子。实力罐中的数字有-3、0和3,而运气罐中的数字有-4、0和4。随机摆列组合的结果在-7(实力差,运气也差)到7(实力好,运气也好)之间(见图3-3)。当然,现实中的事件比这复杂多了,不过这个例子还是能证明一些问题的。
图3-3
双罐模型

来源:作者分析
如果取样的次数少,运气又很差,即使实力再好,活动的结果也会很糟糕,就像你实力水平为3,运气水平却为-4,总和为-1,从结果中就看不出实力高低了。另一种情况是,你的实力水平为-3,运气水平为4,总和为1,实力很烂,结果倒也能差强人意。
当然,随着取样量的变化,结果也会不同。试想你的实力水平一直为3,从运气罐中取到的球有大有小。短期内,总和会有很大的浮动,但是从长远看,运气的好坏会相互抵消,总和会维持在3。也就是说,活动的最终结果取决于你的实力水平。[6]
实力悖论:实力越高,运气越重要
上文中的观念也是实力悖论的精髓——实力提高了,活动的结果也相应提高,运气此时就变得更加重要了。1941年赛季,职业棒球大联盟波士顿红袜队的泰迪·威廉姆斯创下了超过四成(0.406)打击率的纪录。[7]自此棒球联盟再没有出过击出四成打击率或以上的球手。古生物学家斯蒂芬·杰·古尔德创建了“实力悖论”这一理论来解释这一现象。古尔德也考虑过一些寻常的解释,诸如比赛在夜间进行、赛场较远、人才匮乏、投手技术太好等因素妨碍击球手的发挥。虽然这些因素在一定程度上影响比赛的结果,但并不足以解释无人达到四成打击率这一事实。另一种可能是,威廉姆斯不仅是他那个时代的最伟大的击球手,而且到今天也没人能够超越。但是这一可能又被古尔德很快否定了,因为任何运动都是在不断发展进步的,威廉姆斯是那个时代的传奇,却不一定能称雄当今。
实力悖论,乍看之下的确让人费解。自1941年以来,棒球运动的水平也许不像其他体育运动提升得那么明显,其平均打击率总在0.260到0.270之间小范围浮动。看似平稳的打击率水平其实掩盖了棒球界两个很重要的进步。我们知道,平均打击率反映的不是个人的实力,而是投手和击球手之间的相互合作,就像团体接力赛一样。如果投手和击球手的实力同时提高,那么他们之间的互动水平会稳定不变。如今的投手和击球手在实力上比以往更胜一筹,但是实力提升的步调一致,打击率就维持在原来的高度了。[8]不过这种同步提升不是自然演变的,而是在外界干预下形成的。在20世纪60年代末,当投手的实力大大提升,而击球手显得力不从心时,美国职业棒球大联盟的监督者修正了游戏规则,降低了投球区土墩的高度,缩短了(击球手肩与膝之间的)好球区,这样击球手的表现就不会显得太差。投手和击球手表现的大致平衡,一方面反映了球员实力的提高,另一方面也反映出联盟高级官员对棒球界的外部干预。
古尔德解释说,之所以不再有击出四成打击率的球手是因为所有职业击球手的实力越来越扎实,球员实力的差距渐渐缩小。近60年来,棒球培训有了很大的发展,球员间球技的切磋也日益频繁。另外,棒球大联盟在世界各地招募优秀球员,建立人才库。求知若渴的优秀苗子,如来自多米尼加共和国的山米·苏萨、来自墨西哥的佛南度·瓦伦佐拉为棒球这项运动注入了新的活力,提高了总体水平。但在同时,运气对球员的打击率提升仍有着很大的影响,因为一旦投球手将球发出,击球手能否击中,击中后能否得分仍然都是未知数。
用统计术语解释就是,即便击球手的实力一直在提高,平均打击率的变化范围还是在渐渐缩小。图3-4显示的就是19世纪70年代以来平均打击率的标准偏差和变更系数。
图3-4
职业棒球大联盟平均打击率的标准偏差逐年递减

来源:作者分析
方差是标准偏差的平方。标准偏差降低,方差随之降低。变更系数是标准方差除以平均打击数,由此可以看出球员个人平均打击率和联盟总的平均打击率之间的差距。图3-4显示,几十年来,平均打击率逐渐向某一点靠拢。古尔德侧重研究的是平均打击率,但是这种现象在其他的相关统计中也很普遍。比如,投手防御率(投手每投九局所允许的自责分)的变更系数在几十年内不断跌落。[9]
方差的下降很好地解释了为什么不再有击中四成打击率的球员出现。因为每个球员的实力都在提高,球员就不太可能以压倒式优势获胜。在威廉姆斯的时代,他是数一数二的顶级球员,方差比较大说明他可以遥遥领先于其他球员,突破四成打击率。而在今天,方差骤降,即使顶级球员也只能以些许优势险胜。如果威廉姆斯以他在1941年的棒球水平挑战今天的球员,他也很难拿到四分打击率的成绩。
在各项体育运动中,于职业大联盟中打球最具挑战性。那里的投手投出的球速度高达每小时一百英里,这还是在球受地心引力、空气阻力等因素影响下的成绩。“实力悖论”这时就体现为,不管棒球手如何优秀,平均打击率也不像过去那样依赖实力了。原因很简单,当今棒球比赛的成败往往取决于击球手挥拍不及一英寸的位置误差,或是千分之一秒挥球时机的把握。只因为球员整体水平的提高,运气的好坏就变得空前重要。
现在我们很容易就能看到“实力悖论”在其他的竞技活动中的运用。一个公司的绝对绩效在提升,但在竞争对手也在提升的情况下,他的竞争能力就保持不变。[10]如果股票在市场上被有效定价,投资者能否预知股票的涨落取决于运气。当各行各业都在照搬同行的成功经验时,谁能脱颖而出更是纯粹看运气。
有些活动,运气的成分很少,“实力悖论”让我们得出一个能够经得住考验的预测:绝对绩效随着时间推移会慢慢向人的生理极限靠拢,譬如人类跑一英里的速度。顶级的竞技者永远无限接近生理极限,其他竞技者的相对绩效也渐渐汇集到一个区域。图3-5很好地表明了这一观点。随着时间的推移,人们的实力水平从左图变成了右图,平均实力水平渐渐向绝对绩效看齐,方差下降,两极分化的现象消失,竞技者的水平基本持平。
图3-5
实力悖论导致成绩扎堆

来源:作者分析
我们举个例子验证一下图3-5的预测是否正确。比如田径运动中的马拉松项目。它是最古老的运动项目之一,也最受人们喜爱的。马拉松全程距离26英里385码,折合42.195公里。马拉松项目的设立是为了纪念在公元前490年一个叫斐迪庇第斯的战士,他用跑步的方式将希腊人战胜波斯人的消息送到首都——雅典。当他到达雅典时已经精疲力尽,传达了胜利的消息以后便气竭而死。在1896年第一届奥运会上,马拉松成为正式比赛项目。
ESPN频道的主持人约翰·布兰库在他的书《完美的极限点》中预测了人类的极限点。充分考虑了一系列的生理因素后,他公布说人类跑完马拉松的极限速度为1小时57分58秒。[11]本书写就时,马拉松世界纪录保持者肯尼亚人帕特里克·马卡乌的成绩是2小时3分38秒。根据布兰库的预测,马卡乌比人类生理极限慢了5分40秒。
图3-6展示了从1932年到2008年冠军的成绩。这几十年来,冠军的成绩从150多分钟降到125分钟,时间缩短了25分多,折合每英里少用时一分钟。即便这一进步花了近四分之三个世纪,这在马拉松赛事上也算是了不起的成就了。图中也展示了排名第1和排名第20位的选手他们之间成绩的差距。从1932年的近40分钟缩短到2008年的约9分钟,可见选手的整体水平在提升,选手间的差距在缩小。
图3-6
奥运会男子马拉松项目成绩及实力悖论

来源:www.olympicgamesmarathon.com和作者分析
前文讲的双罐模型展示的是,如果运气的分布方差超过实力的分布方差,短时间内运气会占上风。也就是说,假如活动成员整体的实力提升,谁输谁赢就要看运气了。现在我们回过头来分析一下双罐模型。