但它(地球)仍在动。
——出自伽利略(1564—1642)
弗朗西斯·高尔顿爵士在皇家学院展示他的“高尔顿板”(Galton board)或称“梅花机”(quincunx)。他将这种类似弹珠台的仪器看作对基因特性(如身高)遗传的类比。弹球会堆积成一个上边缘为钟形曲线的图案,该曲线与人类身高的分布曲线非常相似。那么,为什么人类一代传一代,其身高分布并没有像弹球那样散开?这一难题引领他走向了“向均值回归”(regression to the mean)现象的发现。(资料来源:由达科塔·哈尔绘制。)
近两个世纪以来,英国科学界最经久不衰的仪式之一便是在伦敦的英国皇家学院举办的“周五晚间演讲”。19世纪,很多重大发现都是在这个会场上由演讲者首次对外宣布的:1839年,迈克尔·法拉第发表了他的摄影原理;1897年,约瑟夫·汤姆逊提出了电子理论;1904年,詹姆斯·杜瓦公布了氢液化理论。
每场演讲会都是一次盛典,毫不夸张地说,演讲会就是把科学当作舞台,而台下的观众则是精心打扮(男人必须身着礼服,佩戴黑领带)的英国社会上层精英。到了指定的时间,钟声敲响,人们将迎接晚会的发言人步入礼堂。依照传统,发言人会省去自我介绍或开场白,直接开始演讲。实验和现场演示都是这一壮观场面的重要组成部分。
1877年2月9日那天晚上的演讲者是弗朗西斯·高尔顿,英国皇家学院院士,他是查尔斯·达尔文的大表弟,著名的非洲探险家、指纹学创始人,维多利亚时期绅士科学家的典范。高尔顿演讲的题目是“典型的遗传规律”。当晚,他的实验仪器是一种奇怪的装置,他称之为“梅花机”,现在该装置常被称为“高尔顿板”。一个名为Plinko的类似游戏常出现在电视节目《价格猜猜看》中。高尔顿板由一块木板和其上按三角形阵列排布的大头针或钉子组成,操作者可以通过顶部的开口塞入小金属球。金属球会像弹球那样从上往下逐层弹跳下来,最后落进底部的一排插槽中(见章首插图)。对单个金属球来说,向左或向右弹落看上去完全是随机的。然而,如果你往高尔顿板里倒入很多小球,一个惊人的规律就出现了:在底部堆积的小球的上边缘总是会形成一个近似钟形的曲线。在最接近中心的插槽中,小球会堆得高高的,插槽中的球数从中间向两侧递减,直至为零。
这种规律性的图形模式有一个数学解释:单个球下落的整个路径就像一系列独立的硬币抛掷的结果一样。小球每撞上一根大头针,其或者弹向左边,或者弹向右边,表面上看,它的选择似乎是完全随机的。而所有结果之和,即往右弹落的次数与往左弹落的次数之差,则确定了小球最终会落于哪个插槽。根据1810年由皮埃尔–西蒙·拉普拉斯证明的中心极限定理?[1]??,任何此类随机过程,即多次硬币抛掷之总效,都会导向相同的概率分布,这种概率分布被称为正态分布(或钟形曲线)?[2]??。高尔顿板只是拉普拉斯中心极限定理的一个直观演示。
中心极限定理确实是19世纪的数学奇迹。试想一下:虽然单个球的路径是不可预测的,但1000个球的路径的可预测性则非常高,这对《价格猜猜看》的制片人来说是一个很实用的事实。他们可以据此准确估算出在较长一段时间内参赛者在Plinko游戏中赢得的奖金数量。此外,尽管人类事物充斥着不确定因素,但同样的规律仍然让保险公司获利丰厚。
皇家学院中穿着考究的观众一定想知道这一切与遗传规律到底有什么关系,因为这是发言人约定的演讲主题。为了说明二者的联系,高尔顿向观众展示了他所收集的关于法国军队新兵身高的数据。这些数据也遵循正态分布:多数人是中等身材,特别高或特别矮的人很少。事实上,无论我们谈论的是1000名新兵的身高还是高尔顿板上的1000个小球的路径,相对应的插槽和身高类别中的数字几乎总是相同的。
因此,对高尔顿来说,梅花机就是一种关于身高遗传的模型,甚至可能也是关于许多其他遗传特征的模型。这是一个因果模型。简单来说,高尔顿相信,就像人类会遗传他们上一代的身高一样,金属小球也会“遗传”它们在梅花机中的位置。
但是,如果我们暂且接受这个模式,就会出现一个难题,这也是高尔顿当晚的主题。钟形曲线的宽度取决于放置在钉板顶部和底部之间钉子的行数。假设我们将行数加倍,我们就构建了一个能够表示两代遗传的模型,其中上半部分代表第一代,下半部分代表第二代。此时你就会发现,第二代比第一代出现了更多的变异情况,而在随后的几代中,钟形曲线会变得越来越宽。
然而,人类身高的真实状况并未出现此种趋势。事实上,随着时间的推移,人类身高分布的宽度保持了相对的恒定。一个世纪前没有身高9英尺?[3]??的人类,现在依然没有。那么,是什么因素解释了这种总体基因遗传的稳定性呢?自1869年高尔顿的《世袭的天才》(Hereditary Genius?)出版以来,他已为这一谜题苦苦思索了八年。
正如书名所表明的,高尔顿真正感兴趣的不是弹珠游戏或人的身高,而是人类的智力。作为孕育了多位科学天才的大家族的成员之一,高尔顿自然乐意证明天赋在家族中代代相传。他在这本书中着手做的正是这项研究。他煞费苦心地编纂了605名英国“名门之秀”上溯4个世纪的家谱。但他发现,这些名门之秀的儿子和父亲并没有那么优秀,其祖父母和孙辈也并非都是卓越人才。
如今我们可以很容易地找到高尔顿研究方法中的缺陷。归根结底,卓越的定义究竟是什么?有没有这种可能,即名门望族的成员获得成功只是因为他们掌握的特权而不是因为其本身的才能?尽管高尔顿意识到了这种可能的解释,但他初心不改,反而以更大的决心徒劳地寻求一个的遗传学解释。
不过,高尔顿在此过程中还是有所发现的,特别是当他开始关注类似身高这样的遗传特征的时候。与“卓越”相比,身高特征更易测量,跟遗传的关联也更强。高个子男性的儿子往往身高也比普通人高——但很可能不如他们的父辈高;矮个子男性的儿子往往身高比一般人矮——但很可能不如他们的父辈矮。一开始,高尔顿称这种现象为“复归”(reversion),后又改称为“向均值回归”(regression toward mediocrity)?[4]??。我们可以在许多其他的情境中观察到这种现象。如果让学生参加基于同样复习资料的两次不同的标准化测试,那么,第一次测试得分较高的学生在第二次测试中的得分通常仍然高于均值,但没有第一次那么高。这种向均值回归的现象普遍存在于生活、教育和商业领域的方方面面。比如,棒球赛中的“年度新秀”(第一赛季表现异常出色的球员)经常会遭遇“新秀墙”,即在次年的比赛中陷入表现欠佳的低谷。
当然,高尔顿并不知道这些,他认为他偶然发现的是一条遗传规律,而不是统计规律。他认为,向均值回归的背后一定存在某个因。在皇家学院的讲座中,他说明了自己的观点。他向听众展示了两层的梅花机装置(见图2.1)。
图2.1 高尔顿板,弗朗西斯·高尔顿用以类比人类的身高遗传规律。(a)将许多小球扔进弹球仪器,随机向下弹跳的小球堆积成钟形曲线。(b)高尔顿指出,经过A和B两个通道,通过两层的高尔顿板(用以模拟两代人)下落的小球所堆积成的钟形曲线会变得更宽。(c)为了抵消这种曲线变宽的趋势,他安装了斜槽,以使“第二代”小球回到中心。斜槽是高尔顿对“向均值回归”这一现象的因果解释(资料来源:弗朗西斯·高尔顿《自然遗传》,1889)
经过第一组钉子阵列后,小球会通过一个斜槽向板子的中心集中,之后再通过第二组钉子阵列。高尔顿借助这一成功的演示,展示出斜槽的设置恰好抵消了正态分布的扩散趋势。这一次,钟形曲线在代代传递中保持了恒定的宽度。
因此,高尔顿推测,向均值回归是一个物理过程,一种自然方式,用以确保身高(或智力)的分布在代代相传中保持恒定。高尔顿告诉观众:“复归过程符合遗传变异的一般规律。”他将这一过程与胡克定律进行了比较,后者描述的是弹簧恢复到稳态长度的趋势。