这种叫做高斯钟形曲线的怪兽并不是高斯的杰作,虽然他对此作了研究,但他是进行理论研究的数学家,而没有像那些统计科学家一样对现实的构造发表言论。G·H·哈迪(G. H. Hardy)在《数学家的歉意》一文中写道:
“真正的”数学家的“真正的”数学,费马(Fermat)、欧拉(Euler)、高斯、阿贝尔(Abel)和黎曼(Riemann)的数学,是完全“无用”的(“应用”数学和“纯”数学都是如此)。
我之前提到过,钟形曲线主要是一个赌徒编造的,他就是亚伯拉罕·棣莫弗(Abraham de Moivre,1667~1754),一个法国加尔文派的避难者,一生中大部分时间生活在伦敦,说着口音浓重的英语。但凯特勒才是思想史上最具破坏性的人,而不是高斯。
阿道夫·凯特勒(Adolphe Quételet,1796~1874)提出了体质平均人的概念。凯特勒本人一点也不平均,他是“一个极具创造激情的人,一个精力充沛、具有创造力的人”。他写诗,甚至与人合写了一部歌剧。凯特勒的根本问题在于,他是一个数学家,而不是经验主义科学家,但他不知道这一点。他在钟形曲线中发现了和谐。
问题有两个层面。首先,凯特勒有一种标准化思维,要把世界塞入他的平均理论中,从这个意义上讲,平均对他而言是“常规”。能够不考虑非常规的、“不规范的”情况以及黑天鹅事件对总体的影响是一件不错的事,但把这个梦留给乌托邦吧。
其次,存在一个严重的经验问题。凯特勒把钟形曲线应用于一切地方。他被钟形曲线遮住了眼睛,这让我再次看到,一旦你让钟形曲线进入你的头脑,就很难把它赶出来。后来,弗兰克·伊西德罗·埃奇沃思(Frank Ysidro Edgeworth)把这种将钟形曲线用在一切地方的严重错误称为凯特勒错误。
金色的平均主义
凯特勒为同时代的理想主义者提供了他们所渴望的产品。这个后启蒙时代的每一个人都渴望金色平均主义:财富、身高、体重等等。这种渴望包含着一种愿望的因素,再加上和谐以及……柏拉图化。
我总是记得我父亲的告诫,“美德在于适度”。很长一段时间,那就是理想。从这种意义上讲,平均甚至被认为是金色的,所有人都拥抱平均主义。
但凯特勒把这种思想带入了另一个层面。通过收集统计数据,他开始制造“平均”的标准。胸围、身高、新生儿体重,很少有什么逃过他的标准。他发现,随着对平均值的偏离越来越大,这种偏离的可能性呈指数下降。提出“平均人”的概念之后,凯特勒先生的注意力转入了社会事物。平均人具有他的习惯,按照他的方式消费,使用他的方法。
通过创造体质平均人和精神平均人,凯特勒创造了偏离平均值的范围,所有人要么在平均值左边,要么在平均值右边,并且对那些站在钟形曲线极左端和极右端的人进行惩罚。他们成了另类。
人们应该对凯特勒同时代的科学界给予一定赞誉,他们并没有立即接受他的论点。比如,哲学家、数学家、经济学家奥古斯汀·库诺特(Augustin Cournot)认为不能纯粹基于量化标准创造一个标准人。标准应该取决于相关特性,一个领域的衡量标准区别于另一个领域的衡量标准。应该用哪一个作为标准呢?平均人会是一个怪兽,库诺特说。我将在后面解释他的观点。
假设做一个平均人有什么值得向往的话,那他一定具备某种专长,在这项专长上他比其他人更有天赋——他不可能在一切事情上都是平均的。钢琴家平均来看更擅长弹钢琴,但在比如骑马方面,则更不擅长。绘图员则更擅长绘图等等。在概念上,平均人与一个在所有方面都平均的人是不同的。实际上,一个绝对平均的人应该一半男一半女。凯特勒完全忽略了这一点。
上帝的失误
更令人担忧的是,在奎特利时代,高斯分布被称为la loi des erreurs,即误差法则,因为其最初的应用是研究天文测量中误差的分布。你同我一样不安吗?对平均值(在这里同时也是中值)的偏离居然被当做误差!
这一概念很快风靡。人们混淆了“应该是”和“是”,并且获得了科学界的许可。这一概念浸润在新生的欧洲中产阶级文化中,即后拿破仑时代的商店主文化,对过度的财富和才华小心翼翼。实际上,对财富扁平化分配社会的梦想符合面临基因博彩的理性人的渴望。如果你必须选择下辈子降生于怎样的社会,但不知道等待你的是什么结果,你很可能选择不冒险。你会希望降生于一个没有贫富差别的社会。
赞美平均主义的一个娱乐性结果就是法国一个叫做布德热主义(Poujadism)的政党的诞生,它起初是一场杂货铺运动——一种非无产阶级革命。那些不太被社会眷顾的人互相温暖地拥抱着,期望宇宙扁平化为他们这一类。数学工具的运用反映出一种杂货铺老板的思想。高斯的数学是为这些商店主提供的吗?
彭加莱的救援
彭加莱本人对高斯方法非常怀疑。我猜当他看到高斯及类似描述不确定性的模型时,会感到忧虑。只要想一想,高斯方法最初是用来衡量天文误差的,而彭加莱关于天体运行机制的思想则包含了更深的不确定性。
彭加莱写道,他的一位“杰出的物理学家”朋友向他抱怨,物理学家喜欢使用钟形曲线,因为他们以为数学家认为它是必备的数学工具;而数学家使用钟形曲线,是因为他们以为物理学家认为它是经验事实。
消除不公平影响
我在此声明,我是相信中庸和平均主义的价值的。什么样的人道主义者会不想缩小人与人之间的差距呢?没有什么比自私的超级精英思想更令人反感的了!我真正关心的问题是认知上的。现实世界不是平均斯坦,所以我们要学会接受这一点。
“希腊人会把它奉若神明”
由于钟形曲线具有柏拉图式的纯粹,头脑被钟形曲线牢牢占据的人多得令人难以置信。
查尔斯·达尔文的表弟弗朗西斯·高尔顿(Francis Galton)爵士大概与他表兄一样,是最后的独立绅士科学家之一,这些科学家还包括卡文迪什、开尔文、维特根斯坦因(以他独特的方式)以及我们的大哲学家罗素。虽然凯恩斯不属于这一类,但他的思想在此之列。高尔顿生活在维多利亚时代,当时的世袭贵族和有闲阶层除了骑马和打猎之外,还可以选择成为思想家、科学家或者(对那些天分不高的人来说)政治家。那个时代有许多值得人们向往的东西:纯粹为了科学而从事科学,而不存在直接的职业动机。
不幸的是,为了对知识的热爱而从事科学并不一定意味着你会走向正确的方向。一接触并吸收“正态”分布,高尔顿就迷上了它。据说他曾声称,假如希腊人知道它,他们会把它奉若神明。也许正是他的狂热推动了高斯分布的普遍使用。
高尔顿没有数学天分,但对计量却有少见的热爱。他并不知道大数定理,但自己从数据中发现了它。他造出了梅花相位机,一种演示钟形曲线如何形成的弹球机器,我在几个段落以后会讲到它。确实,高尔顿只是把钟形曲线应用到基因和遗传领域,而在这些领域的应用是正确的。但他的狂热帮助这种新生的统计方法进入了社会领域。
请回答“是”或“否”
我在这里谈一谈危害的程度。如果你从事的是定性的推理,比如哲学或医学,需要寻找一些“是”或“否”的答案,而不需要考虑数量的大小,那么你可以假设你处在平均斯坦而不会产生严重的问题。低概率事件的影响不会很大。你要么有癌症,要么没癌症;要么怀孕了,要么没怀孕等等。死亡或怀孕的程度并不相关(除非是流行病)。但如果你面对的是合计数字,其大小是重要的,比如收入、财富、投资组合的收益或图书销量,那么使用高斯分布就会有麻烦,因为高斯分布在此不适用。一个数字就能瓦解你的所有平均值,一次亏损就能抹平一个世纪的利润。你再也不能说“这是意外”。“当然,我可能亏钱”再也传递不了任何信息,除非你能对亏损进行量化。你可能亏掉所有净资产,也可能亏掉日均收入的一小部分,这是有区别的。
所以,我在本书较早的章节曾经提到,经验心理学及其对人类本性的研究不受钟形曲线应用的影响。这些研究是幸运的,因为它们的大部分变量可以适用传统的高斯统计方法。在衡量样本中有多少人有心理偏差或犯错误时,这些研究通常只需要回答“是”或“否”。单个观察结果不可能瓦解整体结果。
下面我将从头开始详细介绍一种独创的钟形曲线表现方法。