突破性与全球化
每当你听一个猥琐(而沮丧)的欧洲中等知识分子向你描述他眼中典型的美国人时,他总会使用“没教养”、“没知识”和“不懂数学”这样的词语,因为和其他人群不同,美国人不擅长解方程式以及这名中等知识分子称为“高等文化”的东西,如对歌德富有灵感(和重大意义)的意大利之旅的了解,或者对代夫特画派的熟悉。但发表这种言论的人很可能对iPod着迷,穿牛仔裤,用微软的Word软件在个人电脑上记录自己的“文化”言论,其间不时地使用Google进行搜索。事情就是这样,美国人比这些经常去博物馆而且会解方程式的国家的人们具有大得多的创造力,他们对自下而上的改良和无序的反复尝试也更为包容。全球化使美国专门从事创造性活动,产出新的理念、思想及具有突破性的产品,并且通过输出工作机会的方式,逐渐把不那么具有突破性的部分分离出去,让那些喜欢按小时取酬的人去做。设计一双鞋比真正把它们做出来赚的钱要多得多——耐克、戴尔和波音只需要思考并组织和运用它们的专有技术就能赚钱,发展中国家的转包工厂负责做那些烦琐的制造工作,而有文化和擅长数学的国家的工程师们则负责解决那些没有创造性的技术性小问题。美国经济极大地依赖思维创造,所以美国人即便失去制造业,其生活质量仍能不断提高。显然,思维创造获得大部分报酬的世界经济框架的缺陷,就是造成了更大的不公平并提高了机会和运气的重要性。我把社会经济问题留在第三部分讨论,这里只讨论知识。
平均斯坦
这种突破性与非突破性的差异使我们能够在两类不确定性、两类随机性之间划分明确的界限。
我们来看下面这个想象实验。假设你从普通人群中随机挑选1 000人,让他们在一个体育馆里并排站着。
把你所能想到的体重最重的人加入样本。假设他的体重是平均体重的3倍,不过他在总体重中所占的比例仍微不足道(在这个实验中大约占0.5%)。
你还可以更极端一点。即使你挑选了从生物学上说可能是地球上最重的人(但仍然能被称为人类),比如能占到总体重的0.6%,但增加的量也微乎其微。假如你挑选了1万人,那么他占的比重就几乎可以忽略不计了。
由于理想的平均斯坦,特定事件的单独影响很小,只有群体影响才大。可以这样陈述平均斯坦的最高法则:当你的样本量足够大时,任何个例都不会对整体产生重大影响。最大的观察值虽然令人吃惊,但对整体而言最终微不足道。
另一个例子来自我的朋友布鲁斯·戈德堡,是关于我们卡路里摄入量的。看看我们每年摄入多少卡路里——人类应该接近80万卡路里。任何一天的卡路里摄入量,即使是在重大节日的摄入量,也不会占这一摄入量的多大部分。即使你试图靠吃来自杀,那一天摄入的卡路里也不会对你的年摄入量产生重大影响。
现在,如果我告诉你有可能碰到某个体重几千吨或者身高几百英里的人,你可能会送我去医院,或者建议我改写科幻小说。一个身高几百英里的人在生物学上是不可能的,但用另一类数字,你就没那么容易排除极端值了。下面我们讨论这个问题。
奇异的极端斯坦
现在考虑一下体育馆里那1 000人的净资产。把世界上最富有的人加入他们中间,比如微软创始人比尔·盖茨。假设他的净资产接近800亿美元,而其余人大约几百万美元。他的净资产占总资产的多少?99.9%?实际上,所有其他人的净资产只不过是他净资产数字的零头而已,或者仅仅是他净资产在过去一秒内的变化值。如果某个人的体重要达到这样的比例,他需要5 000万磅的体重!
再来看一个例子,比如图书销量。挑选1 000名作家,看看他们的作品销量。然后加上J·K·罗琳(目前在世的拥有读者最多的作家),她的《哈利·波特》系列的销量已达数亿册。这将使余下的1 000名作家变成侏儒,他们的销量加在一起顶多也就几百万册。
再想想学术引用(在正式出版物中提及另一名学者的观点)、媒体报道、收入、公司规模等。让我们称它们为社会问题,因为它们都是人为的,而不是像腰围之类的物理问题。
在极端斯坦,不平均指个体能够对整体产生不成比例的影响。
因此,虽然体重、身高和卡路里摄入量来自平均斯坦,但财富不是。几乎所有社会问题都来自极端斯坦。换句话说,社会变量是信息化的,不是物理的,你无法接触它们。银行账户里的钱是重要的东西,但显然不是物理的。同样,它可以是任何数值,而不需要消耗能量。它只是一个数字!
请注意,在现代技术发展以前,战争曾经属于平均斯坦。如果你一次只能杀一个人,那么杀死许多人是很难的。但今天,有了大规模杀伤性武器,只需要一个按钮,一个疯子,或者一个小错误,就能够杀光地球上所有人。
看看黑天鹅事件的影响。极端斯坦能够制造并且已经制造了黑天鹅现象,因为少数事件已经对历史产生了巨大影响。这是本书的主要观点。
极端斯坦与知识
平均斯坦与极端斯坦的区别对社会公平和事件演变都有重大影响。现在让我们看看它对知识的意义吧,这是其大部分价值之所在。如果一个火星人来到地球,测量这个快乐星球上居民的身高,他只需要测量100个人,就能够对平均身高有很好的了解。如果你假设自己生活在平均斯坦,你可以坦然接受你的测量结果,前提是你确定这一结果来自平均斯坦。你还可以坦然接受从数据获得的知识。其认识论上的结果就是,在平均斯坦的随机现象中,是不可能 [13] 获得黑天鹅这样的意外的,因此整体由一个观察结果决定。首先,最开始的100天能够告诉你对于这些数据你所需要知道的一切。其次,即使你发现了一个意外,比如那个体重最重的人,也没有什么影响。
如果你处理的是极端斯坦的数据,从任何样本求得平均值都是令人困扰的,因为它受某一单个观察值的影响如此之大。这就是困难所在。在极端斯坦,个体能够轻易地以不成比例的方式影响整体。在这个世界里,你总是会对你从数据中获得的知识表示怀疑。这是能让你区别两类不同随机性的非常简单的测试方法。
你从平均斯坦的数据中获得的知识随着信息供给的增加而迅速增加。而你从极端斯坦数据中获得的知识增加得很慢,而且与数据的增加不成比例,有些数据非常极端,甚至达到未知的程度。
温和与狂野
按照我的突破性与非突破性的思路,就能够清楚地看到平均斯坦与极端斯坦之间的区别。我在这里再举几个例子。
属于平均斯坦的问题举例(受我们所说的第一类随机性影响):高度、重量、卡路里摄入量、面包师、小餐馆老板和牙医的收入、赌博收入(假设在特殊的情况下,某人去赌场只赌固定的筹码)、车祸、死亡率、智商(测出来的)。
属于极端斯坦的问题举例(受我们所说的第二类随机性影响):财富、收入、单个作者图书销量、名人知名度、Google搜索量、城市人口、词汇表中某个单词的使用量、每种语言的使用人数、地震造成的损失、战争死亡人数、恐怖事件死亡人数、行星大小、公司规模、股票持有量、物种之间的高度差异(比如大象和老鼠)、金融市场(但你的投资经理是不知道这一点的)、商品价格、通货膨胀率、经济数据。极端斯坦的清单比平均斯坦的长得多。
意外事件的统治
关于平均斯坦与极端斯坦之间的差别还有另一种说法:在平均斯坦,我们受到集体事件、常规事件、已知事件和已预测到的事件的统治;在极端斯坦,我们受到单个事件、意外事件、未知事件和未预测到的事件的统治。不论多么努力,你也不可能在一天内减轻许多体重,而需要许多天、许多周甚至许多月的累积。同样,如果你是一名牙医,你永远不可能在一天内变富,但经过30年积极、勤奋、小心和日复一日的钻牙操作,你会逐渐变得富有。然而,假如你从事极端斯坦的投机,你可以在一分钟之内赚取或赔掉大笔财富。
表3–1总结了两个国度的差别,我会在本书余下的部分提到它们。将左右两栏混淆将导致可怕(或极端走运)的结果。
表3–1
平均斯坦 | 极端斯坦 |
不具突破性 | 具有突破性 |
温和的第一类随机现象 | 疯狂的(甚至超级疯狂的)第二类随机现象 |
最典型的成员为中庸成员 | 最“典型”的成员要么是巨人,要么是侏儒,即没有典型成员 |
赢者获得整块蛋糕的一小部分 | 赢家通吃 |
举例:留声机发明之前某个歌剧演员的观众数量 | 今天某位艺术家的观众数量 |
更可能存在于古代环境 | 更可能存在于现代环境 |
不受黑天鹅现象的影响 | 受黑天鹅现象的影响 |
数量有限制 | 数量上没有物理限制 |
(主要)与物理量相关,比如高度 | 与数字相关,比如财富 |
达到现实所能提供的乌托邦式公平 | 受赢家通吃的极端不公平统治 |
整体不取决于个例或单个观察结果 | 整体取决于少数极端事件 |
观察一段时间就能够了解情况 | 需要花很长时间了解情况 |
集体事件占统治地位 | 意外事件占统治地位 |
容易通过观察到的东西做出预测并推广至没有观察到的部分 | 很难从过去的信息中做出预测 |
历史缓慢发展 | 历史跳跃发展 |
事件分布 [14] 服从高斯“钟形曲线”(智力大骗局)或其变体 | 事件分布要么是曼德尔布罗特 [15] 式的“灰”天鹅(尚可用科学方法解释),要么是完全不可解释的黑天鹅 |
这一框架表明,大部分黑天鹅现象发生在极端斯坦,它只是粗略的近似概括,请不要将其柏拉图化(即不要过度简化)。
极端斯坦并不全是黑天鹅现象。有些事件很少发生,很有影响,但某种程度上是可预测的,尤其对那些有准备并且有办法去理解它们的人(而不是听从统计学家、经济学家和各种钟形曲线理论鼓吹者的人)。它们是黑天鹅的近亲,在某种程度上是可以用科学方法理解的,了解它们的发生频率会降低你的惊奇感:这些事件很少见,却在预测范围内。我把它们称为“灰”天鹅曼德尔布罗特随机现象。
在平均斯坦也会有严重的黑天鹅现象,虽然十分少见。为什么如此呢?你可能忘了某事件具有随机性,以为它是确定的,然后却大吃一惊。或者你可能由于缺乏想象力而过滤并忽略了某个不确定性的来源,不管是温和的还是疯狂的,大部分黑天鹅现象来自一种“过滤性”缺陷,这点我将在第九章中讨论。
以上是对本书讨论的核心差别的文字性概括,教你区分分别属于平均斯坦和极端斯坦的事物。我说过,将在本书第三部分进行更为深入的探讨,因此让我们先着重讨论知识论,看一看这一差别对知识的影响。
[12 ] 斯坦,即国度。——编者注
[13 ] 我着重强调“可能”,因为其可能性属于万亿分之一级别,接近不可能。
[14 ] 我在本书所说的概率分布指的是用来计算不同事件发生的概率及其分布的模型。当我说事件分布服从“钟形曲线”时,我所指的是高斯钟形曲线[以C·F·高斯(C. F. Gauss)命名,关于他在后面有更多的讲述],它能够描述事件的不同结果发生的可能性。
[15 ] 曼德尔布罗特(Mandelbrot),分形几何创始人。分形几何引入分数维度,用来研究“不连续”但“自相似”的现象,也被应用于资本市场。——译者注