在我饭后吃甜点时,我受到了严重但却令人愉悦的侮辱,当时我在与一名雷曼兄弟公司的男性员工争论。此人曾在《华尔街日报》上发表声明说,我们看到的2007年8月的事件应当每一万年发生一次。事实情况是,在连续三天的时间里发生了三起这样的事情。《华尔街日报》刊登出了他的照片,如果你看到这幅照片,你一定会说,“他看上去并没有一万岁那么老”。那么,他是如何得出“一万年一次”的可能性的呢?当然不是来自个人经验,也不是来自雷曼兄弟公司的档案——雷曼兄弟公司诞生至今远没有一万年——它也不会继续存在一万年,就在我们的争论结束之后它就破产了。因此,他是从一个理论中得出这一低概率的可能性的:事件越久远,我们便越难以得到经验数据(只是一般性的假定,未来会类似于过去),因此便也越依赖于理论。
设想一下,罕见事件发生的频率不能通过经验观察来预测,原因是它们太罕见了。因此,我们需要一个先验模式来代表它;事件越罕见,使用标准的归纳方法(比如通过例数过去发生的事情进行频率抽样)进行预测的错误便越严重,同时对于能延伸至低可能性事件(这类事件当然不常见)领域的先验代表的依赖度也便越高。
但是,即便在低可能性之外,先验问题也总会存在。看上去似乎罕见的事件也变得常见,但它会遍及可能性知识。我将会阐述我的两个想法,这两个想法是我与两个合作者合作产生的,他们是科学哲学家艾维塔·皮尔佩尔(他走路很快)和数学家拉菲尔·多阿蒂(他在不忙时喜欢散步)。
克里特预言家埃庇米尼得斯
艾维塔·皮尔佩尔和我就风险管理的认知问题争论了一番,但这一争论可被归纳为任一形式的可能性知识。这是一种通过可能性衡量的自我参照问题。
我们可以进行如下的叙述。如果我们需要数据来获得一种可能性分布,从而对关于未来行为(通过过去的结论进行分布)的知识进行衡量,同时,如果我们需要可能性分布来衡量数据充足性以及它是否能预知未来,那么我们便会面对一个严重的回归回路。这是一个自我参照的问题,类似于克里特预言家埃庇米尼得斯宣布克里特岛人是否是骗子的问题。的确,这有些过于接近埃庇米尼得斯的状况,因为可能性分布被用于对真理程度的评估,但却不能反映出其自身的真理与正确的程度。同时,与关于自我参照的诸多问题一样,那些与风险评估有关的问题都存在严重的后果。对于低可能性,这一问题则更为严重。
不可判定性定理
《黑天鹅》出版之后,自我参照问题被人们忽视了。因此,拉菲尔·多阿蒂和我从数学上重申了这一哲学问题。较之哥德尔问题,它的实际含义看上去更加具有破坏性。
在我所认识的人之中,拉菲尔也许是数学知识最渊博的——他可能比当代任何人都具备更多的数学知识,除了他死去的父亲阿德里安·多阿蒂。
在写到此处时,我们也许已采用数学以及叫做“衡量理论”(这一理论被法国人用于为可能性数学提供精确性)的数学分支进行了正式考证。这篇论文被临时称为“不可判定性:关于来自样本的预测可能性的矛盾(不将先验假设与可接受可能性结合在一起)”。
结果……
在真实生活中,我们并不在意简单与原始的可能性(不管事件发生还是未发生),我们担心的是结果(事件的规模;生命或财富会受到多大的损失,还会发生哪些其他的损失;一件有益的事件会给我们带来多大的好处)。如果事件发生越不频繁,事件结果便越严重(我们设想一下,百年一遇的洪水较之十年一遇的洪水结果更严重,但发生频率却更低;十年最佳畅销书的销量要大于年度畅销书的销量),我们对罕有事件贡献的预测便也会大错特错(贡献是可能性与效果的乘积,将此与预测错误相乘),没有任何东西可以弥补它。 [81]
可见,事件越罕见,我们对其作用的了解也越少。同时,我们也越需要运用推断和归纳的理论弥补这一不足。对于事件罕有性的主张,相应地缺乏精确性。因此,理论与模型错误直到最后才会显现出严重后果;对于好消息,有些表现较之其他会更加脆弱。
我认为,这一谬误在极端斯坦中更为严重。在极端斯坦中,由于缺乏尺度,或者缺乏可变任意性的渐进限度,罕见事件便更具影响力。在平均斯坦,通过比较,常规事件的集合效应起着主要作用,例外情况并不合理。我们知道它们的效果,但这一效果程度并不高,因为“大数法则”使得人们可以多样化。让我再一次对极端斯坦进行阐述。世界上不到0.25%的上市公司代表着大约一半的市场资本化,世界上极少部分的小说占据了约半数的小说销量,不到0.1%的药品为制药工业赢得了超过一半的利润——同样,不到0.1%的风险事件会引发至少一半的破坏与损失。
从现实到表现 [82]
让我们选取另外一个角度。从理论到现实世界的道路会出现两个截然不同的困难:相反的问题和预渐进性。
先看看相反的问题。让我们回想一下,通过水坑重新造一块方冰块(反向设计)要远比预测水坑的形状困难。实际上,解决方法并不是唯一的:冰块的形状可以有许多种。我发现,苏联–哈佛式的看待世界的方法(与肥托尼风格相对)会使我们犯下混淆两个方向(从冰块到水坑,从水坑到冰块)的错误。这是关于柏拉图化思想错误的又一个例证。柏拉图化思想会使人们认为,我们心中的柏拉图思想是你在外部世界所必须遵守的。在医药发展史上,我们看到过很多将这两个方向混淆的证据,比如我前面提到的基于亚里士多德目的论的理性化药物。这一混淆是基于下面的原因。我们会假定,我们知道一种器官背后的逻辑,以及这种器官的作用,因此我们便能够在为病人治疗的过程中运用这种逻辑。在医学上,我们很难给出关于人体的理论。同样,在自己内心形成一种理论,或从哈佛获得一种理论,然后将其应用于这个世界是很容易的。如果是这样,那么事情将变得无比简单。
这一关于两个方向混淆的问题对于可能性非常重要,特别是对于低的可能性。 [83]
当我们阐述不可判定定理及自我参照论据时,我们在现实生活中并不遵循可能性分布,我们只遵循事件。因此,我将结果重新叙述如下:我们不知道统计特性,直到(当然)看到事实之后。看一套观察资料,我们会看到,许多统计分布都符合完全相同的认识——每一种在其源自的一系列事件之外都会有不同的推断。当更多的理论和更多的分布能够适合一套数据,特别是在非线性或非节俭分布的情况下, [84] 反面问题会更严重。在非线性情况下,可能的模式/参数化家族数量会急剧增加。 [85]
但是,在某些领域,这一问题变得越来越有趣。回想一下第八章中的卡萨诺瓦问题。对于倾向于产生负面黑天鹅而不产生正面黑天鹅的环境(这些环境被称为负面偏斜),低的可能性问题更糟糕。为什么呢?很明显,灾难性事件不会出现在数据之中,因为可变的生存自身会依赖于这一效应。因此,这样的分布会使遵守者倾向于对稳定性的高估和潜在挥发性及风险的低估。
事物倾向于在过去看上去更稳定和不具风险性,这一点需要严肃对待,特别是在医疗领域。流行病学的历史,并不意味着发生大灾祸的风险会降临,从而影响整个世界。同时,我确信,在我们履行对环境的职责时,我们大大低估了潜在的不稳定性。我们会从给大自然造成的累积性破坏中经历这一潜在的不稳定性。
对这一点的一种解释已经结束。在写到此处时,美国股市大涨,比无知的退休者基于100年的历史数据所认为的更具风险。21世纪最初10年,美国股市上涨了23%,而金融骗子们告诉退休者们说,这段期间股市上涨超过了75%。这使得许多人的养老金付诸东流(世界上最大的汽车制造公司也告破产),因为他们真心认可这一“经验主义”的经历——当然,这也导致许多失望的人推迟了退休计划。试想一下,我们都是经不住诱惑的人,会情不自禁地受到那些变化着的事物的影响,这些事物不稳定但看上去却很稳定。
再看看预渐进性。让我们重新讨论一下出现于近期的预渐进性,并回到柏拉图化思想。当然,理论总是令人厌倦的,而在某些情况下,当理论来自理想状况(渐进线)时,理论则会更糟。不过,这些理论会在渐进线(它的限制,比如无限性或无穷小)之外被运用。曼德尔布罗特和我已经阐明,有些渐进特性是如何在平均斯坦中很好地进行预渐进性发挥作用的,这也是赌场生意兴隆的原因。而在极端斯坦,情况则大不相同。
大多数的统计教育基于这些渐进性、柏拉图式的特性,然而,我们生活在真实的世界里,真实的世界极少类似于渐进线。统计理论学家知道这一点或者自称知道这一点,但你的那些经常使用统计数据、在写文章时总谈到“证据”的人却不知道。另外,这印证了我所称的游戏化谬误:数学统计学学生们做得最多的,是假设一个类似于封闭游戏结构的结构,一般是运用一个先验的已知可能性。然而,我们的问题并不是在知道可能性之后马上进行计算,而是找到有关知识范围的真正分布。我们的许多知识问题来自这种先验与后验之间的紧张状态。
活生生的验证
计算低可能性没有可靠的方式。我从哲学角度阐述了计算罕见事件发生率的困难。我使用几乎所有现成的经济数据(我之所以使用经济数据,是因为经济数据比较清晰),阐述了运用数据进行计算的不可能性。有一种叫做峰度的方法(读者不必效仿),这一方法代表了“尾巴有多肥”,即罕见事件扮演了何种角色。一般来讲,拥有一万条数据和40年时间里每日的观察,一次观察便代表着90%的峰度。取样错误对任意一条关于非高斯的某物如何的统计推断都过大,这意味着如果你错过一个数字,你便会错过所有。峰度的不稳定性意味着,某类统计方法应当被完全禁止。这证明,所有依赖于“标准偏差”、“变化”等的东西都是假的。
同时,我还讲述过,不可能用不规则碎片来得到精确的可能性——只是因为我在第十六章提到的来自观察错误的“尾指数”的很小的变化,会使可能性变化10倍,甚至更多。
含义:需要避免暴露于某些领域的低可能性,我们总是无法计算它们。