倘若克利奥帕特拉的鼻子再短几分,整个世界的面貌就会改变。
——布莱斯·帕斯卡(1669)
“可惜我不能同时去涉足,我在那路口久久伫立……”
罗伯特·弗罗斯特这首著名的诗反映了诗人对反事实的敏锐洞察力。我们不能两条道路都走,但是我们的大脑有能力判断假如我们当初走了另一条路会发生什么。借助这种判断能力,弗罗斯特便带着对选择的满足结束了他的诗,意识到它“决定了我一生的道路”。(资料来源:马雅·哈雷尔绘图。)
在开始攀登因果关系之梯的顶层之前,让我们回顾一下从第二层级中学到的知识。我们已经见识了几种方法,可以用于在各种情景设定和条件下确定干预的效果。在第四章,我们讨论了随机对照试验,它被广泛誉为医学临床试验的“黄金标准”。我们还看到了一些适用于观察性研究的方法,其中处理组和对照组的成员不是随机分配的。对此,如果我们可以采集到能够阻断所有后门路径的变量(集)的数据,我们就可以使用后门调整公式来估算出干预效果。如果能找到一个被混杂因子“屏蔽”的前门路径,我们就可以引入前门调整。如果我们愿意接受线性或单调性假设,那么我们就可以使用工具变量(假设该变量可以在因果图中找到,或研究者可以根据试验设计提出一个合适的变量)。此外,那些真正富有冒险精神的研究者还可以用do演算或其衍生算法,绘制出一条通往干预之峰山巅的新路线。
在所有这些努力中,我们的目标都是找到研究中处理的某个总效应或者在某些典型个体或子总体中的效应(平均因果效应)。但到目前为止,我们还不具备在特定事件或个体层面上谈论个性化的因果关系的能力。说“吸烟致癌”是一回事,而说“我的叔叔乔30年来每天抽一包烟,假如他不曾吸烟的话,那他现在可能还活着”就完全是另一回事了。两者的区别既明显又深刻:像乔叔叔那样在吸了30年烟之后去世的人,是不可能在另一个他不曾吸30年烟的世界中被观察到的。
责任和过失,遗憾和信誉——这些概念都可以被纳入因果思维之中。为了真正理解这些概念,我们需要在某些备择假设的前提下,将发生过的事情与“假如……则本可能”的事情进行比较。正如我们在第一章讨论的那样,人类具有设想那个不存在的世界的能力,正是这一能力将我们与类人猿祖先以及地球上的其他生物区分开来。其他生物能看到“是什么”,而我们的天赋是能看到“假如……则本可能是什么”,当然,这种天赋有时也可能是一个诅咒。
本章的主要内容是讨论如何使用观察数据和试验数据来提取有关反事实情景的信息。我将具体解释如何在因果图的语境中表示个体层面的因,这项任务将迫使我们对此前尚未讨论过的因果图的一些具体细节做出解释。我还会介绍一个密切相关的概念,叫作“潜在结果”(potential outcomes)或奈曼—鲁宾因果模型,这个概念最初是由波兰统计学家耶日·奈曼(后来成为伯克利大学的教授)在20世纪20年代提出的。但是,直到20世纪70年代中期,唐纳德·鲁宾发表了关于潜在结果的研究论文之后,这种因果分析方法才真正开始得到不断的推进和发展。
我们在前几章已经建立了因果关系的理论框架——休厄尔·赖特的路径图及其衍生产物结构因果模型(SCMs)。我将在本章展示反事实是如何自然而然地在这个框架中出现的。我们在第一章已经对此有了初步的了解。在行刑队执行枪决的例子中,我们展示了应该如何回答反事实的问题,如“假如枪手A没有开枪,那么犯人还会活着吗”这个问题。我将比较反事实在奈曼—鲁宾范式和结构因果模型中的定义,其中后者的提出公开地受益于因果图的独特优势。而多年来,鲁宾一直坚持认为因果图没有任何用处。因此,信奉鲁宾因果模型的研究者往往困扰于缺乏一个工具用以表示因果知识或推导出可验证的蕴涵,我们将考察他们是如何在一片黑暗中解决因果问题的。
最后,我们将研究两个案例,其中反事实推理必不可少。几十年来,甚至几个世纪以来,针对被告的罪责,律师们一直使用的是一种相对直接的证明方法,即所谓的“若非(but–for)因果关系”?[1]??:若非被告做出某种行为,伤害事件就不会发生。我们将讨论如何用反事实语言来阐释这个令人费解的概念,以及如何估计被告有罪的概率。
接下来,我将讨论反事实在气候变化中的应用。直到最近,气候学家仍然困扰于如何回答诸如“是不是全球变暖导致了这场风暴(或者这次持续高温天气、持续干旱)”这类特别棘手的问题。传统的答案是,个别的气象状况不能简单归因于全球性的气候变化。然而,这个答案似乎相当避实就虚,甚至很可能导致了公众对气候变化的漠不关心。
而反事实分析能帮助气候学家给出比以前更精确的表述。不过,它要求我们适当增加一些词汇量。此外,我们还需要区分3种不同的因果关系:必要因果关系、充分因果关系以及充要因果关系?[2]??。(其中必要因果关系等同于“若非因果关系”。)使用这些术语,气候学家就可以说,“人为因素导致的全球气候变化是这次持续高温天气的必要因的概率为90%”,或者“有80%的可能性,全球气候变化是这次50年一遇的持续高温天气的充分因”。第一句话与归因有关——是什么因素引起了这次异常高温?第二句话与策略有关,它表明我们最好对这种持续高温天气做好准备,因为它迟早会发生。相较于只是耸耸肩,对个别天气事件的起因不做任何说明的传统做法,这两种说法中的任何一个都包含更大的信息量。