现在,我们已经准备好论证规则1到3是怎样让我们得以将一个表达式变换为另一个,最终得到我们想要的那个表达式的。虽然操作步骤有些复杂,但我认为要想真正理解如何运用一系列do演算规则推导出前门调整公式,展示这一论证过程是必需的(见图7.4)。你不需要遵循所有的步骤一一照做,我的目的只是希望你体会一下do演算究竟是什么。我们从目标表达式P(Y|do(X))开始。我们需要引入辅助变量,将目标表达式转换为一个没有do的公式,当然我已经知道,我们最终得到的表达式将与前门调整公式一致。我们需要绘制一张包含X、Y和辅助变量的因果图,论证过程的每一步都必须得到因果图的许可。在某些情况下,论证步骤还需要从因果图的子图中获得许可,这些子图以删除箭头的形式表明混杂消除的不同情况。这些子图显示在图7.4右侧。
图7.4 利用do演算规则推导前门调整公式
我对do演算有着特别的偏爱。有了这三条简单的规则,我就能推导出前门调整公式。这是科学史上第一个不以控制混杂因子为手段来估计因果效应的方法。我相信,不用do演算,没有人可以做到这一点。所以在1993年伯克利大学举办的一次统计学研讨会上,我把它作为一个挑战提出来,甚至提供了100美元的奖金,用以奖励解决它的人。同样参加了这次研讨会的保罗·霍兰德曾对我说过,他把这个问题作为课堂作业布置下去了,并会在有了结果后把解决方案发给我。(我的同事们告诉我,他最终在1995年的一次会议上提出了一个非常复杂的解决方案,如果他的论证是正确的,我可能就欠了他100美元。)经济学家詹姆斯·赫克曼和罗德里戈·平托在2015年进行了另一次尝试,他们希望利用“标准工具”来证明前门调整公式。他们的辛勤劳动最终得到了回报,尽管其论证过程不得不用长达8页的论文来解释清楚。
实际上,在那次研讨会的前一天晚上,我在一家餐馆中只用了一张餐巾纸就写完了论证过程(与图7.4很类似),并把它递给了大卫·弗里德曼,可惜后来他写信给我说他把那张餐巾纸弄丢了。他无法重建整个论证过程,并询问我是否保存了一份副本。第二天,杰米·罗宾斯从哈佛大学写信给我说,他从弗里德曼那儿听说了这个“餐巾纸问题”,并提出打算立即乘飞机来加利福尼亚,与我一起核实这个论证。我很高兴与罗宾斯分享do演算的秘密,我相信这次洛杉矶之行是他之后热情接纳因果图方法的关键。在他和桑德·格林兰的推动下,因果图逐渐发展成为流行病学家的第二语言。这也从侧面说明了我为什么对这个“餐巾纸问题”这么着迷。
前门调整公式的论证是一个惊喜,它指出了do演算所具有的重要价值。然而,我无法确定do演算的这三条规则是否充分。我们是否遗漏了第四条规则,而它可以帮助我们解决这三条规则所不能解决的问题?
1994年,当我第一次提出do演算时,我之所以选择这三条规则,是因为它们足以处理我所知道的所有不同类型的情况。我不知道这些规则是否会像阿里阿德涅之线 [2] 一样能永远带领我走出迷宫,又或者终有一天我会遇到一个极其复杂、无法逃脱的迷宫。当然,我抱着乐观的希望。我猜想,只要因果效应可以从数据中估计出来,我们就可以利用这三条规则通过一系列处理步骤消除do算子。但我还没能证明这一论断。
这类问题在数学和逻辑学中有许多先例。我想证明的这种性质在数学逻辑上通常被称为“完备性”。一个完备的公理系统有这样一种特性,即其中的公理足以推导出使用该公理系统的语言书写的任何正确表述。的确存在一些非常出色的公理系统是不完备的,比如概率论中描述条件独立性的菲利普·戴维公理。
在这个关于完备性猜想的迷宫故事中,有两个研究小组在我这个徘徊的忒修斯面前扮演了阿里阿德涅的角色:南卡罗来纳大学的黄一鸣(音)、马尔科·瓦尔托塔,和加州大学洛杉矶分校的伊利亚·斯皮塞,他也是我的学生。这两个研究小组同时独立地证明了,规则1至3足以让我们走出任何一个确有出口的do迷宫。我不确定学界是否曾屏息等待他们的完整证明,因为那时,大多数研究者都满足于仅使用前门标准和后门标准。好在,这两个研究小组的成果都得到了公开的认可,在2006年的人工智能大会上同时获得了有关不确定性研究的最佳学生论文奖。
我承认我本人就曾对这一证明结果屏息以待。这一对于完备性的证明告诉我们,如果我们在规则1到3中找不到根据数据估计P(Y|do(X))的方法,那么对于这个问题,解决方案就是不存在的。在此情况下,我们就能意识到除了进行随机对照试验,我们别无选择。它还能告诉我们,对于某个特定的问题,什么样的额外假设或试验可以使因果效应从不可估计变为可估计。
在宣布全面胜利之前,我们应该尝试使用do演算来讨论一个问题。就像其他运算一样,它可以让某种有效的理论建构得到证明,但它并不能帮助我们找到理论建构本身。它是一个优秀的解决方案验证工具,但并不是一个很好的解决方案搜索工具。如果你知道变换的正确顺序,你就可以很容易地向其他人(熟悉规则1到3的人)证明do算子可以被消除。但是,如果你不知道正确的变换顺序,你就很难找到消除do算子的方法,甚至无法确定do算子是否可以消除。用几何证明来类比的话,就是我们需要确定下一步应该使用哪种辅助构造,是画一个以A点为圆心的圆?还是画一条与AB平行的线?可能的辅助构造有无限多个,并且公理本身不会对我们下一步该进行何种尝试提供任何指导。就像我的高中几何学老师常说的,你需要借助“数学眼镜”自己去发现它。