• 精选
  • 会员
因果关系+休谟因果论问题的全新诠释——从相关关系到因果关系-因果关系认知的思维陷阱-详述因果关系与相关关系的异同-因果必然性的颠覆者:休谟|为什么说客观事件本身不存在因果联系-因果之箭指向何方?| 图灵奖得主珀尔的《为什么》-因果推断方法分类汇总:怎样从复杂系统中找到因果关系-为什么:关于因果关系的新科学+为什么:前言-导言:思维胜于数据-推荐序: 了解因果关系科学,从珀尔的《为什么》开始+第一章 因果关系之梯-因果关系的三个层级-因果关系的三个层级(2)-迷你图灵测试-迷你图灵测试(2)-迷你图灵测试(3)-论概率与因果关系+第二章 从海盗到豚鼠:因果推断的起源-从海盗到豚鼠:因果推断的起源(2)-高尔顿和被丢弃的探索-皮尔逊:狂热者的愤怒-皮尔逊:狂热者的愤怒(2)-休厄尔·赖特、豚鼠和路径图-但它仍在动!-但它仍在动!(2)-从客观性到主观性——贝叶斯连接+第三章 从证据到因:当贝叶斯牧师遇见福尔摩斯先生-电脑侦探波拿巴-贝叶斯牧师与逆概率问题-贝叶斯牧师与逆概率问题(2)-贝叶斯牧师与逆概率问题(3)-从贝叶斯法则到贝叶斯网络-贝叶斯网络:应如何看待数据-我的行李箱在哪里从亚琛到桑给巴尔-真实世界中的贝叶斯网络-从贝叶斯网络到因果图+第四章 混杂和去混杂:或者,消灭潜伏变量-混杂和去混杂:或者,消灭潜伏变量(2)-对混杂的长期恐惧-对自然的巧妙询问:随机对照试验为何有效-对自然的巧妙询问:随机对照试验为何有效(2)-混杂的新范式-混杂的新范式(2)-do算子和后门标准-do算子和后门标准(2)+第五章 烟雾缭绕的争论:消除迷雾,澄清事实-烟草:一种人为的流行病-烟草:一种人为的流行病(2)-美国卫生局局长委员会和希尔标准-吸烟对新生儿的影响-激烈的辩论:科学与文化+第六章 大量的悖论-令人费解的蒙提·霍尔悖论-令人费解的蒙提·霍尔悖论(2)-更多的对撞偏倚:伯克森悖论-辛普森悖论-辛普森悖论(2)-辛普森悖论(3)-图示中的辛普森悖论-第七章 超越统计调整:征服干预之峰-最简单的路线:后门调整公式+前门标准-前门标准(2)-do演算,或者心胜于物-do演算,或者心胜于物(2)-do演算,或者心胜于物(3)-do乐队中隐藏的演奏者+案例:斯诺医生的离奇病例-案例:斯诺医生的离奇病例(2)+好胆固醇和坏胆固醇-好胆固醇和坏胆固醇(2)+第八章 反事实:探索关于假如的世界-从修昔底德和亚伯拉罕到休谟和刘易斯-从修昔底德和亚伯拉罕到休谟和刘易斯(2)-潜在结果、结构方程和反事实的算法化-潜在结果、结构方程和反事实的算法化(2)-潜在结果、结构方程和反事实的算法化(3)-看到你的假设的好处-看到你的假设的好处(2)-反事实与法律-必要因、充分因和气候变化-反事实的世界+第九章 中介:寻找隐藏的作用机制-坏血病:错误的中介物-先天因素与后天培养:巴巴拉·伯克斯的悲剧-寻找一种语言(伯克利大学招生悖论)-寻找一种语言(伯克利大学招生悖论)(2)-黛西、小猫和间接效应-线性“仙境”中的中介-线性“仙境”中的中介(2)-拥抱“假如”世界-拥抱“假如”世界(2)-中介个案研究——“全民学代数”:一套方案和它的副作用-中介个案研究——吸烟基因:中介与干预-中介个案研究——止血带:隐藏的谬误+第十章 大数据,人工智能和大问题-因果模型与“大数据”-因果模型与“大数据”(2)-强人工智能和自由意志-强人工智能和自由意志(2)-强人工智能和自由意志(3)-强人工智能和自由意志(4)-为什么:致谢

do演算,或者心胜于物(2)

2020年7月10日 字数:1932 来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

现在,我们已经准备好论证规则1到3是怎样让我们得以将一个表达式变换为另一个,最终得到我们想要的那个表达式的。虽然操作步骤有些复杂,但我认为要想真正理解如何运用一系列do演算规则推导出前门调整公式,展示这一论证过程是必需的(见图7.4)。你不需要遵循所有的步骤一一照做,我的目的只是希望你体会一下do演算究竟是什么。我们从目标表达式P(Y|do(X))开始。我们需要引入辅助变量,将目标表达式转换为一个没有do的公式,当然我已经知道,我们最终得到的表达式将与前门调整公式一致。我们需要绘制一张包含X、Y和辅助变量的因果图,论证过程的每一步都必须得到因果图的许可。在某些情况下,论证步骤还需要从因果图的子图中获得许可,这些子图以删除箭头的形式表明混杂消除的不同情况。这些子图显示在图7.4右侧。

图7.4 利用do演算规则推导前门调整公式

我对do演算有着特别的偏爱。有了这三条简单的规则,我就能推导出前门调整公式。这是科学史上第一个不以控制混杂因子为手段来估计因果效应的方法。我相信,不用do演算,没有人可以做到这一点。所以在1993年伯克利大学举办的一次统计学研讨会上,我把它作为一个挑战提出来,甚至提供了100美元的奖金,用以奖励解决它的人。同样参加了这次研讨会的保罗·霍兰德曾对我说过,他把这个问题作为课堂作业布置下去了,并会在有了结果后把解决方案发给我。(我的同事们告诉我,他最终在1995年的一次会议上提出了一个非常复杂的解决方案,如果他的论证是正确的,我可能就欠了他100美元。)经济学家詹姆斯·赫克曼和罗德里戈·平托在2015年进行了另一次尝试,他们希望利用“标准工具”来证明前门调整公式。他们的辛勤劳动最终得到了回报,尽管其论证过程不得不用长达8页的论文来解释清楚。

实际上,在那次研讨会的前一天晚上,我在一家餐馆中只用了一张餐巾纸就写完了论证过程(与图7.4很类似),并把它递给了大卫·弗里德曼,可惜后来他写信给我说他把那张餐巾纸弄丢了。他无法重建整个论证过程,并询问我是否保存了一份副本。第二天,杰米·罗宾斯从哈佛大学写信给我说,他从弗里德曼那儿听说了这个“餐巾纸问题”,并提出打算立即乘飞机来加利福尼亚,与我一起核实这个论证。我很高兴与罗宾斯分享do演算的秘密,我相信这次洛杉矶之行是他之后热情接纳因果图方法的关键。在他和桑德·格林兰的推动下,因果图逐渐发展成为流行病学家的第二语言。这也从侧面说明了我为什么对这个“餐巾纸问题”这么着迷。

前门调整公式的论证是一个惊喜,它指出了do演算所具有的重要价值。然而,我无法确定do演算的这三条规则是否充分。我们是否遗漏了第四条规则,而它可以帮助我们解决这三条规则所不能解决的问题?

1994年,当我第一次提出do演算时,我之所以选择这三条规则,是因为它们足以处理我所知道的所有不同类型的情况。我不知道这些规则是否会像阿里阿德涅之线 [2]  一样能永远带领我走出迷宫,又或者终有一天我会遇到一个极其复杂、无法逃脱的迷宫。当然,我抱着乐观的希望。我猜想,只要因果效应可以从数据中估计出来,我们就可以利用这三条规则通过一系列处理步骤消除do算子。但我还没能证明这一论断。

这类问题在数学和逻辑学中有许多先例。我想证明的这种性质在数学逻辑上通常被称为“完备性”。一个完备的公理系统有这样一种特性,即其中的公理足以推导出使用该公理系统的语言书写的任何正确表述。的确存在一些非常出色的公理系统是不完备的,比如概率论中描述条件独立性的菲利普·戴维公理。

在这个关于完备性猜想的迷宫故事中,有两个研究小组在我这个徘徊的忒修斯面前扮演了阿里阿德涅的角色:南卡罗来纳大学的黄一鸣(音)、马尔科·瓦尔托塔,和加州大学洛杉矶分校的伊利亚·斯皮塞,他也是我的学生。这两个研究小组同时独立地证明了,规则1至3足以让我们走出任何一个确有出口的do迷宫。我不确定学界是否曾屏息等待他们的完整证明,因为那时,大多数研究者都满足于仅使用前门标准和后门标准。好在,这两个研究小组的成果都得到了公开的认可,在2006年的人工智能大会上同时获得了有关不确定性研究的最佳学生论文奖。

我承认我本人就曾对这一证明结果屏息以待。这一对于完备性的证明告诉我们,如果我们在规则1到3中找不到根据数据估计P(Y|do(X))的方法,那么对于这个问题,解决方案就是不存在的。在此情况下,我们就能意识到除了进行随机对照试验,我们别无选择。它还能告诉我们,对于某个特定的问题,什么样的额外假设或试验可以使因果效应从不可估计变为可估计。

在宣布全面胜利之前,我们应该尝试使用do演算来讨论一个问题。就像其他运算一样,它可以让某种有效的理论建构得到证明,但它并不能帮助我们找到理论建构本身。它是一个优秀的解决方案验证工具,但并不是一个很好的解决方案搜索工具。如果你知道变换的正确顺序,你就可以很容易地向其他人(熟悉规则1到3的人)证明do算子可以被消除。但是,如果你不知道正确的变换顺序,你就很难找到消除do算子的方法,甚至无法确定do算子是否可以消除。用几何证明来类比的话,就是我们需要确定下一步应该使用哪种辅助构造,是画一个以A点为圆心的圆?还是画一条与AB平行的线?可能的辅助构造有无限多个,并且公理本身不会对我们下一步该进行何种尝试提供任何指导。就像我的高中几何学老师常说的,你需要借助“数学眼镜”自己去发现它。

统计

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000