• 精选
  • 会员
因果关系+休谟因果论问题的全新诠释——从相关关系到因果关系-因果关系认知的思维陷阱-详述因果关系与相关关系的异同-因果必然性的颠覆者:休谟|为什么说客观事件本身不存在因果联系-因果之箭指向何方?| 图灵奖得主珀尔的《为什么》-因果推断方法分类汇总:怎样从复杂系统中找到因果关系-为什么:关于因果关系的新科学+为什么:前言-导言:思维胜于数据-推荐序: 了解因果关系科学,从珀尔的《为什么》开始+第一章 因果关系之梯-因果关系的三个层级-因果关系的三个层级(2)-迷你图灵测试-迷你图灵测试(2)-迷你图灵测试(3)-论概率与因果关系+第二章 从海盗到豚鼠:因果推断的起源-从海盗到豚鼠:因果推断的起源(2)-高尔顿和被丢弃的探索-皮尔逊:狂热者的愤怒-皮尔逊:狂热者的愤怒(2)-休厄尔·赖特、豚鼠和路径图-但它仍在动!-但它仍在动!(2)-从客观性到主观性——贝叶斯连接+第三章 从证据到因:当贝叶斯牧师遇见福尔摩斯先生-电脑侦探波拿巴-贝叶斯牧师与逆概率问题-贝叶斯牧师与逆概率问题(2)-贝叶斯牧师与逆概率问题(3)-从贝叶斯法则到贝叶斯网络-贝叶斯网络:应如何看待数据-我的行李箱在哪里从亚琛到桑给巴尔-真实世界中的贝叶斯网络-从贝叶斯网络到因果图-第四章 混杂和去混杂:或者,消灭潜伏变量-混杂和去混杂:或者,消灭潜伏变量(2)-对混杂的长期恐惧+对自然的巧妙询问:随机对照试验为何有效-对自然的巧妙询问:随机对照试验为何有效(2)-混杂的新范式-混杂的新范式(2)+do算子和后门标准-do算子和后门标准(2)+第五章 烟雾缭绕的争论:消除迷雾,澄清事实-烟草:一种人为的流行病-烟草:一种人为的流行病(2)-美国卫生局局长委员会和希尔标准-吸烟对新生儿的影响-激烈的辩论:科学与文化+第六章 大量的悖论-令人费解的蒙提·霍尔悖论-令人费解的蒙提·霍尔悖论(2)-更多的对撞偏倚:伯克森悖论-辛普森悖论-辛普森悖论(2)-辛普森悖论(3)-图示中的辛普森悖论+第七章 超越统计调整:征服干预之峰-最简单的路线:后门调整公式-前门标准-前门标准(2)-do演算,或者心胜于物-do演算,或者心胜于物(2)-do演算,或者心胜于物(3)-do乐队中隐藏的演奏者-案例:斯诺医生的离奇病例-案例:斯诺医生的离奇病例(2)-好胆固醇和坏胆固醇-好胆固醇和坏胆固醇(2)+第八章 反事实:探索关于假如的世界-从修昔底德和亚伯拉罕到休谟和刘易斯-从修昔底德和亚伯拉罕到休谟和刘易斯(2)-潜在结果、结构方程和反事实的算法化-潜在结果、结构方程和反事实的算法化(2)-潜在结果、结构方程和反事实的算法化(3)-看到你的假设的好处-看到你的假设的好处(2)-反事实与法律-必要因、充分因和气候变化-反事实的世界+第九章 中介:寻找隐藏的作用机制-坏血病:错误的中介物-先天因素与后天培养:巴巴拉·伯克斯的悲剧-寻找一种语言(伯克利大学招生悖论)-寻找一种语言(伯克利大学招生悖论)(2)-黛西、小猫和间接效应-线性“仙境”中的中介-线性“仙境”中的中介(2)-拥抱“假如”世界-拥抱“假如”世界(2)-中介个案研究——“全民学代数”:一套方案和它的副作用-中介个案研究——吸烟基因:中介与干预-中介个案研究——止血带:隐藏的谬误+第十章 大数据,人工智能和大问题-因果模型与“大数据”-因果模型与“大数据”(2)-强人工智能和自由意志-强人工智能和自由意志(2)-强人工智能和自由意志(3)-强人工智能和自由意志(4)-为什么:致谢

混杂的新范式

2020年7月10日 字数:2227 来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

“虽然混杂被广泛认为是流行病学研究的核心问题之一,但文献回顾显示,学界对混杂或混杂因子的定义几乎始终未曾达成一致。”通过这句话,加州大学洛杉矶分校的桑德·格林和哈佛大学的杰米·罗宾斯指出了自费舍尔以来为控制和消除混杂所做的努力并未取得实际进展的原因所在。由于缺乏对混杂本质的清晰理解,科学家无法在物理控制处理行不通的观察性研究中给出任何有意义的陈述。

那么在以往,混杂是如何被定义的,又应该被如何定义呢?在掌握了我们现在已经有所了解的因果论的逻辑之后,找出第二个问题的答案就很简单了。我们观察到的是给定处理效应的条件概率P(Y|X),我们要问自然的问题是X和Y之间的因果关系,该因果关系可以通过干预概率P(Y|do(X))获得。如此一来,混杂就可以简单地定义为导致P(Y|X)≠P(Y|do(X)),即两个概率出现差异的所有因素。是不是很简单明了?

遗憾的是,在20世纪90年代之前,事情并没有那么简单,因为那时do算子这一表达形式还未被提出。即使是在今天,如果你在街上拦住一个统计学家,问他:“混杂对你来说意味着什么?”你仍然可能会得到一个你能从科学家那里听到的最令人费解和困惑的答案。最近出版的一本由几位权威的统计学家合著的新书,就花了整整两页的篇幅试图解释这个概念,而我到现在还没有发现哪个读者真的理解了他们的话。

定义困难的原因就在于混杂并非统计学概念。它代表了我们想要评估的内容(因果效应)和我们实际使用统计方法所评估的内容之间的差异。如果你不能在数学上表达出你想评估的内容,那你就无法定义是什么构成了这种差异。

历史上,“混杂”的概念演变围绕着两个相关概念展开——不可比性和潜伏的第三变量。这两个概念都很“抵制”形式化。在丹尼尔的试验中,当我们谈到可比性时,我们说的是,处理组和对照组应该在所有相关方面都相同,但这就要求我们必须从不相关的属性中区分出相关的属性。在步行与死亡率的研究中,我们要如何知道年龄是否相关?要如何知道参与者名字的字母顺序是否相关?你可能会说这是显而易见的或者完全是常识性的,但是几代科学家一直致力于实现在数学上表达这种常识,否则我们就无法要求机器人在没有人类的常识可以依靠的情况下采取正确的行动。

对于潜伏的第三变量的定义也存在同样的模糊性。混杂因子是X和Y的共因吗?还是仅仅与它们每个都相关?今天,我们可以借助因果图来检查是哪些变量导致了P(X|Y)和P(X|do(Y))之间的差异,从而回答这个问题。而在没有因果图或do算子的时代,大约有五代的统计学家和医学专家不得不尝试找到某种替代定义,而这些定义没有一个令人满意。想到你药柜里的药物可能是基于混杂因子的某个可疑的替代定义开发的,你应该多少为此感到担忧才对。

让我们来看看这些关于混杂的替代定义。它们主要分为两大类,即声明性定义和过程性定义。一个典型的(错误的)声明性定义是“混杂因子是与X和Y都相关的任何变量”。而过程性定义则试图根据统计检验来描述混杂因子的特征。这种定义尤其吸引那些喜欢直接检验数据而忽视建构模型的统计学家。

下面是一个过程性定义,它有一个可怕的名字——“非溃散性”(noncollapsibility)。这个定义出自挪威流行病学家斯文·亨伯格1996年的论文:“在形式上,你可以将天然的相对死亡风险和根据潜在混杂因子进行统计调整后得到的相对死亡风险进行比较。二者的差异即表明混杂存在,在这种情况下,你就应该使用调整后的相对死亡风险评估结果。如果二者没有差异或只有微不足道的差异,那么混杂就不是问题,我们首选粗略估计。”换句话说,如果你怀疑存在某个混杂因子,你可以据其进行统计调整,并比较调整后的估计和未经调整的估计。如果二者有区别,那么这个因子就是混杂因子,因而你应该采用那个校正值。如果二者没有区别,那么你就摆脱了混杂的困境。亨伯格绝不是第一个提倡这种做法的人,而这种做法误导了一个世纪的流行病学家、经济学家和社会学家,并且仍然统治着应用统计的某些领域。我之所以单独挑出亨伯格的陈述,是因为他的这个定义非常清晰明确,也因为他是在因果革命已经开始之后的1996年发表的这篇文章。

最为流行的一个声明性定义经历了一段时期的发展和演变。《流行病学方法与概念史》(A History of Epidemiologic Methods and Concepts?)一书的作者阿尔弗雷多·莫拉比亚称之为“混杂的经典流行病学定义”,它包含两个条件。X(处理)和Y(结果)的一个混杂因子Z,满足(1)在整个总体上与X相关,(2)在未接受处理X的人群中与Y相关。近年来,该定义又增加了第三个条件:(3)Z不应当出现在X和Y之间的因果路径上。

请注意,“经典”版本的定义[只包含条件(1)和(2)]中的所有术语都是统计学的。其中条件(1)体现得尤为明显,即Z只是被假定为与X、Y相关,而不是X和Y的因。1951年,爱德华·辛普森在此基础上提出了相当复杂的条件(2):“在未接受处理的人群中Y与Z相关。”从因果的角度来看,辛普森的想法似乎是要去除由X对Y的因果效应引起的Z与Y的那部分相关;换句话说,他想说的是Z对Y的影响不依赖于Z对X的影响。他认为表达这种“去除”的唯一方法就是通过聚焦对照组(X=0)来对X进行变量控制。统计学剥夺了“效应”这个词,让他无法用其他方式来表达这一想法。

如果这个定义令你感到困惑的话,那就对了!如果他能简单地画出如图4.1所示的因果图,并据此说明“Y并没有通过X与Z发生关联”,那事情就会简单明了得多。但他没有这个工具,也无从谈论路径,因为这是一个被禁用的概念。

混杂因子的“经典流行病学定义”还有其他缺陷,如以下两个例子所示:

(i)X→Z→Y

在例(i)中,Z满足条件(1)和(2),但它不是一个混杂因子,而应该被称为“中介物”(mediator)。它是解释X对Y的因果效应的变量。如果你试图找出X对Y的因果效应,那么控制Z将带来一场灾难。如果你只看处理组和对照组中Z=0的那些个体,那么你就完全阻断了X的影响,因为它是通过改变Z来起作用的。如此一来你就会得出错误的结论——X对Y没有影响。埃兹拉·克莱因所说的“你最终控制了你真正想要测量的东西”正是这个意思。

在例(ii)中,Z是中介物M的替代物。当实际的因果变量无法测量时,统计学家通常会选择控制其替代物。例如,党派归属就可能被视为政治信仰的替代物。而因为Z并不是M的完美度量,所以如果你控制了Z,则X对Y的影响就可能会部分地被“遗漏”掉。实际上,控制Z本身仍然是一个错误,虽然它带来的偏倚可能会小于控制M,但偏倚仍然存在。

混杂

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000