• 精选
  • 会员

黛西、小猫和间接效应

2020年7月10日  来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

到目前为止,我们已经用一种模糊的、直觉性的方式讨论了直接效应和间接效应的概念,但我还没有给出它们精确的科学含义。我们早该弥补这一漏洞了。

让我们从直接效应开始,因为它肯定更简单,我们可以用do演算(第二层级)定义它的一个版本。我们首先考虑一个只包含3个变量的最简单的案例:处理X,结果Y,中介物M。当我们“扰动”X而保持M恒定时,我们就得到了X对Y的直接效应。在伯克利大学招生悖论的例子中,假设我们强迫每个人都申请历史系,即我们do(M=0)。并且,不考虑申请者的实际性别是什么,我们随机分配一些人(在申请表上)报告其性别为男性[do(X=1)],另一些人报告其性别为女性[do(X=0)]。然后,我们观察两个性别报告组在录取率上的差异。该结果也被称为“受控直接效应”(controlled direct effect,简称为CDE),可以用符号表示为CDE(0):

CDE(0)=P(Y=1|do(X=1),do(M=0))–P(Y=1|do(X=0),do(M=0)) (9.1)

“0”在CDE(0)中表示的是我们迫使中介物取值为0。我们也可以进行另一个类似的试验,迫使每个人都申请工程学系:do(M=1)。我们将由此产生的受控直接效应表示为CDE(1)。

我们已经看到了直接效应和总效应之间的一个区别:我们现在有两个不同版本的受控直接效应,CDE(0)和CDE(1),哪一个是对的?一种选择是简单地报告两个版本。不难想象,也许实际情况就是一个院系歧视女性,另一个歧视男性,找出哪个院系歧视哪种性别本身就很有趣,毕竟,这正是汉默尔研究的初衷。

然而,我不建议你做这样的试验,原因如下:设想有一个名叫乔的申请人,他的毕生梦想是学习工程学,而他碰巧(随机地)被分配去申请历史系。在和招生委员会面谈几次之后,我敢保证,对委员会来说,乔的申请看起来会非常奇怪。无论他在申请表上报告的性别是“男性”还是“女性”,他在电磁波课程中拿到的A+ 和在欧洲民族主义课程中拿到的B– 都足以促使委员会做出不录取的决定。相比申请人按照自己的意愿正常申请历史系的情况,在这种失真的情境中,男性和女性的录取比例很难反映出实际的招生政策。

幸运的是,另一种方法可以让我们避免踏入这个“过度对照试验”的陷阱。我们指示申请人随机报告性别,但允许他们按照自己的意愿申请他们本来就青睐的院系。我们将由此得到的直接效应称为“自然直接效应”(natural direct effect,简称为NDE),因为每个申请人最终都会申请他自己选择的院系。“本来就”这样的措辞暗示NDE的正式数学定义需要反事实。对于喜欢数学的读者,该定义可表示为如下公式:

NDE=P(YM = M 0 =1|do(X=1))–P(YM = M 0 =1|do(X=0)) (9.2)

在此例中,NDE代表的是如果一个女生将她的性别报告为“男性”,即do(X=1),其申请自己想去的院系(M=M0 )的录取概率。在这里,院系的选择是由真实的性别决定的,而录取是由报告的性别(假性别)决定的。由于前者无法被强制干预,我们不能将这个术语转化为包含do算子的表达式,我们需要调用反事实下标。

现在,你已经知道了我们如何定义受控直接效应和自然直接效应,那么我们如何计算它们呢?对于受控直接效应,这项任务很简单,因为它可以表示为一个do表达式,所以我们只需要使用do演算定律将do表达式精简(转化)为see表达式(可从观测数据中直接估计出的条件概率)即可。

而估计自然直接效应则是一个更大的挑战,因为它不能用do表达式来定义。它需要我们调用反事实的语言,因而我们也不能用do演算来估计它。当我最终设法完成了将NDE公式中所有的反事实下标都去掉的任务时,那真是我一生中最激动兴奋的一刻。这一重要成果被我称为“中介公式”(Mediation Formula),它使NDE成为一种真正实用的工具,因为我们再一次实现了从观测到的数据中将其直接估计出来这一目标。

与直接效应不同的是,间接效应没有“受控”版本的定义,因为我们无法通过保持某些变量恒定来关闭直接路径。但它确实有一个“自然”版本的定义,自然间接效应(natural indirect effect,简称为NIE),且该定义同NDE一样需要调用反事实的语言。为了推导出这个定义,我们先来看本书合著者达纳·麦肯齐提出的一个有趣的例子。

达纳·麦肯齐和他的妻子收养了一只名叫黛西的狗,黛西是贵宾犬和吉娃娃的混血品种,顽皮任性。黛西不像他们以前养的狗那样容易驯服,几周后,它仍会偶尔在家里制造“意外”(比如随地大小便)。但后来发生了一件非常奇怪的事。达纳和他的妻子从动物收容所带了三只小猫回来寄养,而黛西突然就不再制造“意外”了。寄养的小猫在家里待了3周,那段时期,黛西一次都没有违规。

那么,这究竟只是一种巧合,还是小猫以某种方式激发了黛西的文明行为?达纳的妻子认为,小猫的到来可能给了黛西一种对于“群组”的归属感,让它意识到它属于这一群组,因而不应该把这一群组生活的地方弄得一团糟。在小猫被送回收容所的几天后,黛西故态萌发,又开始在屋子里撒尿,仿佛它从来不知道它此前遵守过的那些良好习惯。这一事实让这一理论的证据得到了加强。

但是达纳忽然想起,在小猫到来和离开时,还有另外一件事也同时发生了变化。小猫在的时候,黛西要么被与小猫隔离开来,要么受到了主人的细心监管。因此,在那段时期,它要么长时间地待在自己的窝里,要么长时间地被人密切监视,甚至时不时就要被拴上皮带。无论是要求宠物待在自己的窝里还是给宠物拴上皮带,都是公认有效的管教方法。

小猫离开后,麦肯齐全家不再密切监督它,于是它立即恢复原状。达纳假设小猫的作用不是直接的(就像群组理论所描述的那样),而是间接的,由限制活动范围和严密监督介导。图9.6显示了此例的因果图。在此基础上,达纳和他的妻子做了一个试验。他们开始像小猫还在时那样对待黛西,让它待在自己的窝里,或者在它出来的时候严密监督它。如果“意外”不再发生,他们就可以合理地断定这一假设的中介物是可靠的。如果“意外”没有停止,那么直接效应(群组理论)就变得更可信了。

图9.6 黛西与小猫的因果图

在科学证据的层次结构中,麦肯齐夫妇的试验会被视为非常不可靠,肯定不能在科学期刊上发表。一个真正的试验首先要求你有不止一只狗,并且试验要分别在小猫在场和不在场的情况下进行。不过,我们在此关注的是试验背后的因果逻辑。我们设法重建的是,假如小猫不在场,同时假如我们将中介物的值设置为小猫在场时的值,那么本应该发生的事是什么。换句话说,我们移走了小猫(干预1),并像小猫在家时那样监督黛西(干预2)。

当你仔细观察上面那段话时,你可能会注意到其中提到了两个“假如”,这是反事实语言。实际发生的事情是,小狗黛西在小猫在场的情况下改变了自己的行为,而我们想问的是,假如小猫不在场,可能会发生什么。同样,我们知道实际发生的事情是,如果小猫不在场,达纳也不会监督黛西的行为,而我们现在想问的问题是,假如小猫不在场,但我们仍然监督黛西的话,会发生什么。

你现在可以明白为什么统计学家为定义间接效应困扰了这么长的时间。如果说只涉及一个反事实的情况都已经这么复杂了,那双嵌套的反事实就更无法理解了。不过,这个定义实际上非常符合我们对因果关系的自然直觉。不得不说,我们的直觉实在强大,这种人类的天赋让达纳的妻子在没有接受过特殊训练的情况下就能轻松地理解试验背后的逻辑。

对于那些更习惯公式定义的读者,上述NIE的定义 [3]  可以用公式表示为:

NIE=P(YM = M 1 =1|do(X=0))–P(YM = M 0 =1|do(X=0)) (9.3)

第一个P是黛西试验的结果:假设我们不引入其他宠物(X=0),但将中介物设置为引入其他宠物时会有的值(M=M1 ),此时黛西的行为有所改善(Y=1)的概率。我们将它与“正常”条件(没有其他宠物)下黛西的行为有所改善的概率进行对比。请注意,反事实M1 的计算必须基于特定案例的特定动物:不同的狗可能对活动范围限制和严密监督的需求也有所不同。这就使得间接效应的计算超出了do演算的范围。它也可能使试验变得难以实施,因为试验者可能无从了解特定的狗u的M1 (u)。然而,若假设M和Y之间没有混杂,则自然间接效应仍然是可以计算出来的。从NIE中删除所有的反事实下标,我们就能得到一个中介公式,就像之前我们对NDE所做的那样,这一操作是可能的。这种计算虽然涉及来自因果关系之梯第三层级的信息,但仍然可以简化成一个可以只根据第一层级的数据计算出结果的公式。但实施该简化的前提条件是假设不存在混杂,提出这一假设的根据是结构因果模型中的方程所具有的确定性性质(位于因果关系之梯的第三层级)。

关于黛西的表现,该试验并不能给出定论。在达纳和他的妻子送走了小猫的前提下,他们是否能真的像小猫在家时那样仔细地监视黛西,这是值得怀疑的。(也就是说,我们并不能确定M是否真的被设置为M1 。)经过几个月的耐心培训,黛西最终学会了在室外大小便。不过不论结果怎样,黛西的故事依然留给了我们一些有益的经验。只需要设定中介物的值,达纳就能推测出另一个因果机制。并且这一机制有一个重要的现实意义:他和他的妻子不必为了改善黛西的行为而养一屋子的猫。

核心关键词不超过3个

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000