• 精选
  • 会员

线性“仙境”中的中介(2)

2020年7月10日  来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

现在,让我们来看一个非常简单的例子,它说明了在离开线性仙境之后,我们此前的假设将如何导致错误。在对图9.7进行了略微的修改后,我们就得到了图9.8,其中求职者当且仅当预期工资超过某一阈值(此例中阈值为10)时才会决定接受工作。如图所示,公司提供的工资是确定的,表示为:7×学历+3×技能。请注意,确定技能和工资的函数仍假设为线性的,而工资与结果的关系是非线性的,因为它涉及一个阈值效应。

图9.8 结合了阈值效应的中介

现在让我们计算一下,对于这个模型,每增加1个单位的“学历”所带来的总效应、直接效应和间接效应。总效应显然等于1,因为随着“学历”从0变为1,“工资”也就从0变为(7×1)+(3×2)=13,其超过了阈值10,使得“结果”从0变为1。

记住,自然间接效应指的是结果的预期变化,假设我们对“学历”不做任何改变,而将“技能”设定为在“学历”提高了一个水平的前提下其所应该有的水平。很容易看出,在这种情况下,“工资”将从0变为2×3=6,低于阈值10,所以求职者不会接受这份工作,因而NIE=0。

那么直接效应呢?如前所述,我们遇到的问题是要弄清楚中介物应该取什么值。一方面,如果我们采用“学历”水平改变之前的“技能”水平,那么“工资”将从0增加到7,低于阈值,使“结果”等于0。因此,CDE(0)=0。另一方面,如果我们采用“学历”改变后(学历=2)的“技能”水平,那么“工资”将从6增加到13,这将使“结果”从0变为1。所以CDE(2)=1。

因此,直接效应要么是0要么是1,这取决于我们为中介物设定的常值。不同于线性仙境,中介物选择的值会对结果产生影响,这就让我们陷入了一个两难困境。如果我们希望保留相加性原则:总效应=直接效应+间接效应,我们就需要使用CDE(2)作为因果效应的定义。但这一选择似乎过于武断了,显得有些不自然。如果我们考虑改变“学历”对“结果”的直接效应,那么我们就更希望“技能”保持其现有水平不变。换言之,此时使用CDE(0)作为直接效应的定义会更直观。不仅如此,这一定义还与本例中的自然直接效应是一致的。但是这样一来我们就违背了相加性原则:总效应≠直接效应+间接效应。

然而,令人惊奇的是,只需要对原来的相加性原则进行一次微调,我们就能重新让其在这个例子中成立,并且不仅在本例中,在一般的情况下我们也可以这样做。不介意做一些计算的读者可能会对计算从X=1转变为X=0时的NIE感兴趣。在这种情况下,“工资”从13降到7,“结果”从1降至0(求职者不接受此工作)。所以按照这一反方向(从X=1转变为X=0)来计算,NIE=–1。据此,我们可以推导出一个令人惊奇的公式:

总效应(X=0→X=1)=NDE(X=0→X=1)–NIE(X=1→X=0)

直接代入这个例子中的具体数值,就是1=0–(–1)。这就是相加性原则的“自然效应”版本,只不过它其实是一个相减性原则!我特别高兴能从分析中得到这个相加性原则的新版本,使其在我们的非线性函数中成立。

人们花费了大量笔墨阐述如何正确地根据线性模型的直接效应和间接效应的计算方法推导出非线性模型的直接效应和间接效应的计算方法。遗憾的是,试图解决这个问题的大多数文章都在拖后腿。研究者没有从头开始,重新思考我们所说的直接效应和间接效应,而是假设我们只需要微调线性模型下两者的定义即可。例如,在线性仙境中,我们看到两个路径系数的乘积可以得出间接效应。而一些研究者就据此试图用两个数量的乘积来定义间接效应,其中一个数量测量的是X对M的影响,另一个则反映M对Y的影响。这一计算方法也被称为“系数乘积法”。但我们也能看到,在线性仙境中,用总效应减直接效应可以得出间接效应。所以另一组同样敬业的研究者便据此将间接效应定义为两个量的差,其中一个测量的是总效应,另一个测量的是直接效应。这一计算方法也被称为“系数差异法”。

哪一个是对的?都不对!两组研究人员都混淆了步骤和意义。步骤是数学的,意义是因果的。事实上,深入挖掘这个问题你将发现:在线性模型之外,间接效应对回归分析来说就不再有意义了,其仅剩的意义就是代数步骤的结果(“路径系数的乘积”)。一旦撤走步骤本身,它们就会像一艘没有锚的小船一样随波逐流。

梅兰妮·沃尔,现在在哥伦比亚大学担任教职,之前常给生物统计学和公共健康学的学生上建模课。她也是我的书《因果论》的一位读者。在写给我的一封信中,她很好地描述了那种失落感。有一次,她像往常一样向她的学生解释如何通过直接路径系数的乘积来计算间接效应。突然,一个学生起身问她间接效应的含义是什么。“我像往常一样给出了我对这个问题的答案,间接效应是指X的变化通过它与中介物Z的关系对Y产生的影响。”沃尔如此写道。

但是这个学生很执着。他记得他的老师曾将直接效应解释为,保持中介物恒定后剩余的效应。于是他问:“那么,当我们解释一个间接效应的时候,我们保持恒定的变量是什么呢?”

沃尔不知道该说什么。“我不确定我现在就能给出一个让你满意的答案,”她说,“我之后再回复你好吗?”

这件事发生在2001年10月,仅仅4月后,我就在西雅图的人工智能大会上提交了一篇关于因果中介的论文。不用说,我当时显然十分急切地想用我最新获得的解决方案打动梅兰妮,我给她的回信是这么写的:“保持X恒定,并将M增加到X增加1个单位的情况下M所能达到的量,则我们所看到的Y的增量就是X对Y的间接效应。”

我不确定梅兰妮对我给出的答案是否满意,但她那刨根问底的学生启发了我开始认真地思考当代科学应当如何取得进步这一问题。在布莱洛克和邓肯第一次向社会学领域介绍路径分析的40年后,真正的变革终于发生了。这40年中的每一年都有大量关于直接效应和间接效应的著作和数以百计的研究论文公开出版或发表,其中有些标题充满矛盾,比如“基于回归的中介方法”。每代研究者都将那些当时为多数人所接受的共识传给了他们的下一代,此类共识包括间接效应仅仅是两种其他效应的乘积,或者是总效应与直接效应的差。没有人敢提出这个简单的问题:“但是,间接效应首先到底意味着什么?”就像“皇帝的新装”中那个小男孩一样,我们正需要一个刨根问底的学生,以勇气与天真粉碎我们对科学共识的盲目崇拜。

核心关键词不超过3个

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000