你还记得你的家庭医生第一次和你谈论“好”胆固醇和“坏”胆固醇是什么时候的事吗?这件事很可能发生在20世纪90年代,当时,一种能降低血液中“坏”胆固醇(低密度脂蛋白,LDL)水平的药物首次面市。这类被称为“他汀类药物”的药品迅速变成了为制药公司带来巨额盈利的印钞机。
第一种进入临床试验阶段的降胆固醇药物是消胆胺(考来烯胺)。这项开始于1973年结束于1984年的冠心病初步预防临床试验显示,由于服用了消胆胺药物,男性受试者的胆固醇水平平均下降了12.6%,其心脏病发作的风险平均降低了19%。
由于临床试验是一种随机对照试验,你可能认为我们不需要使用本章中的任何方法就能估计出其中的因果效应,因为这些方法是专门为在只有观察性数据可用的情况下,用观察结果替换随机对照试验数据设计的。但事实并非如此。这项试验和许多随机对照试验一样,存在着“未履行问题”(problem of noncompliance),即受试者虽然随机地接受了药物安排,但实际上并没有服用被分配的药物。这一问题的存在将降低药物效果的表现水平,所以考虑到存在这些“未履行者”,我们仍然需要对结果进行统计调整。同以往一样,混杂再次登场了。如果未履行者在某些相关的方面有别于履行者(比如他们可能从一开始身体状况就更差),那么我们就无法预测如果他们遵从研究者的指示会如何。
针对这种情况,我们绘制出了如图7.11所示的因果图。如果病人被随机分配了药物,则变量“药物分配”(Z)取数值1,如果病人被随机分配了安慰剂,则该变量取数值0。如果病人真的服用了该药物,则变量“药物服用”的数值取1,反之取0。最后,为方便起见,我们将“胆固醇水平”(Y)设定为一个二元变量,即如果胆固醇水平降至某个临界值以下,则取值1,反之则取值0。
图7.11 存在未履行问题的临床试验的因果图
注意,在这个例子中,我们的变量都是二元变量,而不是数值变量。这显然意味着我们不能使用线性模型,因此我们在前面推导出的工具变量公式也不适用。不过,在这种情况下,我们通常可以用一种被称为“单调性”(monotonicity)的弱相关来代替线性假设,下面我将对此进行具体解释。
但在这么做之前,我们必须先确保工具变量的其他必要假设都是有效的。第一,工具变量Z独立于混杂因子吗?Z的随机化确保了这一问题的答案是肯定的。(正如我们在第四章看到的,随机化是确保变量不受任何混杂因子影响的好方法。)第二,从Z到Y有直接路径吗?常识告诉我们,接受一个特定的随机处理(Z)不可能直接影响人体的胆固醇水平(Y),所以这个问题的答案是“没有”。第三,Z和X之间是否存在强关联?我们应该借助数据来回答这个问题,而数据显示,答案是肯定的。记住,每次使用工具变量之前,我们都必须先回答出上述三个问题。在这个例子中,答案显而易见,但我们不应该因此就无视这一重要事实,即我们正在使用因果直觉来回答问题,而因果图捕捉、保存并阐明了这种直觉。
表7.1显示了X和Y的观测频率。例如,未被分配药物的病人中有91.9%的人为X=0(没有服药)且Y=0(胆固醇水平未降低至临界值)。这是一个很合理的结果。而该组中另外8.1%的人为X=0(没有服药)且Y=1(胆固醇水平降至临界值)。显然,他们体内的胆固醇水平下降是出于其他原因而非服用药物。同时还要注意表中有两个0:没有人没被分配药物(Z=0)却服用了药物(X=1)。在运行良好的随机化研究中,这种情况一般而言是真实的,特别是在医学领域,通常医生都有其独有的渠道获得试验药物,这就限定了受试者只能从医生那里得到药物或治疗。而没有人符合Z=0且X=1这一假设就被称为单调性。
现在让我们来看看如何估计治疗效果。首先,让我们来看最坏的情况:所有的未履行者即便遵从指令吃了药其身体状况也不会得到改善。在这种情况下,我们需要的概率是那些的确遵从指令吃了药(Z=1,X=1)并且胆固醇水平的确有所下降(Y=1)的病人,这部分人占被分配药物组的47.3%。但考虑到安慰剂效应,我们需要对这一估计结果进行调整。在被分配安慰剂并服用了安慰剂的人中,有8.1%的人其体内胆固醇水平有所下降。因此,在这种最坏的情况中,排除安慰剂效应的净药物效果就是47.3%减去8.1%,为39.2%。
表7.1 消胆胺临床试验的数据
那么最好的情况又是怎样的呢?所谓最好的情况是指,所有的未履行者倘若遵从指令吃了药,则他们的身体状况都会得到改善。在这种情况下,我们需要在刚刚算出的基线水平39.2%上加上未履行者(Z=1,X=0)的31.5%和7.3%,总计78.0%,即为此种情况下的药物效果。
因此,即使在最坏的情况下,即混杂的作用与药物的作用方向完全相反,我们仍然可以说药物有效降低了39%的受试者的胆固醇水平。而在最好的情况下,混杂的作用与药物的作用方向一致,则我们就有78%的受试者状况会得到改善。尽管由于存在大量的未履行者,这一置信区间相当大,但研究者还是可以明确地得出结论,即药物是有效的,可以达到预期目标。
取最坏和最好情况的做法通常会让我们得到一个估计结果的取值范围。当然,就像我们在线性情况下做的那样,得到一个点估计肯定是更理想的。若有必要,我们也可以使用一些缩小取值范围的方法,在某些特定的情况下,我们甚至可以借此得到点估计。例如,如果你只对履行者这个子总体(那些被分配了药物并确定服用了药物的人)感兴趣,那么我们就可以推导出一个被称为“局部平均处理效应”(Local Average Treatment Effect,简称为LATE)的点估计。不管怎样,我希望用这个例子表明,离开线性模型的世界,我们也并非束手无策。