• 精选
  • 会员

辛普森悖论(2)

2020年7月10日  来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

毫无疑问,辛普森逆转令包括棒球迷在内的许多人感到吃惊不已。每年我都有一些学生在一开始不相信它的存在,但在弄懂了我在本书中所展示的那些例子后,他们就慢慢接受了它。了解辛普森逆转的原理不过是他们迈出对数字(尤其是聚合统计)运作方式的新的、更深层次的理解的第一步。我不认为辛普森逆转是一个悖论,因为它最多只是纠正了人们对“平均表现”的错误观念。而悖论的含义不止于此:它应该能够引起两种为绝大部分人深信不疑的信念之间的冲突。

对于那些每天都与数字打交道的专业统计学家来说,他们就更没有理由认为辛普森逆转是一个悖论了。一个简单的算术不等式不可能让他们如此困惑和着迷,以至于60年后还在撰写关于这个问题的文章。

现在让我们回到那个最重要的例子,BBG药物悖论。当“对男性有害”“对女性有害”“对人类有益”这三个陈述被理解为比例增减时,它们在数学上并不矛盾,我已经解释了其中的原因。然而,你可能仍然认为这种情况在现实世界中不可能出现,因为一种药物不可能既导致心脏病发作又防止心脏病发作。这种直觉是普遍的,我们在2岁左右就发展出了这种直觉,远远早于我们开始学习数字和分数的年龄。因此在接下来的讨论中,我猜当你发现自己不必放弃直觉的时候,你一定会觉得如释重负。BBG药物确实不存在,也永远不可能被发明出来,我们可以在数学上证明这一结论。

第一个注意到这一直观原则存在的人是统计学家伦纳德·萨维奇,他在1954年称其为“确凿性原则”(sure–thing principle)。他阐述道:

假设一位商人正在考虑购买某处房产。他认为下一届总统选举的结果与之有重大关系。因此,为了弄清楚这件事,他问自己,如果他知道民主党候选人将获胜,他是否愿意购买此处房产,他的答案是他会购买。同样,他又问自己,如果他知道共和党候选人将获胜,他是否愿意购买此处房产,他发现他仍然会选择购买。当得知无论竞选结果如何他都会选择购买之后,他便决定这处房产是一定要购买的,即使他不知道哪个事件会出现,或将要出现。在现实生活中,基于这个原则做决定的情况是非常少见的,但是……据我所知,没有哪一种其他的外在于逻辑的原则在支配决策这方面能比该原则更被我们如此心甘情愿地接受。

萨维奇的最后一句话特别有见地:他意识到“确凿性原则”是外在于逻辑的。实际上,正确的解释建立在因果逻辑之上,而非建立在经典逻辑之上。此外,“据他所知,没有哪一种……原则……被我们如此心甘情愿地接受”这句话意味着,很显然,他已经和很多人讨论过了,而这些人都认为这一推理过程很有说服力。

为了将萨维奇的确凿性原则与我们之前的讨论联系起来,我们假设这位商人实际上需要在两处房产A和B之间做出选择。如果民主党获胜,则该商人就有5%的概率在房产A上赚到1美元,有8%的概率在房产B上赚到1美元,所以此种情况下B是首选。如果共和党获胜,则他有30%的概率在房产A上赚到1美元,有40%的概率在房地产B上赚到1美元,此时B再次成为首选。根据确凿性原则,他绝对应该买房产B。但目光敏锐的读者可能会注意到,这些数值具有和辛普森逆转例子中的数据一样的特征,这一点提示我们,购买房产B可能是一个过于草率的决定。

事实上,购买房产B这一结论有明显的瑕疵。如果商人的购买决定可以改变选举的结果(比如借助媒体对其行为的曝光),那么购买房产A可能对他最有利。因为一旦选举结果公布,选错总统带来的危害可能会远远超过他从这笔交易中可能获得的经济收益。

为确保确凿性原则的有效性,我们必须坚持商人的购买决定不会影响选举结果。只要商人确信他的决定不会影响民主党或共和党获胜的可能性,他就可以继续购买房产B。否则,一切就另当别论了。

请注意,确凿性原则中缺失的成分(萨维奇对此未做明确说明)实际上是一个因果假设。该原则的正确版本应当这样表述:假设无论事件C是否发生,某个行动都会增加某一结果的可能性,则该行动也将在我们不知道C是否发生的情况下增加这个结果的可能性,条件是该行动不改变C的概率。换句话说,BBG药物这种东西是不存在的。这一修正版本的萨维奇确凿性原则不遵循经典逻辑:为了证明它,你需要进行引入了do算子的因果演算。我们认为BBG药物是不可能存在的这一强烈的直觉,表明人类(以及模仿人类思维的智能机器)也是利用类似do演算的方式来引导直觉的。

根据修正后的确凿性原则,下面三句陈述之一必定为假:药物D增加了男性患者和女性患者的心脏病发作的概率;药物D降低了整个总体的心脏病发作的概率;这种药物不会改变男性和女性的数量。因为药物改变病人性别的事不太可能发生,所以前两句陈述中一定有一句为假。

那么,哪句陈述是假的?在此处寻求表6.4的指导是徒劳的。要回答这个问题,我们必须在数据范围之外探寻数据生成的过程。一如既往,如果没有因果图,那么讨论这一数据生成过程就几乎是不可能的。

图6.4对性别不受药物影响这一关键信息进行了编码,此外,这张图也对性别对心脏病发作风险的影响(男性患者的风险更大),以及患者是否选择服用药物D这些信息进行了编码。在这项研究中,女性显然更倾向于服用药物D,而男性则相反。因此,性别就是是否服用药物和心脏病发作的混杂因子。为了客观估计药物对心脏病发作的影响,我们必须对混杂因子进行控制。我们可以通过单独查看男性和女性的数据然后取平均值来做到这一点。

图6.4 辛普森悖论示例的因果图

?对女性患者而言,未服用药物D者心脏病发作的概率为5%,服用药物D者心脏病发作的概率是7.5%。

?对男性患者而言,未服用药物D者心脏病发作的概率是30%,服用药物D者心脏病发作的概率是40%。

?取算术平均值(因为男性和女性在一般总体中比例接近1∶1),未服用药物D者心脏病发作的概率为17.5%(5和30的平均值),服用药物D者心脏病发作的概率为23.75%(7.5和40的平均值)。

这就是我们所寻找的对于这个问题的清晰、明确的答案。药物D不是BBG药物,它是BBB药物:对女性有害,对男性有害,对人类有害。

当然,我并不想让你从这个例子中得到这样的印象:聚合数据总是错误的,或者分割数据总是正确的。哪种做法更合适取决于数据的生成过程。在蒙提·霍尔悖论中,我们看到改变游戏规则就改变了结论。此处同样的原则也适用。接下来我将借助另一个不同的故事来演示何时适合汇总数据进行分析。在数据本身完全相同的前提下,如果“潜伏的第三变量”所扮演的角色发生了变化,则我们得到的结论也会因此而改变。

悖论

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000