• 精选
  • 会员

迷你图灵测试(3)

2020年7月10日  来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

不过,我们最好也不要过于得意于人类的优越性。在许多情境中,人类可能需要花费很大的努力才能找到那个正确的因果结论。例如,某些问题可能涉及更多的变量,并且它们很可能并非简单的二元(真/假)变量。在日常生活中,我们更想预测的可能是如果政府提高最低工资标准,则社会失业率会上升多少,而不是预测犯人的死活。这种定量的因果推理通常超出了我们的直觉范畴。此外,在行刑队的例子中,我们实际上还排除了很多不确定因素,比如,也许行刑队队长在士兵A决定开枪后的瞬间下达了命令,或者士兵B的枪卡住了,等等。为了处理不确定因素,我们就需要掌握有关此类异常事件发生可能性的信息。

下面的例子就证明了概率的重要性。这个案例涉及欧洲首次引进天花疫苗所引发的大规模公开辩论。出人意料的是,数据显示有更多的人死于天花疫苗,而非死于天花。有些人理所当然地利用这些信息辩称,应该禁止人们接种疫苗,而不顾疫苗实际上根除了天花,挽救了许多生命的事实。为阐明疫苗的效果,解决争端,让我们来看一组虚拟数据。

假设100万儿童中有99%接种了疫苗,1%没有接种。对于接种了疫苗的儿童来说,一方面,他有1%的可能性出现不良反应,这种不良反应有1%的可能性导致儿童死亡。另一方面,这些接种了疫苗的儿童不可能得天花。相对的,对于一个未接种疫苗的儿童来说,他显然不可能产生接种后的不良反应,但他有2%的概率得天花。最后,让我们假设天花的致死率是20%。

看到这组虚拟数据,我想你很可能会赞同疫苗接种。因为接种后出现不良反应的概率要低于得天花的概率,而天花比接种不良反应更危险。但现在让我们仔细分析一下数据。按照假设,在100万个孩子中,99万人接种了疫苗,其中有9900人出现了接种后的不良反应,这之中有99人因此死亡。与此同时,那1万个没有接种疫苗的孩子中,有200人得了天花,其中的40人死于天花。这样一来,死于疫苗接种不良反应的儿童(99人)就多于死于天花的儿童(40人)了。

因此,对那些举着“疫苗杀人!”的标语,向卫生部游行示威的家长,我表示充分地理解。数据似乎恰恰支持了他们的观点——接种疫苗确实会造成比天花本身更多的死亡。但逻辑是否也站在他们那一边呢?我们应该禁止接种疫苗还是应该把疫苗挽救的生命也考虑在内?图1.7展示了此例的因果图。

图1.7 疫苗接种示例的因果图。疫苗接种是有益还是有害?

在刚刚的假设中,我们提到过疫苗接种率是99%。现在让我们问一个反事实问题:“假如我们把疫苗接种率设为零会怎样?”利用上述虚拟数据中给出的概率,你可以得出如下结论:100万孩子中2万人会得天花,4000人会死亡。将反事实世界与现实世界进行比较,我们就可以得出真正的结论:不接种疫苗会导致我们多付出3861(4000与139之差)个儿童的生命的代价。在此,我们应该感谢反事实的语言?[3]??让我们避免了付出如此惨重的代价。

对学习因果论的学生来说,他们能从这个例子中学到的最重要的知识是:构建因果模型不仅仅是画箭头,箭头背后还隐藏着概率。当我们绘制一个从X指向Y的箭头时,我们是在暗指,某些概率规则或函数具体说明了“如果X发生改变,Y将如何变化”。我们在某些情况下可能知道这个规则具体是什么,而在大多数情况下,我们不得不根据数据对这个规则进行估计。不过,因果革命最有趣的特点之一就是,在许多情况下,我们可以对这些完全不确定的数学细节置之不理。通常情况下,因果图自身的结构就足够让我们推测出各种因果关系和反事实关系:简单的或复杂的、确定的或概率的、线性的或非线性的。

从计算的角度来看,我们设计出的这种让机器通过迷你图灵测试的方案也很出色。在所有三个例子中,我们都使用了相同的程序:将故事转化成因果图,解读问题,执行与既定问题(干预问题或反事实问题)相对应的“手术”(如果问题是关联类的,则不需要进行任何“手术”),并使用修改后的因果模型计算答案。并且,每次改变故事的时候,我们也不必根据各种新的问题重新训练机器。这一方法具有足够的灵活性,只要我们能绘制出因果图,我们就能解决问题,无论这个问题是关乎长毛象狩猎、行刑队执行枪决还是关乎疫苗接种。这正是我们希望因果推断引擎具备的特性:一种为人类所独享的灵活性。

当然,因果图本身没有什么内在的魔力。它之所以如此好用,是因为它承载了因果信息,即在构建因果图时,我们会问“谁能直接导致犯人死亡”或者“接种疫苗的直接效应是什么”这些问题。如果我们仅仅通过提出关联问题来构建因果图,它就不会为我们提供这些问题的答案了。如图1.7所示,如果我们逆转“疫苗接种→天花”中的箭头,我们同样可以获得两组数据的关联,但同时我们会错误地断定罹患天花与否本身会影响某人是否进行疫苗接种。

针对这类问题几十年的研究经验使我确信,无论是在认知意义上还是在哲学意义上,因果观都比概率观更重要。在理解语言和任何数学运算之前,我们就开始学习因果知识了。(研究表明,三岁大的儿童已经能够理解整个因果关系之梯的图示。)同样,因果图所蕴含的知识通常比由概率分布编码的知识具有更强大的应用潜能。例如,假设随着时代改变,出现了一种更安全、更有效的疫苗。同时,由于卫生条件和社会经济条件的改善,人们感染天花的危险也减少了。这些变化将对前文提到的例子中的绝大部分变量的概率产生极大的影响;但显然,原有的因果图结构仍将保持不变。这正是构建因果模型的关键秘诀。此外,一旦我们完成了之前的分析工作,并从数据中找到了估算疫苗接种能带来多大益处的方法,我们就不必在条件改变时从头开始重复整个分析过程。如导言所述,同样的被估量(也就是回答相应问题的方法)将一直有效,并且只要因果图不变,该被估量就可以应用于新数据,并为特定问题生成新的估计值。我猜想,正是由于具备这种稳健性,人类的直觉才以因果关系而非统计关系为组织的核心。

因果关系

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000