可惜,在伯克斯超越时代的论文发表后的半个世纪,统计学家依然停留在试图阐述直接效应和间接效应的定义这一阶段,更不用说估计它们了。此处,我们有一个特别恰当的例子,这也是一个著名的悖论,与辛普森悖论有关,但又有所不同。
1973年,加州大学副院长尤金·汉默尔注意到大学的男女生入学率呈现出一种令人担忧的趋势。他的数据显示,在申请伯克利大学研究生的男生中,有44%的人被录取了,相比之下,女生申请者只有35%被录取了。性别歧视在当时正引起公众的广泛关注,汉默尔不想等别人来质疑才行动。他决定调查这一比例差距的原因。
和其他大学一样,伯克利大学的研究生入学决定是由各个系而不是由大学做出的。因此,通过挨个查看各个系的招生数据找出罪魁祸首的做法是合理的。但当汉默尔这样做时,他发现了一个惊人的事实。每个系的招生决定都更有利于女生,而不是男生。怎么会这样呢?
对此,汉默尔做了一个明智的决定,找来统计学家彼得·毕克尔帮忙,而彼得在查看数据时立刻认出了辛普森悖论。正如我们在第六章看到的,辛普森悖论指的是一种趋势,它似乎在总体的每一层中都趋于一个方向(在每个系里,女生的录取率都更高),但在整个总体中却趋于一个完全相反的方向(在整个大学里,男生的录取率更高)。我们在第六章还看到,悖论的正确解决在很大程度上取决于你要回答的问题是什么。在这个案例中,我们要回答的问题很明确的:大学(或大学内的某些人)是否歧视女生?
当我第一次向我的妻子介绍这个例子时,她的反应是:“这不可能。如果每个系都存在对某一性别的歧视,那么整个学校就不可能出现对另一种性别的歧视。”她是对的!这一悖论与我们对歧视的理解相抵触。歧视是一个因果概念,涉及对申请者所上报性别的偏好响应。如果所有的行为者都更偏好某个性别,那么整个群体就必然表现出相同的倾向。而如果数据看起来并非如此,那必然意味着我们没有遵循因果关系的逻辑合理地处理数据。唯有理顺因果逻辑,并给出一个清晰的因果叙述,我们才能确定某所大学是否确实存在性别歧视。
事实上,毕克尔和汉默尔发现了一个令他们自己非常满意的因果叙述。他们在1975年的《科学》杂志上发表了一篇文章,其中提出了一个对这一悖论的简单解释:女生申请者被拒绝的人数更多,是因为她们倾向于申请更难被录取的系。
具体而言,一方面,在人文科学和社会科学系的申请中,女性申请者所占比例要高于男性,而在这些院系中,她们面临着双重困境:申请者数量更多,而录取名额更少。另一方面,女生不怎么申请像机械工程学这样的系,但这些系本身录取的学生更多,且系里为研究生提供了更多的资金和空间,简而言之,这些系的录取率更高。
那么,为什么女性会倾向于申请更难录取的系?她们没有选择申请技术性领域的院系,也许是因为那些领域对数学水平的要求较高,或被认为更“男性化”。也许是因为她们在教育的早期阶段遭到了歧视,就像巴巴拉·伯克斯的故事所显示的那样,社会往往倾向于将女性从技术性领域排挤出去。但这些因素并不在伯克利大学的控制之中,因此不能视作大学存在性别歧视的证据。毕克尔和汉默尔的结论是:“伯克利大学并没有歧视女性申请者。”
顺便一提,我注意到了毕克尔这篇论文中所使用的描述语言的精确性。他仔细地区分了两个术语——“偏倚”和“歧视”,这两个术语在日常英语中经常被看作一对同义词。一方面,他将偏倚定义为“某一决定与申请人的某个性别之间的关联模式”。注意其中的“模式”和“关联”这两个词,这两个词告诉我们,偏倚是一种现象,处于因果关系之梯的第一层级。另一方面,他将歧视定义为“在性别与入学资格无关的情况下,受到申请人性别的影响而做出的决定”。即使毕克尔在1975年无法说出“因果关系”这个词,“做出决定”“影响”“无关”这些字眼也足以使人联想到因果关系。歧视不同于偏倚,它属于因果关系之梯的第二层级或第三层级。
在毕克尔的分析中,他认为数据应按院系分层,因为院系是决策单位。这是正确的选择吗?为了回答这个问题,我们首先需要绘制一张因果图(见图9.4)。此外,研究一下《美国判例汇编》中关于歧视的定义也很有启发。这一定义采用了反事实的术语,是我们已经攀升到因果关系之梯第三层级的一个明确信号。在卡尔森诉伯利恒钢铁公司案(1996)中,第七巡回法院在判决词中写道:“任何就业歧视案件的中心问题都是,假如雇员除属于不同的种族(或有不同的年龄、性别、宗教、出身国等)外,在其他的一切方面都一样,那么雇主是否会采取同样的行动。”这个定义清楚地表达了这样一种观点:我们必须先关闭或“冻结”所有以其他变量(如录取资格、院系选择等)为介导的从性别到录取的因果路径。换言之,歧视是性别对录取结果的直接效应。
图9.4 伯克利大学录取悖论例子的因果图(简化版)
我们之前已经认识到,想估计一个变量对另一变量的总效应,控制中介物的做法是不正确的。但是就歧视这个例子来说,根据法院的定义,真正重要的不是总效应,而是直接效应。因此毕克尔和汉默尔的做法被证实是正确的:在图9.4所呈现的假设下,他们按院系划分数据是对的,这一操作的结果带来了关于“性别”对“录取结果”的直接效应的有效估计。尽管1973年毕克尔和汉默尔无法使用直接效应和间接效应这样的词语,但他们仍然取得了成功。
然而,这个故事最有趣的部分不是毕克尔和汉默尔发表的论文本身,而是这篇论文所引发的讨论。论文发表后,芝加哥大学的威廉·克鲁斯卡尔写了一封信给毕克尔,指出他们的解释并没有真正证明伯克利大学的清白。事实上,克鲁斯卡尔本质上是在质疑我们是否可以从任何纯粹的观察性研究(而不是进行某种随机对照试验,比如利用伪造的入学申请表考察录取情况)中得到这样的结论。