烟草：一种人为的流行病（2）

2020年7月10日　　来源：为什么：关于因果关系的新科学　作者：[美]朱迪亚·珀尔；[美]达纳·麦肯齐　提供人：kangtao76......

然而，像费舍尔和耶鲁沙米这样的怀疑论者是不会被就此说服的。前瞻性研究仍未能将吸烟者与其他各方面都相同的不吸烟者进行比较。事实上，这种比较是否可行值得怀疑。毕竟，吸烟是吸烟者的一种自我选择。在许多方面，他们都可能与不吸烟者有着基因或“体质”上的不同，比如有更多的冒险行为，更易饮酒过量等。其中一些行为同样可能会对健康造成不良影响，而这些不良影响可能被错误地归咎于吸烟。对于怀疑论者来说，这是一个特别便利的论据，因为体质假说几乎不可检验。直到2000年人类基因组测序工程开启之后，寻找与肺癌相关的基因才成为可能。（具有讽刺意味的是，费舍尔的主张被证明是正确的，尽管只是非常有限的正确：这种基因确实存在。）对于体质假说，杰尔姆·康菲尔德与亚伯·利连菲尔德于1959年共同发表了一篇论文，逐一驳斥了费舍尔的论据。在许多医生看来，这篇论文已经解决了问题。在美国国立卫生研究院工作的康菲尔德是吸烟与癌症之关系这场辩论的一名不寻常的参与者。他既不是统计学家，也不是生物学者，他大学时期主修历史，后来在美国农业部学习统计。自学成才的他最终成为一位备受欢迎的顾问，并担任了美国统计协会主席。他还是一个一天要抽两包半香烟的大烟鬼，但当他看到有关肺癌的数据时，他就戒烟了。（有趣的是，有关吸烟与癌症之关系的这场辩论与参与其中的科学家的个人生活息息相关。费舍尔从来没有丢开过他的烟斗，耶鲁沙米也不曾放弃自己的香烟。）

康菲尔德把目标直接对准了费舍尔的体质假说，并在费舍尔的领域——数学中阐述了他的驳斥。他认为，假设存在一个混杂因子，比如吸烟基因，它完全地解释了吸烟者患肺癌的风险。如果吸烟者患肺癌的风险为常人的9倍，那么在吸烟者中，这种混杂因子存在的概率也需要至少比常人高出9倍，如此才能解释这种患病风险的差异。让我们思考一下这意味着什么：如果有11%的不吸烟者携带“吸烟基因”，那么就至少有99%的吸烟者一定携带吸烟基因。而如果有12%的不吸烟者碰巧携带这种基因，那么从数学的角度看，“吸烟基因”就不可能完全解释吸烟和癌症之间的相关。对生物学家来说，这个被称为“康菲尔德不等式”（Cornfield’s inequality）的论证瓦解了费舍尔的体质假说。因为在现实中，我们很难想象基因方面的某个差异可以如此紧密地与某人选择吸烟这种复杂的、不可预知的行为和意愿联系在一起。

康菲尔德不等式实际上是因果论证的雏形：它提供了一种标准，让我们可以在因果图5.1（此种情况下，体质假说无法完全解释吸烟与肺癌之间的关联）和因果图5.2（此种情况下，吸烟基因的存在能充分解释我们观察到的关联）中做出裁定。

图5.1 反体质假说因果图

图5.2 体质假说因果图

如上文所述，吸烟与肺癌之间的关系极其紧密，因而不能用体质假说来解释。

事实上，康菲尔德的方法为一种名为“敏感度分析”的非常有效的分析方法的提出埋下了种子，后者对我们在导言中描述的由因果推断引擎得出的结论进行了补充。该分析方法的使用者不是通过假设模型中缺少某些因果关系而进行进一步的推断，而是对这些假设直接提出挑战，并评估在解释所观察到的数据时，新的假设所内含的相关性应该达到怎样的强度，之后对此定量结果进行似然性判断，就像假设在这些因果关系不存在的情况下进行的初步判断那样。不用说，如果我们想要对康菲尔德的方法进行推广，将其用于分析包含超过3个或4个变量的模型，那么我们就需要特定的算法和估算工具，而这些方法只有在图示工具的基础上才有可能被开发出来。

20世纪50年代的流行病学家面临的批评是，他们的证据“只是统计学证据”，其结论缺乏“实验室证据”的支持。但简单回顾一下医学史我们就能发现，这种说法并不可靠。如果将（只有）“实验室证据”（才有效）的标准应用于坏血病研究中，那么在20世纪30年代之前，水手们就会不可避免地接二连三地死亡，因为在发现维生素C之前，我们并没有关于食用柑橘类水果可以预防坏血病的“实验室证据”。此外，在20世纪50年代，一些有关吸烟影响的实验室证据已经开始出现在医学期刊上，包括身体被涂抹了香烟焦油的老鼠会患上癌症，以及香烟烟雾被证明含有苯并芘，后者是一种已知的致癌物。这些实验室证据增强了吸烟致癌假说的生物学合理性。

到了50年代末，大量此类证据的积累使该领域的几乎所有专家都开始相信吸烟确实会致癌。值得注意的是，甚至连烟草公司的研究人员也被说服了。但这一事实一直被隐藏得很深，直到20世纪90年代，越来越多的诉讼案件和行业内的揭发者的出现最终迫使烟草公司公开了数以千计的关于吸烟致癌研究的秘密文件，其中就包括1953年雷诺兹烟草公司的化学家克劳德·提格给该公司的高管写的一封信，信中指出烟草是“诱导原发性肺癌的重要致病因素”，这几乎是一字不落地重复了希尔和多尔的结论。

在公共场合，香烟公司则一直高唱反调。1954年1月，几家龙头烟草公司（包括雷诺兹烟草公司）在全国发行的报纸上发布了一篇题为“对吸烟者的坦诚声明”的文章。声明是这样说的：“我们相信我们的产品不会损害健康。我们一直并且将来也会一直与那些维护公共健康的人密切合作。”在1954年3月的一次演讲中，菲利普·莫里斯公司的副总裁乔治·韦斯曼说：“如果我们认为或者获知我们销售的产品对消费者有害，我们一定会立即停业关店。”60年过去了，我们仍在等待菲利普·莫里斯践行这一诺言。

烟草公司的这些公开声明揭开了关于吸烟与癌症之关系这场争论中最令人痛心的一幕：烟草公司在烟草对健康的危害方面蓄意欺骗公众。如果说大自然是一只难以掌握的精灵，但仍能实事求是地回答问题的话，那么我们可以想象一下，当科学家面对的是一个蓄意欺骗我们的对手时，其面临的挑战会有多大。这场关于香烟的战争是科学界首次遭遇有组织的对抗，对此谁都没有做好准备。烟草公司夸大了它们能找到的任何一点科学争议，还成立了自己的烟草工业研究委员会，向科学家提供资金，委托他们研究关于癌症或烟草的问题，但永远不去涉及真正的核心问题。烟草公司找到的科学家都是像费舍尔和雅各布·耶鲁沙米这样的吸烟致癌论怀疑者，他们会支付给这些研究者一笔咨询费供其发表文章。

在这件事上，费舍尔的做法尤其令人痛心。我并不否认，怀疑论在科学领域自有其重要意义。可以说，统计学家的工作就是质疑，他们是科学的良心。但是，合理的怀疑论与不合理的怀疑论是有区别的。费舍尔的做法则越过了这条底线。他一直不承认自己的错误，当然这也受到他长期吸烟的个人习惯的影响。他拒绝承认已有大量的证据驳斥了他的观点。他的论证变得越发极端。他在希尔和多尔的第一篇论文中发现了一个有违常理的结果，即根据肺癌患者中吸烟者的口述，其吸入的烟雾比对照组的少（但该差异几乎没有任何统计意义），继而紧抓不放。而事实上，在随后的研究中类似的结果再也没有出现过。虽然费舍尔和其他人一样知晓“统计显著”的结果有时无法重复，但他依然仅凭借这一点就对所有其他的研究结果嘲讽不已。他辩称，多尔和希尔的研究表明，吸入香烟烟雾可能反而是对身体有益的，并呼吁进一步研究这个“极其重要的结果”。对费舍尔在辩论中所扮演的角色，我们所能给出的唯一一项正面评价可能是，烟草公司的贿赂恐怕并没有对他造成什么影响，他自己的顽固性格就已经足够他做到这一切了。

尽管流行病学家早已对此问题达成了共识，但在此后很长一段时间里，鉴于上述这些原因，吸烟与癌症之关系在公众眼中仍然存在争议。即使是本该更积极地响应科学号召的医生们也心存疑虑：美国癌症协会在1960年进行的一项民意调查显示，美国只有1/3的医生认同吸烟是“肺癌的主要原因”，而43%的医生自己就是吸烟者。

虽然我们现在可以公正地批评费舍尔的顽固和烟草公司的蓄意欺骗，但也必须承认，当时的科学家一直是在一种僵化的思想框架下开展工作的。费舍尔提倡随机对照试验，并将其视为评估因果效应的一种高效的方法，这完全没错。然而，他和他的追随者没有意识到的是，我们从观察性研究中也可以学到很多东西。这就是因果模型的好处：它能够调用研究者业已掌握的科学知识来分析新问题。费舍尔的方法实际上是在假设研究者对所要测试的假设没有预先的知识或看法。他们把无知强加给科学家，而这正是吸烟致癌论怀疑者在这场争论中乐于利用的优势。

由于科学家不具备对“导致”这个词的明确定义，也无法在随机对照试验不适用的情况下确定因果效应，因此，对于吸烟是否会导致癌症的争论，他们的准备是不充分的。他们被迫摸索着寻找一个定义，这一寻找过程贯穿了整个20世纪50年代，并最终导向了一个于1964年提出的戏剧性的结论。

争论

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。