1902年,香烟仅占美国烟草市场的2%,且烟草消费最普遍的标志在当时还是痰盂而不是烟灰缸。但是两股强大的力量一起改变了美国人的习惯:自动化和广告。由于实用性强和成本低廉,机器制造的香烟轻松战胜了手工制作的雪茄和烟斗。与此同时,烟草业开创并完善了许多广告销售技巧(见图5.1)。20世纪60年代的电视观众可以很容易地记住那些朗朗上口的香烟广告,不管是“你会钟情万宝路”,还是“宝贝,你已走过漫漫长路”。
图5.1 精心制作的广告意在让公众安下心来,相信香烟对他们的健康没有害处。图中显示的就是一则刊登在1948年《美国医学协会杂志》上针对医生所做的广告,其中显示香烟有提神醒脑之效,是医生治病救人的必备用品(资料来源:来自斯坦福大学关于烟草广告影响的研究论文集)
到1952年,烟草市场的香烟份额已从2%飙升至81%,烟草市场本身也在急剧扩大。美国人民消费习惯的重大改变给公共卫生带来了意想不到的影响。早在20世纪早期,人们就开始怀疑吸烟有害健康,会引发咽炎和咳嗽。而到了20世纪中叶,负面性的证据越来越多。在香烟出现之前,肺癌是一种十分罕见的疾病,医生从业一辈子可能只会遇到一例。但是在1900年到1950年间,这种曾经的罕见疾病的发病率翻了两番。到1960年,肺癌已成为男性群体中最常见的癌症。一种致死疾病的发病率发生了如此巨大的变化,这迫切需要专业人士做出解释。
事后看来,这一灾难性的变化显然应该归咎于吸烟。如果我们用图示表示出肺癌和烟草消费的比例关系(见图5.2),二者的关联就是不言而喻的。但时间序列数据对于因果关系的证明是一种非常糟糕的证据。1900年到1950年,许多其他的事情也发生了变化,它们同样有可能是罪魁祸首,比如道路铺设、含铅汽油尾气排放以及普遍的空气污染。英国流行病学家理查德·多尔在1991年说:“汽车的普及就是一个新因素,如果我必须在当时所有那些因素中挑出一个真正的致癌物的话,我肯定会把赌注下在汽车尾气或者用于铺设公路的柏油上。”
图5.2 美国人均香烟消费量(黑色曲线)和肺癌及支气管癌死亡率(灰色曲线)的变化趋势显示出了惊人的相似:癌症死亡率曲线比香烟消费量曲线延迟了大约30年,其形状几乎是后者的复制。然而,这种证据是间接的,不能证明因果关系。图中还标出了一些关键日期,包括理查德·多尔和奥斯汀·布莱德福·希尔1950年发表的论文,这篇论文首次面向医学专家揭示了吸烟与肺癌之间的联系(资料来源:马雅·哈雷尔绘图,数据来自美国癌症协会、疾病控制中心和卫生局局长办公室)
科学的工作是把假设放在一边,研究事实。1948年,多尔和希尔进行了研究合作,共同探索癌症流行的原因。希尔作为首席统计学家,在当年的早些时候发表了一项非常成功的随机对照试验。试验证明,链霉素(最早的抗生素之一)对结核病有效。这一发现是医学史上的一个里程碑,它不仅为医学界带来了一种“特效药”,而且提高了随机对照试验的声誉,使其很快成为流行病学临床研究的标准范式。
希尔当然知道,在对吸烟是否致癌这一问题的研究上,随机对照试验是不适用的,但是他已经认识到了对比处理组和对照组这一方法的优势所在。因此,他建议将已经被诊断为癌症的病人与由健康志愿者组成的对照组进行比较,采访每一组的成员,了解他们过去的行为和病史。为避免偏倚,他没有告知采访者其采访对象是处理组的癌症患者还是对照组的健康志愿者。
研究结果令人震惊。在649名接受采访的肺癌患者中,除两人外其余均为吸烟者。这一结果在统计学上与随机水平相去甚远,是一件极不可能发生之事。多尔和希尔情不自禁地计算出了该结果的精确度:1500000∶1。此外,平均而言,肺癌患者的吸烟量也比对照组成员的吸烟量更大,但采访也显示,肺癌患者吸入烟雾的比例相对较小(注意,在之后的辩论中,费舍尔就抓住这一结果中的矛盾进行了激烈的攻击)。
多尔和希尔将“病例”(患有疾病的人)与对照组进行了比较,因此这种研究类型现在也被称为“病例—对照研究”(case-control study)。相对于时间序列数据而言,借助这种方法搜集数据显然是一种进步,因为研究人员可以控制包括年龄、性别和所接触的环境污染物等混杂因子。然而,病例—对照设计也存在一些明显的弊端。首先,它是回顾性的,这意味着我们已知研究对象患有癌症,在此前提下我们要回顾过去找出原因。其次,它的概率逻辑也是反向的,这些数据告诉我们的是癌症患者是吸烟者的概率,而不是吸烟者患癌症的概率。对于那些想知道是否应该吸烟的人,吸烟者患癌症的概率才是他们真正关心的概率。
此外,病例—对照研究承认存在几种可能的偏倚来源。其中之一被称为“回忆偏倚”:虽然多尔和希尔确保了采访者不知道其采访对象是否患有癌症,但被采访者本人肯定知道他们自己是否患有癌症,而这一事实很可能会影响他们的回忆。另一个来源是选择偏倚:已入院就医的癌症患者绝不是整个人口总体的代表性样本,甚至不能作为吸烟者总体的代表性样本。
简而言之,多尔和希尔的结果非常具有启发性,但仍然不能被当作吸烟致癌的有力证据。这两位研究人员起初很谨慎地将这种相关性称为“关联”。在去除了几个混杂因子后,他们大胆地提出了一个更有力的观点:“吸烟是肺癌形成的一个因素,一个非常重要的因素。”
接下来的几年里,在不同国家进行的19个病例—对照研究基本上都得出了类似的结论。但正如费舍尔毫不在意地指出的那样,一项有偏倚的研究重复19次也不能证明任何事情,它仍有偏倚。费舍尔在1957年写道,这些研究“仅仅是同类证据的重复,因此,我们有必要尝试检验一下这种研究方法是否足以得出任何科学结论”。
多尔和希尔意识到,如果病例—对照研究中的确存在隐藏的偏倚,那么仅仅靠重复研究肯定是无法消除偏倚的。因此,他们于1951年开始了一项前瞻性研究,向6万名英国医生发放调查问卷,采集关于其吸烟习惯的信息,并对他们进行追踪调查。(美国癌症协会也在同一时间发起了一项类似的、规模更大的研究。)在短短的5年里,一些戏剧性的差异就出现了。在接受了追踪调查的医生中,重度吸烟者患肺癌死亡的概率是不吸烟者的24倍。在美国癌症协会发表的研究结果中,情况甚至更加严峻:一方面,吸烟者死于肺癌的概率是不吸烟者的29倍,而重度吸烟者死于肺癌的概率更是不吸烟者的90倍。另一方面,曾经吸烟,然后戒烟的那些人,其患病风险降低了一半。所有这些结果都表明了一个一致的结论:吸烟越多,患肺癌的风险就越高,而戒烟能降低这种风险。这是一个强有力的因果证据。医生们称此类结论为“剂量—响应效应”(dose-response effect):如果物质A会导致生物反应B,则通常而言(但不是百分之百),更大剂量的A会导致更强的反应B。