依据传统,与归纳概括有关的两种错误被称为“仓促概括”和“以偏概全”。仓促概括通常被描述为基于太小的样本所做的概括推理。但就像我们在表10-1中看到的一样,如果在较大的误差幅度或较低的置信水平的条件下,基于小样本推理并没有错。所以,我们要把仓促概括(hasty generalization)的谬误界定为过高地估计了基于小样本的论证的强度。过高地估计是从明示或暗示的置信水平或误差幅度中体现出来的。“这只比特咬人,所以,所有的比特都咬人”是仓促概括的实例,不是因为它的样本小(n=1),而是因为结论中的“所有”表明其误差为零,与之对照,“这只比特咬人,所以,有的比特咬人”就不是仓促概括,因为结论中的“有的”表达了一个较大的误差幅度。
值得一提的是仓促概括的一种类型,即传闻证据(anecdotal evidence)的谬误。传闻就是听说的事,统计工作者和科学家都不采纳“只是传闻”的证据。若概括基于的样本只是传闻,就是仓促概括中的传闻证据谬误。如:“这些报道都说比特小气,实际上根本不是。你该看看哈利,他和小狗们一起时甚至让小狗吃光了他的食物。”像这个例子一样,基于传闻的概括往往用来反驳一般陈述(这个例子中的一般陈述是:比特都小气)。但从根本上说,这只是在多样化的总体中选取了n=1,如果过高地估计了该论证的强度(该例中的说话者就是这样),就犯了传闻证据的谬误。
基于小样本的概括需要较宽的误差范围或较低的置信水平,但这并不意味着基于大样本的概括就当然可以具有较窄的误差范围或较高的置信水平。我们把不具代表性的样本叫做片面的样本,把过高地估计基于片面样本的论证的强度的谬误叫做以偏概全的谬误(fallacy of biased generalizing)。如:针对CNN著名主持人卢·多布斯提出的特定问题,某晚可能有1 000个人在线发表了看法。我们已经提到过,职业民意调查的样本人数通常也是这么多。但作为公众意见的样本,多布斯的“样本”难免有偏差,并不是因为发表意见的人有偏差的,而是就作为样本而言,在线回答问题的人并没有表现出我们关注的相关特征的代表性。如果有人提出:该晚卢·多布斯的民意调查说明,大多数美国人希望约翰·爱德华兹当选为总统,由于不知道被调查的人代表的类型,这个人就犯了以偏概全的谬误。假如这个人只是说:多布斯的调查显示,或许多数美国人希望约翰·爱德华兹当选为总统,那他所说的就不构成谬误。
除非目标总体缺乏多样性因而允许小样本,否则大多数太小的样本都是片面的。尽管如此,对于过高地估计了基于小样本的论证强度的,我们称做“仓促概括”,对于过高地估计基于有偏差的较大样本的论证强度的,我们称做“以偏概全”。
人们也会过高地估计基于类比的论证的强度,这种错误也是通过表达“置信水平”或“误差幅度”体现出来的。如“我以前养过的比特不咬人,所以,这只也不会咬人”,前提只列出了两只狗之间的一个相似点:都是比特;结论却表达了这个相似性所无法合理证明的绝对判断。说话者过高地估计了基于类比的论证的强度。
上述错误的确切名称为过高地估计类比的强度(overestimating the strength of an analogy)。假如说的是“我以前养的比特不咬人,所以,这只或许也不咬人”,这依然是一个类比,但不是谬误,因为这里有较低的置信水平的提示词。
人们往往用“弱的”(或“假的”)类比来表达如下的意思:综合考虑各种因素,类比项之间的差异太多,以致于很难通过类比来得出结论。
不恰当的归纳换位
很小比例的狗是水獭猎犬,由此能推出很小比例的水獭猎犬是狗吗?没有人会持这种看法。从大多数哈佛学生是聪明的当然推不出大多数聪明人都是哈佛学生。从大多数X是Y,推不出大多数Y是X;从少数X是Y,也推不出少数Y是X。有下述形式的论证是不恰当的归纳换位(illicit inductive coversion):
空白处填百分比或比例或其他表达误差幅度的词语,如:大多数、几乎所有、过半、少数、不多、仅有少数等。
容易混淆的是,在演绎逻辑中,“有的X是Y,所以,有的Y是X”是有效的论证。但你可以断定的是:“大多数恐怖分子都来自中东,所以,大多数来自中东的人都是恐怖分子”是无效的(如果“大多数”指的是超过50%)。
归纳换位虽然是不恰当的,但这样换位能诱惑人。“少数民主党派住在郊外,所以,少数住在郊外的人是民主党派”这个论证听起来似乎有道理。第一个陈述无疑是真的,也有报道说第二个陈述是真的。但即使第二个陈述是真的,其真也不是从第一个陈述中推出来的。把这个论证中命题的顺序颠倒一下听起来似乎更有诱惑力:“少数住在郊外的人是民主党派,所以,少数民主党派住在郊外”,这两个命题都可能是真的,可是第二个命题不能从第一个中推出来。
听说较小比例的交通事故发生在70岁以上的司机身上后,或许你会不假思索地想到70岁以上的人驾驶相对安全。这么想的错误根源在于“较小比例的交通事故关涉70岁以上的司机,所以,70岁以上的司机较小比例地发生交通事故”,这是不恰当的归纳换位。较小比例的交通事故关涉70岁以上的司机的原因在于70岁以上司机的“基础比率”较低:70岁以上年纪的人很少在路上驾驶。而这个年纪的驾驶者中涉及交通事故的比例很可能相对较高。
当一个人在体检后发现他的某项指标呈阳性后往往会犯这种错误。医学检查的准确率为90%,通常意味患有某种病症的人中90%在检查中呈阳性,但并不意味90%的检查呈阳性的人患有该病症。假如你在一个准确率为90%的检查中发现自己的膀胱癌指标呈阳性,并不能由此推出你患膀胱癌的可能性是90%。你实际上患有膀胱癌的可能性决定于患这种病的“基础比率”和体检为阳性的人中多大比例的人没患此病。我们将在第11章深入讨论这个话题。