• 精选
  • 会员

10.2 从特殊到一般的论证(基于样本的归纳概括)

2025年1月22日  来源:批判性思维(原书第10版) 作者:摩尔(Moore,B.N.) 提供人:yehe60......

通过样本进行归纳概括遍布于我们的日常生活。汤的味道怎样?咖啡是否太浓?为了回答这些问题我们往往要尝一口。在超市决定是否买葡萄时,我们往往要在没人注意时尝一下味道。本校大学生是否需要新的娱乐中心?我们往往借助于民意测验来得出结论。

统计学家将任意可识别的事物群体称为总体,类似于第8章所讲的范畴。若需要将一壶咖啡视为总体,就可以将其视为每一小口咖啡所构成的总体。总体各具特征:不仅仅表现在总体可大可小,有些总体如“本年度纽约市的犯罪”包罗万象,也有的总体如“一壶咖啡中的每一口”之间就不会如此各具特征。

对于我们感兴趣的总体,经验往往是我们推测其属性的指南针。本校的员工停车场有很多丰田普锐斯车,是否意味着大学教授这个群体更喜欢普锐斯?除了本校员工还有很多大学教授,为了科学地回答这个问题,就不能只关注在本校员工停车场停车的人,这些教授未必具有典型性。科学地回答问题需要更好的样本。

这时候批判性思维就要发挥作用了。哪些人可以被称为“大学教授”?依据什么确定一个人“喜欢普锐斯”?回答这些问题就意味着在设计抽样框。抽样框是对总体的精确定义,也体现了我们所关心的总体所具有的属性。基于这个定义,我们就可以识别任一个体是否属于总体,也可以识别某个体是否具有我们关心的属性。为了回答上例中的问题,抽样框可以是当前美国大学教授协会(AAUP)的会员和登记的普锐斯车主。对于问题“多大比例的大学教授喜欢普锐斯”,这个抽样框就能澄清其模糊性。

从抽样框中选取并检验样本,理想的样本应该准确地代表总体。能准确代表总体的样本或者说具有代表性样本(representative sample)是指,对于与我们关心的属性相关的变量而言,样本与总体的情况相同。例如,驾驶的车型与车主的收入相关,抽样框中高收入教授在大学教授中的比例应该与总体中高收入教授在大学教授中的比例相同。如果针对某变量而言,样本的比例与总体的比例不同,那么相对于这个变量而言,样本对于总体是有偏差的。

由于缺乏关于所有重要变量的信息,例如,我们不知道究竟多少比例的大学教授具有给定的收入水平,选取样本的程序就要使得总体中的每个成员都有同等机会进入样本。通过这种方法选取样本叫做随机抽样(random sample)。但即使随机抽样也不能完全杜绝选取的样本免于偏差,因为变量出现的情形会在样本间随机变异。样本间随机变异的范围被称为样本的误差幅度(error margin)。样本足够大,随机变异越会落在给定的范围,或者说,样本越大,样本的误差幅度越小。特定的样本中随机变异落在给定误差幅度内的概率大小称为置信水平(confidence level)。

这些看起来似乎令人费解,让我们通过例子说明问题。假定实际情形是,20%的美国大学教授协会的成员拥有普锐斯,我们从美国大学教授协会成员中随机选取了1000个样本,样本中的成员拥有普锐斯的比例会随机变异。变异的极限是什么呢?在这个大小的样本中,有95%的概率随机变异落在实际比例(20%)的正负3个百分点以内。换句话说,在1000个随机样本中,置信水平为95%,误差幅度为正负3个百分点,这意味着,在随机抽样的100个样本中,每100个随机样本中,有95人拥有普锐斯的成员的比例会在17%~23%之间。在给定的置信水平之下,样本越大,误差幅度越小。

我们无需讨论计算出上述数值背后的数学,但这是值得相信的该领域中基本的数学理论。通过这些理论、经可靠计算可以得出针对大总体统计的相关具体数值,见表10-1。表格中的数据都是经可靠的计算得来的。表中的置信水平是95%,民意调查机构科学地进行调查都把置信水平定在95%。在所进行的科学调查中,如果没有交代置信水平,通常就假定其为95%。

表10-1 总体较大的情形中各种大小的随机样本的近似误差


注:当样本大小增大时,误差幅度明显减小,但当样本变得更大时,误差幅度减小的趋势变缓了。除非对于精确度或置信水平有特殊的要求,通常把样本增加到1500以上是无足轻重的。(在我们的语境中,目标大小在10000或以上,当目标很小时,可以应用校正因子来确定相应的误差幅度。但绝大多数报道的民意调查都有足够大的样本,所以我们不必关注校正误差幅度的计算方法。)

表中最左边的一栏是一系列不断增加的样本的大小。第2栏是与各样本大小相应的误差幅度,误差幅度表示为加或减x个百分点。为方便起见,这里对误差幅度四舍五入,取近似值。第3栏表示误差幅度在整个范围中的百分点。

看该表格时请注意如下三点:(1)随着样本大小的增加,误差幅度在减小。(2)样本小的误差幅度大。在95%的置信水平下,10个样本中,误差幅度是正负30个百分点。这就意味着,如果要从较小的样本中得出大的总体的一般结论,如果你还要相信这个一般结论,你就必须接受一个较大的误差幅度。(3)当样本从10增加的25时,误差幅度缩小得很快,但从上往下,误差缩小的幅度在减缓。当样本大小达到500时,误差幅度为正负4%,为了使误差幅度减至正负3个百分点,我们需要将样本加大到1000,为了将使误差幅度降低1个百分点,就需要再增加500个样本(加倍)。当样本并不太小时,为了让误差幅度降低1个百分点或者更少,就需要大量增加样本的数量。了解到这一点就不难理解,无论多么声誉卓著的民意调查,调查采用的样本往往都在1000到1500之间。为了更进一步缩小误差幅度而支付的昂贵代价往往得不偿失。

有了这些科学的基于样本的归纳概括的知识,我们再来看看日常生活中的基于样本的归纳概括。

日常生活中基于样本的归纳概括

通过样本进行归纳概括,日常生活中的运用不同于科学地运用主要体现在如下两个方面:(1)并不需要精心选择样本;(2)并不需要像表10-1那样精确计算各种可能性的大小。但是,科学方法的基本原则适用于日常生活中的非演绎概括。

先从变量(variable)说起。正如前面所说,有些变量与我们关心的属性相关。例如,驾驶普锐斯与车主的收入水平有关。要使得样本对于总体有代表性,就要做到相对于该变量的比例而言,样本与总体相同。只有这样,才能代表总体,如果不能保证这一点,相对于这个变量而言,样本的代表性就过高或过低。

科学地运用基于样本的归纳概括的关键在于抽样的程序足以降低样本的误差,借以保证样本的代表性、避免样本的非典型与偏离。所以,如果我们批判地审查公众民意调查,我们就要特别关注样本是如何选取的。不过,日常运用时往往并不科学地选取样本,所以,对日常生活中基于样本的推理进行批判性思维时,并不关注样本的选取方法,取而代之的是,关注样本本身的特点,特别是关注如下两点。

首先,要查看在本该具有代表性的特征方面,样本与总体是否存在重大差异,差异可能导致样本的偏差。其次,要审查在大小及多样性两个方面,样本是否能代表总体。例如,本书第10版各册的扉页都相同。如果想知道本书第10版各册中的扉页上印刷错误的比例是多少,并不需要多大的样本,总体的同质性是如此之强,以至于小样本(甚至是1本书)就能满足多样性的要求。

为了对基于样本的归纳概括进行批判性思维,我们提炼出如下两条原则:

1.如果样本与总体之间的差异导致样本在代表总体方面出现偏差,就削弱了论证。

2.在代表总体方面,样本太小或过于片面,也会削弱论证。

对基于样本的归纳概括进行批判性思维的实例:

例10-1:这个汽车旅馆的房间里没有跳蚤,所以,洛迪市任何地方都没有跳蚤。

这是一个显而易见的弱论证,一般不会出现在实际思维中。但我们可以追问为什么这个论证是弱的。主要问题是有太多变量会影响某地是否有跳蚤,而作为样本的特定房间并未体现其多样性。另外,汽车旅馆比许多地方更关注处理害虫。所以,这个样本在代表总体方面有差异,不具多样性而且太小。

例10-2:戴夫在为邻居做草坪护理时敷衍了事,所以他工作时通常敷衍了事。

这里的总体是戴夫所做的草坪护理工作,显然在样本大小及多样性方面本例与例10-1并无区别。但在处理害虫方面,汽车旅馆具有非典型性,而没有证据表明戴夫为邻居所做的护理草坪工作具有非典型性。所以,这个论证的论证强度高于例1的论证强度。

例10-3:我的教师中多数是民主党,所以,教师中多数是民主党。

假定说话者心目中的总体是美国大学教师,说话者心目中的“民主党”是指上次总统大选中投票给奥巴马的人。那么相对于上面两例,“民主党”不仅很大而且多样性更明显。所以,在代表总体方面,说话者的样本不仅太小而且太片面。

例10-4:我不喜欢简,很多人也会和我一样。

如果第一个陈述是为第二个陈述提供支持,那我们就可以分析其中的概括:这是基于一个样本的概括——由说话者到所有是否喜欢简的人的总体的概括。影响人们喜欢某个特定的人的因素有很多,样本“我”根本不能体现变量的多样性。

例10-5:看,这植物让我起皮疹了,以后我要远离这植物。

说话者的意思是指要远离这类植物中的任何一株。这样我们就可以把说话者的推理理解为,由一株植物为样本推及同种植物的总体。这里,“总体”的多样性并不明显,样本与总体之间潜在的差异也不会很多。(尽管可能存在幼苗或休眠的植物不引起皮疹)通常认为与植物导致皮疹相关的变量并不多。虽然的样本具有多样性的论证较强,但与前面的各例证相比,这个论证最强。

例10-6:本班共10人,其中8人说期中考试太难。虽然不知道另外2人的看法,但可以说,本班每个人都认为期中考试太难。

这里,虽然样本较小,但它代表了总体的80%,所以,该论证强度较高。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000