如果没有理由主张大多数教师是民主党派,那么主张约克是教师意味着约克是民主党就是不合逻辑的。由此引出一个问题:认为“大多数X是Y”的理由是什么?
查明多大比例的X是Y的一种简单方法是观察所有的X。如果你的查询范围是你所在的学校的老师,你想知道这些老师中有多大比例的人是民主党派,假定他们愿意告诉你他们的政治倾向,你只需逐一询问他们就可以了。
但当X涉及的范围较广时,逐一访查的方法往往就不可行了。例如,若总体(population)是“美国教师”,由于所包含的教师人数太多就无法对他们逐一调查。为了查明多大比例的美国教师是民主党派就需要先研究作为美国教师的子集的样本(sample),然后将相关结论推广到全部美国教师的总体上。
正是基于由样本展开的概括,使我们在没有观察总体的每一成员的情形下得出关于总体的一般陈述。尽管我们将论及的总体都是由人构成的,但我们所说的概括适用于任何可识别的对象。
由样本展开的概括,即(inductive generalizing)实际上远比看起来复杂得多。抽样是运用统计和概率理论的一门科学,而要完全解释清楚统计和概率理论需要专门的书籍和课程。好在由样本展开的科学概括的基本逻辑原则是清楚明白的,而且在日常概括中便于运用。
无论是科学的还是其他领域,归纳概括的基本形式都可用教师和民主党的例子来说明:
在已调查的美国教师中,特定比例的人是民主党派,
所以,在所有美国教师中同样比例的人是民主党派。
因为归纳概括可以针对任何对象,可以将其进一步公式化为:
在已考察的X中,特定比例的是Y,
所以,在所有X中,有同样比例的Y。
问题是如何评估这类形式的论证。
让我们先来定义几个常用术语。已考察的X(上例中的“已调查的美国教师”)是样本。样本的大小,也就是样本中对象的数目被称做n(如果样本的大小为1,我们记做"n=1",如果样本中有35个教师,就记做n=35)。所有的X(上例中的“所有美国教师”)是总体或目标总体(target population)或目标(target)。(我们不加区别地使用这三个术语。)对象所具有的属性Y(上例中的“是民主党派”)是特征(feature)。样本、总体(或目标、目标总体)、特征以及n是重要的术语。我们已考察到样本中有一定比例的对象具有某种特征,问题是:“目标总体中有同样比例的对象具有这种特征,该可能性有多大?”
首先,我们要能合理地知道总体和特征分别是什么;这个问题似乎显而易见,以致于人们往往忽略了在这些问题上的模糊不清。如要知道多大比例的教师是民主党派,先要弄清的是具有哪些条件的人可被叫做教师,哪些人是民主党。在该情形下,我们无法识别目标总体中的所有成员,因此我们需要确定抽样框(sampling frame),抽样框是总体的子集,抽样框的每个成员都是可识别的。在我们的例子中,美国教师联合会可以作为抽样框,样本正是从抽样框中选取的。
接下来的问题是,根据什么确认一个人是民主党派?为了识别某对象是否具有某特征,首先须确定特征是什么。为了知晓多大比例的美国教师联合会成员是民主党,我们最好先确定“民主党派”意味着登记投票的民主党。
对于由前提“样本中特定比例的X是Y”得出结论“所有X中有同样比例的是Y”这个推理而言,推理的强度完全决定于样本和总体中Y占X的比例是否相同。用公式表示就是样本中的Y/X和总体中的Y/X相等吗?样本中的美国教师是民主党派的比例和总体中的美国教师联合会成员是民主党派的比例相同吗?这是问题的关键。
当然,我们不知道总体中美国教师是民主党派的比例是否和样本中美国教师是民主党派的比例相同,如果知道这一点,也就没必要进行抽样了。
但样本中的确存在着一些因素(属性),对象是否具有这些因素影响着我们所关注的特征是否存在。例如,人们的党派偏好与他们的种族、年龄、收入、宗教、地理位置、参与的俱乐部、喜欢观看的赛事、购物场所等各种因素都有联系。(有一种说法是:拥有丰田普锐斯汽车的人几乎都投民主党的票。)如果我们的样本中新英格兰地区的教师所占的比例高于(或低于)总体中该地区教师所占的比例,那么这个样本中民主党派占教师的比例就会相应倾斜,基于这种样本的概括就失去了可靠性。
上述可能影响我们所关注的特征的因素称做相关因素(related factors)。当样本中包含相对于给定相关因素的比例失当的对象(上例中的“人”)时,这个样本就是相对于该因素的偏差(biased)。一个美国教师联合会成员的样本中如果包含比例失当的新英格兰人,就是对新英格兰人要素的偏差。
经验和专业知识会告诉我们哪些因素和某特征相关。需要注意的是:相关因素是那些可能影响特征是否存在的因素,而不是我们已知的影响因素。我们对事物之间相关性的理解决定于一般经验和专门领域的知识。为了确定特定的样本相对于某相关因素是否偏差,我们不必知道该相关因素在总体之中出现的精确概率。例如,若某样本中100%的教师都来自新英格兰,该样本中新英格兰人的比例太高,我们因此就知道该样本中民主党在教师中所占的比例不具有代表性。无论在教师总体中新英格兰人的确切比例是多少,大概都不会是100%。
至此,我们对所需的样本的要求就比较清晰了。在相关因素方面,样本要和总体一样具有多样性,样本的大小要足够体现该多样性。另外,所有相关因素出现的比例,样本要和总体保持一致。
当然,即使是专家也不能完全确切地知道哪些因素和给定的特征相关。正因如此,减少偏差的最佳策略就是随机抽样(random sample)——总体中的每个成员都有同等机会进入样本。如果对美国教师协会的成员进行随机抽样,那么每个该协会的成员都有同等的机会进入样本。随机抽样出的美国教师中民主党派的比例依然有可能不同于总体中的比例,但下文将要解释,这种可能性是可以精确计算出来的,而且它决定于样本的大小。
我们暂时不讨论随机抽样的复杂性。实际生活中的归纳概括很少是基于随机抽样的。如果我们不进行随机抽样,对于基于样本的归纳概括,可以用以下原则来指导我们评估该归纳论证的强度:
大小:样本是否足以体现总体中相关因素的多样性;
多样性:样本是否确实体现了多样性;
偏差:样本中是否存在任何相关因素出现的频率异于总体。
例如,在美国教师协会成员的总体中,与政治党派偏好的相关因素是极其多样的,相应的,样本就应该是多样的——而且样本要大到足以体现该多样性。理想的样本在宗教、地理位置、种族、收入等和民主党派相关的因素方面是多样的,而且理想的样本在各相关因素出现的比例上与总体并无不同。
与上述关于教师和民主党派的例子不同,如果我们想知道本书第9版各册中的扉页上印刷错误的比例是多少,对样本的多样性、样本的大小就没有太高的要求。因为就相关因素(影响书的扉页上的印刷错误的因素)而言,本书第9版的总体并不具有明显的多样性,相关因素也不多。例如,书的同一版本可能有多次印刷,有时出版商为了纠正太多的错误会重新印刷。如果就比例而言某次印刷的册数过多或过少地进入样本,就形成了样本的偏差。
如果就相关因素而言两个样本具有同等的多样性,样本越大的偏差越小。既然就相关因素而言,样本要体现目标总体的多样性,针对相对同质的目标总体,我们可以采用较小的样本。
案例
“这个房间里没有跳蚤,所以,洛迪市任何地方都没有跳蚤。”这是一个显而易见的弱论证,一般不会出现在实际思维中。但我们可以追问为什么这个论证是弱的。主要问题是有太多的因素(相关因素)影响某地是否有跳蚤,而作为样本的特定房间没有体现相关因素的多样性。
当需要论证“大多数教师是民主党派”时,有人举证说“我的老师中大多数是民主党派”,这个论证的强度怎么样呢?
首先需要澄清的问题是:目标总体中到底包括哪些人;特征到底是什么。为了慎重起见,我们最好要询问上述举证人对该问题的看法。但我们可以设想:目标总体是“美国的大学教授”;特征是“总是投票给民主党”。
其次是我们一直关注的问题——样本是随机抽取的吗?答案是否定的。影响一个人投票的相关因素有很多吗?答案是肯定的。这就要求样本要体现相应的多样性,而且样本大小要足够容纳该多样性。上述举证的样本没有体现潜在相关因素的多样性,而且该样本太小,不足以容纳丰富的多样性。所以,上述论证中的前提并没有在很大程度上提高结论的可能性。
如果你认为上述论证明显提高了结论的可能性程度,那说明你混淆了两个本该区分的概念:特定论证的强度和论证的结论为真的可能性。还有其他理由可以支持大学教授往往是民主党,但这并不能使上述论证变得更强。
“我不喜欢简,很多人会和我一样。”如果第一个陈述是为第二个陈述提供支持,那我们就可以分析其中的概括,这是由说话者(n=1)到所有是否喜欢简的人的总体的概括。影响人们喜欢某个特定的人的因素(相关因素)有很多,包括关系、利益、年龄,等等。由于样本“我”不能体现相关因素的多样性,这个论证就是相当弱的。
“看,这植物让我起皮疹了,以后我要远离这植物。”说话者的意思可以作多种理解,但我们假定说话者的意思不是指将要远离特定的这株植物,而是要远离这类植物中的任何一株。这样我们就可以把说话者的推理理解为:由一株植物(n=1)为样本推及同种植物的总体。以这种方式来分析,其中隐含的论证就是:这类植物样本的100%让我起皮疹,所以,所有这类植物都会让我起皮疹。尽管可能存在幼苗或休眠的植物不引起皮疹,但通常认为与植物导致皮疹相关的因素并不多。虽然要求的样本不止一个,但并不要求很大的样本就能体现该总体的多样性。与前一个例证相比较,这个论证的前提的确在较大程度上提高了结论为真的可能性。
这一节我们讲解了归纳概括的基本原则,继类比论证之后,我们将进一步讨论随机抽样。