五
我将这样的平均数字——例如每平方英里的居民数、每周的死亡人数、每个刑事案件的定罪数,或者用更一般的说法,每个y的x——称为“相对数”(relative numbers)。此处的x是一类事物,它们与另一类事物,也就是这些x的y,存在着关联。我将x称为“相关群体”(relate),而将y称为“相关项目”(correlate)。
概率是一个相对的数字,也就是在某一类事物中另一类事物成立的比率。从这一点可以轻易地得出计算概率的规则。由于这些规则非常简单,我们可以在此进行罗列。有时,掌握一些基础的计算法则是很有用的。
规则1:直接计算——直接计算任何相对数字,例如有轨电车旅程中的平均乘客数等。我们要通过以下方法进行计算。
数出每次旅程中的乘客数目,将这些数目相加,再除以旅途次数。有些情况下,我们也可以简化这个规则。假设我们想知道纽约某住所中的住户人数。一个人不可能同时居住在两处住所中;如果他有两处住宅,则在每一处都算半个住户。在这种情况下,我们只需要用纽约所有居民人数除以他们的住宅数即可,不需要分别去数清每所住宅中的人数。如果每个“相关群体”中的个体只能拥有最多一个“相关项目”,那就都可以采取类似的方法。我们如果需要知道每个y中x的个数,且没有x同时属于两个或两个以上的y,那么用y中所有x的数量除以y的数量即可。如果用这种方法去计算每次有轨电车旅程中平均乘客的数量,那就肯定是无效的。我们不能用总乘客数除以旅程数,因为有很多乘客可能会往返多次。
要从给定前提类别A和结论B中计算概率,只需要确定前提正确和结论正确的比例,也就是只要用A和B同时发生的次数除以A事件发生的次数即可。
规律2:相对数之和——若两个相对数字有着相同的关联群体,例如求每个y中x的数量和每个y中z的数量,我们需要统计每个y中x和z的总数。如果没有x和z属于同一个y的情况,则这两个数字之和就是所需答案。例如,假设我们已知一个人平均有多少个朋友以及平均有多少个敌人,则二者之和就是对一个人有利害关系之人的数量。而从另一种情况来说,如果将体质虚弱的人数与超过兵役年龄的人数相加,以获得享受兵役豁免的平均人数,这是不可行的,因为有许多人同时享受两次或更多次的豁免。
这个规则直接适用的概率是,两个不同的且相互独立存在的事件有可能在同样的一系列情况下发生。例如,已知“如果A那么B”的概率以及“如果A那么C”的概率,则两种概率之和是“如果A那么B或C”的概率,只要没有同时属于B和C的事件即可。
规则3:相对数之积——假设我们已知每个y中x的相对数字,以及每个y的x中z的相对数字;或者举个更加准确的例子,假设我们首先已知纽约家庭中孩子的平均数量,之后我们又知道了一个纽约儿童牙齿的平均个数,于是通过这两个数字,我们可以得出一个纽约家庭中孩子牙齿的平均总数。然而,这种方式有两个限制条件:第一,如果同一个孩子同时属于不同家庭,那么结果就不准确了,因为这样的孩子牙齿数量也许会格外多或格外少,从而影响一个家庭中孩子的牙齿平均数量。这种影响要大于对每个孩子平均牙齿数量的影响。第二,如果不同的孩子可以共用牙齿,这种计算也不属实。在这种情况下,单个家庭孩子牙齿的平均总数会与一个孩子牙齿的平均数量有很大差异。
使用这种概率法则,我们必须根据以下条件进行:假设我们已知前提A带来结论B的概率,B与A代表某种类型的前提,我们还已知以B为前提的推论的概率,以及结论C的前提,这就是所需的信息。首先,我们有了每个A中B的相对数量,之后我们也有了每个B中C的相对数量。然而,这两类前提是经过挑选的,所以C在B中的总体概率与C可以从A中推导出的B的概率一致。两种概率可以相乘,来给出C在A中的概率。加法中的限制条件依然存在。从A类事件几种不同命题下会得到B类事件命题,也有可能B从A中得出的概率会受到B类事件命题的影响。但是,从实际的角度看,这些限制条件几乎不会带来什么后果,并且人们普遍认为存在一条通用的概率原则,即“如果A那么B”的概率乘以“如果B那么C”的概率,得出的就是“如果A那么C”的概率。
概率乘法能发挥很大的作用,但还有一条辅助的规则。这条规则并非举世通用,而且用时必须非常谨慎,有两方面需要注意。首先,涉及重大失误时不要使用。其次,如果有机会可以使用的话,不要错过。该规则基于以下事实:“如果C为真则B为真”的概率与“如果C为真则A为真”的概率大体一致。举个例子,假设我们现在知道纽约每年出生的男童平均数量,又知道纽约每年冬季出生的男女童平均数量,我们就可以推断,这至少是一个很近似的命题(对于概率学来说没有完美的估算),即在纽约出生的男童比例与在纽约夏季出生的男童比例相同。因此,如果将一年之内出生的所有孩子的名字放入一个罐子中进行抽取,我们可以将抽中男童名字的概率和抽中夏季出生的男女童名字的概率相乘,就可以知道抽中夏季出生的男童的概率为多少。在许多论述此问题的相关论文中,这样的概率问题通常与抽签游戏和纸牌游戏等联系起来。在这些情形下,“事件独立性”的概念非常简单,也就是在假设A和假设B的前提下,C发生的概率相同。但是,概率在解决日常生活的问题时,有一个很值得我们思考的问题,即两个事件是否可以有足够的证据被认为是独立的。在纸牌游戏中,为了保证牌之间没有关联,牌一定要洗开。然而,实际情况是,牌很少有完全洗开的时候。因此,在惠斯特纸牌游戏中,一共有四种花色,同花色的牌可能还是会排在一起,哪怕已经洗过牌了。或者说,至少有一些牌没洗开的痕迹。比如,所谓“短套花色”[32]的数量比正确估算的要少,也就是说,由于洗牌分牌不均导致“长套花色”数量增加。所以,当一副烂牌被充分洗过时,我们通常就会说下一把会有很多“短套花色”了。几年前,我有一个很喜欢玩惠斯特纸牌的朋友,他曾经计算过在165手牌中他被发到黑桃的数量。在这一样本中,洗牌彻底程度肯定至少超出了平均水平。最后根据计算,我朋友本应拿到3张或4张黑桃的数量为85手,但实际上他拿到了94手,这个例子说明了洗牌不彻底的影响。
以上就是概率计算的全部基本原则了。但还有一个原则是从人们对概率的不同理解中衍生出来的,这在一些论文中也提到过,如果最后被合理论证的话,那么很有可能成为一个推理理论的基础。虽然我个人认为这很荒谬,但对此进行的思考却有可能把我们带向真理。正是由于讨论这个话题的缘故,我才在学习科学逻辑之初就提前向读者介绍了概率理论。