来,做做思维体操
!关键问题:统计数据有没有欺骗你?
在下列每篇练习文章里,请你找出证据的不当之处。
⊙第一篇
政府部门职位的竞选和角逐变得越来越失控。越来越多的选举中金钱开始起到关键作用。现在赢得普通的参议院席位平均花在竞选活动中的支出就要超过800万美元,而典型的总统竞选人则要花费超过3亿美元。现在是时候来点实质性的改变了,因为我们不能只让那些政客通过广告宣传的大笔花费来购买他们的职位。
⊙第二篇
家庭正变成越来越危险的栖身之所。和家庭相关的伤害案件的数量正在直线上升。2000年,大约有2 300名14岁及14岁以下的儿童死于家庭中发生的事故。同时,每年有4 700 000人被狗咬。更糟糕的是,哪怕电视机这个相对安全的家用电器也开始变成危险源。事实上,每年有42 000人被电视机或者电视机架所误伤。既然家里发生这么多的事故,也许人们需要花更多的时间待在户外。
⊙第三篇
攻击型的心理咨询减少了部队的精神问题。最近在一场重要的战斗冲锋期间由部队开展的一项针对10 000名士兵的研究显示,更具攻击性的心理咨询手段使士兵们企图自杀的危险行为减少了超过50%。
给个提示
⊙第一篇
结论:有必要改变对政府部门职位的竞选角逐。
理由:政客们花在竞选活动上的钱太多了。普通的参议员在竞选活动中花费超过800万美元。总统候选人花费超过3亿美元来进行竞选活动。
竞选活动是不是太费钱了?“平均”和“典型”这样的词应该提醒我们注意其潜在的欺骗性。我们需要了解用来计算这些数据的平均值的种类。是平均数、中位数还是众数?比如,在参议院席位竞选数据中使用平均数有可能会得出一个歪曲的数字,因为某些参议员,尤其是那些势均力敌的参议员在竞选中作为候选人花费的钱确实数额巨大。但是,由于很多参议员基本上是必定会重新当选,这些竞选活动很可能花费并不大。我们知道只有极小一部分参议员的竞选活动双方实力极其接近。因此,如果用平均数来代表平均值,多数人可能不会花费报道中提到的那么多钱。换句话来说,如果用中位数或者众数就可能表现出低得多的数值。同样,知道数值分布和全距也会让你更加了解你所关心的竞选活动的花费到底有多少。
附带提一句,重要的参照数据也缺失了。竞选活动的花费和过去类似的活动花费比起来怎么样?其他政府部门的竞选花费又怎么样?很可能竞选活动的花费近几年实际上一直在走下坡路。
⊙第二篇
结论:花时间待在家里正变得越来越危险。
理由:和家庭相关的伤害正在日渐增多。
证据:一年期间,2 300名儿童死于家中发生的事故。
每年有4 700 000人被狗咬。
每年有42 000人被电视弄伤。
要评价这个论证,我们首先需要确定什么样的证据拿来回答下面的问题最为合适,“现在的家里比起从前来是不是更加不安全了?”在我们看来,用来回答这个问题的最佳数据就是拿现在每年家中重大事故的发生率和过去几年的事故发生率做比较。同样有关的是每小时在家里发生的伤害事件的数量和过去几年同样的数据之间的对比。很可能更多家庭伤害的发生是因为人们比过去花在家里的时间增加了很多。如果他们待在家里的时间更多,在家中发生伤害的数字相应增加,这就显得符合逻辑了。
这个论证当中提供的证据很可疑,有下面几点理由。第一,关于家庭伤害的总数作者根本没有提供任何数字。我们知道作者说它们在直线上升,但是根本没有证据表明这样的上升。第二,有关儿童在家庭事故当中丧生的具体细节也没有披露。这个数据和过去儿童在家中身亡的数据相比又怎么样?是什么类型的事故导致这些儿童的死亡?第三,狗咬的数字具有欺骗性。我们根本不知道这些狗咬事件是不是发生在家中。更重要的是,狗咬人的数字好像不能引导我们得出结论说待在家里是不安全的。第四,有关电视机的数据也很可疑。作者是从哪里得到这些动人的数据的?同样,这些伤害中大部分到底伤得有多严重?