二、对全面二孩之前生育率的估算
预测出现偏差,或偶尔口误都情有可原。即便预测偏差较大也可归为专业水平欠缺。但一而再再而三地在同一个方向上错得如此离谱,令人怀疑这是在故意扭曲。翟振武近日言论似乎在继续这种行为。
翟振武称,以公安户籍登记数推算,2006-2014年间,中国总和生育率为1.71。公安数据并不公开,不知道他如何获取这些数据,更无法验证他的计算。由于户籍政策调整,不同年份数据之间存在不一致性,甚至有一人多户。 笔者今年曾协助起草一份全国人大建议,解决一人多户乃至学籍与户籍错配的问题;很多人当年让孩子在外地上户以规避计划生育处罚,等户籍脱钩计划生育后又在本地上户,导致一人多户。
翟振武称,他根据2017年小学在校人数算出2007-2010年生育率为1.69。但自1997年中央分担部分教育经费后,在校学生数长期有虚报倾向。在2013年采纳电子学籍后,各年级在校学生数就普遍缩水10%以上。虽然学籍管理日趋严格,但因为在校学生数涉及教育经费,虚报现象难以杜绝,而在电子学籍采纳之前的虚报更难清理。教育部门删除重复学籍非常谨慎,甚至还需家长申请。
针对人口和生育,国家统计局每年按惯例会公布1‰ 的抽样调查生育率,以统计公报公布出生人口数,尾数逢0年份会进行人口普查,尾数逢5年份会进行1%抽样“人口小普查”。其中,每10年一次的人口普查耗费巨大的人力和财力,是和平时期最大的社会动员;其必要性正是因为其他数据源难以准确反映人口状态。此外,卫生机构每年还会公布分娩数据。
表1显示了不同来源报告或推算的2007至2010年出生人口。其中,2010年人口普查和2015年1%“人口小普查”使用对应岁数的人口,后者按全国总人口成比例调整;由分娩数推算的是当年卫生机构活产数/住院分娩率;2017年在校生分别是各年级学生数,假设所有孩子6岁上学,且没有变更年级。据生命表推算,2006年以来,0至12岁的累计死亡率不到2.5%,所以忽略夭折对分析影响有限。
根据表1,翟振武在估算生育率时采用的在校生数要远高于其他数据。 针对2007-2010年的总和生育率,根据国家统计局公报计算为1.56、2010年人口普查回测为1.46、2015年“人口小普查”回测为1.51、每年抽样调查数据直接计算为1.37、由分娩数推算为1.37。 如果去掉偏低的普查年份2010年的数据,结果则分别为1.57、1.54、1.53、1.42、1.37,全部显著低于翟振武由公安数据估算的1.71和由教育数据估算的1.69。
在各种方法中,根据每年抽样调查数据计算总和生育率最直接,也是国际上通用的方法。虽然使用的抽样仅1‰ ,但不受汇总数据利益的影响。人口普查数据是系统性采集,较好地保持数据的内部一致性,理应是最全面和最权威的人口数据,其准确性也为“人口小普查“所佐证。
相比之下,公安、教育数据不仅有虚报倾向,而且由于采集时间不同和方法差异,存在内部不一致性。在估算总和生育率时,教育数据只能提供在校学生数,而母辈数据必须来自其他数据源。这些因素给偏差性使用数据留下空间。
特别是,总和生育率的估算涉及年龄别妇女数量、生育年龄分布和出生人口的选取等环节。如果在每个环节刻意选择有利数据,导致5%的偏差,那三个环节就能带来15.8%的偏差。如果实际生育率是1.45,这种选择性使用数据甚至可以算出1.68。鉴于翟振武过去预测的一贯表现,和他解读数据的扭曲和夸张,无法排除他对总和生育率的估算过程中,选择性使用数据以得出严重误导的结论。
翟振武还提到,“根据国家卫计委2017年全国生育调查,45岁妇女在结束生育期时,平均生育了1.68个孩子。这就与教育部、公安部获取的数据计算结果基本一致。” 但在2017年45岁的妇女,是生于1972年的70后,在他计算生育率的2007-2010年区间里,已是35-38岁,早过了生育高峰;而生育高峰落在2007-2010年的妇女,在2017年应是34岁左右,即出生于1983年的80后。我们根据每年抽样调查生育率重构的数据,计算她们在2017年的累计生育率只有1.25,终生孩子数难以超过1.4,根本不能佐证翟振武根据教育和公安数据计算的结论。