第六次人口普查时间(程轶平:基于第六次人口普查数据的中国人口中长期预测)

第六次人口普查时间

作者程轶平,北京交通大学教师。

本文写作于2015年,所采用的数据也是几年前数据,但道理和逻辑依旧使用,而且,中国当前的人口形势较之以往,更加严重。

目前社会上对于人口政策的争论非常激烈。有人认为中国的人口基数依然庞大,必须继续实施目前的计划生育政策,而有些则看到了我国未来深度老龄化,乃至人口坍塌的风险。中国人口究竟处在什么样的状况?未来人口趋势如何?人口峰值何时达到?峰值后人口走势是缓慢下降还是断崖式下降?很多政府官员、学者、工商界人士都在关心这些问题,他们特别期待人口学家给出令人信服的答案。
遗憾的是,目前文献上发表的人口预测文章都是直接给出结论,文中并不透露这些结论是用什么方法、什么依据得到的。由于不同的人口学家得出的结论差距很大,公众看了这些文章就会感到莫衷一是,无所适从。
本文也将讨论人口预测问题,但我们想作一个新的尝试,就是不仅给出结论,而且给出结论是如何达到的、所依据的假设有哪些。文中也将包含所有的相关数据的出处,以便怀疑结论的读者可以自行验证。

1.预测模型
   人口预测并无玄妙之处,它完全基于这样的常识:随着年份的增加,每个人的年龄向上平移,在平移的过程中会有由于死亡带来的损失,同时在年龄的最低端由于生育达致人口的补充。这一过程可以用一个数学模型来描述,然后用编程语言将模型实现,最后得到预测输出。
   模型中包含有许多变量。首先,必须为男性和女性分设不同的变量,因为他们在人口繁衍中的角色是不同的。其次,必须为不同的年龄设置不同的变量,因为处在不同的年龄时死亡率不同,另外对于女性来说生育有年龄上限和下限。最后,毋庸赘言,必须为不同的年份设置不同的变量。这里,我们记X(i,n)为n年年末时i岁的女性总人数,Y(i,n)为n年年末时i岁的男性总人数。例如,Y(27,2018)表示2018年年末时27岁的男性总人数。这里,岁数=当时所在年份-该人出生年份。
   为方便,我们的模型只包括0-99岁的人数变量。这样做基本不损失精度,因为百岁及以上老人只是总人口的几万分之一。这样,模型中针对每一年有200个变量。第六次人口普查提供了2010年0-99岁的男性人数和女性人数,也就是说,我们已经有X(0,2010),…,X(99,2010),Y(0,2010),…,Y(99,2010).下面,我们用递推得到2011年的相应数据。
   对于非新生儿,也就是i≥1的情况,有
   X(i,2011) = 2011年末时i岁的女性人数 = 2010年末时i-1岁的女性人数-这些女性在2011年死亡的人数 =(1 – i岁女性在2011年的死亡率)×2010年末时i-1岁的女性人数 = (1 – i岁女性在2011年的死亡率)×X(i-1,2010)。
   同理,Y(i,2011) = (1 – i岁男性在2011年的死亡率)×Y(i-1,2010)。
   对于新生儿,有
   X(0,2011)=2011年婴儿总数×女婴比例×(1-女婴夭折率),
   Y(0,2011)=2011年婴儿总数×男婴比例×(1-男婴夭折率)。
   而2011年婴儿总数 = 2011年时15岁女性人数×15岁女性生育率 + …… + 2011年时49岁女性人数×49岁女性生育率 = 2010年时14岁女性人数×15岁女性生育率 + …… + 2010年时48岁女性人数×49岁女性生育率 = X(14,2010)×15岁女性生育率+ …… + X(48,2010)×49岁女性生育率。
   这里从统计的角度把生育的下限和上限分别设置为15岁和49岁,是符合实际情况的。另外,这里也忽略了育龄女性在2011年生育之前死亡,因为这不会带来实质性精度损失。
   上面说明了2010到2011的递推法则,以后年份的递推依此类推。

2.数据来源
   2010年的分年龄女性人数和男性人数,在人口普查数据的A0201表中提供。分年龄的女性死亡率和男性死亡率在A0604a表中提供。男/女婴夭折率即为A0604a表的0岁男/女死亡率。我们隐含假定了人的死亡率主要是和他/她的年龄有关,因而2010年的死亡率数据可以拿来给以后年份用。
   当然,随着我国卫生福利条件的改善,死亡率应该是呈逐年下降趋势,不过对于人口预测来说,固定死亡率带来的误差是可以接受的。
   女性分年龄生育率的情况要复杂一些,因为生育率受政策、经济等因素影响,波动更大。不过我们假定各个年龄的生育率相对比例不变,或者说生育率的年龄分布不变。也就是,当生育率波动时,各个年龄段按照相同的比例波动。这样当然也会带来误差,因为女性的高峰生育年龄有向后推迟的趋势。采用此假设的好处是我们只需给定某年的总和生育率,然后乘以年龄分布系数则可得到当年的各个女性分年龄生育率。
   实际上,人口普查数据的B0603a表给出了2010年的女性分年龄生育率,按照该表,2010年度的总和生育率是1.188,属于超低生育率。但是,如果按照这个数据来推算2010年的出生数,则该数字显著低于统计局公布的2010及其相邻年份的出生数。我们相信统计局公布的出生数更可靠,所以本文不采用B0603a表给出的女性分年龄生育率绝对值,而只是采用其分布。
   关于新生儿性别比,人口普查数据的A0112表给出2010年的出生人口男女性别比为117.9%。随后国家统计局先后公布了2011,2012年的出生人口性别比,分别为117.78%和117.70%。其后年份的出生人口性别比没有公布。

3.关于2011-2014年份的仿真
   我们现在处于2015年,因此2011-2014年度的出生数,死亡数已经公布。在本文模型中,每个年度的总和生育率和出生性别比是需要外部给定的。因此,我们需要设置这两个参数的值,以便仿真数据与公布数据尽量吻合。具体设置情况如下:
表1:2011-2014年份的仿真参数设置

总和生育率出生性别比
年份 2011 2012 2013 2014
1.464 1.483 1.484 1.536
117.78% 117.70% 117.70% 117.70%

   这里有一个难题需要解决的是第六次人口普查数据的日期是2010年10月31日的,而我们需要2010年年底的数据。国家统计局公布了2010年底的人口总数,但是没有分年龄数据。这两个日期数据的差别应该是:对于0岁,2010年底的数据会新增11月1日到12月31日之间出生的人口。对于1岁及其以上,年底的数据将会扣除掉在11月1日到12月31日之间死亡的人口。
   国家统计局公布的2010年底人口比普查的10月31日人口多出了810万,这显然是不合理的,因为这就意味这2010年的新生人口要达到至少2200万,而这显然是不可能的。
   因此,本文人口普查数据中的0岁男性和女性人口均乘以1.2作为年底的人口数,将1岁及其以上的人口数不变作为年底的数据。这样处理之后,0岁男女总人口数为1600多万,与2010年的出生数相吻合。

4.关于2015-2100年份的仿真预测及分析
   我们将预测终点设置为2100年,属于长期预测,是为了更好地凸显不同的政策选择对未来中国人口的长期影响。由于未来的中国人口政策选择和人口文化的走向有极大的不确定性,势必需要考虑多种方案。由于篇幅所限,本文仅给出两个方案的仿真预测结果。第一个方案是低方案,即按照目前状态惯性延伸。低方案的仿真参数设置如下:
表2:低方案2015-2100年份的仿真参数设置

总和生育率出生性别比
年份 2015-2100
1.536
117.70%

     第二个方案是高方案。该方案假设我国在2020年放松计划生育,允许每个家庭生育两个孩子。关于政策上放开是否能导致实际总和生育率达到2,学界有很多争议,因为与我国文化相近国家或地区(如日本,台湾,新加坡)为鼓励生育,但其总和生育率也显著低于2;越南不实行计划生育,其总和生育率也低于2。高方案的仿真参数设置如下:
表3:高方案2015-2100年份的仿真参数设置

总和生育率出生性别比
年份 2015-2019 2020-2100
1.536 2
117.70% 110%

   对于这两种方案,我们分别绘制下列曲线:总人口、劳动年龄人口(16-60岁男性+16-55岁女性)、老龄化率(60岁及以上占总人口比例)、育龄(15-49岁)女性总数、每年出生人数。

4.1 总人口   按照低方案(红色线条为高方案,蓝色线条为低方案,下同),我国在2023年迎来人口峰值,为14.02亿,峰值过后我国人口将急速下跌,并在2060-2070年间跌破10亿。按照高方案,我国在2028年迎来人口峰值,为14.29亿,峰值过后我国人口将温和下跌,但是由于总和生育率为2依然处在世代交替生育率之下,下跌趋势不会停止。

4.2  劳动年龄人口

   在2035年之前,我们感觉不到两个方案的劳动年龄人口有何不同。这是因为生育率的变化传导到劳动人口需要16年时间。低方案的陡峭下降曲线意味着如果不改变现行政策,我国劳动人口将会持续以每年减少四百万甚至更多的速度下降。

4.3  老龄化率   按照两个方案,我国将在2030年左右达到60岁以上人口占总人口的四分之一,此后继续攀升。整个剩下的二十一世纪,我国都将处于深度老龄化状态。

4.4  育龄妇女数   无论按照哪种方案,我国的育龄妇女总数都将从2010年的3.8亿下降到2030年的3亿,平均每年减少400万。按照低方案,育龄妇女数的下滑是无底的。按照高方案,我国育龄妇女总数会在2040-2070年长期企稳在2.5亿。

4.5  每年出生人数   按照曲线的显示,我国出生人数将在近两年跌破1600万,此后将无底下滑。高方案中,在生育率突变的2020年,出生人口有一个小尖峰,但是此后继续下滑,这是因为育龄妇女总数下滑导致的。按照高方案,我国在2030年后每年出生人数较长时间稳定在1400万以上。

5.结束语
   本文所得出的仿真曲线,其准确性依赖于所采用数据的准确性,也依赖于仿真参数与将来的实际情况的符合程度。无论如何,本文的预测曲线向公众展示一个事实,即中国目前的庞大人口已经是强弩之末。真正决定未来中国人口走向的是育龄妇女总数,而它正走在快速的下降通道。
本文经作者授权发布,如有打赏将转交作者本人。

扩展阅读
程轶平:缺乏人口年龄结构意识,将使中华民族面临灭顶之灾

如何走出“低生育率陷阱”?——人口生育的经济学

第六次人口普查时间相关文章

版权声明