当前位置:文档之家› 人口预测论文

人口预测论文

关于中国人口预测模型的讨论

摘要

人口预测一直以来都受到各国人民的关注,相关方面的研究也是层出不穷. 本文针对《中国人口统计年鉴》所提供的数据,对中国未来总人口数作短期,中期和长期预测.同时对人口的年龄分布以及城乡的人口结构进行了预测.做了如下工作:

1、通过运用M althus模型和V erhulst模型分别对中国人口中短期趋势给出预测.在M althus模型和V erhulst模型中,以2001年为基数,对今后10年给出预测.得到的结果与实际的4年数据误差均不超过0.6%.

2、通过建立离散模型,灰色预测模型,动态离散模型分别对中国人口中长期趋势给出预测.在动态离散模型中,由于生育率和存活率完全确定了人口的演变状态,本文采用了时间序列中最小平方法拟合出生育率和存活率曲线,通过改进

美国人口统计专家Nathan Keyfitz的人口预测模型 ,动态地对各年龄分布给出

预测.得出中国人口分布和2001~2005年的历史数据非常吻合.在预测未来中国人口总数中,对各年人口总数增量采用五维灰色预测模型得到增量函数:

-0.024267*(t-1)

t n

y=(34706.6898-33822.6898)(1,2...)

结果表明:中国人口总数在2021年达到最高峰,为13.745亿;老年人口(65岁以上,含65岁)到2041年将达到最高峰,占总人口的19.85%;男女人口比重在2050年将达到107:100;城镇人口逐年递增,在2050年将达到总人口的59.94%.

关键字:人口预测动态离散模型灰色预测最小平方法

1问题重述

近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长.人口问题一直是制约我国发展的首要因素. 90 年代以来, 随着我国经济高速发展, 人民文化和健康水平逐步提高, 计划生育工作的不断深入, 在20~29 岁生育旺盛人数年均超过1 亿的情况下, 人口出生率依然呈现大幅下降的趋势,到2005 年底人口出生率从1990 年的21.06 ‰下降到12.40 ‰, 自然增长率由1990 年的14.39 ‰下降到5.89‰, 妇女总和生育率在第五次人口普查时下降到1.22.然而过低的总和生育率也不利于中国的经济社会发展.所以现阶段对中国人口预测很有必要性,党和国家也十分关心人口的发展趋势.

本文从中国的实际情况和人口增长的特点出发,参考《中国人口统计年鉴》中的部分数据以及国家统计局的相关数据,首先运用M althus 模型和V erhulst 模型对中国未来人口中短期趋势进行预测,比较得出较好的模型.然后建立离散模型,灰色预测模型以及改进后的动态离散模型对中国未来人口中长期趋势进行预测,并对它们进行了优缺点分析.

2问题假设

1. 不考虑重大事件对人口的影响,比如战争和灾害.

2. 不考虑国家重大政策的调整

3. 国与国之间的迁入和迁初保持动态平衡

4. 假设《中国人口统计年鉴》以及国家统计局的相关数据真实有效

3符号说明

1. ()x t 表示t 时刻的人口总数.

2. r 表示自然增长率

3. i t d 表示第t 时刻的k 岁的i 人口年死亡率, 1i =时表示男,2i =时表示女。

4. ()t b k 表示第t 时刻的k 岁的妇女年生育率

5. ()t n k 表示第t 时刻的k 岁男所占的百分比

6. ()t w k 表示第t 时刻的k 岁女所占的百分比

7. ()i t p k 表示第t 时刻的k 岁的i 人口年成活率

8. ()i t k s 表示第t 时刻的k 岁的i 人口z 总数

9. ()i t k M 表示第t 时刻的k 岁的i 人口的转移矩阵

4模型建立与求解

人口预测是个研究的比较早的数学问题,相关的研究方法很多.本文经过研究分析,发现预测中短期未来人口增长趋势时, M althus 模型和历史数据吻合的最好,相对误差不超过0.2%.对于预测中长期未来人口增长趋势,改进后的动态离散模型预测的结果比较符合实际生活,得到的各年龄人口分布最能反应中国未来人口结构.下面本文将详细展开对各个模型的建立和分析: 4.1中短期模型的建立

4.1.1建立M althus 模型预测

对我国而言,迁入和迁出的人数占总人口数比例相对很小,故略去这一因素对人口变化的影响,只考虑人口变化与出生率和死亡率有关。

人口增长数量为出生数量和死亡数量之差,即:()B D rx t -=,其中B , D , 比例常数r 分别表示出生人口,死亡人口,自然增长率.得到人口增长的M althus 模型:

()()

()dx t rx t dt

x t x

==??? 解得:0

()00()t t

r

x t x e -=,当0r >时,人口将以指数规律增长.

M althus

模型中的最关键的假设是自然增长率r 仅与人口的出生率和死亡率

有关,而且是常数.这一假设是该模型得到最大的简化.但是,这一假设也导致了人口无限制的增长,如下图所示.显然用该模型作为长期的人口预测是不合理的,故只用于中短期的预测.

4.1.2建立V erhulst 模型预测

在人口比较稀少,资源比较丰富的条件下,人口增长较快,且在短期内维持常熟增长率。相反,人口增长会下降的较快,并在长期内增长率很难上升。依据这种现象,得出V erhulst 假设:

()(1)()x t B D r x t k

-=-

这一假设反映了人口的增长率随着人口数量的增加而减少的现象。k 为环境所能容纳人口的最大数量。

得到人口增长的V erhulst 模型(也称阻滞增长模型(Logistic )):

00()(1)()()dx x t r x t dt k x t x ??

=-??????=?? 得到: 00

()()1(1)k

x t t t r

k e

x

=

--+-

从解的表达式可以得到一下两点结论:

(1)lim ()x t k l =→∞

,它在人口问题中的实际意义是:不管开始的时候人口处于什

么状况,当人口无限增加时,人口总数总会趋于其环境所能容纳的人口最大数量k 。

(2)当()

x t k

>时,

()

dx t

dt

<。当()

x t k

<时,

()

dx t

dt

>。

以30亿作为我国可以容纳的最大人口数量

4.1.3M althus模型与V erhulst模型的预测结果比较:

对比:作为短期预测,M althus模型与V erhulst模型的预测结果不相上下,但作

为中长期预测,V erhulst 模型就要比M althus 模型更合理一些。

缺点:V erhulst 模型也有一个缺陷,模型中多了一个参数k ,对它没有好的方法估计,只能够凭经验给出。

以上模型对于中长期人口预测显然比较粗糙,下面以灰色预测模型和离散模型对中长期人口进行预测. 4.2中长期模型的建立与求解

4.2.1建立灰色预测模型

灰色预测模型属于全因素的非线性拟合外推类方法, 在形式上是单数列预测, 只运用研究对象自身的时间序列建立模型, 与其相关联的因素没有参与建模。因为任何一个系统究竟包含多少因素, 难以说清。比如本文研究的人口预测系统就是由生育、死亡、疾病、灾害、环境、社会、经济等诸多因素影响、制约的共同结果, 如此众多的因素不可能通过几个指标就能表达清楚, 它们对人口增长的潜在而复杂的影响更是无法精确计算。这反映出人口预测系统具有明显的灰色性, 适宜采用灰色模型去发掘和认识原始时间序列综合灰色量所包涵的内在规律。

利用2001年至2005年五年的中国人口总数以及这五年的人口增量通过M atlab 的M 编程建立五维灰色预测模型,得到人口总数和人口增量预测方程如下:

0.0059178*(t-1)

t y =(-21515016.901+21642643.901)(1,2...)t n = -0.024267*(t-1)

t y =(34706.6898-33822.6898)(1,2...)

t n =

可以看出用人口总量做中长期预测会得到一条斜率近似恒定的曲线,而用人口增量预测,会发现每年的新增人口越来越少,更符合实际情况.

4.2.2建立改进的动态离散模型

根据当前的生育率和存活率可以完全确定了下一年人口的演变状态,但美国统计专家 Nathan Keyfitz 的模型中,始终用得是某一年的存活率和生育率代替以后各年的存活率和生育率.显然偏差会越来越大.

k 岁的男女人口年死亡率和k 岁妇女的年生育率计算公式如下: 第t 时刻的k 岁的i 人口年死亡率

()i

t d k =

t k i k i 第时刻的那一年内岁人口的死亡人数

该年度岁的人口总数

, 1i =表示男;2i =表示女

第t 时刻的k 岁妇女的年生育率

()t b k =

t k k 第时刻的那一年内岁妇女生育的婴儿总数

该年度岁人口总量

第t 时刻的k 岁男所占的百分比

()t n k =

t t 一年内岁男总数该年度岁人口总量

(1,2,...90)t +

=

第t 时刻的k 岁女所占的百分比

()t w k =

t t 一年内岁女总数该年度岁人口总量

(1,2,...90)t +

=

()()1t t n k w k +=(1,2,...90)t +

=

第t 时刻的0 岁的男婴数量1

0()()()t t k b k n k s = 零岁的女婴数量

20()()()t t

k b k w k s = 这里的()i t d k ,()t b k 在所给数据中没有直接给出,需要进行相关处理计算得出.本文采用的是全概率公式计算如下:

331122()()()()()()()()()()()i i i i t t t t d k d k d k d k P P D P D P D P D P D P D =++

331122()()()()()()()()()()()t t t t k k k k P b P b B P B P b B P B P b B P B =++

其中1()P D 2()P D 3()P D 表示第t 时刻的k 岁城人口,镇人口,乡人口的死亡率, 1(())i t P d k D 2(())i t P d k D 3(())i t P d k D 表示第t 时刻的k 岁城i 人口,镇i 人口,乡i 人口所占的比例; 1()P B 2()P B 3()P B 表示第t 时刻的k 岁妇女城人口, 妇女镇人口, 妇女乡人口的死亡率, 1(())i t P d k B 2(())i t P d k B 3(())i t P d k B 表示第t 时刻的k 岁妇女城人口, 妇女镇人口, 妇女乡人口所占的比例.

存活率记为:()1()i i t t p k d k =-

本文采用时间序列中的最小平方法拟合出生育率和死亡率曲线,模型如下: 应用最小平方法研究现象的发展趋势,就是对原有的动态数列配合一条适当的趋势线来进行修匀.它要满足下述要求:

2()c y y -→∑最小值

式中, c y 表示趋势线的估计数值,y 表示数列的实际数值. 其中的直线方程一般形式为: c y a bt =+ 式中, a 表示截矩,b 表示斜率.

联立以下方程组

2

y na b t ty a t b t

?=+??=+??∑∑∑∑∑ 可求得a ,b .其中t 表示动态数列的时间, y 表示动态数列中的各期水平,n 动态数列的项数.

考虑到15~49岁妇女在2001~2005各年龄段的年生育率较难把握其预测方向,故先采用2001~2005各年的总和生育率进行最小平方预测,再对2001~2005各年的每个年龄段求生育率求和,然后除以2001~2005各年的总和生育率之和,用这个平均比率近似代表不同年龄段的年生育率比率.最后用这个比率乘以用最小平方法得出的不同年份的总和生育率,即得到不同时点、年龄段的年生育率.同理也可以得出不同时点、年龄段的年死亡率.下图就是对总和生育率和年死亡率的预测曲线:

对所预测的数据按照人口模型进行计算,其中人口预测模型如下:

1()()()1,2()i i i t t t k k k s M s i -==

式中

(0)(1)()1,2(90) ()t t t

i i

i

t i k s s s i s +????

????

??????==

为第t 时刻的k 岁i 人口按年龄的列向量,1i =时表示男,2i =时表示女。

1

1

1

1

1

10(15)(15)

(49)(49)

00

(0)(15)

()(49)

(89)

(90)

t t t t t t t t t t b n b n p p M k p p p +

??

???????

??

?=??????????????

2

2

2

2

2

20(15)(15)

(49)(49)

(0)(15)

()(49)

(89)

(90)

t t t t t t t t t t b w b w p p M k p p p +

?????????

??

?=?????????????

?

下表就是运用改进的动态离散模型得出的男女性别比以及城乡人口比重

从以上表格数据,可知:

1.2025年人口数量达到高峰13.7亿,而后逐渐回落.

2.中国城镇化进程加速,到2050年城镇化接近60%.

3.中国男女性别比逐年递增,到2050年男女性别比接近107:100

劳动力负担系数:指单位劳动力要抚养和赡养的的人数(劳动力指年龄在18~65岁的人)。

根据改进的离散模型得到劳动力负担指数预测图如下:

说明在2011年,负担系数到达最低点,平均每两个人负担一个人。

到2050年,负担系数达到0.7,平均每三个人就要负担两个人。

根据改进的离散模型得到老龄化预测图如下:

如上图所示,老龄化进程加速。老年人口数量多、老龄化速度快、高龄趋势明显。

目前,我国60岁以上老年人口已达1.43亿,占总人口的11%。到2020年,60岁以上老年人口将达到2.34亿人,比重从2000年的9.9%增长到16.0%;65岁以上老年人口将达到1.64亿人,比重从2000年的6.7%增长到11.2%。预计2040年形成老龄人口高峰平台,60岁以上老年人口达3.5763亿人,比重达25.1%;65岁以上老年人口达2.8253亿多人,比重达19.86%。70岁以上老年人口达1.9359亿多人,比重达13.61%。

2020年、2050年70岁以上高龄老年人口将分别达10021万人、18814万人。人口老龄化将导致抚养比不断提高,对社会保障体系和公共服务体系的压力加大,并影响到社会代际关系的和谐。

5模型灵敏度分析

在中短期预测模型中, M althus模型和V e r h u l s t模型都是把自然增长率看成常数进行预测的.如果自然增长率发生了较大变化后,得到的预测结果也会有

较大变化,灵敏度差,不能适应当今人口结构变化.并且在V erhulst模型中的最大容量k较难估计,而k对人口总数的预测至关重要.

在中长期预测模型中,离散模型没有考虑到每年每个年龄段的存活率、生育率都是变化的,因而具有滞后性.且受选定的基数的存活率、生育率影响大.灵敏度也不高,但由于是矩阵运算,其预测值有一定的参考意义.

灰色预测模型属于全因素的非线性拟合外推类方法, 在形式上是单数列预测, 只运用研究对象自身的时间序列建立模型, 与其相关联的因素没有参与建模。其可信度是最差的,往往在只有少量数据时才不得以使用.其预测的好坏直接决定与所选取的数据,所以其灵敏度非常差.

本文提出的改进的动态的离散模型正是在考虑了上述模型的优缺点后孕育而生的. 根据当前的生育率和存活率可以完全确定了下一年人口的演变状态,再用下一年的人口分布作为预测下下一年的人口的演变状态的依据.所以其结果在存活率和生育率已知的情况下是唯一确定的,不仅精度高,还能抗干扰,即时纠正错误.所以其灵敏度能够得到保障.但这个模型也不有其缺点的,那就是它的预测值要依据各年的生育率和存活率,而这两种率的预测目前为止也没有好的方法.所以生育率和存活率是否准确对人口的预测影响较大.

6模型的推广

在实际的人口总量变化过程中,有多种因素影响人口总量的变化。影响人口总量的主要因素有:经济因素、文化因素、医疗卫生因素。其中经济因素对人口自然增长的作用主要表现在它决定了人口的增殖条件和生存条件,通过改变人口的出生率和死亡率来影响人口的自然增长率。一般情况下,当人口数量不能满足经济发展对劳动力的需求时,人口自身的再生产必将会刺激;当人口数量超越了经济发展所能提供的消费总数后,人口自身的再生产必将受到遏制。在现代生产力水平下,人口的自然增长率往往随着经济水平的提高而下降。经济因素对人口机械增长也有重要影响。通常情况下,经济发达或发展速度较快的地区,对人口具有一种吸引力和凝聚力,人口机械增长为正值;相反,经济落后或经济发展速度缓慢的地区,对人口会产生一种排斥力和离散力,人口机械增长一般为负值。具体以GDP总量与人口的关系为例。使用国家统计局公布的修订后的1993年至

描绘GDP总量与人口总量的散点图:

依据那些数据可计算出人口总量与GDP总量的Person相关系数为0.972。可见,人口总量与GDP总量存在紧密关系。因此,在建立人口预测模型时可以引入GDP总量因素。

7参考文献

[1]薛定宇陈阳泉《高等数学问题的MATLAB》北京:清华大学出版社,2004.8

[2]徐国祥《统计预测和决策》上海:上海财经大学出版社,2005.8

[3]阮晓青周义仓《数学建模引论》北京:高等教育出版社,2005.7

[4]李洁明祁新娥《统计学原理》上海:复旦大学出版社2003.10

[5]梁国业廖健平《数学建模》北京:冶金工业出版社2004.9

[6] 中华人民共和国国家统计局. 中国统计年鉴-2002[M]. 北京:中国统计出版社,2002

[7] 中华人民共和国国家统计局. 中国统计年鉴-2001[M]. 北京:中国统计出版社,2001

[8] 中华人民共和国国家统计局. 中华人民共和国2002年国民经济和社会发展

统计公报[J]. 中国统计,2003(3):

相关主题
文本预览
相关文档 最新文档