基于模糊权马尔可夫链的中国未来人口发展趋势预测_第1页
基于模糊权马尔可夫链的中国未来人口发展趋势预测_第2页
基于模糊权马尔可夫链的中国未来人口发展趋势预测_第3页
基于模糊权马尔可夫链的中国未来人口发展趋势预测_第4页
基于模糊权马尔可夫链的中国未来人口发展趋势预测_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于模糊权马尔可夫链的中国未来人口发展趋势预测

0马尔可夫链预测分析马尔可夫链模型是一种随机预测模型。与其他统计方法不同,它不需要从复杂预测因素中寻求不同因素之间的对应规律。只考虑事件本身的历史发展特征,通过计算状态转移率预测未来状态的发展趋势。国内学者运用马尔可夫链模型对我国各地区的人均GDP的变化趋势及房价指数、人均旅游消费进行了预测分析。2011年,郭嗣琮等进一步对模糊马尔可夫链预测模型作了探讨。通过分析人口数据及历史状况的演变特点,马尔可夫链模型可以应用于建立离散人口预测模型。笔者利用我国近10年来人口数据,通过选取适当的状态变量,建立相应的离散人口模型,并用Matlab软件计算分析,修正模型,较准确预测了我国未来人口问题的发展趋势,分析了人口老龄化发展进程及控制问题。1基于马尔科夫链的人口预测模型1.1简单近自然条件的马尔可夫链定义1设{Xn}是随机序列,状态空间E={1,2,…,N},若与m无关,称{Xn}为时齐的Markov链。其中叫由状态i出发经k步到达状态j的转移概率。叫k步转移概率矩阵;当k=1时,P(1)简记为P,P为一步转移概率pij所组成的矩阵,称为一步转移概率矩阵。k步转移概率矩阵由一步转移概率矩阵得到,即P(k)=Pk。定义2Markov链{Xn}初始时刻各状态的概率P{X0=i}=pi(i∈E),称为初始分布;在时刻n(n≥0)取各状态的概率,称为绝对分布,且其中定义3对于一切i、j∈E,若与i无关,则称该Markov链具有遍历性,此链又称为遍历链。对有限遍历链,有称π=(π1,π2,…,πN)为平稳分布,式(2)也可写成矩阵形式:π=πP。定理1对状态有限的马尔可夫链,如果存在k>0,使pij(k)>0,i,j=1,2,…,N,则此马尔可夫链是遍历性的。通过构造马尔可夫链的转移概率矩阵及初值分布,计算绝对分布及平稳分布,对未来各状态的结构进行预测的模型称为绝对分布马尔科夫链预测模型。1.2生灭过程计算定义4设齐次马尔可夫过程{X(t),t≥0}的状态空间为E={0,1,2,…},转移概率为pij(t),如果则称{X(t),t≥0}为生灭过程,λi为出生率,μi为死亡率。运用生灭过程建立的人口生灭模型可以简单地描述:设λi为第i年的人口出生率,μi为第i年的人口死亡率,Si为第i年的人口数,为第i年的预测人口数,用生灭链推导的人口数,有如下关系成立:其中,λi和ui都不为0,式(3)可用于中国人口总量的中长期预测。1.3模糊资源马尔可夫链预测模型模糊权马尔可夫链是改进的马尔可夫链模型,其基本求解步骤:(1)马尔可夫链的权重首先计算指标样本序列的各阶自相关系数再将自相关系数规范化并将其作为各阶马尔可夫链的权重(m为需要计算的时滞数)。(2)模糊矩阵的计算和预测分五个步骤进行:①选择统计指标和标定方法设U={u1,u2,…,un}为待分类的全体,ui表示第i个指标,用rij表示指标ui和uj的相似系数,0≤rij≤1(i,j=1,2,…,n)。rij计算常用绝对值减数法:其中c适当选取,使rij在中且尽量分散,记模糊矩阵R=(rij)。②模糊聚类对模糊矩阵R,用逐次平方法求出其传递闭包为模糊等价矩阵,再选择阀值λ,对U进行分类。在选择一个阀值λ后,对传递闭包做如下处理:由此,得到一个只包含元素0和1的模糊矩阵。选择不同的阀值λ时,就会得到不同的分类结果,比较这些分类结果后选择合适的阀值λ及分类。③状态划分U的分类数就是马氏链的状态数,同时还得到各指标所对应的状态及具体划分范围。④计算转移概率矩阵根据各指标所对应状态进行统计,计算出一步以及多步转移概率矩阵。⑤预测和检验利用马尔可夫链权重ωk,结合k转移概率矩阵,预测某年处于状态i的概率值pi,取max{pi}的状态i作为某年预测状态。通过对已知样本进行预测,检验预测的效果。2人口结构指标的预测将马尔可夫链的预测模型应用于中国人口指标的预测,包括人口结构、死亡率与出生率、人口总数预测及人口的控制。文中数据均来源于中国统计年鉴人口各项指标数据。2.1各年龄人口所占比例将人口按照0~14、15~34、35~49、50~64、65岁以上(对应于1~5状态)来划分,由2004~2009年各年龄段人口数据计算出各年龄段的人口所占比例,如表1所示。65岁及以上人口比例走势图如图1所示。2.1.1状态i下,pi每相邻两年为一步,状态转移概率的计算方法如下:(1)一步状态转移只会发生于其本身和相邻状态之间,且是状态i向状态j(j≥j)转移;(2)在相同状态i下,若n+1年比n年的数据比例升高了,则记为pii=1,而pij=0,j=1,2,…,5(j≠i);(3)在相同状态i下,若n+1年比n年的数据比例下降了,则pi,应该为n+1年的比例与n年的比例的商值,而pi,i+1的值恰等于1-pii,pij=0,j=1,2,…,5(j≠i,i+1);(4)在n年到n+1年的过程中,若有状态i-1转移到状态i的数据发生,则计算状态i的转移概率时,应考虑加进状态i-1转移到状态i的数据部分,并加到计算比值的分母部分;(5)若状态5转移的部分不是全发生在本状态,且同年状态1的比例比前一年增加了,则记状态1增加的比例为状态5转移出的数据部分,依此类推。按此转移概率计算方法,则2004~2005年的状态转移概率矩阵为同样,计算2005~2006、2006~2007、2007~2008、2008~2009年的状态转移概率矩阵分别记为P2、P3、P4、P5。为了消除样本随机性影响,更好地描述状态规律,在此取P1、P2、P3、P4、P5的平均值作为状态转移概率矩阵P:2.1.2中国马尔可夫链的平稳分布利用Matlab软件计算P14,其所有元素都大于0,该过程具有遍历性。设{πj,j∈I}是该马尔可夫链的平稳分布,则由一步转移概率矩阵式(8),可建立如下方程组,解上述方程组,得平稳分布:说明按照现行人口政策长此以往,中国人口的年龄结构比例中老年人口将达到54.82%。2.1.3不同年龄年龄的人口比例采用2007~2009年这三年各年龄段所占比例的均值作为初始概率分布:利用式(1)求绝对分布律,即把2009年作为初始年份,经过n年的人口结构分布记为2010~2012年的人年龄构成进行预测:这个计算结果与2010、2011、2012年人口年龄构成实际值基本吻合。同理,经过20年、30年、50年、100年的人口年龄构成如下:图2可以直观地看出各年龄段人口比例变化趋势。从预测值分析得到,按照现行的人口政策,20、30年后,我国老年人口比例分别接近15%、20%;50年后,老年人口比例占到近30%。我国人口老龄化进程在不断加快,这样必然造成社会抚养系数过大,不利于社会经济的持续发展。政府应适当调整人口政策,使人口结构趋向合理。2.2模糊物种马尔可夫链的人口死亡率和死亡率预测利用表2数据对人口死亡率作模糊权马尔可夫链的相关分析。出生率预测方法类似得到。2.2.1人口死亡率预测人口死亡率的基本求解步骤为:(1)马尔可夫链的权重由表2和式(4)求得人口死亡率序列的1~4阶自相关系数:(2)计算表15.设U={u1,u2,u3,…,u28,u29,u30}表示1981~2010年死亡率。由绝对值减数法(6),取l=1,c=1.3,有rij=1-1.3×|xi-xj|,得到30阶模糊相似矩阵R=(rij)30×30,再计算R的传递闭包,得选择阀值λ,求矩阵,并按将U分成若干个等价类。当λ=0.80,将U分为一类;当λ=0.92,将U分为两类,即{u1,u2,u3,…,u25,u26,u27}和{u28,u29,u30};当λ=0.94,U分为三类,即{u1,u2,u7,u8,u9,u10,u11,u12,u13,u14,u15,u16,u17,u18,u19,u20,u21,u22,u23,u24,u25}、{u3,u4,u5,u6,u26,u27}、{u28,u29,u30};当λ=0.96时,可将U分为七类。经计算分析后可以得到,当λ=0.94,将U分为三类时比较合理。(3)死亡率区间划分U分为三类时对应的马尔可夫链取1、2、3三个状态,由表2的数据,可以划分各状态对应的死亡率区间分别为ui<0.675%、0.675%≤ui≤0.700%和ui>0.700%。(4)计算转移概率矩阵的成本根据各年份对应状态,求得死亡率的1步到4步转移概率矩阵(5)32013年,2.3.3.3.3.3.3.3.3%是加权复合膜下的死亡率首先预测2011年的人口死亡率。由以上各步转移概率及式(7),预测情况如表3。表3的最后一行是加权求和的结果,其中状态3的概率最大为0.9913,说明2011年人口死亡率状态等级为3,死亡率≥0.700%与2011年实际人口死亡率0.714%相符合。由这个预测值进一步预测2011年之后的死亡率情况表4,可以得到未来三年死亡率都在0.700%以上。2.2.2人口统计表类似死亡率预测方法,计算得到:(1)各阶马尔可夫链的权重(2)利用rij计算记V={v1,v2,v3,…,v28,v29,v30}表示1981~2010年人口出生率。利用rij=1-0.08×|xixj|,求得。经计算,当λ=0.94时,V分为五类,即{v7}、{v1,v2,v3,v4,v5,v6,v8,v9,v10,v11}、{v12,v13,v14,v15,v16,v17}、{v18}和{v19,v20,…,v29,v30}。(3)状态死亡率对应区间的分析对应的马尔可夫链的五个状态记为1、2、3、4、5,根据表2得到各状态出生率对应区间分别为vi>2.250%、1.950%<vi≤2.250%、1.600%<vi≤1.950%、1.500%<vi≤1.600%和vi≤1.500%,进而求得一步转移概率矩阵。(4)预测不同年份、不同性别人口启示利用出生率的各步状态转移概率矩阵及式(7),预测2011、2012、2013、2014年的人口出生率均为≤1.500%,处于状态5,与2011、2012年人口出生率实际值相符。2.3预测的生态链计数按照此方法,可以继续预测2014年之后的人口数范围。利用预测的人口总数及结合2.1中预测的人口结构比例,可得到相应各年龄段的人口数。3b人口结构正常稳定分布人口结构的自我控制是指既要抑制人口增长过快的趋势,又要使人口的年龄结构有一个合理的分布,使未来人口年龄结构更合理且稳定的增长趋势。从现在的人口结构出发,让各状态每年进入下一状态的人数在总进入人数中的比例依赖于时间t年,希望从现在的人口结构出发,逐步调控尽快达到合理的人口结构。人口年龄结构的合理控制分析(不妨设人口状态为五个),得到控制方程其中为每年进入第i状态的人数在总进入人数中的比例,ri≥0且为合理的年龄结构;E为单位矩阵;Q=(qij)为准转移阵(qij表示每年从i级转到j级人数在i级总人数中的百分比);,wi为每年从第i级退出的比例,于是。由于要求ri=0,所以中的每一项即,因此对于,由式(9)找到,可见合理的稳定分布必须在集合A中。取理想的人口结构=(0.18,0.24,0.26,0.24,0.08),由表1和表2数据及式(9)计算得到:=(0.2368,0.2363,0.2282,0.1968,0.0833)。这表明目前我国应适当加大生育比例,使0~14岁的人口比例要逐步增加到23.6%。为使人口结构能够维持一个合理的稳定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论