




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
黄山学院本科毕业论文.引言1.1研究背景与意义研究背景:在当前这个信息发达的时代,面对大量杂乱无章的数据,如果没有工具对其进行处理,许多信息将无法使其价值得到最大的利用,使其价值最大化,在现代社会,建立模型的分析方法逐渐被广泛使用。最早的时间序列分析方法起源于七千年前的古埃及,那个时候的古埃及人们为了使农业得到发展,通过记录数据,对这一系列数据长期的观察,他们发现序列是有其特定规律的,然后根据这个规律,应用于农业,使农业得到高速发展[1]。建立时间序列模型分析的方法应用十分广泛,例如,通过对多组数据的收集和观察,建立模型,发现它们之间的关联程度;还可以通过建立模型,发现社会经济变量变化规律,预测未来数据变化,针对出现的问题尽早排除掉故障[2]。研究意义:本文将通过建立时间序列模型的方法对人口进行预测。人作为现在社会的一种不可缺少的因素,不仅可以运用自已的主观能动性,利用一切可以利用的资源对个人乃至社会产生影响,而且人的生存也需要不断的利用社会资源,人与社会形成了一个相辅相成的整体。面对人口的不断增加,有限的资源如何能够持续为人类的发展提供条件,这是需要仔细考虑的。因为人口数量的变化不仅对地区有影响,它还关系着国计民生,社会发展,甚至关系到每个人的生活,而且对国家发展有十分重要的意义。1.2研究现状国外研究现状:20世纪30年代,即现在社会以前,人类生存环境较差,同时医疗水平较为落后,生活得不到基本的保证,虽然当时人们生育意愿很高,但死亡率也较高,所以早期人口增长缓慢。然而,随着时代、生产力的进步,科技的加速发展,生活水平的提升,死亡率开始略微下跌,但是人们之前固有的“多生多福”的生育观念仍没有改变,从而导致死亡率小于人口出生率,人口数量迅速增长。伴随人口数量急剧增加,统计工作日益复杂,考虑到出生率、死亡率、人口迁移等人口学因素对政治、经济、文化发展等因素的影响,人口数量的预测变得更为迫切[3]。国内研究现状:国内关于人口数量的预测虽然起步较晚,且源于西方,但是近些年来,经过我国人口研究学者的不断探索,也取得了很多的研究成果,对做出人口问题方面的决策提供了依据,从而对国家发展产生影响。杨君哲等人在2010年运用Eviews软件中的ARMA模型对1949年至2007年中国人口数据进行建模分析,并且预测2029年人口总量将达到高峰,约为14.42亿;高采文等人在2014年通过时间序列分析和回归分析预测人口老龄化将会加重,提出放宽生育“二胎”政策;汤红辉等人在2017年运用时间序列分析中的ARIMA模型预测2020年中国人口总量将超过14亿,同时预测老年人口比例由2017年的11.31%增加至12.77%[4]。1.3研究方法首先,查阅相关文献资料了解中国人口预测研究方法及其研究现状,以及其他学者已经研究的成果,学习并且了解计量经济学中的Eviews软件的使用过程,熟悉ARIMA模型运用过程的步骤要求,做到可以熟练操作[5]。其次,运用现有的资源,收集自1949年至2020年中国每年年末人口总量数据,运用统计学中经常使用的Eviews软件建立ARIMA模型对其进行一定分析,并根据模型对未来几年中国总人口数量进行预测,得出结论。同时,分别收集自1949年至2020年中国人口死亡率和新生儿出生率,并根据结果预测未来几年的情况。最后,根据得出的结果,针对中国人口问题提出自己的看法和建议。2.ARIMA模型2.1三种模型AR模型:AR模型一般是指p阶自回归模型,该模型具有以下结构[6]:当时,该模型又可称为中心化模型。MA模型:MA模型一般是指q阶移动平均模型,该模型具有如下结构:,同理,当时,该模型为中心化模型。ARIMA模型:ARIMA模型一般是指求和自回归移动平均模型,简称模型,具有以下结构:,。2.2建立ARIMA模型的操作步骤根据ARIMA模型的特点和基本内容,需要以下几个步骤进行研究:步骤一:获取数据,然后录入Eviews软件;本文是以1949年至2020年内每年年末人口总量数据、1949年至2020年每年人口死亡率和新生儿出生率数据为依据,将数据录入Eviews软件中,数据来源于国家统计局。步骤二:判断时间序列的平稳性;步骤三:确定差分次数;步骤四:模型识别;步骤五:估计模型的参数;步骤六:检验模型的适应性;步骤七:根据模型进行预测。3.我国人口数据预测模型的建立3.1录入数据根据国家统计局收集数据[7],见表3-1和图3-1所示,根据收集的数据,可以帮我们建立模型,并且预测以后几年的人数总量的变化,可以观察发现,2020年的人数总量大约为1949年人数总量的三倍,可见增长之快。表3-11949年至2020年我国人口总量表年份人口总数(万人)年份人口总数(万人)年份人口总数(万人)年份人口总数(万人)1949年541671967年763681985年1058512003年1292271950年551961968年785341986年1075072004年1299881951年563001969年806711987年1093002005年1307561952年574821970年829921988年1110262006年1314481953年587961971年852291989年1127042007年1321291954年602661972年871771990年1143332008年1328021955年614651973年892111991年1158232009年1334501956年628281974年908591992年1171712010年1340911957年646531975年924201993年1185172011年1347351958年659941976年937171994年1198502012年1354041959年672071977年949741995年1211212013年1360721960年662071978年962591996年1223892014年1367821961年658591979年975421997年1236262015年1374621962年672951980年987051998年1247612016年1382711963年691721981年1000721999年1257862017年1390081964年704991982年1016542000年1267432018年1395381965年725381983年1030082001年1276272019年1400051966年745421984年1043572002年1284532020年141178图3-1我国1949年至2020年年末人口总量折线图3.2判断时间序列的稳定性根据自1949年至2020年间的数据,并且将序列定为y,用Eviews软件根据数据作出时序图,见图3-2所示:图3-2序列y的时序图根据图3-2可以看出,该时间序列的时序图近似呈现一条射线上升,所以可以初步得出该时间序列非平稳。然后根据数据建立相关图,见图3-3所示:图3-3序列y的相关检验图根据图3-3可以看出,偏自相关图是平稳的,而自相关图是非平稳的,所以再次可以断定该时间序列非平稳。为了验证该结果,接下来,我们对序列y做单位根检验,检验结果见表3-2所示:表3-2序列y的单位根检验表根据并3-2可以看出,该时间序列的t统计值为-1.710462,大于-3.530030、-2.904848和-2.589907。因此,可以确定该时间序列非平稳。3.3确定差分次数d我们已经知道了该时间序列模型是非平稳的,接下来根据时间序列的差分序列的情况判断差分次数d。先建立一阶差分序列,见图3-4所示:图3-4序列y的一阶差分后的时序图根据图3-4可以看出,序列y的一阶差分序列y1在1949年至2020年这个期间有明显上升和下降的情况,且幅度较大,由此可以看出一阶差分非平稳。接下来进行单位根检验,检验结果见表3-3:表3-3序列y的一阶差分的单位根检验表由表3-3可以看出,一阶差分后的t统计量为-2.235587,显然大于-3.531592、-2.905519和-2.590262。因此,可以再次确定,该时间序列非平稳。接下来,对序列y在进行二阶差分处理,即得到序列dy2,序列dy2的时序图见图3-5所示:图3-5序列y二阶差分后的时序图从上面的时序图可以看出,序列dy2虽开始有一段明显上升的趋势,但总体是平稳的,所以初步判断其平稳。接着,对序列dy2进行单位根检验,检验结果见表3-5所示:表3-4序列y的二阶差分的单位根检验表由上图可以看出,二阶差分后的t统计量为-8.014993,显然小于-3.528515、-2.904198和-2.589562。因此可以判断序列dy2是平稳的,由此得出差分次数d为2。3.4模型识别 由上述的研究可知,序列y二阶差分后的序列是平稳的,将差分后的序列定为序列w,然后根据序列w建立相关图,见表3-6所示:图3-6序列w的相关检验图由图3-6的相关图可以看出,它们二者都是截尾的,根据表3-6可以估计模型有以下几种形式:。下面进行模型的估计。3.5估计模型参数经过多次组合和实验,我们选择模型,即[8],我们可以根据表3-5看出,p的值小于0.05,拟合程度较好,可以选择这个模型。表3-5:模型的检验表3.6检验模型的适应性图3-5ARIMA(1,2,1)拟合图根据图3-5可以看出,模型的拟合程度很好,因此可以采用该模型。3.7根据模型进行预测上面根据国家统计局的数据,运用Eviews软件对数据进行处理,然后得出2022年中国人口出现负增长的现象,预计2025年会维持在14亿左右[9]。可见我国对人口进行了一定的控制,采取了一定的措施,下面对我国历年来的人口死亡率建立模型,进行预测。4.我国死亡率预测模型的建立4.1录入数据根据国家统计局,收集1949年至2020年我国年末人口死亡率数据,见表4-1所示:从图4-1中可以看出我国死亡率由高降低,接下来维持一个数值左右变化,并且变化幅度较小。表4-1我国1949年至2020年人口死亡率表年份死亡率(%)年份死亡率(%)年份死亡率(%)年份死亡率(%)1949年201967年8.471985年6.782003年6.401950年181968年8.251986年6.862004年6.421951年17.81969年8.061987年6.722005年6.511952年171970年7.641988年6.642006年6.811953年141971年7.341989年6.542007年6.931954年13.181972年7.651990年6.672008年7.061955年12.281973年7.081991年6.702009年7.081956年11.41974年7.381992年6.642010年7.111957年10.81975年7.361993年6.642011年7.141958年11.981976年7.291994年6.492012年7.131959年14.591977年6.911995年6.572013年7.131960年25.431978年6.251996年6.562014年7.121961年14.331979年6.211997年6.512015年7.071962年10.081980年6.341998年6.502016年7.041963年10.11981年6.361999年6.462017年7.061964年11.561982年6.602000年6.452018年7.081965年9.51983年6.902001年6.432019年7.091966年8.871984年6.822002年6.412020年7.07图4-1我国1949年至2020年人口死亡率折线图新中国成立以来,中国人口由建国初的5.4亿增加到2020年的14.1亿,在短短七十年内,人口翻了将近三倍,可见随着中国的发展,人民生活质量得到了极大的改善,人口增长也在快速增长。新中国成立之初,我国人口死亡人数较多,之后几年也一直维持在较高水平,1960年高达25.43%,主要由于当时生活水平低,医疗条件差,生病得不到及时的治疗,而导致死亡率高,而且当时人们的平均寿命也较低。新中国成立后,人民生活得到了不断提高,社会恢复和平,生活恢复宁静,没有战争的社会使世界更加和平,人民相处更加和睦,并且医疗水平不断提高。到1965年,死亡率已经降低至9%以下,人均寿命也有很大的提高。结合图3-1和图4-1可以看出,在2019年以后,人口总量高达十四亿,而死亡率也保持在7%左右,可见人口总量还在增加,但死亡率不会有较大的改变。伴随着人口增长,老年人口较多问题逐渐突出。接下来根据1949年至2020年中国人口死亡率数据预测未来五年人口死亡率的变化情况。4.2判断时间序列的稳定性用Eviews软件将数据录入,然后绘制时序图,将人口死亡率序列命名为序列x,序列x的时序图如下图所示:图4-21949年至2020年人口死亡率数据时序图根据图4-2可以看出,该序列x先是短期下降,然后突然上升到一个新的高峰位置,接着下降,最后趋于一个较为平稳的状态,总体来说,呈现下降趋势,所以,初步判断,该序列非平稳。为了进一步验证该结果,我们对其进行相关检验,检验结果见图4-3:图4-3序列x的相关检验图根据表4-2所示,我们可以看出,虽然偏自相关图是平稳的,但自相关系数是呈现减少的状态,因此,该序列非平稳。接下来,我们对序列x做单位根检验,检验结果见表4-2:表4-2序列x的单位根检验表从表4-2可以看出,该序列单位根检验的结果t统计值为-2.519792,均大于-3.533204、-2.906210、-2.590628,因此,可以确定序列x非平稳。4.3确定差分次数d我们已经知道了该时间序列是非平稳的,接下来根据时间序列的差分序列确定差分次数d。先建立一阶差分序列,见图4-3:图4-4序列x的一阶差分后的时序图由图4-4可以看出,序列x的一阶差分后的新序列x1先是波动较大,然后呈现一条直线,初步判断序列x1是平稳的。接下来,对其做单位根检验,检验结果如下:表4-3序列x1的单位根检验表根据表4-4的检验结果可以看出,序列x1的单位根检验中t统计值为-4.505540,明显小于-3.548208、-2.912631、2.594027,因此,可以确定序列x1是平稳的。因此,可以判断序列x的差分次数d为1。4.4模型识别 由上面可知,序列x一阶差分后的序列是平稳的,将差分后的序列定为序列r,然后根据序列r建立相关图,见图4-5所示:图4-5序列r的相关检验图根据图4-5的序列r相关检验,我们估计模型为:。4.5估计模型参数经过多次组合和实验,我们选择模型,即,我们可以根据表4-4看出,p的值小于0.05,拟合程度较好,可以选择这个模型。表4-4模型的检验表4.6检验模型的适应性图4-6ARIMA(0,1,2)的拟合图根据图4-6所示,模型的拟合程度较好,因此可以采用该模型。4.7根据模型进行预测上面根据国家统计局的数据,运用Eviews软件对数据进行处理,根据预测结果,可以知道我国人口死亡率将维持在7%左右,在我国人口基数庞大的同时,老龄化问题突出,可见我国人口仍然面临很严峻的问题。下面对我国历年新生儿出生率数据建立模型,并且进行预测。5.我国出生率预测模型的建立5.1录入数据根据国家统计局收集数据,见表5-1和图5-1:从表中可以看出我国出生率由高降到低,接下来维持一个数值左右变化,并且变化幅度较小。表5-1:1949年至2020年我国人口出生率表年份出生率(%)年份出生率(%)年份出生率(%)年份出生率(%)1949年361967年34.121985年21.042003年12.411950年371968年35.751986年22.432004年12.291951年37.81969年34.251987年23.332005年12.401952年371970年33.591988年22.372006年12.091953年371971年30.741989年21.582007年12.101954年37.971972年29.921990年21.062008年12.141955年32.61973年28.071991年19.682009年11.951956年31.91974年24.951992年18.242010年11.901957年34.031975年23.131993年18.092011年13.271958年29.221976年20.011994年17.702012年14.571959年24.781977年19.031995年17.122013年13.031960年20.861978年18.251996年16.982014年13.831961年18.131979年17.821997年16.572015年11.991962年37.221980年18.211998年15.642016年13.571963年43.601981年20.911999年14.642017年12.641964年39.341982年22.282000年14.032018年10.861965年381983年20.912001年13.382019年10.411966年35.211984年19.902002年12.862020年8.52图5-11949年至2020年我国人口出生率折线图从图5-1可以看出,从1949年至2020年我国人口出生率先是增长状态,然后几年处于下跌状态,接着就是突然升起至一个高峰期,最后缓慢下跌,总体处于下跌状态。新中国成立之初,社会和平安定,人民生育意愿强烈,国家鼓励生育,人口出生率普遍维持在35%以上;1959年至1962年期间,社会出现自然灾害,出生率骤减;自然新灾害一过,出现了补偿生育政策,出生率又有所上升;1970年,国家意识到人口不能无节制的增加,出现了计划生育政策,使得人口增长得到了控制,出生率处于下降状态;2015年,国家为了防止老年人口过多问题,开启了二胎政策;接着2021年,为进一步优化生育政策,国家开始针对人口问题实施一对夫妻可以生育三个子女的政策。但是即使如此,出生率还是不见上涨。5.2判断时间序列的稳定性用Eviews软件将数据录入,然后绘制时序图,将数据命名为序列z,序列z的时序图见图5-2:图5-21949年至2020年我国人口出生率时序图根据上面的时序图可以看出,我国从1949年至2020年期间,人口出生率变化幅度很大,并且在短时间内升降明显,因此,初步判断,该时间序列不平稳。为了进一步验证该序列非平稳,我们对其进行相关检验,检验结果见图5-3所示:图5-3序列z的相关检验图根据图5-3所示,我们可以看出,虽然偏自相关图的是趋于平稳的,但自相关系数是减少的,因此,初步判断该序列非平稳。接下来,我们对序列x做单位根检验,检验结果见表5-3:表5-2序列z的单位根检验表从表5-2可以看出,该序列单位根检验的结果t统计值为-1.327780,均大于-3.525618、-2.902953、-2.588902,因此,可以确定序列z非平稳。5.3确定差分次数d我们已经知道了序列x是非平稳的,接下来根据时间序列的差分序列确定时间序列的差分次数d。先建立一阶差分序列,并且命名为序列dz1,见图5-3:图5-4序列z的一阶差分后的时序图根据图5-4可以看出,该值在开始的时候波动幅度较大,初步判断序列z的一阶差分平稳。接下来对序列dz1作单位根检验,检验结果如下图所示:表5-3序列dz1的单位根检验表见表5-4所示,该序列单位根检验的结果t统计值为-6.872960均小于-3.528515、-2.904198、2.589562,因此,可以确定序列dz1平稳。因此,可以判断差分次数d为1。5.4模型识别由上面可知,序列z一阶差分后的序列是平稳的,将差分后的序列定为序列h,序列h的相关检验见表5-5,图5-5序列h的相关检验图根据表5-5中序列r的相关图,我们估计模型为:。然后对模型进行估计。5.5估计模型参数经过多次组合和实验,我们选择模型,即,我们可以根据表5-6,p的值小于0.05,拟合程度较好,可以选择这个模型。表5-4模型检验表5.6检验模型的适应性图5-6ARIMA(1,1,1)拟合图根据图5-5可以看出,模型的拟合程度较好,因此可以采用该模型。5.7根据模型进行预测上面根据国家统计局的数据,运用Eviews软件对数据进行处理,根据预测结果,我国未来几年人口出生率将低于2020年的8.52%,在人口基数庞大的同时,出生率低,国民生育意愿低,将面临更多的人口问题,如男女比例失调,教育和民族等问题。6.论文的总结6.1分析结果通过上面分析可以看出我国人口从1949年开始,一直呈现直线上升的现象,预计未来会有所下降;然后保持在14亿左右,而我国人口死亡率变化较大,在1958年附近突然升高,然后降低,到现在随着医疗水平的提高,死亡率有所下降,预计未来会在7%左右;而我国人口出生率确变化不定,与国家期望呈相反状态变化,为了减少人口老龄化继续加重,国家有意提高新生儿出生率,“二胎”、“三孩”等政策的出现,但是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年专利权质押合同登记程序
- 企业法律顾问合同(2025年版)
- 2025年审计鉴定合同
- 五年级上册数学教案-总复习 第2课时 图形与几何|北师大版
- 二年级上册数学教案-用厘米做单位量长度 (7)-西师大版
- 专题一第2课三、《便携移动设备》教学设计 2023-2024学年青岛版(2018)初中信息技术七年级上册
- 2025年黑龙江省绥化市单招职业倾向性测试题库含答案
- 2025年湖南司法警官职业学院单招职业技能测试题库必考题
- 2025年吉林省辽源市单招职业适应性测试题库附答案
- 2025年黑龙江护理高等专科学校单招职业倾向性测试题库汇编
- 2025届东方电气集团校园招聘正式开启笔试参考题库附带答案详解
- DeepSeek科普学习解读
- 2024年山东公务员考试申论试题(B卷)
- 部编2024版历史七年级下册第二单元第12课《宋元时期经济的繁荣》检测卷
- 【人教版化学】必修1 知识点默写小纸条(答案背诵版)
- 危险化学品目录(2024版)
- 脑卒中-脑卒中的康复治疗
- 疫情统计学智慧树知到答案2024年浙江大学
- 浙江省绍兴市各县区乡镇行政村村庄村名居民村民委员会明细
- 人教版八年级数学第二学期教学计划+教学进度表
- 水转印检验规范(吉利)
评论
0/150
提交评论