基于多元统计分析的上市公司市盈率分析报告毕业设计正文终稿_第1页
基于多元统计分析的上市公司市盈率分析报告毕业设计正文终稿_第2页
基于多元统计分析的上市公司市盈率分析报告毕业设计正文终稿_第3页
基于多元统计分析的上市公司市盈率分析报告毕业设计正文终稿_第4页
基于多元统计分析的上市公司市盈率分析报告毕业设计正文终稿_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程期末报告(科研训练)题目:基于多元统计分析的上市公司市盈率分析报告姓名:学院:数学科学学院年级:学号:2015年5月19日

基于多元统计分析的人均人身险原保险保费收入地区差异原因探究摘要本文着重于对影响人均人身险原保险保费收入的相关因素进行探究与分析,利用中国统计年鉴的相关数据,从人均人身险原保险保费收入按省市分布不均的特点入手,去探究与发掘导致人均人身险原保险保费收入分布地域差异背后的社会经济发展原因。在方法上主要利用了线性回归模型来判断不同的回归模型中不同指标与人均人身险原保险保费收入的相关性,并利用逐步回归的方法解决多重共线性。解决了人均人身险原保险保费收入同经济,医疗,教育等几大影响因子的关系,主要目的是找到统计意义上较为显著的指标,联系其背后的现实生活意义进行分析,给出提高人均人身险原保险保费收入的切实建议,从而实现该课题的目标。此外,利用主成分分析模型,可以很好地对现有31个省份保险业的发展做出一个大致的划分。参考线性回归模型,最主要的结论是验证了人均人身险原保险保费收入同人均GDP,高等学校在校生数,医疗水准,人口死亡率等因素的相关关系,为进一步选择措施来促进保险行业的发展打下理论基础。因此,我们可以肯定,发展经济水平,大力提升文化素养,进一步完善医疗设施,努力提高人民收入与存款都会提升人均人身险原保险保费收入。关键词原保险保费收入回归模型逐步回归法主成分分析经济指标教育指数医疗水平

AnalysisofDifferenceoftheOriginalPremiumIncomeindifferentareasbasedonMultivariateStatisticalAnalysisAbstractThispaperfocusesontheexplorationandanalysisofthefactorsaffectingtheoriginalpremiumincome.ByusingthedatafromNationalBureauofStatisticsofthePeople’sRepublicofChina,themainfunctionofthelinearregressionmodelistodeterminethefactorsinfluencingtheoriginalpremiumincome,whichfocusesontheeconomic,health,educationfactor.Andthemainpurposeistofindthecorrelationbetweentheoriginalpremiumincomeandsomeothersocialindicators,suchaseconomics,healthcaresystem,deathrateandeducation.Withthelinearregressionmodelandthestepwiseregression,themostimportantconclusionisthatthereisastrongcorrelationbetweentheaveragelifeexpectancy,educationlevel,healthcaresystemandtheeconomics.AndweusethePrincipalcomponentanalysistosortthedata.Therefore,wecandrawaconclusionthatweneedtokeepdevelopingoureconomic,healthcaresystemandeducationsystemtoimprovetheoriginalpremiumincome,asweexpect.KeywordsOriginalPremiumIncomeLinearregressionStepwiseregressionPrincipalcomponentanalysisEconomicsHealthcareEducation

目录引言 5一.研究资料和方法 6i. 研究资料 6ii. 研究方法 6二.数据描述 7i. 东、中、西部地区人均人身险原保险保费收入差异明显 7ii. 近些年的发展显著提高了人均人身险原保险保费收入 10iii. 社会经济数据的选用与处理 11三.研究结果及其分析 14i. 人均人身险原保险保费收入的单变量回归模型 14a) 人均人身险原保险保费收入同经济指标GDP的关系 14b) 人均人身险原保险保费收入同医疗指标的关系 15c) 人均人身险原保险保费收入同教育程度指标的关系 17d) 人均人身险原保险保费收入同人口死亡率的关系 18ii. 人均人身险原保险保费收入的多变量回归模型 19a) 基于逐步回归法的人均人身险原保险保费收入的多变量回归模型 19b) 基于主成分分析的人均人身险原保险保费收入的数据分类方法 20结论 22致谢语 23参考文献 23

引言近日来,养老金改革以及相应的退休年龄变化成为了万众瞩目的社会焦点。它的重要性不仅在于平衡国家收入与开支,更在于实现自古以来所期待与追求的“老有所养”的社会责任。和谐社会是当今一大主题,每位社会成员,包括年轻人与中年人,都应该为这个社会贡献出自己的重要力量。本文就是希望从一个角度,利用多元统计分析的相关工具,对养老金问题以及进一步的解决办法提供新的视角,以期能够获得新的认知。舆论压力的核心在于责难政府通过延迟退休时间的措施把部分养老压力转移到民众身上。在笔者看来,与其盲目跟风抱怨政府政策措施,不如从根源开始分析这一问题产生的根源,一来可以给我们带来更加合理化的视角与看法,二来也有机会能够利用自己的专业知识从新的角度剖析社会问题。我们不得不认清养老金问题的根源在于社会的老龄化。在经历上世纪建国后初期人口爆发性增长之后,史上最为严厉与有效的计划生育政策作为基本国策走上前台。正是介于计划生育这一基本政策,我国的人口增长速度与比率均大幅下降,这种趋势为今日开始逐渐呈现的人口老龄化埋下了重要的伏笔。钱是不会凭空从天上掉下来的,怎么可能有国家不差钱呢。养老金的来源不外乎这几种,一是大家按照某个标准交的保险金形成一个基金,进行一定的投资收益,弥补每年收上来的钱和付给老年人的钱的差额;二是不形成基金池,按需要付的数额来制定收费标准,左手收年轻人的钱,右手付给老人;三是个人帐户制度,好像是半强制性的存款一样,你工作时存的养老金是你自己的,替你保管,给你一定的收益,等退休以后可以取出来花。几乎所有的国家的养老金制度都可以归类为其中之一或是它们的组合。同样受压于社会老龄化问题,情形更为严峻的日本采用的主要是第一种形式。当我们意识到人口老龄化加剧的现状之后,如何去弥补政府养老能力不足的问题就转变成了问题的焦点。在21世纪,金融业与保险业高度繁荣的今天,市场这只无形的手可以很有力地帮助并辅佐政府有形的手。在养老金不能充分保证退休生活的时候,绝大多数人会把目光转向保险市场,选择适合自己的保险年金,以期达到年轻时储蓄,年老时收获的目标与作用。人身险是以人的寿命和身体为保险标的物的保险。当人们遭受不幸事故或因疾病、年老以致丧失工作能力、伤残、死亡或年老退休时,根据保险合同的约定,保险人对被保险人或受益人给付保险金或年金,以解决其因病、残、老、死所造成的经济困难。考虑以省份为参考单位,综合大量人口数据而得出的人均人身险原保险保费收入可以较为充分地避免因为学历,能力等个人差异,先天遗传疾病等遗传差异或不同行业的不同薪资待遇而产生的影响,从而更完整地反映出当地社会经济,自然环境,医疗条件以及受教育程度等方面的发展和影响。此外,人均原保险保费收入是一个具有代表性和全面综合性的指标,相比较于工资收入或股票投资,其不受年龄构成的影响,可以用来对不同地区的养老需求进行对比分析。一.研究资料和方法研究资料数据来源:互联网上中国统计年鉴资料中有关各地区原保险保费收入情况,分地区经济发展状况,教育程度,医疗条件,死亡率等统计数据。研究方法基于中国统计年鉴的相关统计数据,利用Stata软件制作相关图表,使用单变量,多变量的回归模型,对多重共线性使用逐步回归的方法,根据汇总分析结论得出会影响人均原保险保费收入的解释变量及每个解释变量的影响程度。并利用主成分分析进一步挖掘数据中隐含的社会现象并对数据进行分类。二.数据描述本文所使用的数据来源于中国统计年鉴,包含了31个省级行政单位(香港特别行政区,澳门特别行政区,台湾省三处数据暂缺)。各地区人均原保险保费收入是反映一个国家或地区人口经济发展水平,政府养老扶持力度,以及死亡率等的重要指标,也是开展人寿保险研究和制定社会保障政策的重要依据。目前,我国平均预期寿命已高于大多数发展中国家,但保险行业的发展仍落后于先进水平较多。由于我国地域辽阔,各地区经济发展水平、医疗条件、生活习俗及自然环境不同,其数值表现有较大差异。本文拟根据国家统计年鉴中的相关资料,分析我国各地区人均原保险保费收入的差异特征、变动趋势及其原因。东、中、西部地区人均人身险原保险保费收入差异明显我国人均人身险原保险保费收入地区差异呈现东高西低的特点。针对各地区人均人身险原保险保费收入,以2010年为例,首先进行描述性统计分析:由此结果我们可以看出,在人均人身险原保险保费收入这一指标上,各省级行政区存在着较大的差异,最高值与最低值相差2698元之多,且前者是后者的143倍。为进一步了解其数据分布,我们使用箱线图来展示分位数等相关信息。

由以上结果我们可以看出四分位数为:320.5(25%),525.6(50%),627.4(75%).2010年人均人身险原保险保费收入:数值最高的前三个省份分别为:北京,上海,山西,均达到了1000元以上。数值最低的三个省份分别为:西藏,贵州,青海,均不足200元,西藏甚至不足20元。对比最高的三个省份和最低的三个省份,很容易考虑到东西部的不平衡发展。东部因地理历史因素,发展水平相对西部地区更为先进,为了直观验证这种东西部发展不均的印象与假设,本文利用Stata做出2009年中国人均人身险原保险保费收入分布图(图中单位:万元)。从该地图中,我们可以显而易见地看出除了重庆市作为直辖市掌握较多资源,山西省借助能源优势经济发展程度较高外,整体上我国人均人身险原保险保费收入从东部到中部,西部呈现逐步递减状态。由此可见,在大体上,人均人身险原保险保费收入的分布同经济社会的发展有着较为密切的关系,由此来看,本文所选择的主题有着较为显著的现实意义。为进一步展现人均人身险原保险保费收入的地理分布差异,本文制作了东部中部西部的人均人身险原保险保费收入箱线图:根据以上箱线图,数据分布清晰明了地展示出:从西部10省份看起,绝大多数分布在600元及以下,甚至有个别省份人均人身险原保险保费收入不足20元。中部10省人均人身险原保险保费收入分布的最为均匀与一致,几乎全部落在了500元左右的区间内。东部11省人均人身险原保险保费收入分布大多均位于600元到2700元之间,显著高于中部与西部。其次,针对人均人身险原保险保费收入的离散程度,中部最小,东部较大,西部最大,反映了西部省份内部的气候,社会条件,经济发展差异最大。西部开发需要进一步的推进,不仅要推进西部整体的发展与改革,同时也要注意西部10省内部之间较大的发展差距,政策应该引导西部的均衡发展。再者,针对人均人身险原保险保费收入的偏斜度,东部向低端偏斜,西部则向高端偏斜。以上信息充分说明了我国人均人身险原保险保费收入地区之间的差异性较为明显,因此研究人均人身险原保险保费收入受哪些因素影响就显得非常重要,一方面对可以对政策制定者提供重要的意见,另一方面也为解决医疗保障与养老保险问题提供了新的可能性。近些年的发展显著提高了人均人身险原保险保费收入显而易见,在过去的三十多年间,人均人身险原保险保费收入有了显著的增长,不论是最大值,最小值,抑或是各分位数都非常明显地保持了正向递增。2009年的人均人身险原保险保费收入离散程度最高,2008年次之,2007年人均人身险原保险保费收入离散程度最低。三个时间段数据的平均值随时代发展稳步递增。3年间,各省份地区自然环境的差异在如此短暂的时间跨度上可以忽略不计,时间轴线上的对比很好地说明了在我国影响人均人身险原保险保费收入最明显的因素是社会经济因素,而非自然环境因素,这个结论将本文的讨论重点着重集中在社会经济发展的各个层面对人均人身险原保险保费收入的影响。社会经济数据的选用与处理众所周知,现代社会繁荣稳定的基石便是经济的繁荣。正所谓“经济基础决定上层建筑”,很多时候绝大多数的社会相关指标都或多或少受到经济发展水平的影响,有时甚至是决定性因素。衡量一个地区的经济发展水平有很多种不同的指标与角度,比如税收数量,就业人员人数,科技创新专利数量等等,但这些因素很多时候往往只能反映经济发展的某一层次或某一方面,并不能很好地在大局上给出某个省份经济发展水平的客观评价。为了客观描述整体的发展状况,本文选用GDP作为衡量经济发展水平的指标。选用GDP指标存在一个需要解决的问题:各地区GDP指标考察的对象是某个省的整体经济运行状况,但人均人身险原保险保费收入的对象却是某个省的个体的保费投入,二者在考察对象上便存在显著的差别。为消除这一差别,使用各省份的人均GDP数据作为衡量各省份经济发展的指标。提到人均人身险原保险保费收入,绝大多数人的第一反应便是生老病死。而医院作为医疗保障环节重中之重的机构,其质量和效率的高低直接影响着该地区的健康水平。考虑衡量医疗水平的指标,本文选用婴儿死亡率这一指标来刻画医疗机构的效能与发展水平。教育,同样深刻地影响着人们的行为方式与生活习惯。往往很多慢性病的根源就在于不良的生活习惯,除此之外,现代化的教育也会促进完善的保险制度的普及。接受良好的教育不仅仅能培养健康的生活习惯,面对生活中的不确定性,受现代化教育者更容易接受牺牲当今部分收入来换取未来的稳定性这一规避风险的做法。因此,不能否认教育对人均人身险原保险保费收入可能会产生的巨大影响。为了进一步探讨这种因素的影响,本文选用每十万人口高等学校平均在校生数作为衡量教育指标的数据。具体数据使用见下表:gdpperpersonregionmededuinsuranceperpersondeathrategrowthrate7.19383Beijing8.864102717.514.563.57.09962Tianjin10.74432812.09665.72.62.83506Hebei9.21871308.76236.436.52.5743Shanxi19.220501321.8025.984.894.72134InnerMongolia291794420.59035.613.964.2189Liaoning18.72659592.05615.090.973.15575Jilin24.42695525.69464.741.952.7048Heilongjiang18.42420578.27285.422.067.45485Shanghai12.443932228.485.942.75.26416Jiangsu152786863.3176.992.565.08992Zhejiang17.12303627.42415.594.632.07486Anhui26.11742452.61356.66.473.99056Fujian232039540.451866.22.11805Jiangxi432118320.49595.987.894.08536Shandong12.92153525.55496.085.622.45521Henan18.51774497.24196.464.992.78768Hubei25.12829529.766963.482.44105Hunan38.12040416.256.946.114.40697Guangdong15.91952690.03834.527.262.07589Guangxi441436214.56195.648.532.37695Hainan29.22001244.14865.78.962.74753Chongqing38.42317685.08196.23.72.13619Sichuan38.41732534.87936.432.721.32286Guizhou52.41043170.09416.696.961.56993Yunnan65.81298243.18986.456.081.68747Tibet96.2131719.573495.0710.242.71027Shaanxi223045532.97446.2441.60968Gansu31.51806341.13476.716.612.39663Qinghai66.31080181.98486.198.322.66944Ningxia37.31721433.42914.79.682.48842Xinjiang58.51430479.95395.4310.56变量名称与单位对照表:insuranceperperson…………...……..人均人身险原保险保费收入(单位:元)gdpperperson…………………人均国内生产总值(单位:万元)med……….………..婴儿死亡率(单位:百分比)edu……………每十万人口高等学校平均在校生数(单位:个)deathrate……..…….人口死亡率(单位:百分比)growthrate……..…….人口增长率(单位:百分比)三.研究结果及其分析人均人身险原保险保费收入的单变量回归模型进行单变量回归主要是一种探索性的研究,遵从“从简单到复杂”的模型设计理念。通常单变量回归分析模型如下:之所以使用单变量回归,其主要目的是:1)寻找潜在的关键少数“X”;2)预测“Y”;3)确定如何设置“X”以优化“Y”.在本文的回归分析部分中,单变量回归模型首先用于确定上文分析后我们所感兴趣的三个因素是否同人均人身险原保险保费收入存在着较为显著的相关关系,其次可用于预测人均人身险原保险保费收入的变化。人均人身险原保险保费收入同经济指标GDP的关系根据中国统计年鉴,我们可以得到各省级行政单位区域内的相关人均人身险原保险保费收入与主要经济指标的数据,根据这一数据进行进一步的分析。首先,利用Stata软件绘制散点图与线性拟合图:从图中散点分布的趋势来看,可见具有较强的正相关性。进一步进行回归分析:具体的一元线性回归方程如下:人均GDP系数1.303的现实意义是:在其他指标不发生改变的情况下,人均GDP每变动(增加或减少)一万元,对应的人均人身险原保险保费收入会正相关地增加或减少249.74元。因此我们可以看出,尽管很多人认为GDP是单纯的经济指标,但是GDP对我们的生活水平乃至对未来风险的控制能力都有着紧密的不可分割的关系。人均人身险原保险保费收入同医疗指标的关系受经济社会条件、卫生医疗水平限制,死亡率难以降低,人们对于固定年限的年金这种保险方式一直抱有疑问。然而随着经济的发展,医疗卫生服务水平的提高,人均人身险原保险保费收入也在稳步增长。具体关系如下:从图中散点分布的趋势来看,可见具有较强的负相关性。进一步进行回归分析:婴儿死亡率系数-14.24的现实意义是:在其他指标不发生改变的情况下,婴儿死亡率每减少一个百分点,对应的人均人身险原保险保费收入会负相关地增加14.24元。因此,我们可以看出,医疗机构设施水平的高低,医疗服务与医疗资源的充分与否对我们的健康生活水平,乃至本文中所探究的人均人身险原保险保费收入都有着紧密的不可分割的关系,所以大力发展医疗卫生产业可以更好地保障人民身体健康,增加人民幸福指数,同时增加民众对于健康问题的重视程度。人均人身险原保险保费收入同教育程度指标的关系考虑了经济发展及医疗水平此类相对客观的指标,接下来受教育水平作为影响人民思想与生活方式的最为重要的指标,在主观上一定程度的影响了人们能否选择健康的生活方式,能否具有控制未来风险的积极性。散点图如下:从图中散点分布的趋势来看,可见具有较强的正相关性。进一步进行回归分析:从回归结果中我们可以看出,当edu变量的单位是每十万人口平均高等学校在校生数时,系数单位较小,对edu变量单位进行调整,变更为每百人平均高等学校在校生数。重新进行回归:每百人平均高等学校在校生数系数432.8的现实意义是:在其他指标不发生改变的情况下,每百人平均高等学校在校生每增加一位,对应的人均人身险原保险保费收入会正相关地增加432.8元。因此,我们可以看出,教育事业不仅是国家科技发展经济繁荣的基础,同样很大程度上会影响人的生活方式,影响到绝大多数的人民能否选择市场化的保险产业作为社保基金的良好补充。人均人身险原保险保费收入同人口死亡率的关系类似以上分析,人均人身险原保险保费收入同人口死亡率的关系如下:通过以上结果我们可以显而易见地看出,人均人身险原保险保费收入同人口死亡率关系不够显著,但为了谨慎起见,留在后期的多变量模型中以确保模型的精确。人均人身险原保险保费收入的多变量回归模型相比于单变量模型,在确定了经济,医疗,教育等因素对人均人身险原保险保费收入有着显著的影响之后,接下来讨论的重点自然而然放在了这些因素整体上会对人均人身险原保险保费收入产生怎样的影响。与单变量模型不同,通过比较不同解释变量的回归系数,我们可以较为客观地看出不同解释变量对被解释变量影响的强弱关系。更进一步,我们可以加入交互项来进一步扩充模型,并对结果进行分析,选择出最佳的模型。多变量回归模型的方程一般形式通常如下:基于逐步回归法的人均人身险原保险保费收入的多变量回归模型在选择模型的过程中,我们往往需要在“简洁”与“详尽”这两个不同的考量中取得一个合理的平衡,在前文的讨论中,我们着重研究了较为简洁的模型。在这一部分中,笔者希望能够加入之前讨论的所有五种因素在同一个模型中,使得模型的表述更为详尽,同时也能考虑到更多的变量。直接考虑所有因素进行回归,结果如下:从以上结果我们可以看出,首先从整体角度考虑模型的显著性,在5%的显著性水平下,整个模型的F值达到了14.34通过了F-test的显著性检验,也达到了0.74,整体拟合效果较好。再从每个变量的系数角度,利用t检验考察其显著性。变量edu是显著的,其余变量显著性效果不尽人意。进一步考虑,五个解释变量之间很可能存在多重共线性问题,从而对模型的精确度造成干扰,为了避免

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论