北航回归分析大作业_第1页
北航回归分析大作业_第2页
北航回归分析大作业_第3页
北航回归分析大作业_第4页
北航回归分析大作业_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用数理统计第一次课程论文学号:SY1227217姓名:袁帅2012年11月 北京航空航天大学数理统计课程论文第页符号说明变量符号居民消费价格指数y国内生产总值x1总人口x2能源生产总量x3人民币汇率x4居民存款x5第一产业总产值x6成灾受灾面积x7引言CPI(ConsumerPriceIndex居民消费价格指数)指在反映一定时期内居民所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格水平的变动率在一定程度上反映了通货膨胀(或紧缩)的程度。通俗的讲,CPI就是市场上的货物价格增长百分比。一般市场经济国家认为CPI增长率在2%~3%属于可接受范围内,当然还要看其他数据。CPI过高始终不是好事,高速经济增长率会拉高CPI,但物价指数增长速度快过人民平均收入的增长速度就一定不是好事,而一般平均工资的增长速度很难超越3-4%。居民消费价格指数(ConsumerPriceIndex,简称CPI)是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况。编制居民消费价格指数的目的,是了解全国各地价格变动的基本情况,分析研究价格变动对社会经济和居民生活的影响,满足各级政府制定政策和计划、进行宏观调控的需要,以及为国民经济核算提供参考和依据与就业形势报告(非农)结合在一起,消费者物价指数(CPI)就成了金融市场上被仔细研究的另一个热门的经济指标。它获得关注的原因显而易见:通货膨胀影响着每一个人,它决定着消费者花费多少来购买商品和服务,左右着商业经营的成本,极大地破坏着个人或企业的投资,影响着退休人员的生活质量。而且,对通货膨胀的展望有助于设立劳动合同和制定政府的财政政策。基于此目的,本文从国家统计信息网上选取了1991-2010年这20年间的年度财政收入及主要影响因素的数据,包括国内生产总值、总人口、能源生产总量、人民币汇率、居民存款、第一产业总产值、受灾成灾面积。并进一步采用多元逐步回归分析方法对以上因素进行了显著性分析,从而确定了关于居民消费价格指数的最优多元线型回归方程。数据的采集和整理数据采集本文在进行统计时,查阅《中国统计年鉴2011》中收录的1991年至2010年连续20年的居民消费价格指数(CPI)为因变量,并初步选取这20年的国内生产总值、总人口、能源消费总量、人民币汇率、居民存款、第一产业总产值、受灾成灾面积7个因素为自变量,其具体数据见表格1.表格SEQ表格\*ARABIC1年份CPI国内生产总值(亿元)总人口(万人)能源消费总量(万吨标准煤)人民币汇率(100美元)居民存款(亿元)第一产业总产值(亿元)受灾成灾面积(千公顷)1991103.421781.5115823103783532.339244.98157.0732911992106.426923.5117171109170551.4611757.39084.7772251993114.735333.9118517115993576.2015203.510995.5719611994124.148197.9119850122737861.8721518.815750.5864281995117.160793.7121121131176835.1029662.320340.9680921996108.371176.6122389135192831.4238520.822353.7682251997102.878973.0123626135909828.9846279.823788.483734199899.284402.3124761136184827.9153407.524541.975326199998.689677.1125786140569827.8359621.824519.1767132000100.499214.6126743145531827.8464332.424915.8890622001100.7109655.2127627150406827.7073762.426179.684008200299.2120332.7128453159431827.7086910.727390.8741062003101.2135822.8129227183792827.70103617.729691.8870222004103.9159878.3129988213456827.68119555.436239.0534042005101.8184937.4130756235997819.17141051.039450.9587842006101.5216314.4131448258676797.18161587.340810.8657232007104.8265810.3132129280508760.40172534.248893.0740562008105.9314045.4132802291448694.51217885.458002.262274200999.3340902.8133450306647683.10260771.760361.0684482010103.3401202.0134091324939676.95303302.569319.855964建模我选取了居民消费价格指数(CPI)做为因变量y,选取对CPI可能的影响因素为自变量,其中对应关系在1符号说明中已经列举。这里构建模型如下:y=其中ε为随机误差项,β0为常数项,β数据分析本文利用逐步回归法对该问题进行分析。该方法是从一个自变量开始,视自变量对y的显著程度,从大到小地依次逐个引入回归方程,但当引入的自变量由于后面的引入而变得不显著时,要将其剔除掉。引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步,对于每一步都要进行F值检验,以确保每次引入新的显著性自变量前回归方程中只包含对作用显著的变量。这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。本文运用统计软件SPSS的有关功能模块根据上述原理精选出一些配合较好和方差贡献大得自变量,组建回归方程。当F引=F剔=0时,则所有的变量全部被引入,逐步回归分析结果就和一般的多元线性回归分析结果相同。当F取值较大时,理论和实践都表明,在相同的F水平上,用逐步回归筛选出的显著变量个数往往比先引入全部变量后再剔除的办法要少一些。为了从挑选因子中筛选出尽可能多的因子建立模型,本系统可以自己给出F临界值,计算机默认的F引=0.05,F剔=0.1,如果入选的自变量因子数目不多,可通过人为降低F临界值的水平而筛选出更多的因子。如此时入选的因子太多,可人为提高F临界值的水平而筛选出有代表性因子来组建模型。如最后建立的模型的复相关系数不大,回归模型的拟合精度不太高,可根据这些入选因子来组建多元非线性模型。现将数据输入统计软件SPSS中,并设定F引=0.25,F剔=0.35可得如下分析结果:

表格SEQ表格\*ARABIC2输入/移去的变量a模型输入的变量移去的变量方法1总人口.步进(准则:F-to-enter的概率<=.250,F-to-remove的概率>=.350)。2能源消费总量.步进(准则:F-to-enter的概率<=.250,F-to-remove的概率>=.350)。3人民币汇率.步进(准则:F-to-enter的概率<=.250,F-to-remove的概率>=.350)。4第一产业产值.步进(准则:F-to-enter的概率<=.250,F-to-remove的概率>=.350)。a.因变量:CPI表2显示了变量的引入和剔除,以及引入或剔除的方法与标准。系统在进行逐步回归过程中产生了4个模型,模型1是按照F检验的标准概率值,先将与y最密切的总人口(x2)引入模型,建立y与x2之间的一元线性回归模型,然后再将能源消费总量(x3)引入模型,建立y与x2,x3之间的二元线性模型,最后分别依次把人民币汇率(x4),第一次产业产值(x6)引入模型,分别建立了他们与y之间的三元,四元线性模型。最后建立的是y与x2,x3,x4,x6之间的四元线性关系。表格SEQ表格\*ARABIC3模型汇总e模型RR方调整R方标准估计的误差1.542a.294.2555.763402.598b.357.2825.659423.704c.496.4015.167754.742d.550.4305.04186a.预测变量:(常量),总人口。b.预测变量:(常量),总人口,能源消费总量。c.预测变量:(常量),总人口,能源消费总量,人民币汇率。d.预测变量:(常量),总人口,能源消费总量,人民币汇率,第一产业产值。e.因变量:CPI表格SEQ表格\*ARABIC4模型汇总e模型RR方调整R方标准估计的误差1.542a.294.2555.763402.598b.357.2825.659423.704c.496.4015.167754.742d.550.4305.04186a.预测变量:(常量),总人口。b.预测变量:(常量),总人口,能源消费总量。c.预测变量:(常量),总人口,能源消费总量,人民币汇率。d.预测变量:(常量),总人口,能源消费总量,人民币汇率,第一产业产值。e.因变量:CPI

表格SEQ表格\*ARABIC5系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)84.6387.48211.313.00068.920100.357总人口1.382.504.5422.740.013.3222.4422(常量)63.59817.8743.558.00225.888101.307总人口2.310.873.9072.647.017.4694.151能源消费总量4.067E-5.000.4421.291.214.000.0003(常量)9.70330.466.318.754-54.88374.289总人口3.7841.0631.4853.560.0031.5306.037能源消费总量8.564E-5.000.9312.386.030.000.000人民币汇率.032.015.4962.095.052.000.0644(常量)-2.19131.012-.071.945-68.29163.909总人口3.8561.0381.5133.713.0021.6426.069能源消费总量2.100.0002.0842.222.042.000.000人民币汇率.039.016.6052.470.026.005.072第一产业产值.240.000-1.155-1.345.199-.001.000a.因变量:CPIFigureSEQFigure\*ARABIC1FigureSEQFigure\*ARABIC2FigureSEQFigure\*ARABIC3结论通过前面的分析与计算可以得到最优的回归方程:y=-2.191+3.856通过以上分析可以发现,居民消费价格指数与总人口,能源消费总量,人民币汇率以及第一产业总产值呈线型相关性显著。这说明我国的居民消费价格指数中受到包括总人口,能源消费总量,人民币汇率以及第一产业总产值等多方面的影响。CPI是一个滞后性的数据,但它往往是市场经济活动与政府货币政策的一个重要参考指标。CPI稳定、就业充分及GDP增长往往是最重要的社会经济目标。不过,从中国的现实情况来看,CPI的稳定及其重要性并不像发达国家所认为的那样“有一定的权威性,市场的经济活动会根据CPI的变化来调整”。当然,由于调研时间有限,上述回归模型存在一些不足,还需要不断查阅资料加以改进。但在一定程度上体现了与选取的自变量之间的线性关系,并能对因变量做出近似的预测。综合来看,数据模型基本达到了预期的目的。参考文献孙海燕,周梦,李卫国,冯伟.应用数理统计[M].北京:北京航空航天大学数学系,2011.张建同,孙昌言.以Excel和SPSS为工具的管理统计[M].北京:清华大学出版社,2002.[3]国家统计局.2011年中国统计年鉴[

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论