北航数理统计回归分析大作业_第1页
北航数理统计回归分析大作业_第2页
北航数理统计回归分析大作业_第3页
北航数理统计回归分析大作业_第4页
北航数理统计回归分析大作业_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学专1995-2012年的财政收入为因变量,选取了8个可能的影响因素,选用逐步回归法对各影响因素进行了筛选分析,最终确定了其“最优”回归方程。关键字:多元线性回归逐步回归法财政收入SPSS1引言践、指导实践的科学方法。政收入的充裕状况。之间的关系,总结主要影响因素,并对其作用、前景进行分析和展望。2多元线性回归2.1多元线性回归简介行处理的。对多元线性回归模型简要介绍如下:如果随机变量y与m(m2)个普通变量x,xx有关,且满足关系式:12mxmyxx01122mED(2.1)2其中,,,,是与x,xx无关的未知参数,是不可观测的2012m12m随机变量,~N(0,I)。2N1式(2.1)为m元理论线性回归模型,其中,,为回归系数,012mx,xx为回归因子或设计因子。(,)实际上反映了因子im12mixi,)对观测值y的作用,因此也称m(,)为因子imiixi,)的效应。mi(,)进行最小二乘估计后,可以得到m元经验通过对回归系数imi回归方程为:ˆˆˆˆˆyxxx01122mm(2.2)ˆˆˆˆ也称式(2.2)为m元线性回归方程。,称012m为回归系数。2.2逐步回归法行筛选。本次选用的方法是逐步回归法。1)回归效果的显著性检验y与变量x,xx线性相关的密切程度可以用回归平方和U在总平方和L12myyU中所占的比例来衡量。称R为y关于x,xx的样本复相关系数,L12myyUR2Lyy回归方程对原有数据拟合程度的好坏。显然0R21,其越接近1,回归方程拟合程度越高。2)偏F检验检验某个自变量对y的影响是否显著的正规方法是偏F检验。设原回归方程(全模型)为:ˆˆˆˆˆˆˆˆxxxxyxx01122i1i1iii1i1mm2去掉变量x后的新回归方程(减模型)为:iˆˆˆˆˆˆˆxxxyxx01122i1i1i1i1mm全模型的复相关系数的平方为R2,减模型的复相关系数的平方为R,定义2iRRR。若R几乎为零,则说明x对y没有显著影响,反之则表示x2222iii对y有其它变量不可替代的显著影响。检验假设:H:RH:R0220i1i当H为真时,检验统计量为0ˆR22F~FnmiiR)/(nmSci22ii对于给定显著性水平FFFnm则拒ii绝H,说明x对y有显著影响,应在减模型中引入自变量x;反之则应剔除x,0使之成为减模型。偏FF法进行检验的。3)逐步回归法的步骤F检验量从回归模型中剔除。具体步骤如下:ˆˆ(0)1、对m个自变量分别与y建立回归模型ˆ,对它们分别计算xi(0)i0iF,得F中最大的那个值,比如F。ii1(Ⅰ)如果FF,则计算结束,即y与所有自变量均线性无关;进1(Ⅱ)如果FF,则引入x,建立回归方程进11ˆˆˆ(2.3)y0x1132、建立y与自变量子集{x,x}(iL)的二元回归模型Li11ˆˆˆ(0)iˆxx(2.4)(0)i0(0)1Li1以式(2.4)(2.3)为减模型求FFii如说F。L2⑴如果FF,则计算结束,这时建立的模型为式(2.3);L进2⑵如果FF,则引入x,建立回归方程L进L22ˆˆˆ(2)2ˆxx(2.5)(2)0(2)1L213、当引入x后,对x做偏F检验,看x是否需要剔除;LLL211⑴如果FF,则不剔除x,并继续引入下一个变量;L出L11⑵如果FF,则从式2.4中剔除x,再继续引入下一个变量。L出L11剔除为止。3财政收入回归分析实例本次作业利用SPSS软件和逐步回归法,对原始数据进行了回归分析,并最终获得了最优回归方程,解决这个问题。3.1数据收集及处理人口数(万人)等。本文从中选取了国内生产总值(亿元),人口数(万人),能源生产总量(标准煤)(万吨),农作物总播种面积(千公顷),货运量(万吨),出口总额(亿元),进口总额亿元,建筑业总产值(亿元)8个因素作1所示为所选取的自1995年至2012年18年间财政收入与所选变量的数据汇总。483427485374945384558139.31.013.2建立回归模型过程为了研究财政收入与各种影响因素的关系,必须要建立二者之间的数学模型。数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型了便于研究,我们可以建立财政收入与各影响因素的线性回归模型,模型如下:αXαX2+αXαXαXαXαXαX112334455667788其中,Y是因变量,X是自变量,是各个自变量的系数。各变量符号的定ii义见表2。Y83.3线性回归模型的验证6))))))7))1)财政收入与国内生产总值散点图;(23)财政收入与能源生产总量;(45)财政收入与货运量散点图;(67)财政收入与进口总额散点图;(8图1逐步分析方法进行进一步的显著性判断。3.4线性回归的结果及分析利用统计数据建立回归模型,用SPSS软件的线性回归分析功能,得到以下8表3输入移去的变量输入的变量移去的变量步进(准则:F-to-enter的概率<=.050,1F-to-remove的概率>=.100)。步进(准则:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。步进(准则:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。a.因变量:财政收入表4显示三个模型的拟合情况,模型3的复相关系数R=1.000,可决系数R2=0.999,调整可决系数为0.999,估计值的标准差为916.74710,可见模型3的拟合度较高。RR标准估计的误差21615.379291163.51991916.74710a.预测变量:(常量),货运量(万吨)b.预测变量:常量),),国内生产总值(亿元)c.预测变量:(常量),),能源生产总量(万吨)d.因变量:财政收入(亿元)从表5中看出方差分析结果可以看出,三个模型的值检验Sig值远小于0.01,可见,最终模型的整体线性关系是成立的。9FSig..000a11161722.046E101.023E10.000b.000c1353778.5862.047E106.823E9840425.252如表6所示,包含的是进入模型的变量,主要描述模型的参数估计值,以及t检验Sig值都接近或小于0.010,因此,最终的回归效果很好。tSig..000B(常量)1.999.000.000.000.001.103.0263.980(常量).003.002.000货运量(万吨)能源生产总量(万吨)-.124-3.188.007tSig..000B1货运量(万吨)(常量).000.000.000.001.103.0263.980(常量).003.002.000.176.031-.060.019-.124-3.188.007a.因变量:财政收入(亿元)如表7t检验的Sig值都大于0.1,这些变量对模型的贡献都不明显,所以它们都不包含在最终方程中。共线性统计量t.006.061.092.064.002.027.034.369.073.088.848.007.283.446.427-.050-.649-.2862出口总额(亿元)3a.模型中的预测变量:(常量),货运量(万吨)b.模型中的预测变量:(常量),货运量(万吨),国内生产总值(亿元)N5652.1587116279.0000-1919.03113-.952图2图4从图4在垂直围绕的范围内,预测值与标准化残差值之间没有明显的关系,所以回归方程应该满足线性关系与方差齐性的假设且拟和效果较好。3.5最优回归方程由以上多元回归分析可得各个分量的影响关系,从而得出最优方程为:Y=-15515.418+0.176X-0.060X+0.015X135其中R=0.999,F=8117.9992X代表国内生产总值,X代表能源生产总量,X代表货运量135代入2011年数据,可得Y=-15515.418+0.176×473104.0-0.060×317987+0.015×3696961=104126.0820112008年实际财政收入为103874.43(亿元)可算得误差为e=(104126.081-103874.43)/103874.43×100%=0.24%,在可接受误差范围之内,可见拟合效果能够满足要求。4结论在本次作业中,结合过去的经验和学习结果,我选择了影响财政收入的8个因素,通过查阅2013中国统计年鉴,利用IBMSPSSStatistics19.0软件对所最终发现所选8个因素中有6个因素与国民总收入之间的的散点图呈现良好的线很明显。了主要、次要原因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论