版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验报告实验课程:信息分析1专业:信息管理与信息系统班级:学生姓名:指导教师:请输入姓名完成时间:2013年6月28日.实验目的多元线性回归简单地说是涉及多个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。本实验要求掌握附带残差分析的多元线性回归理论与方法。二.实验环境实验室308教室三.实验步骤与内容1打开应用统计学实验指导书,新建excel表ty(年销售量)x1(地区人口)x2(人均收入)11.6227.42.4521.2183.25432.2337.53.80241.3120.52.83850.678.62.34761.6926.53.78270.
2、819.83.00881.92332.4591.1619.52.137100.555.32.56112.52434.02122.3237.24.427131.4423.62.66141.0315.72.088152.12372.6052.打开SPSS将数据输入。3.调用SPSS主菜单的分析一一回归一一线性命令,打开线性回归对话框,指定因变量(工业GDP比重)和自变量(工业劳动者比重、固定资产比重、定额资金流动比重),以及回归方式;逐步回归(图1)图1线性对话框4 .在统计栏中,选择估计以输出回归系数B的估计值、t统计量等,选择Duribin-watson以进行DW佥验;选择模型拟合度输出拟合优
3、度统计量值,如RA2、F统计量值等(图2)。5 .在线性回归栏中选择直方图和正态概率图以绘制标准化残差的直方图和残差分析与正态概率比较图,以标准化预测值为纵坐标,标准化残差值为横坐标,绘制残差与Y的预测值的散点图,检验误差变量的方差是否为常数(图3)图3绘制栏6 .提交分析,并在输出窗口中查看结果,以及对结果进行分析表1输入/移去的变量模型输入的变量移去的变量方法12地区人口人均收入.步进(准则:F-to-enter的概率=.100)o步进(准则:F-to-enter的概率=.100)oa.因变量:年销售量系统在进行逐步分析的过程中产生了两个回归模型,模型1先将与因变量(销售收入)线性关系的自
4、变量地区人口引入模型,建立他们之间的一元线性关系。而后逐步引入其他变量,表1中模型2表明将自变量人均收入引入,建立二元线性回归模型,可见地区人口和人均收入对销售收入的影响同等重要。表2模型汇总c模型RR方调整R方标准估计的误差Durbin-Watson1.995a.991.990.061072.999b.999.999.021772.701a.预测变量:(常量),地区人口。b.预测变量:(常量),地区人口,人均收入c.因变量:年销售量从表2中给出了两个模型各自的RY和调整后的R9,第一个模型中的销售收入中有99%的变动可以用地区人口的变动解释,第二个模型中地区人口和人均收入的变动可以解释销售收
5、入中99.9%的变动,显然第二个模型的拟合数据效果比较好一点。止匕外,还给出了第二个模型的DW简言之2.701,按照a=0.0Sn=15、k=2,查表,得到DW检验临界值dl和du分别为0.9用01.54,因为du=d=4du,不从在自相关。表3Anova方差分析表模型平方和df均方FSig.1回归5.34215.3421432.139.000a残差.04813.004总计5.390142回归5.38422.6925679.466.000b残差.00612.000总计5.39014a.预测变量:(常量),地区人口。b.预测变量:(常量),地区人口,人均收入c.因变量:年销售量表3中给出了两个模
6、型的F检验值,查表可知当a=0.05,自由度为(1,13)时,F检验的临界值为4.67,第一个模型的F值为1432.139,远远大于临界值,拒绝原假设,备择假设为真,即至少有一个bi不等于0,因此模型1有效。当a=0.05,自由度为(2,12)时,F检验的临界值为3.88,第二个模型的F值为5679.466,模型2也通过了有效性的检验。表4系数回归系数表模型非标准化系数标准系数tSig.B标准误差试用版1(常量).228.0376.115.000地区人口.053.001.99537.844.0002(常量).035.0241.420.181地区人口.050.001.93481.924.000人
7、均收入.092.010.1089.502.000a.因变量:年销售量根据表中非标准化系数B的数值可知,逐步回归过程先后建立的两个回归模型分别是:模型1:销售收入=0.228+0.53*地区人口模型2:销售收入=0.35+0.05*地区人口+0.092*人均收入表中给出了两个模型各个自变量系数的t检验值,其自由度为n-k-1,查表可知当a=0.05,自由度为13时,竹佥验的临界值为2.160,自由度为12时,t检验的临界值为2.179,可见回归系数显著。止匕外,F统计量的值较大,t统计量的值也通过了检验,因此不存在严重的多元共线性问题。回归分析中,总假定残差服从正态分布,图4和图5就是根据样本数
8、据的计算结果显示残差分布的实际状况,然后对残差分布是否为正态分布的假设做出检验。直方图Q丁EH林淮化线光的标窗P-P国因交1L年标售量口0.2D.4QA。01。童洲的累枳率图5观测量累计概率图从残差的直方图与图上的正态分布曲线相比较,可以认为残差基本服从正态分布。进一步观察观测量累计概率图(图5),图中的斜率对应着一个均值为0的正态分布,可以看出图上的散点大致散布在斜线的附近,因此可以认为残差分布基本上是正态的。散点图因娈鼠:年销将量2-II01回“标准化残差回打标准北前计做图6标准残差与标准y的预测值散点图从图6中看到,随着y的变化,残差无明显变化,因此误差变量的方差为常数,不具有异方差性。
9、7 .进行预测正如前面所说的,多元当中计算特定的y值预测区间的置信区间估计以及给定x的条件下y期望值的置信区间估计所使用的公式比较复杂们可以使用SPSS进行简化,操作步骤为:1)在原始数据文件中进入回归模型的自变量下方输入给定的值,相应的因变量将产生缺失值;2)选择主菜单分析一一回归一一线性,指定自变量和因变量;3)单击保存对话框,选择预测值未标准化。选择预测区间均值、单值以及置信区间95%,4)提交运行,除了输出回归分析结果外,还将在数据文件中生成pre_1、lmci_1、umic_1、lici_1和uici_1等变量。Pre_1保存点预测值,lmci_1和umci_1分别保存y期望值预测期
10、间的下限和上限,lici_1和uici_1分别保存特定y值预测区间的下限和上限。n等乐助1助痛9:wtp招毡啪,山、敷咯炮,型收曰3如W升HAJ用期二工用电针qHJI片断日山也R助b图加曲e雷-;,,L繇里1理驰对赤.白1我廿1F日u曲日死H工百问/度警rw2冲当5丸SW古R1*盘,3.1*曼朝习2地芯*口分B*甘问聿度也值82.yifrA.羌天8i韦冏/曲外6PF_1MMin6U伽版P匈上芍区AA13GEftJZ由6g_iin696LCl&y-为A13二占网#I99(S7UMClJ捌司NHl3史UClbif更配13;SR,图都BLICIJ灯也却1196%L融yndhduil无ft13SEFJ
11、#鹏曰9UIC1J匍燃网Hl5S5%UQbi丁ndrrdu*无汽13三石问S木厕01蔺肉霞0|4WS砧寓蜘鼻饵Z*Cl!&痼卬(*中明3事总由3段2如同脸gm看曲回*i*上麻抗乱才+ERi&F或,丁11Q氏LJWCLIUMCLILKUUCJ|_7IKzrW3451.51:3KIGQSfl1,637314湖卯1石两,J212518iX326USBf120001J44321ITEiE1.27T2332333503印2.244S2Z23B32.25762192E32.23535412D卯2EM111Ml12Q&2IJ2U91IJGtSatjeffij3fittoa杷幽心的euj96:1dX50371
12、LG段第i.CTWSLF1国1iUS0L74B317IQ用93CH.WnQF3JFQH痔MKIEa15ETOD工的1035T2UMI71BiUfiW9ilifi19Sil.i谢117912I.H尚1147Ui.23D1D10口耳303Gi.51291口红即S.5S744U.5Q&311125243X4DQ25货152511SA2.5&2il24624425916612152.ZQ于西A432.29991226BM131513NMM134211191514J23S32腐15原蒋1iMV彻11C04Jij蚓ISU1*1.E1njNHJ1.00533OSftffl1.02*3*CW1.056621E211rOQlil第加13lAMi3哨St!3.1013在图7和图8中,我们可以得到
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论