《应用回归分析》课后题答案_第1页
《应用回归分析》课后题答案_第2页
《应用回归分析》课后题答案_第3页
《应用回归分析》课后题答案_第4页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、页眉内容使用回归分析部分课后习题答案第一章回归分析概述1.1变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系, 而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。1.2回归分析和相关分析的联系和区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y 称为因变量,处在被解释的特殊地位。在相关分析中,变量 x 和变量 y 处于平等的地位, 即研究变量 y 和变量 x 的密切程度和研究变量 x 和变量 y 的密切程度是一回事。 b. 相关分析中所涉及的变

2、量 y 和变量 x 全是随机变量。而在回归分析中, 因变量 y 是随机变量, 自变量 x 可以是随机变量也可以是非随机的确定变量。 C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。1.3回归模型中随机误差项的意义是什么?答:为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究 y 和 x1,x2 .xp 的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限

3、而没有考虑的种种偶然因素。1.4线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1. 解释变量 x1.x2.xp 是非随机的,观测值xi1.xi2 .xip 是常数。 2. 等方差及不相关的假定条件为 E( i)=0 i=1,2 . Cov(i, j)= 23. 正态分布的假定条件为相互独立。 4. 样本容量的个数要多于解释变量的个数,即 np.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量, 即便是不显著的, 如果理论上无法判断那么可以采用统计方法来判断, 解释变量和被解释变量存在统计关系。 应注意的问题有:在选择变量时

4、要注意和一些专门领域的专家合作, 不要认为一个回归模型所涉及的变量越多越好, 回归变量的确定工作并不能一次完成, 需要反复试算,最终找出最合适的一些变量。1.6收集,整理数据包括哪些内容?答 ; 常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要有按时间顺序统计数据和在同一时间截面上统计数据, 在数据的收集中, 样本容量的多少一般要和设置的解释变量数目相配套。 而数据的整理不仅要把一些变量数据进行折算差分甚至把数据对数化, 标准化等有时还需注意剔除个别特别大或特别小的“野值”。1.7 构造回归理论模型的基本依据是什么?答:选择模型的数学形式的主要依据是经济行为理论, 根据变量的

5、样本数据作出解释变量和被解释变量之间关系的散点图, 并将由散点图显示的变量间的函数关页眉内容系作为理论模型的数学形式。 对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。1.8为什么要对回归模型进行检验?答:我们建立回归模型的目的是为了使用它来研究经济问题, 但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。1.9回归模型有那几个方面的使用?答:回归模型的使用方面主要有:经济变量的因素分析和进行经济预测。1.10为什么强调运用回归分析研究经济问题要定性分析和定

6、量分析相结合?答:在回归模型的运用中, 我们还强调定性分析和定量分析相结合。 这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专门的学科研究才能下定论, 所以,在经济问题的研究中, 我们不能仅凭样本数据估计的结果就不加分析地说长道短, 必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确使用。第二章一元线性回归2.14 解答:(1)散点图为:(2)x 和 y 之间大致呈线性关系。(3)设回归方程为 y01 xnxiyin x y1 = i n12n(x

7、)27xii121n2(4)( yiyi )n-2 i=11( 10- ( -1+72221) ( 10- ( -1+72) (20- ( -1+7 3)=223( 20- ( -1+74) ( 40- ( -1+75)2(5)由于1:N (1 ,)Lxx服从自由度为 n-2的 t 分布。因而也即: p(1t/2Lxx11 t /2) =1Lxx可得1 的置信度为 95%的置信区间为( 7-2.353133,7+2.3531 33)即为:( 2.49,11.5)33服从自由度为n-2 的 t 分布。因而页眉内容即 p( 01( x) 2t /2001(x)2t /2 ) 1nLxxnLxx可得

8、 1的置信度为 95%的置信区间为(7.77,5.77 )ny)2( yi(6) x 和 y 的决定系数r2i 1n490 / 6000.817( yiy)2i 1(7)ANOV Ax平方和df均方F显著性组间(组合)9.00024.5009.000.100线性项加权的8.16718.16716.333.056偏差.8331.8331.667.326组内1.0002.500总数10.0004由于F F(1,3) ,拒绝 H 0 ,说明回归方程显著, x 和 y 有显著的线性关系。11Lxx21n21n2(8) t其中( yiyi )2ein2 i1n 2 i 1/ Lxx接受原假设 H0:10

9、, 认为1显著不为0,因变量 y 对自变量 x 的一元线性回归成立。n( xix)( yi y)Lxy(9)相关系数ri1nnLxx Lyyx)2( xi( yiy)i 1i 1=7070.9041060060r 小于表中1%的相应值同时大于表中5%的相应值,x 和 y 有显著的线性关系 .(10)序号111064221013-33320200442027-75540346页眉内容残差图为:从图上看,残差是围绕e=0 随机波动,从而模型的基本假定是满足的。(11)当广告费x0 =4.2 万元时,销售收入y028.4万元,置信度为 95%的 置信区间近似为 y2,即( 17.1, 39.7)2.

10、15 解答:( 1) 散点图为:( 2 ) x和 y 之间大致呈线性关系。(3) 设回归方程为 y01 xnxiyin x y(2637021717)1 = i n10.0036xi2n(x)2(71043005806440)i 121n2(4)( yiyi)n-2 i=1=0.23050.48012(5) 由于1: N(1,)Lxx页眉内容服从自由度为n-2 的 t 分布。因而也即: p( 1t/2Lxx11 t/2) =1Lxx可得1 的置信度为95%的置信区间为即为:( 0.0028, 0.0044)服从自由度为n-2 的 t 分布。因而即 p(01( x) 2t /2001(x)2t/

11、2 )1nLxxnLxx可得1的置信度为95%的置信区间为(0.3567,0.5703)ny)2r 2( yi16.82027(6)x 和 y 的决定系数in1=0.908( yiy)218.525i1(7)ANOV Ax平方和df均方F显著性组间(组合)1231497.5007175928.2145.302.168线性项加权的1168713.03611168713.03635.222.027偏差62784.464610464.077.315.885组内66362.500233181.250总数1297860.0009由于 FF (1,9) ,拒绝 H 0 ,说明回归方程显著, x 和 y 有

12、显著的线性关系。11Lxx21n21n2(8) t其中ei( yiyi )2n2 i 1n2 i 1/ Lxx接受原假设 H0: 1 0,认为1显著不为0,因变量 y 对自变量 x 的一元线性回归成立。n( xix)( yiy)Lxy(9) 相关系数ri 1nnLxx Lyy(xix) 2( yiy)i 1i 14653=0.9489129786018.525页眉内容r 小于表中1% 的相应值同时大于表中5% 的相应值,x 和 y 有显著的线性关系.(10)序号18253 53.07680.4232221510.88080.11923107043.95880.0412455022.0868-0

13、.0868548011.8348-0.8348692033.4188-0.4188713504.54.9688-0.466883251.51.27680.2232967032.51880.481210121554.48080.5192从图上看,残差是围绕e=0 随机波动,从而模型的基本假定是满足的。(11)新保单 x0 1000时,需要加班的时间为y03.7小时。( 12) y0的置信概率为 1-的置信区间精确为y 0t/2 (n2)1 h00 ,即为( 2.7,4.7)近似置信区间为: y02 ,即( 2.74,4.66)( 13)可得置信水平为1-的置信区间为y0t /2 ( n2)h00

14、,即为(,)3.33 4.07 .2.16 (1)散点图为:可以用直线回归描述y 和 x 之间的关系 .(2)回归方程为 : y12112.6293.314x(3)页眉内容从图上可看出,检验误差项服从正态分布。第三章多元线性回归3.11 解:(1)用 SPSS算出 y,x1,x2,x3相关系数矩阵:相关性yx1x2x3Pearson相关性y1.000.556.731.724x1.5561.000.113.398x2.731.1131.000.547x3.724.398.5471.000y.048.008.009x1.048.378.127x2.008.378.051x3.009.127.051

15、.Ny10101010x110101010x210101010x310101010=所以 ra系数模型标准系非标准化系数数tSig.B 的 95.0%置信区间相关性共线性统计量页眉内容B标准误差试用版下限上限零阶偏部分容差VIF1(常量)-348.2176.459-1.974.096-780.083.5008060x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13

16、.4138.310.724.433.212.5861.7085a. 因变量 : y(2)所以三元线性回归方程为y?348.283.754x17.101x212.447 x3模型汇总模型标准 估计的更改统计量RR 方调整R方误差R 方更改F 更改df1df2Sig. F 更改1.898 a.806.70823.44188.8068.28336.015a.预测变量 : (常量 ), x3, x1, x2。( 3)由于决定系数 R方=0.708R=0.898较大所以认为拟合度较高( 4)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015 a残差329

17、7.1306549.522总计16952.5009a.预测变量 : (常量 ), x3, x1, x2。b. 因变量 : y因为 F=8.283P=0.01515, 这是因为如果样本再小, 利用残差就很难对自相关的存在性作出比较正确的判断; DW检验不适合随机项具有高阶序列相关的检验。页眉内容4.13解:(1)系数 a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量 )-1.435.242-5.930.000x.176.002.999107.928.000a. 因变量 : yy?=-1.435+0.176x(2)模型汇总b模型标准估计的误RR 方调整R方差Durbin-Watson

18、1.999 a.998.998.09744.663a. 预测变量 : ( 常量 ), x 。b. 因变量 : yDW=0.663 查 DW分布表知: d L =0.95所以 DWd L, 故误差项存在正相关。残差图为:et 随 t 的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。( 3) ? =1-0.5*DW=0.6685 计算得:Yx 8.4951.177.3944.907.8847.267.6545.808.7752.336.8440.698.9352.698.0048.509.3254.957.7946.859.2955.548.2649.459.4856.777.9648.4

19、79.3855.838.2850.049.6758.007.9048.039.9059.22YX 模型汇总 b模型标准 估计的误RR 方调整R方差Durbin-Watson1.996 a.993.993.073951.344a. 预测变量 : ( 常量 ), xx。页眉内容模型汇总 b模型标准 估计的误RR 方调整R方差Durbin-Watson1.996a.993.073951.344.993a. 预测变量 : ( 常量 ), xx 。b. 因变量 : yy系数 a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量 )-.303.180-1.684.110xx.173.004.99

20、649.011.000a. 因变量 : yy得回归方程y? =-0.303+0.173x即: y?t =-0.303+0.6685 yt 1 +0.173( xt 0.6685xt 1 )( 4)模型汇总b模型标准估计的误RR 方调整R方差Durbin-Watson1.978 a.957.955.074491.480a. 预测变量 : ( 常量 ), x3 。b. 因变量 : y3系数 a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量 ).033.0261.273.220x3.161.008.97819.528.000a. 因变量 : y3 yt =0.033+0.161 xt即

21、: y?t =0.033+ yt 1 +0.161 ( xt - xt 1 )( 5)差分法的 DW值最大为 1.48 消除相关性最彻底,但是迭代法的 ? 值最小为0.07395 ,拟合的较好。4.14 解:( 1)模型汇总 b模型标准 估计的误RR 方调整R方差Durbin-Watson1.541a.264329.69302.745.293a. 预测变量 : (常量 ), x2, x1 。页眉内容模型汇总 b模型标准 估计的误RR 方调整 R方差Durbin-Watson1.541a.264329.69302.745.293a.预测变量 : (常量 ), x2, x1 。b.因变量 : y系

22、数 a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量 )-574.062349.271-1.644.107x1191.09873.309.3452.607.012x22.045.911.2972.246.029a. 因变量 : y回归方程为: y?=-574.062+191.098x1+2.045x2DW=0.745Dl 所以误差项存在正相关残差图为:( 2) ? =1-0.5*DW=0.6275模型汇总 b模型标准 估计的误RR 方调整 R方差Durbin-Watson1.688a.452257.670641.716.474a.预测变量 : (常量 ), x22, x12。b.

23、因变量 : y2系数 a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量 )-179.66890.337-1.989.052x12211.77047.778.5224.432.000x221.434.628.2692.283.027a. 因变量 : y2此时得方程: y?t =-179.668+211.77x1 +1.434x2 所以回归方程为:?179.668 0.6275 yt 1 211.77(x1t 0.6275 x1t 1 ? ) 1.434(x2t 0.6275 x2t 1 )yt( 3)模型汇总b模型标准估计的误RR 方调整R方差Durbin-Watson页眉内容1.

24、715 a.511.490283.791022.042a.预测变量 : (常量 ), x23, x13。b.因变量 : y3a系数模型非标准化系数标准系数B标准 误差试用版tSig.1(常量 )7.69839.754.194.847x13209.89144.143.5444.755.000x231.399.583.2742.400.020a. 因变量 : y3此时得方程:?7.698209.891x11.399x2yt所以回归方程为:?xt 1 )1.399(x2t x2t 1 )yt 7.698 209.891( xt4.15异常值原因异常值消除方法1 )数据登记误差,存在抄写或录入的错误重

25、新核实数据2 )数据测量误差重新测量误差3 )数据随机误差删除或重新观测异常值数据4 )缺少重要自变量增加必要的自变量5 )缺少观测数据增加观测数据, 适当扩大自变量取值范围6 )存在异方差采用加权线性回归7 )模型选用错误,线性模型不适用改用非线性回归模型4.16编号 学生化残差删除学生化残差杠杆值库克距离1-0.89353-0.876040.354180.1660920.627670.592770.140250.0311530.265170.243490.160790.006204-0.00433-0.003960.099350.0000051.754002.293830.247020.4

26、08746-2.11566-3.832140.641873.216017-1.17348-1.220390.492770.501108-1.16281-1.206060.361290.2894690.409350.379020.163660.01500101.064621.079110.338830.22158从上表中看到, 绝对值最大的学生化残差为2.11566 ,小于 3,因而根据学生化残差诊断认为数据不存在异常值。绝对值最大的删除学生化残差为 3.83214 ,大于 3,因而根据学生化残差诊断为第 6 个数据为异常值,是因变量的异常值。其中心化杠杆值等于 0.64187 最大,库克距离等于 3.21601 也是最大,中心化杠杆平均值为 0.3001 ,第 6 个数据杠杆值等于 0.64187 大于 2 倍的中心化杠杆值,因而从杠杆值看第 6 个数据是自变量的异常值, 同时第 6 个数据的库克距离等于 3.21601 ,大于 1,这样第 6 个数据为异常值的原因是由自变量异常和因变页眉内容量异常两个原因共同引起的。第五章 自变量选择和逐步回归5.9后退法:输出结果系数 a模型标准系非标准化系数数标准B误差试用版tSig.1(常量 )1438.122252.47.638.533

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论