《应用回归分析》课后题答案解析_第1页
《应用回归分析》课后题答案解析_第2页
《应用回归分析》课后题答案解析_第3页
《应用回归分析》课后题答案解析_第4页
《应用回归分析》课后题答案解析_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.应用回归分析部分课后习题答案第一章 回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归

2、分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。1.3 回归模型中随机误差项的意义是什么?答:为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2.xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。1.4 线性回归模型的基本假设是什么?答:线性

3、回归模型的基本假设有:1.解释变量x1.x2.xp是非随机的,观测值xi1.xi2.xip是常数。2.等方差及不相关的假定条件为E(i)=0 i=1,2. Cov(i,j)=23.正态分布的假定条件为相互独立。4.样本容量的个数要多于解释变量的个数,即np.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意的问题有:在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需

4、要反复试算,最终找出最合适的一些变量。1.6 收集,整理数据包括哪些内容?答;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要有按时间顺序统计数据和在同一时间截面上统计数据,在数据的收集中,样本容量的多少一般要与设置的解释变量数目相配套。而数据的整理不仅要把一些变量数据进行折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或特别小的“野值”。1.7 构造回归理论模型的基本依据是什么?答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采

5、用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。1.8 为什么要对回归模型进行检验?答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。1.9 回归模型有那几个方面的应用?答:回归模型的应用方面主要有:经济变量的因素分析和进行经济预测。1.10 为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?答:在回归模型的运用中,我们还强调定性分析和定量分析相结合。这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉

6、及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。第二章 一元线性回归 2.14 解答:(1)散点图为: (2)x与y之间大致呈线性关系。 (3)设回归方程为 =(4) = (5)由于服从自由度为n-2的t分布。因而也即:=可得即为:(2.49,11.5) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数(7)ANOVAx平方和df均方F显著性

7、组间(组合)9.00024.5009.000.100线性项加权的8.16718.16716.333.056偏差.8331.8331.667.326组内1.0002.500总数10.0004由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9)相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10) 序号111064221013-33320200442027-75540346残差图为:从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)当广告费=4.2万元时,销售收入

8、,即(17.1,39.7)2.15 解答:(1) 散点图为:(2)x与y之间大致呈线性关系。(3)设回归方程为 =(4) =0.23050.4801(5) 由于服从自由度为n-2的t分布。因而也即:=可得即为:(0.0028,0.0044) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数 =0.908(7) ANOVAx平方和df均方F显著性组间(组合)1231497.5007175928.2145.302.168线性项加权的1168713.03635.222.027偏差62784.464610464.077.315.885组内66362.500233181.250总数12978

9、60.0009由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9) 相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10)序号1825353.07680.4232221510.88080.11923107043.95880.0412455022.0868-0.0868548011.8348-0.8348692033.4188-0.4188713504.54.9688-0.466883251.51.27680.2232967032.51880.481210121554.48080.5

10、192从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)(12),即为(2.7,4.7)近似置信区间为:,即(2.74,4.66)(13)可得置信水平为为,即为(3.33,4.07).2.16 (1)散点图为:可以用直线回归描述y与x之间的关系.(2)回归方程为:(3) 从图上可看出,检验误差项服从正态分布。第三章 多元线性回归3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性yx1x2x3Pearson 相关性y1.000.556.731.724x1.5561.000.113.398x2.731.1131.000.547x3.724.398.54

11、71.000 y.048.008.009x1.048.378.127x2.008.378.051x3.009.127.051.Ny10101010x110101010x210101010x310101010所以=1.0000.5560.7310.7240.5561.0000.1130.3980.7310.1131.0000.5470.7240.3980.5471.000系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.

12、7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y(2) 所以三元线性回归方程为模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.898a.806.70823.44188.8068.28336.015a. 预测变量: (常量), x3

13、, x1, x2。(3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), x3, x1, x2。b. 因变量: y因为F=8.283 P=0.01515,这是因为如果样本再小,利用残差就很难对自相关的存在性作出比较正确的判断;DW检验不适合随机项具有高阶序列相关的检验。4.13 解:(1)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-1.435.242-5.9

14、30.000x.176.002.999107.928.000a. 因变量: y=-1.435+0.176x(2) 模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.999a.998.998.09744.663a. 预测变量: (常量), x。b. 因变量: yDW=0.663 查DW分布表知:=0.95所以DW,故误差项存在正相关。残差图为:随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。(3)=1-0.5*DW=0.6685 计算得:25 / 50Y x7.3944.907.6545.806.8440.698.0048.507.7946.858.26

15、49.457.9648.478.2850.047.9048.03Y X8.4951.177.8847.268.7752.338.9352.699.3254.959.2955.549.4856.779.3855.839.6758.009.9059.22模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.996a.993.993.073951.344a. 预测变量: (常量), xx。b. 因变量: yy系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.303.180-1.684.110xx.173.004.99649.011.000a. 因变量:

16、 yy得回归方程 =-0.303+0.173x即:=-0.303+0.6685+0.173(0.6685)(4)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.978a.957.955.074491.480a. 预测变量: (常量), x3。b. 因变量: y3系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).033.0261.273.220x3.161.008.97819.528.000a. 因变量: y3=0.033+0.161即:=0.033+0.161(-)(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的值最小为0.0

17、7395,拟合的较好。4.14解:(1)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.541a.293.264329.69302.745a. 预测变量: (常量), x2, x1。b. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-574.062349.271-1.644.107x1191.09873.309.3452.607.012x22.045.911.2972.246.029a. 因变量: y回归方程为:=-574.062+191.098x1+2.045x2DW=0.745Dl 所以误差项存在正相关残差图为:(2)=1

18、-0.5*DW=0.6275模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.688a.474.452257.670641.716a. 预测变量: (常量), x22, x12。b. 因变量: y2系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-179.66890.337-1.989.052x12211.77047.778.5224.432.000x221.434.628.2692.283.027a. 因变量: y2此时得方程:=-179.668+211.77x1+1.434x2所以回归方程为:(3)模型汇总b模型RR 方调整 R 方标准 估

19、计的误差Durbin-Watson1.715a.511.490283.791022.042a. 预测变量: (常量), x23, x13。b. 因变量: y3系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)7.69839.754.194.847x13209.89144.143.5444.755.000x231.399.583.2742.400.020a. 因变量: y3此时得方程:所以回归方程为:4.15 异常值原因 异常值消除方法 1)数据登记误差,存在抄写或录入的错误 重新核实数据 2)数据测量误差 重新测量误差 3)数据随机误差 删除或重新观测异常值数据 4)缺少重要

20、自变量 增加必要的自变量 5)缺少观测数据 增加观测数据,适当扩大自变 量取值范围 6)存在异方差 采用加权线性回归 7)模型选用错误,线性模型不适用 改用非线性回归模型4.16 编号 学生化残差 删除学生化残差 杠杆值 库克距离1 -0.89353 -0.87604 0.35418 0.16609 2 0.62767 0.59277 0.14025 0.031153 0.26517 0.24349 0.16079 0.006204 -0.00433 -0.00396 0.09935 0.000005 1.75400 2.29383 0.24702 0.408746 -2.11566 -3.8

21、3214 0.64187 3.216017 -1.17348 -1.22039 0.49277 0.501108 -1.16281 -1.20606 0.36129 0.289469 0.40935 0.37902 0.16366 0.0150010 1.06462 1.07911 0.33883 0.22158 从上表中看到,绝对值最大的学生化残差为2.11566,小于3,因而根据学生化残差诊断认为数据不存在异常值。绝对值最大的删除学生化残差为3.83214,大于3,因而根据学生化残差诊断为第6个数据为异常值,是因变量的异常值。其中心化杠杆值等于0.64187 最大,库克距离等于3.2160

22、1也是最大,中心化杠杆平均值为0.3001,第6个数据杠杆值等于0.64187大于2倍的中心化杠杆值,因而从杠杆值看第6个数据是自变量的异常值,同时第6个数据的库克距离等于3.21601,大于1,这样第6个数据为异常值的原因是由自变量异常与因变量异常两个原因共同引起的。 第五章 自变量选择与逐步回归5.9 后退法:输出结果系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)1438.1202252.472.638.533农业x1-.626.168-1.098-3.720.002工业x2-.328.207-1.352-1.587.135建筑业x3-.383.555-.251-.6

23、91.501人口x4-.004.025-.014-.161.875最终消费x5.672.1303.7105.178.000受灾面积x6-.006.008-.015-.695.4992(常量)1079.754299.7593.602.003农业x1-.642.130-1.126-4.925.000工业x2-.303.131-1.249-2.314.035建筑业x3-.402.525-.263-.765.456最终消费x5.658.0953.6366.905.000受灾面积x6-.006.007-.017-.849.4093(常量)1083.150295.8163.662.002农业x1-.624

24、.127-1.095-4.931.000工业x2-.373.093-1.535-3.998.001最终消费x5.657.0943.6276.981.000受灾面积x6-.005.007-.015-.758.4604(常量)874.604106.8698.184.000农业x1-.611.124-1.073-4.936.000工业x2-.353.088-1.454-3.994.001最终消费x5.637.0893.5167.142.000a. 因变量: 财政收入yAnovae模型平方和df均方FSig.1回归1.365E862.274E7602.127.000a残差528793.31914377

25、70.951总计1.370E8202回归1.365E852.729E7772.734.000b残差529767.8521535317.857总计1.370E8203回归1.364E843.411E7991.468.000c残差550440.1031634402.506总计1.370E8204回归1.364E834.547E71355.753.000d残差570180.9311733540.055总计1.370E820a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1,

26、 最终消费x5, 工业x2。c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。e. 因变量: 财政收入y模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.998a.996.994194.34750.996602.127614.0002.998b.996.995187.93046.000.026114.8753.998c.996.995185.47913.000.585115.4564.998d.996.995183.13944.000

27、.574116.460a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。回归方程为: 逐步回归法:输出结果模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.994a.989.988285.68373.9891659.441119.

28、0002.996b.992.991247.77768.0037.258118.0153.998c.996.995183.13944.00415.948117.001a. 预测变量: (常量), 最终消费x5。b. 预测变量: (常量), 最终消费x5, 农业x1。c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。Anovad模型平方和df均方FSig.1回归1.354E811.354E81659.441.000a残差1550688.6541981615.192总计1.370E8202回归1.359E826.794E71106.637.000b残差1105088.0031861

29、393.778总计1.370E8203回归1.364E834.547E71355.753.000c残差570180.9311733540.055总计1.370E820a. 预测变量: (常量), 最终消费x5。b. 预测变量: (常量), 最终消费x5, 农业x1。c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。d. 因变量: 财政收入y系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)710.37290.8917.816.000最终消费x5.180.004.99440.736.000.994.994.9942(常量)1011.912136

30、.9017.392.000最终消费x5.311.0491.7186.374.000.994.832.135农业x1-.414.154-.726-2.694.015.987-.536-.0573(常量)874.604106.8698.184.000最终消费x5.637.0893.5167.142.000.994.866.112农业x1-.611.124-1.073-4.936.000.987-.767-.077工业x2-.353.088-1.454-3.994.001.992-.696-.062a. 因变量: 财政收入y回归方程为:5.10(1)模型汇总模型RR 方调整 R 方标准 估计的误差1

31、.908a.824.736625.883262.000b.000.0001217.15945a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量)Anovac模型平方和df均方FSig.1回归1.830E753660971.6839.346.002a残差3917298.52210391729.852总计2.222E7152回归.0000.000.b残差2.222E7151481477.129总计2.222E715a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量)c. 因变量: y系数a模型非标准化系数标准系数t

32、Sig.B标准 误差试用版1(常量)5922.8272504.3152.365.040x24.8642.507.6771.940.081x32.374.842.7822.818.018x4-817.901187.279-1.156-4.367.001x514.539147.078.050.099.923x6-846.867291.634-.899-2.904.0162(常量)7542.938304.29024.789.000a. 因变量: y回归方程为:(2)后退法:输出结果模型汇总模型RR 方调整 R 方标准 估计的误差1.908a.824.736625.883262.907b.824.75

33、9597.04776a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量), x6, x3, x2, x4。Anovac模型平方和df均方FSig.1回归1.830E753660971.6839.346.002a残差3917298.52210391729.852总计2.222E7152回归1.830E744575257.66912.835.000b残差3921126.26211356466.024总计2.222E715a. 预测变量: (常量), x6, x3, x2, x4, x5。b. 预测变量: (常量), x6, x3, x2, x4。c. 因变

34、量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)5922.8272504.3152.365.040x24.8642.507.6771.940.081x32.374.842.7822.818.018x4-817.901187.279-1.156-4.367.001x514.539147.078.050.099.923x6-846.867291.634-.899-2.904.0162(常量)6007.3202245.4812.675.022x25.0681.360.7063.727.003x32.308.486.7604.750.001x4-824.261167.776

35、-1.165-4.913.000x6-862.699232.489-.916-3.711.003a. 因变量: y(3)逐步回归模型汇总模型RR 方调整 R 方标准 估计的误差1.498a.248.1941092.832062.697b.485.406937.950383.811c.657.572796.60909a. 预测变量: (常量), x3。b. 预测变量: (常量), x3, x5。c. 预测变量: (常量), x3, x5, x4。Anovad模型平方和df均方FSig.1回归5502210.0904.607.050a残差1.672E7141194281.918总计2.222E7152回归1.079E725392697.5546.130.013b残差1.144E71387

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论