应用回归分析课后题答案_第1页
应用回归分析课后题答案_第2页
应用回归分析课后题答案_第3页
应用回归分析课后题答案_第4页
应用回归分析课后题答案_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#总计203回归3.000c残差17总计20预测变量:(常量),最终消费x5。预测变量:(常量),最终消费x5,农业xl。预测变量:(常量),最终消费x5,农业xl,工业x2因变量:财政收入y系数a模型非标准化系数标准系数tSig.相关性B标准误差试用版零阶偏部分1(常量).000最终消费x5.180.004.994.000.994.994.9942(常量).000最终消费x5.311.049.000.994.832.135农业.154.015.987x13(常量).000最终消费x5.637.089.000.994.866.112农业.124.000.987x1工业.088.001.992x2a.因变量:财政收入y回归方程为:y二874.604-0.636x-0.353x+0.637x125(1)模型汇总模型RR方调整R方标准估计的误差1.908a.824.7362.000b.000.000预测变量:(常量),x6,x3,x2,x4,x5预测变量:(常量)Anovac

模型平方和df均方FSig.1回归5.002a残差10总计152回归.0000.000..b残差15总计15预测变量:(常量),x6,x3,x2,x4,x5。预测变量:(常量)因变量:y系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).040x2.677.081x3.842.782.018x4.001x5.050.099.923x6.0162(常量)000a.因变量:y回归方程为:$二5922.827+4.864x+2.374x-817.901x+14.539x-846.867x3456(2)后退法:输出结果模型汇总模型RR方调整R方标准估计的误差1.908a.824.7362.907b.824.759预测变量:(常量),x6,x3,x2,x4,x5。预测变量:(常量),x6,x3,x2,x4oAnovac模型平方和df均方FSig.1回归5.002a残差10总计152回归4.000b

残差总计1115预测变量:(常量),x6,x3,x2,x4,x5。预测变量:(常量),x6,x3,x2,x4o因变量:y系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).040x2.677.081x3.842.782.018x4.001x5.050.099.923x6.0162(常量).022x2.706.003x3.486.760.001x4.000x6003a.因变量:yy二6007.320+5.068x+2.308x-824.261x-862.699x2346(3)逐步回归模型汇总模型RR方调整R方标准估计的误差1.498a.248.1942.697b.485.4063.811c.657.572预测变量:(常量),x3o预测变量:(常量),x3,x5o预测变量:(常量),x3,x5,x4oAnovad模型平方和df均方FSig.1回归1.050a残差14总计15

2回归残差总计21315.013b3回归残差总计31215.004c预测变量:(常量),x3。预测变量:(常量),x3,x5。预测变量:(常量),x3,x5,x4。因变量:y系数a模型非标准化系数标准系数B标准误差试用版tSig.1(常量).000x37044980502(常量).220.830x3.913.004x5.737.0293(常量).757.464x3.782.001x5.003x4.030a.因变量:yy二1412.807+3.440x+348.729x-415.136x54(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x6,x3,x2,x4作为最终模型。而逐步回归法只引入了x3。说明了方法对自变量重要性的认可不同的,这与自变量的相关性有关联。相比之下,后退法首先做全模型的回归,每一个变量都有机会展示自己的作用,所得结果更有说服力第六章多重共线性的情形及其处理

解:由下表我们可以看出系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量).035xl.279.052.003x2.549.199.016.001x3.911.420.002x4.080.031.281.021.064x5.006.006.038.918.374.434x6.014.466.574a.因变量:y方差扩大因子最大的为VIF2=,故首先应剔除变量x2•将剩下变量继续进行回归得下表:模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量).364x1.237.828.006x3.533.937.017.009x4.036.032.127.274.087x5.006.008.041.822.424.434x6.002.015.006.157.878.647系数aa.因变量:y此时,有最大的方差扩大因子VIF1=,且此时xl系数为负,故xl也应被剔除,继续将剩下变量进行回归得:模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量).258x3.109.862.000.199x4.031.019.107.132.221x5.006.007.041.841.412.434x6.003.015.008.209.837.671系数aa.因变量:y此时,所有方差扩大因子都小于10,故回归方程如下:y=++++第七章岭回归1•岭回归估计是在什么情况下提出的?答:当解释变量间出现严重的多重共线性时,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘法的效果变得很不理想,为了解决这一问题,统计学家从模型和数据的角度考虑,采用回归诊断和自变量选择来克服多重共线性的影响,这时,岭回归作为一种新的回归方法被提出来了。2•岭回归估计的定义及其统计思想是什么?答:一种改进最小二乘估计的方法叫做岭估计。当自变量间存在多重共线性,丨X'X|~O时,我们设想给XX加上一个正常数矩阵kI(k>0),那么X'X+kI接近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计阵仍然用X表示,定义为卩")-(XX+KXy,称为卩的岭回归估计,其中k称为岭参数。3•选择岭参数k有哪几种主要方法?答:选择岭参数的几种常用方法有1•岭迹法,2•方差扩大因子法,3•由残差平方和来确定k值。用岭回归方法选择自变量应遵从哪些基本原则?答:用岭回归方法来选择变量应遵从的原则有:1•在岭回归的计算中,我们假定设计矩阵X已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。2•当k值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着k的增加迅速趋于零。像这样的岭回归系数不稳定,震动趋于零的自变量,我们也可以予以删除。3•去掉标准化岭回归系数很不稳定的自变量,如果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。对第5章习题9的数据,逐步回归的结果只保留了3个自变量xl,x2,x5,用y对这3个自变量做岭回归分析?对习题的问题,分别用普通最小二乘和岭回归建立GDP对第二产业增加值x2,和第三产业增加值x3的二元线性回归,解释所得到的回归系数?答:R-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFKKRSQx2x3•00000.99923.774524.225943•05000•99803.512296.463711•10000.99629.489067.463649•15000.99367.473860.456649•20000.99025.461162.448152•25000.98615.449761.439303•30000.98147.439219.430476•35000.97628.429332.421821•40000.97067.419984.413400•45000.96470.411101.405242•50000.95842.402632.397352•55000•95189.394536.389732.60000.94514.386782.382376.65000.93822.379344.375274.70000.93116.372200.368419.75000.92398.365330.361799.80000.91672.358717.355405.85000.90939.352345.349227.90000.90202.346201.343255.95000.89462.340271.337480.88720.334545.331892RIDGETRACE.SOOOOCr.70000CT.60000CT.50000CT.400000-.300000-.200000-.00000.20000.40000.00000.BOOOO1.JOOCOK系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).000第二产业增加值.151.775.000第三产业增加值.679.244.226.017a.因变量:GDPR-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFKKRSQx2x3.00000.99923.774524.225943.01000.99888.587428.408049.02000.99866.548878.441659.03000.99847.531054.454593.04000.99827.520110.460694.05000.99803.512296.463711.06000.99776.506176.465082.07000.99745.501080.465475.08000.99710.496653.465244.09000.99672.492691.464593.10000.99629.489067.463649RunMATRIXprocedure:******RidgeRegressionwithk=******MultR.999439RSquare.998878AdjRSqu.998691SEANOVAtabledfSSMSRegress+010+009ResidualFvalueSigF.000000VariablesintheEquationBetaB/SE(B)BSE(B)BetaB/SE(B)x2.060219.587428x3.097506.408049Constant.000000——ENDMATRIX结合表及图形可知,用普通最小二乘法得到的回归方程为y=4352.859+1.438x+0.679x23

•显然回归系数卩3=明显不合理。从岭参数图来看,岭参数k在到之间,岭参数已基本稳定,再参照复决定系数当*=时,复决定系数R2=,仍然很大,固用k=做回归得到的未标准化的岭回归方程为y=3980.2479+1.09061x+1.2267x23。7•—家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法,表是该银行所属25家分行2002年的有关业务数据。(1)计算y与其余四个变量的简单相关系数。(2)建立不良贷款y对4个自变量的线性回归方程,所得的回归系数是否合理?(3)分析回归模型的共线性。(4)采用后退法和逐步回归法选择变量,所得回归方程的回归系数是否合理,是否还存在共线性?(5)建立不良贷款y对4个自变量的岭回归。(6)对第4步剔除变量后的回归方程再做岭回归。(7)某研究人员希望做y对各项贷款余额,本年累计应收贷款•贷款项目个数这三个变量的回归,你认为这种做是否可行,如果可行应该如何做?相关性不良贷款y各项贷款余额x1本年累计应收到款x2贷款项目个数x3本年固定资产投资额x4Pearson相关性不良贷款y.844.732.700.519各项贷款余额x1.844.679.848.780本年累计应收到款x2.732.679.586.472贷款项目个数x3.700.848.586.747

本年固定资产投资额x4.519.780.472.747Sig.(单侧)不良贷款y.000.000.000.004各项贷款余额xl.000.000.000.000本年累计应收到款x2.000.000.001.009贷款项目个数x3.000.000.001.000本年固定资产投资额x4.004.000.009.000N不良贷款y2525252525各项贷款余额xl2525252525本年累计应收到款x22525252525贷款项目个数x32525252525本年固定资产投资额x42525252525系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量).782.206各项贷款余额x1.040.010.891.001.188本年累计应收到款x2.148.079.260.075.529贷款项目个数x3.015.083.034.175.863.261本年固定资产投资额x4.015.067.360a.因变量:不良贷款y共线性诊断a模型维数特征值条件索方差比例引(常量)各项贷款余额x1本年累计应收到款x2贷款项目个数x3本年固定资产投资额x411.01.00.01.00.002.203.68.03.02.01.093.157.16.00.66.01.134.066.00.09.20.36.725.036.15.87.12.63.05a.因变量:不良贷款y后退法得系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).782.206各项贷款余额x1.040.010.891.001本年累计应收到款x2.148.079.260.075贷款项目个数x3.015.083.034.175.863本年固定资产投资额x4.015.0672(常量).711.186各项贷款余额x1.041.009.914.000本年累计应收到款x2.149.077.261.066本年固定资产投资额x4.014.0583(常量).697.531各项贷款余额x1.050.007.000本年固定资产投资额x4.015.044a.因变量:不良贷款y逐步回归得系数a模型非标准化系数标准系数tSig.

B标准误差试用版1(常量).723.263各项贷款余额x1.038.005.844.0002(常量).697.531各项贷款余额X1.050.007.000本年固定资产投资额x4.015.044a.因变量:不良贷款yR-SQUAREANDBETACOEFFICIENTSFORESTIMATEDVALUESOFKKRSQx1x2x3x4.00000.79760.891313.259817.034471.05000.79088.713636.286611.096624.10000.78005.609886.295901.126776.15000.76940.541193.297596.143378.20000.75958.491935.295607.153193.25000.75062.454603.291740.159210.30000.74237.425131.286912.162925.35000.73472.401123.281619.165160.40000.72755.381077.276141.166401.45000.72077.364000.270641.166949.50000.71433.349209.265211.167001.55000.70816.336222.259906.166692.005882.60000.70223.324683.254757.166113.013112.65000.69649.314330.249777.165331.019387.70000.69093.304959.244973.164397.024860.75000.68552.296414.240345.163346.029654.80000.68024.288571.235891.162207.033870.85000.67508.281331.231605.161000.037587.90000.67003.274614.227480.159743.040874.95000.66508.268353.223510.158448.043787.66022.262494.219687.157127.046373

RIDGETRACED1.000000-D.750000-.500000-.250000-.000000--.250000-.00000.20000.40000.60003.800001.00000kRIDGETRACED1.000000-D.750000-.500000-.250000-.000000--.250000-.00000.20000.40000.60003.800001.00000kRunMATRIXprocedure:******RidgeRegressionwithk=******TOC\o"1-5"\h\zMultR.0RSquare.8AdjRSqu.7SEANOVAtabledfSSMSRegressResidualFvalueSigF19..00

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论