最新应用回归分析-课后习题参考答案_第1页
最新应用回归分析-课后习题参考答案_第2页
最新应用回归分析-课后习题参考答案_第3页
最新应用回归分析-课后习题参考答案_第4页
最新应用回归分析-课后习题参考答案_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档精品文档第9章含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入 4个0-1型自变量,用SPSS软件计算的结果中总是自动删除了其中的一个自变量, 他为此感到困惑不解。出现这种情况的原因是什么? 答:假如这个含有季节定性自变量的回归模型为:X = % + 3梯牡 + UXkt 山牡 +sD2t +SD3F其中含有k个定量变量,记为X。对春夏秋冬四个季节引入4个0-1型自变量, 记为D,只取了 6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测 值,则样本设计矩阵为:1YaX11Xk11000、1VX12Xk20100(X,

2、 D )=1VX13Xk300101YX14Xk400011YaX15X k501007YaX16Xk61000显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参 数无法唯一求出。这就是所谓的 虚拟变量陷井”,应避免当某自变量xj对其余p-1个自变量的复判定系数R2超过一定界限时,SPSS 软件将拒绝这个自变量 为进入回归模型。称Tolj=1- R2为自变量为的容忍度(Toleranee ),SPSS软件的默认容忍度为 0.0001。也就是说,当R2 0.9999 时,自变量Xj将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。而在这个模型中出现了完全共线性,所

3、以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型, 而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例9.1说明。一是因为模型假设对每类家庭具有相同的斜率 和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。9.3研究者想研究采取某项保险革新措施的速度y对保险公司的规模xi和保险公司类型的关系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项 革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个

4、自变量公司的 规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司 是定性变量,由两种类型构成,即股份公司和互助公司。数据资料见表9.8,试建立y对公司规模和公司类型的回归。表9.8iyX1公司类型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份解:对定型变量“公司类型”进行数量化处理:引入虚拟变量X

5、2:公司类型为“互助”时,X2=1,为“股份”时,X 2=0则表9.5中数据转换成以下数据:iyX1公司类型1171511226921321175143031152210416027717122101819120194290110162381112816401215272013112950143868015318501621224017201660181330501930124020142460建立回归方程y = b0+b1X1+b2X2+ e用SPSS软件作线性回归,得到输出结果如下:Model Summ aryModelRR SquareAdjusted R SquareStd. E rr

6、or of the Estimate1.946 a.895.8833.221a. Predictors: (Constant),公司类型,x1R检验:拟合优度R=0.883,接近1,说明回归拟合的效果较好ANOVA bModelSum of SquaresdfMean SquareFSig.1Regressi on1504.4132752.20772.497.000 aResidual176.3871710.376Total1680.80019a. Predictors: (Constant),公司类型,x1b. Depe ndent Variable: yF检验:F值=72.497, Sig

7、.值为0,说明回归方程通过F检验Coe fficientsModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd. ErrorBeta1(Co nsta nt)41.9302.01020.859.000x1-.102.009-.911-11.443.000公司类型-8.0551.459-.439-5.521.000a. Depe ndent Variable: yT检验:回归系数通过t检验,回归方程为:y= 41.930 - 0.102 x 1 8.055 x 2说明:若引入虚拟变量X2,当公司类型为“互助

8、”时,X2=0,为“股份”时,X 2 = 1则回归方程为:y= 33.874 - 0.102x1 + 8.055x2结果分析:(1) 股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股 份制公司建立在共同承担风险上,所以更愿意革新;(2) 公司规模越大,采取保险革新措施的倾向越大:大规模公司的保险制度的 更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比较更新措施 和现有政策带来的效益,最终表现在采纳革新措施的时间间隔较短。9.4 .表9.9的数据是我国历年铁路里程数据,根据散点图观察在某时间点有折 点,用折线回归拟合这个数据。解:由散点图9(见下图)可看出在1995年

9、(t=16)有折点,考虑由两段构成的 分段线性回归,这可以通过引入一个 0-1型虚拟自变量实现。由散点图可知该折点为t=16,则引入虚拟自变量x,0,t 兰 16X =t 16,t 16由SPSS俞出的调整后的决定系数RS 0.980,说明拟合优度较好由输出的系数表可以得出回归方程为:0 =5.183 0.055t 0.106x由SPSS俞出方程分析表可知,F值为594.524,且P值约为零,说明回归方程非 常显著;系数表中回归参数对应的t检验P值都约等于零,说明回归参数均通过了显著性 检验。因此,折线方程成立。7.50-G.50-.00-5.5020250散点图方差分析表ANOVA bMod

10、elSum of SquaresdfMean SquareFSig.1Regressi on11.11325.557594.524.000 aResidual.20622.009Total11.31924a Predictors: (Con sta nt), x, tb. Depe ndent Variable: y系数表Coe fficientsModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt)5.183.049106.303.000t.055.005.5

11、8911.859.000x.106.012.4509.065.000a. Depe ndent Variable: y9.5某省统计局1990年9月在全省范围内进行了一次公众安全感问卷调查,参 考文献【10】选取了调查表中的一个问题进行分析。本题对其中的数据做了适当的合并。对1391人填写的问卷设计:“一人在家是否害怕生人来”。因变量 y=1表示害怕,y=2表示不害怕。2个自变量:x1是年龄,x2是文化程度。各变 量的取值含义如表9.10所示。表 9.10是否害怕y年龄x1文化程度x2害怕11628岁22文盲0不害怕 02945岁37小学14660岁53中学261岁以上68中专以上3现在的问题

12、是:公民一人在家害怕生人来这个事件,与公民的年龄x1、文化程度x2有没有关系呢?调查数据见表 9.11 o表 9.11序 号X1X2niy=1y=0pi12203090.12500222111380.2916732223891462430.3756442238326570.3154853704310.700006371271890.6607173724871962910.40266837310327760.264429535309450.45000105316330.5000011532188731150.38889126834718290.38542136802020.16667146811

13、0370.3181815682187110.394741634040.10000其中,pi是根据(9.44)式计算的。(1) 把公民的年龄x1、文化程度x2作为数值型变量,建立y对x1、x2的 logistic 回归。(2) 把公民的年龄x1、文化程度x2作为定性型变量,用0-1变量将其数量化, 建立y对公民的年龄和文化程度的logistic 回归。(3) 你对回归的效果是否满意,你认为主要的问题是什么?解: 先对P进行逻辑变换,令p=ln(-B),则1- PiPi = -0 -必1 -2X2;i直接用SPSS!行y与x1、x2的logistic回归,输出结果如下:ANOVA bModelSu

14、m ofSquaresdfMean SquareFSig.1Regressi on.5622.281.386.687 aResidual9.45913.728Total10.02015a. Predictors: (Con sta nt), x2, x1b. Depe ndent Variable: ppiModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt)-.144.662-.218.831x1-.006.012-.137-.510.619x2-.136.1

15、91-.193-.715.487Coe fficientsaa. Depe ndent Variable: ppi由SPSS输出系数表结果得到回归方程:p =-0.144-0.006 x1-0.136 x2则还原后logistic回归方程为:exo( -0.144 - 0.006捲 一 0.136x2)?=1 exp(-0.144 -0.006x1 - 0.136x2)由方差分析表知F值=0.386,P值=0.687,大于5%说明回归方程不显著;由系数表知回归参数的t检验均没有通过,因为P值都大于5%说明回归参数 未通过显著性检验。由于logistic回归模型存在异方差,所以采用加权最小二乘法

16、重新拟合,权重:i =niP/1 - pjSPS输出结果如下:ANOVA b,cModelSum of SquaresdfMean SquareFSig.1Regressi on8.39324.1974.304.037 aResidual12.67613.975Total21.06915a. Predictors: (Co nsta nt), x2, x1b. Depe ndent Variable: ppic. Weighted Least Squares Regressi on - Weighted by w iCoe fficientsModelUn sta ndardized Coef

17、ficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt).146.309.472.645x1.002.005.086.398.697x2-.331.116-.617-2.858.013a. Depe ndent Variable: ppib. Weighted Least Squares Regressi on - Weighted by w i由输出结果得到回归方程:f? =0.146 0.002捲-0.33俶2exp( 0.1460.002x1-0.331x2)还原后的回归万程:B=-1 +exp(0.146

18、+0.002x1 -0.331x2)由方差分析表结果知:F值=4.304 , P值=0.037,小于5%说明回归方程显著; 由系数表知捲对应的回归系数相应的 P值=0.697,大于5%说明捲对应的回归 系数没有通过检验,不显著;X2对应的回归系数相应的P值=0.013,小于5%说明X2对应的回归系数通过检 显著性验,且该回归系数为-0.331,表明文化程度越高越不害怕。(2)把公民的年龄x1、文化程度x2作为定性型变量,引入6个0-1变量表示年龄x1=22I0,x22x2 =乜7=37JI0,x=37x3 = 53,片=53.0,x 式 531,x2 = 00X2“1,冷=1x231,皆20,

19、x2 - 21)直接进行y与6个虚拟变量的未加权的logistic 回归,SPSS俞出结果如下:由方差分析表知F=2.472 , P值=0.106,大于5%说明回归方程不显著;且 除了外,其它自变量对应的回归系数都没通过检验。ANOVA bModelSum ofSquaresdfMean SquareFSig.1Regressi on4.74341.1862.472.106aResidual5.27711.480Total10.02015a. Predictors: (Co nsta nt), x13, x2, x12, x11b. Depe ndent Variable: ppiModelU

20、nstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E rrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.073Coe fficientsaa. Dependent Variable: ppi下面通过后退法选择变量对上述模型改进SPSS俞出结果如下表:ANOVAdModelSum of SquaresdfMean S

21、quareFSig.1Regressi on4.74341.1862.472.106aResidual5.27711.480Total10.020152Regressi on4.64731.5493.459.051 bResidual5.37412.448Total10.020153Regressi on4.27422.1374.835.027 cResidual5.74613.442Total10.02015a Predictors: (Co nsta nt), x13, x2, x12, x11b. Predictors: (Co nsta nt), x13, x2, x12c. Pred

22、ictors: (Con sta nt), x13, x12d. Depe ndent Variable: ppiCoe fficients aModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E rrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.0732(Constant)-.934.326-2.86

23、5.014x2-.136.150-.193-.912.380x121.163.410.6362.838.015x13.859.410.4702.097.0583(Constant)-1.139.235-4.846.000x121.163.407.6362.857.013x13.859.407.4702.110.055a Dependent Variable: ppi后退法的过程中剔除了 x11, x2 ,留下了 x12, x13,但是x13对应的回归系数未通过检验,将其剔除,最后留下了 x12 ;而且回归方程显著,2)加权回归:用后退法选择变量,由输出结果(如下)可知最后只留下了X2ANOVA

24、ModelSum of SquaresdfMean SquareFSig.1Regression9.97942.4952.475.106 aResidual11.090111.008Total21.069152Regression9.52633.1753.301.058 bResidual11.54312.962Total21.069153Regression8.87024.4354.726.029 cResidual12.19913.938Total21.069154Regression8.23818.2388.989.010dResidual12.83114.916Total21.0691

25、5a. Predictors: (Constant), x13, x2, x11, x12b. Predictors: (Constant), x13, x2, x12c. Predictors: (Constant), x2, x12d. Predictors: (Constant), x2e. Dependent Variable: ppif. Weighted Least Squares Regression - Weighted by w iCoe fficients a,bModelUnstandardizedCoefficientsStandardized CoefficientstSig.BStd.ErrorBeta1(Constant)-.092.425-.217.832x2-.344.118-.641-2.901.014x11.263.392.490.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论