应用回归分析第十章_第1页
应用回归分析第十章_第2页
应用回归分析第十章_第3页
应用回归分析第十章_第4页
应用回归分析第十章_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(X,D)二1YX11-a-Xki100(X,D)二1YX11-a-Xki100Ox(X,D)不满秩参1Y-a-Xk2Xk301001*2-a-0010pi2111Y0001¥a3Yx•a-Xk4k1怀-a-xk501004JY-a-Xk6100o显然,(X,D),的第1列可表示成后4列的线性组合从而数无法唯一求出。这,答:假如这个含有季节定性自变量的回归模型为:Yt=-0■-iXit-kXkt«>1Dlt«)2d2tB>3D3t其中含有k个定量变量,记为X。对春夏秋冬四个季节引入4个型自变量,记为D,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:冬各取到一次观测就是所谓的虚拟变量陷井”,应避免。当某自变量Xj对其余P-1个自变量的复判定系数R2超过一定界限时,SPSS2软件将拒绝这个自变量Xj进入回归模型。称Tol1-Rj为自变量Xj的容忍度j=(Toleranee),SPSS软件的默认容忍度为0.0001。也就是说,当R2>0.9999时,自变量%将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。10.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例10-1说明。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其差的自由度更多。y/7|/|、I"7IV/vuI/、/uIL|/|、I公司类型的尖系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。数据资料见表10.8,试建立y对公司规模和公司类型的回归。表10..iT234y17262130Xi151921753122

012.iT234y17262130Xi151921753122

0121910427791011121341628151415113831210120290238164272295161718192021201330146885224166305124246公司类型

互助

互助

互助

互助

互助

互助

互助

互助

互助

互助

股份

股份

股份

股份

股份

股份

股份

股份

股份

股份引入虚拟变量泊:公司类型为“互助”时,x2=1,为“股份”时,x2=0则表9.5中数据转换成以下数据:

10111213141516171920262130221219

416281511312120133014Xi15192175311042772101202902316427229585224166305124246公司尖型建立回归方程y=bo+bXi+bx10111213141516171920262130221219

416281511312120133014Xi15192175311042772101202902316427229585224166305124246公司尖型ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.946a.895.8833.221a.Predctors:(Constant),公司类型*a.R检验:拟合优度R=0.883,接近1,说明回归拟合的效果较好ANOVAa.ModelSumofSquaresdfMeanSquareFSig.1Regression1504.4132752.20772.497.000aResidual176.3871710.376Total1680.80019Predictors:(Constant),公司类型,x1b.DependentVariable:yIJzzL—fj・rjz@j,w,*yu八i——y—/7八:iCoefficientsModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)41.9302.01020.859.000x1-.102.009-.911-11.443.000公司类型-8.0551.459-.439-5.521.000aDependentVariable:yT检验:回归系数通过t检验,回归方程为:y=41.930-0.102x1-8.055x2说明:若引入虚拟变量〃,当公司类型为“互助”时,x2=0,为“股份”时,x2=1则回归方程为:y=33.874-0-102xi+8.055X2结果分析:股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承担风险上,所以更愿意革新;公司规模越大,采取保险革新措施的倾向越大:大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比较更新措施和现有政策带来的效益,最终表现在采纳革新措施的时间间隔较短。10.4•表10.9的数据是我国历年铁路里程数据,根据散点图观察在某时间点有折点,用折线回归拟合这个数据。解:由散点图9(见下图)可看出在1995年(t=16)有折点,考虑由两段构成的分段线性回归,这可以通过引入一个型虚拟自变量实现。由散点图可知该折点为t=16,则引入虚拟自变量x,*0,216X=j-16,r>16由SPSS俞出的调整后的决定系数R2=0.980,说明拟合优度较好。由输出的系数表可以得出回归方程为:y=5.1830.055t0.106x

由SPSS俞出方程分析表可知,F值为594.524,且P值约为零,说明回归方程非常显著;系数表中回归参数对应的t检验P值都约等于零,说明回归参数均通过了显著性检验。因此,折线方程成立。7.50-G.50-.G.OD-.5.50.2025散点图

方差分析表ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression11.11325.557594.524.000aResidual.20622.009Total11.31924aPredictors:(Constant),x,tb.DependentVariable:y系数表CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstBStd.ErrorBeta1(Constant)5.183.049106.303Sig.a..000X.106.012.4509.065.000表10.10曰士”是否害怕y害怕1不害怕o文化程度X2~~文盲0小学表10.10曰士”是否害怕y害怕1不害怕o文化程度X2~~文盲0小学1中学2中专以上3乂1、文化程度X2有没有尖系呢?调查数据见表10.11o表10.11X2Xiriiy=iy=0Pi对1391人填写的问卷设计:“一人在家是否害怕生人来”。因变量y=l表示害怕y=2表示不害怕。2个自变量:x1是年龄,x2是文化程度各变量的取值含义如表10.10所示。年龄X116—28岁2229—45岁3746-60岁5361岁以I:68现在的问题是:公民一人在家害怕生人来这个事件,与公民的年龄序号123491011121314151622222222373737375353535301230123113898342712349101112131415162222222237373737535353530123012311389834274871031478810184-03

14626318196277318032435729176115291140.125000.291670.375640.315480.700000.660710.402660.264420.450000.500000.388890.385420.166670.318180.394740.10000其中,Pi是根据(10.44)式计算的。(1)把公民的年龄x1、文化程度x2作为数值型变量,建立y对x1、x2的logistic回归。(2)把公民的年龄x1、文化程度x2作为定性型变量,用变量将其数量化,建立y

对公民的年龄和文化程度的logistic回归。你对回归的效果是否满意,你认为主要的问题是什么?解:⑴先对P进行逻辑变换'令Pr=ln(-BM,则1-PiPr=:O•:必1•:2Xi2•;i直接用SPSS!行y与x1、x2的logistic回归'输出结果如下:ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression.5622.281.386.687aResidual9.45913.728Total10.02015Predictors:(Constant),x2,x1DependentVariable:ppiCoefficientsModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-.144.662-.218.831x1-.006.012-.137-.510.619x2-.136.191-.193-.715.487aDependentVariable:ppi由SPSS输出系数表结果得到回归方程:P=-0.144-0.006X1-0.136x2则还原后logistic回归方程为:6X9(-0.144—0.006a—0.136X2)?=1exp(-0.144-O.OO6X1-0.136X2)由方差分析表知F值=0.386,P值=0.687,大于由方差分析表知F值=0.386,P值=0.687,大于5%说明回归方程不显著;由系数表知回归参数的t检验均没有通过,因为P值都大于5%说明回归参数未通过显著性检验。由于logistic回归模型存在异方差,所以采用加权最小二乘法重新拟合,权重:-i=niP/1pjSPSI叫"IIcModelSumofSquaresdfMeanSquareFSig.1Regression8.39324.1974.304.037aResidual12.67613.975Total21.06915Predictors:(Constant),x2,x1DependentVariable:ppic.WeightedLeastSquaresRegression・WeightedbywiCoefficientsModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant).146.309.472.645x1.002.005.086.398.697x2-.331.116-.617-2.858.013DependentVariable:ppiWeightedLeastSquaresRegression-Weightedbywi由输出结果得到回归方程:f?二0.1460.002搀・0.33俶2exp(0.1460.002X1-0.331X2)还原后的回归万程:B=12-1+exp(0.146+0.002Xi-0.331X2)由方差分析表结果知:F值=4.304,P值=0.037,小于5%说明回归方程显著;由系数表知搀对应的回归系数相应的P值=0.697,大于5%说明搀对应的回归系数没有通过检验,不显著;X?对应的回归系数相应的P值=0.013,小于5%说明X2对应的回归系数通过检显著性验,且该回归系数为0331…表明文化程度越高越不害怕。(2)把公民的年龄x1、文化程度X2作为定性型变量,引入6个变量表示年龄冷22八=22二)-in*4人991,x2=0,B22…二」37,片=3753凶二53.023722八=22二)-in*4人991,x2=0,B22…二」I/I—Ia/I-4J77|/MTaj5/IV/I、/-IIXXIVII\-TLIw|——Iy―I,Inu1-JL_|h|_|/]、/II•由方差分析表知F=2.472,P值=0.106,大于5%说明回归方程不显著;且除了夕卜,其它自变量对应的回归系数都没通过检验ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression4.74341.1862.472.106aResidual5.27711.480Total10.02015Predictors:(Constant),x13,x2,x12,x11DependentVariable:ppiCoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)x2x11x12x13-1.044-.136.2201.273.969.417.155.490.490.490-.193.120.697.530-2.505-.881.4492.6001.979.029.397.662.025.073a.DependentVariable:ppi下面通过后退法选择变量对上述模型改进SPSS俞出结果如下表:ANOVAModelSumofSquaresdfMeanSquareFSig.1RegressionResidualTotal4.7435.27710.020411151.186.4802.472.106a2RegressionResidualTotal4.6475.37410.020312151.549.4483.459.051b3RegressionResidualTotal4.2745.74610.020213152.137.4424.835.027cPredictors:(Constant),x13,x2,x12,x11Predictors:(Constant),x13,x2,x12Predictors:(Constant),x13,x12.uoeiiicieiitsUnstandardizedStandardizedCoefficientsCoefficientsModelBStd.ErrorBetatSig.1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.0732(Constant)-.934.326-2.865.014x2-.136.150-.193-.912.380x121.163.410.6362.838.015x13.859.410.4702.097.0583(Constant)-1.139.235-4.846.000x121.163.407.6362.857.013x13.859.407.4702.110.055aDependentVariable:ppi后退法的过程中剔除了X11,X2,留下了X12,X13但是X13对应的回归系数未通过检验,将其剔除,最后留下了X12;而且回归方程显著,2)加权回归:用后退法选择变量,由输出结果(如下)可知最后只留下了X22)X2ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression9.97942.4952.475.106aResidual11.090111.008Total21.069152Regression9.52633.1753.301.058bResidual11.54312.962Total21.069153Regression8.87024.4354.726.029cResidual12.19913.938Total21.069154Regression8.23818.2388.989.010dResidual12.83114.916Total21.06915a*Predictors:(Constant),x13,x2,x11,x12b・Predictors:(Constant),x13,x2,x12c・Predictors:(Constant),x2,x12d・Predictors:(Constant),x2e-DependentVariable:ppif-WeightedLeastSquaresRegression-Weightedbywi

ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)-.092.425-.217.832X2-.344.118-.641-2.901.014X11.263.392.490

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论