应用回归分析-第2章课后习题参考的答案_第1页
应用回归分析-第2章课后习题参考的答案_第2页
应用回归分析-第2章课后习题参考的答案_第3页
应用回归分析-第2章课后习题参考的答案_第4页
应用回归分析-第2章课后习题参考的答案_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

...wd......wd......wd...2.1一元线性回归模型有哪些基本假定答:1.解释变量是非随机变量,观测值是常数。2.等方差及不相关的假定条件为这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M条件。在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。3.正态分布的假定条件为在此条件下便可得到关于回归系数的最小二乘估计及估计的进一步结果,如它们分别是回归系数的最及的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。4.通常为了便于数学上的处理,还要求及样本容量的个数要多于解释变量的个数。在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进展处理。因此,线性回归模型的理论和应用是本书研究的重点。1.如何根据样本求出及方差的估计;2.对回归方程及回归系数的种种假设进展检验;3.如何根据回归方程进展预测和控制,以及如何进展实际问题的构造分析。2.2考虑过原点的线性回归模型误差仍满足基本假定。求的最小二乘估计。答:令即解得即的最小二乘估计为2.3证明: Q(,)=∑(--)2因为Q(,)=minQ(,)而Q(,)非负且在上可导,当Q取得最小值时,有即-2∑(--)=0-2∑(--)=0又∵=-(+)=--∴∑=0,∑=0〔即残差的期望为0,残差以变量x的加权平均值为零〕2.4解:参数β0,β1的最小二乘估计与最大似然估计在εi~N(0,2)i=1,2,……n的条件下等价。证明:因为所以其最大似然函数为使得Ln〔L〕最大的,就是,的最大似然估计值。即使得下式最小:=1\*GB3①因为=1\*GB3①恰好就是最小二乘估计的目标函数一样。所以,在的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。2.5.证明是的无偏估计。证明:假设要证明是的无偏估计,那么只需证明E()=。因为,的最小二乘估计为其中E()=E()=E()=E[]=E[]=E()+E()+E()其中==由于=0,所以====)==0又因为一元线性回归模型为所以E()=0所以E()+E()+E(==所以是的无偏估计。2.6解:因为=1\*GB3①,=2\*GB3②,=3\*GB3③联立=1\*GB3①=2\*GB3②=3\*GB3③式,得到。因为,,所以2.7证明平方和分解公式:SST=SSE+SSR证明:2.8验证三种检验的关系,即验证:〔1〕;〔2〕证明:〔1〕因为,所以又因为,所以故得证。〔2〕2.9验证〔2.63〕式:证明:其中:注:各个因变量是独立的随机变量2.10用第9题证明是的无偏估计量证明:注:2.11验证证明:所以有以上表达式说明r²与F等价,但我们要分别引入这两个统计量,而不是只引入其中一个。理由如下:=1\*GB3①r²与F,n都有关,且当n较小时,r较大,尤其当n趋向于2时,|r|趋向于1,说明x与y的相关程度很高;但当n趋向于2或等于2时,可能回归方程并不能通过F的显著性检验,即可能x与y都不存在显著的线性关系。所以,仅凭r较大并不能断定x与y之间有密切的相关关系,只有当样本量n较大时才可以用样本相关系数r判定两变量间的相关程度的强弱。=2\*GB3②F检验检验是否存在显著的线性关系,相关系数的显著性检验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。2.12如果把自变量观测值都乘以2,回归参数的最小二乘法估计和会发生什么变化如果把自变量观测值都加上2,回归参数的最小二乘估计和会发生什么变化解:解法〔一〕:我们知道当,时,用最小二乘法估计的和分别为=1\*GB2⑴当时有QUOTE将=2\*GB3②=3\*GB3③带入=1\*GB3①得到=2\*GB2⑵当时QUOTE有QUOTEQUOTE将=2\*GB3②=3\*GB3③带入=1\*GB3①得到·解法〔二〕:当,时,有当时当,,由最小二乘法可知,离差平方和时,其估计值应当有QUOTE。即回归参数的最小二乘估计和在自变量观测值变化时不会变。2.13如果回归方程QUOTE相应的相关系数r很大,那么用它预测时,预测误差一定较小。这一结论能成立吗对你的答复说明理由。解:这一结论不成立。因为相关系数r表示x与QUOTE线性关系的密切程度,而它接近1的程度与数据组数有关。n越小,r越接近1。n=2时,|r|=1。因此仅凭相关系数说明x与有密切关系是不正确的。只有在样本量较大时,用相关系数r判定两变量之间的相关程度才可以信服,这样预测的误差才会较小。2.14解:〔1〕散点图为:〔2〕x与y大致在一条直线上,所以x与y大致呈线性关系。〔3〕得到计算表:XY1104100206〔-14〕2〔-4〕221011001013〔-7〕2〔3〕2320000200042010027727254044004034142〔-6〕2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20所以回归方程为:〔4〕=所以,〔5〕因为,的置信区间为;同理,因为,所以,的置信区间为。查表知,所以,的置信区间为〔-21.21,19.21〕,的置信区间为〔0.91,13.09〕。〔6〕决定系数〔7〕计算得出,方差分析表如下:方差来源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004查表知,F0.05(1,3)=10.13,F值>F0.05(1,3),故拒绝原假设,说明回归方程显著。做回归系数β1的显著性检验计算t统计量:查表知,,所以,t>t0.05/2(3),所以承受原假设,说明x和Y有显著的线性关系。〔9〕做相关系数r的显著性检验:因为所以,相关系数因为查表知,n-2等于3时,%的值为0.959,%的值为0.878。所以,%<|r|<%,故x与y有显著的线性关系。〔10〕残差表为:序号残差111064221013-33320200442027-75540346残差图为:〔11〕当X0=4.2时,其95%的置信区间近似为,即为:〔17.1,39.7〕。2.15解:〔1〕画散点图;图形→旧对话框→散点图,得到散点图〔表1〕如下:〔2〕x与y之间是否大致呈线性关系由上面〔1〕散点图可以看出,x与y之间大致呈线性关系。用最小二乘估计求出回归方程;分析→回归→线性,得到“回归系数显著性检验表〔表2〕〞如下:CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstBStd.ErrorBeta1(Constant).118.355.333每周签发的新保单数目x.004.000.9498.509a.DependentVariable:每周加班工作时间y由上表可知:=0.118=0.004所以可得回归方程为:=0.118+0.004x〔4〕求回归标准误差;分析→回归→线性,得到“方析分析表〔表3〕〞如下:ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression16.682116.68272.396.000aResidual1.8438.230Total18.5259a.Predictors:(Constant),每周签发的新保单数目xb.DependentVariable:每周加班工作时间y由上表可得,SSE=1.843n=10故回归标准误差为:====0.23==0.48〔5〕给出与的置信度为95%的区间估计;由表2可以看出,当置信度为95%时,的预测区间为:[-0.701,0.937]的预测区间为:[0.003,0.005]〔6〕计算x与y的决定系数;分析→回归→线性,得到“模型概要表〔表4〕〞如下:ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.949a.900.888.4800a.Predictors:(Constant),每周签发的新保单数目xb.DependentVariable:每周加班工作时间y由上表可知,x与y的决定系数为0.9,可以看到很接近于1,这就说明此模型的拟合度很好。〔7〕对回归方程作方差分析;由“方差分析表〔表3〕〞可得,F-值=72.396,我们知道,当原假设:=0成立时,F服从自由度为〔1,n-2〕的F分布〔见〕,临界值〔1,n-2〕=〔1,8〕=5.32因为F-值=72.396>5.32,所以拒绝原假设,说明回归方程显著,即x与y有显著的线性关系。〔8〕做回归系数显著性的检验;由“回归系数显著性检验表〔表2〕〞可得,的t检验统计量为t=8.509,对应p-值近似为0,p<,说明每周签发的新报单数目x对每周加班工作时间y有显著的影响。〔9〕做相关系数的显著性检验;分析→相关→双变量,得到“相关分析表〔表5〕〞如下:Correlations每周签发的新保单数目x每周加班工作时间y每周签发的新保单数目xPearsonCorrelation1.949**Sig.(2-tailed).000N1010每周加班工作时间yPearsonCorrelation.949**1Sig.(2-tailed).000N1010**.Correlationissignificantatthe0.01level(2-tailed).由上表可知,相关系数为0.949,说明x与y显著线性相关。〔10〕对回归方程作残差图并作相应的分析;从上图可以看出,残差是围绕e=0随即波动的,满足模型的基本假设。〔11〕该公司预计下一周签发新保单=1000张,需要的加班时间是多少当=1000张时,=0.118+0.004×1000=4.118小时。〔12〕给出的置信水平为95%的准确预测区间和近似预测区间。〔13〕给出E〔〕置信水平为95%的区间估计。最后两问一起解答:在计算回归之前,把自变量新值输入样本数据中,因变量的相应值空缺,然后在Save对话框中点选Individul和Mean计算因变量单个新值和因变量平均值E()的置信区间。结果显示在原始数据表中,如以以下图所示(由于排版问题,中间局部图省略):的准确预测区间为:[2.519,4.887]E〔〕的区间估计为:[3.284,4.123]而的近似预测区间那么根据2手动计算,结果为:[4.118-2×0.48,4.118+2×0.48]=[3.158,5.078]2.16解答:〔1〕绘制y对x的散点图,可以用直线回归描述两者之间的关系吗如以以下图:〔2〕由上图可以看出,y与x的散点分布大致呈直线趋势,所以可以用直线回归描述两者之间的关系。〔3〕建设y对x的线性回归。利用SPSS建设y对x的线性回归,输出结果如下:表1模型汇总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论