应用回归第三章课后答案_第1页
应用回归第三章课后答案_第2页
应用回归第三章课后答案_第3页
应用回归第三章课后答案_第4页
应用回归第三章课后答案_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章 多元线性回归思考与练习参考答案3.2 讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:n>>p。如果n<=p对模型的参数估计会带来很严重的影响。因为:1. 在多元线性回归模型中,有p+1个待估参数,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。2. 解释变量X是确定性变量,要求,表明设计矩阵X中的自变量列之间不相关,即矩阵X是一个满秩矩阵。若,则解释变量之间线性相关,是奇异阵,则的估计不稳定。3.3证明 随机误差项的方差s2的无偏估计。证明:3.4 一个回归方程的复相关系数R=

2、0.99,样本决定系数R2=0.9801,我们能判断这个回归方程就很理想吗?答:不能断定这个回归方程理想。因为:1. 在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。2. 样本决定系数和复相关系数接近于1只能说明Y与自变量X1,X2,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F检验和t检验。3. 在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R2的增大与拟合好坏无关。3.7

3、验证证明:多元线性回归方程模型的一般形式为:其经验回归方程式为,又,故,中心化后,则有,左右同时除以,令,样本数据标准化的公式为,则上式可以记为则有3.10 验证决定系数R2与F值之间的关系式:证明:3.11 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。数据见表3.9(略)。(1)计算出y,x1,x2,x3的相关系数矩阵。SPSS输出如下:则相关系数矩阵为:(2)求出y与x1,x2,x3的三元回归方程。对数据利用SPSS做线性回归,得到回归方程为(3)对所求的方程作拟合优度检验。由上表可知,调整后的决定系数为0.708,说明回归方程

4、对样本观测值的拟合程度较好。(4)对回归方程作显著性检验;原假设:F统计量服从自由度为(3,6)的F分布,给定显著性水平=0.05,查表得,由方查分析表得,F值=8.283>4.76,p值=0.015,拒绝原假设,由方差分析表可以得到,说明在置信水平为95%下,回归方程显著。(5)对每一个回归系数作显著性检验;做t检验:设原假设为,统计量服从自由度为n-p-1的t分布,给定显著性水平0.05,查得单侧检验临界值为1.943,X1的t值=1.942<1.943,处在否定域边缘。X2的t值2.465>1.943。拒绝原假设。由上表可得,在显著性水平时,只有的P值<0.05,

5、通过检验,即只有的回归系数较为显著 ;其余自变量的P值均大于0.05,即x1,x2的系数均不显著。(6)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,并作回归方程的显著性检验和回归系数的显著性检验。解:用后退法对数据重新做回归分析,结果如下:选择模型二,重新建立的回归方程为:对新的回归方程做显著性检验:原假设:F服从自由度为(2,7)的F分布,给定显著性水平=0.05,查表得,由方差分析表得,F值=11.117>4.74,p值=0.007,拒绝原假设.认为在显著性水平=0.05下,x1,x2整体上对y有显著的线性影响,即回归方程是显著的。对每一个回归系数做显著性检验:做

6、t检验:设原假设为,统计量服从自由度为n-p-1的t分布,给定显著性水平0.05,查得单侧检验临界值为1.895,X1的t值=2.575>1.895,拒绝原假设。故显著不为零,自变量X1对因变量y的线性效果显著;同理2也通过检验。同时从回归系数显著性检验表可知:X1,X2的p值 都小于0.05,可认为对x1,x2分别对y都有显著的影响。(7)求出每一个回归系数的置信水平为955D 置信区间由回归系数表可以看到,1置信水平为95%的置信区间0.381,8.970,2置信水平为95%的置信区间3.134,14.808(8)求标准化回归方程由回归系数表(上表)可得,标准化后的回归方程为:(9)求当x01=75,x02=42,x03=3.1时的y的预测值,给定置信水平95%,用SPSS软件计算精确置信区间,用手工计算近似预测区间;由SPSS输出结果可知,当时,(见上表),的置信度为95%的精确预测区间为(204.4,331.2)(见下表),的置信度为95%的近似预测区间为,手工计算得:(219.6,316.0)。(10)结合回归方程对问题做一些简单分析。答:由回归方程可知农业总产值固定的时候,工业总产值每增加1亿元,货运总量增加4.676万吨;工业总产值固定的时候,农业总产值每增加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论