应用回归分析-第三章课后习题整理_第1页
应用回归分析-第三章课后习题整理_第2页
应用回归分析-第三章课后习题整理_第3页
应用回归分析-第三章课后习题整理_第4页
应用回归分析-第三章课后习题整理_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

+即y=x+根本假定〔1〕解释变量x1,x2...,xp是确定性变量,不是随机变量,且要求rank(X)=p+1<n,说明设计矩阵X中自变量列之间不相关,样本量的个数应大于解释变量的个数随机误差项具有零均值和等方差,即高斯马尔柯夫条件对于多元线性回归的正态分布假定条件的矩阵模型为~N〔0,〕随即向量y~N(X)当存在时,回归参数的最小二乘估计为,要求出回归参数,即要求是一个非奇异矩阵,,所以可逆矩阵为p+1阶的满秩矩阵,又根据两个矩阵乘积的秩不大于每一因子的秩rank(X)p+1,而X为n(p+1)阶矩阵,于是应有np+1结论说明,要想用最小二乘法估计多元线性回归模型的未知参数,样本量n必须大于模型自变量p的个数。不能断定这个方程一定很理想,因为样本决定系数与回归方程中自变量的数目以及样本量n有关,当样本量个数n太小,而自变量又较多,使样本量与自变量的个数接近时,易接近1,其中隐藏一些虚假成分。当接受H时,认定在给定的显著性水平下,自变量x1,x2,xp对因变量y无显著影响,于是通过x1,x2,xp去推断y也就无多大意义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描述,而误用了线性模型,使得自变量对因变量无显著影响;另一方面可能是在考虑自变量时,把影响因变量y的自变量漏掉了,可以重新考虑建模问题。当拒绝H时,我们也不能过于相信这个检验,认为这个回归模型已经完美了,当拒绝H时,我们只能认为这个模型在一定程度上说明了自变量x1,x2,xp与自变量y的线性关系,这时仍不能排除排除我们漏掉了一些重要的自变量。中心化经验回归方程的常数项为0,回归方程只包含p个参数估计值比一般的经验回归方程减少了一个未知参数,在变量较多时,减少一个未知参数,计算的工作量会减少许多,对手工计算尤为重要。在用多元线性回归方程描述某种经济现象时,由于自变量所用的单位大都不同,数据的大小差异也往往很大,这就不利于在同一标准上进行比拟,为了消除量纲不同和数量级的差异带来的影响,就需要将样本数据标准化处理,然后用最小二乘法估计未知参数,求得标准化回归系数。对进行中心化处理得再将等式除以因变量的样本标准差那么有==所以3.8〔为相关阵〔)第i行,第j列的代数余子式〕=3.9F=小于1,F与一一对应,所以F与等价3.10证得3.11(1)相关性yx1x2x3yPearson相关性1.556.731*.724*显著性〔双侧〕.095.016.018N10101010x1Pearson相关性.5561.113.398显著性〔双侧〕.095.756.254N10101010x2Pearson相关性.731*.1131.547显著性〔双侧〕.016.756.101N10101010x3Pearson相关性.724*.398.5471显著性〔双侧〕.018.254.101N10101010*.在0.05水平〔双侧〕上显著相关。(2)〔3〕〔4〕〔5〕〔6〕模型汇总模型RR方调整R方标准估计的误差1.898a.806.708a.预测变量:(常量),x3,x1,x2。Anovab模型平方和df均方FSig.1回归3.015a残差6总计9a.预测变量:(常量),x3,x1,x2。b.因变量:y系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).096x1.385.100x2.535.049x3.277.284a.因变量:y12复相关系数R=0.898,决定系数为0.806,拟合度较高。3方差分析表,F=,P值=0.015<0.05,说明回归方程高度显著,说明x1,x2,x3,整体上对y有高度显著的线性影响4在0.1的显著性水平上,x3未通过检验,应将其剔除掉输入/移去的变量b模型输入的变量移去的变量方法1x2,x1a.输入a.已输入所有请求的变量。b.因变量:y模型汇总模型RR方调整R方标准估计的误差1.872a.761.692a.预测变量:(常量),x2,x1。Anovab模型平方和df均方FSig.1回归2.007a残差7总计9a.预测变量:(常量),x2,x1。b.因变量:y系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量).020x1.479.037x2.676.008a.因变量:y1回归方程为2复相关系数R=0.872,决定系数为0.761,由决定系数看回归方程接近高度相关3方差分析表,F=11.117,P值=0.007,说明回归方程高度显著说明x1,x2,整体上对y有高度显著的线性影响4在0.05的显著性水平上,自变量x1,x2对y均有显著影响〔7〕系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量).020x1.479.037.381x2.676.008a.因变量:y(8)标准化回归方程〔9〕y置信水平95%的区间估计为〔211.09492,324.57506〕y置信水平95%的近似区间估计为〔219.6978,316.0222〕E〔y)置信水平95%的区间估计为(245.00541,290.66457)(10)由于X3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好。输入/移去的变量b模型输入的变量移去的变量方法1x2,x1a.输入a.已输入所有请求的变量。b.因变量:y模型汇总模型RR方调整R方标准估计的误差1a.999.999a.预测变量:(常量),x2,x1。Anovab模型平方和df均方FSig.1回归2.000a残差12总计14a.预测变量:(常量),x2,x1。b.因变量:y系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量).050x1.607.299.081.065.050x2.074.921.000.050a.因变量:yVIF的值都大于10,所以变量之间存在多重共线性共线性诊断a模型维数特征值条件索引方差比例(常量)x1x211.01

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论