应用回归分析第5章课后习题参考_第1页
应用回归分析第5章课后习题参考_第2页
应用回归分析第5章课后习题参考_第3页
应用回归分析第5章课后习题参考_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章自变量选择与逐渐回归思虑与练习参照答案自变量选择对回归参数的预计有何影响?答:回归自变量的选择是成立回归模型得一个极为重要的问题。假如模型中丢掉了重要的自变量,出现模型的设定偏误,这样模型简单出现异方差或自有关性,影响回归的成效;假如模型中增添了不用要的自变量,或许数据质量很差的自变量,不单使得建模计算量增大,自变量之间信息有重叠,并且获取的模型稳固性较差,影响回归模型的应用。自变量选择对回归展望有何影响?答:当全模型(m元)正确采纳选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘预计是全模型相应参数的有偏预计,使得用选模型的展望是有偏的,但因为选模型的参数预计、展望残差和展望均方偏差拥有较小的方差,因此全模型正确而误用选模型有益有弊。入选模型(p元)正确采纳全模型(m元)时,全模型回归系数的最小二乘预计是相应参数的有偏预计,使得用模型的展望是有偏的,并且全模型的参数预计、展望残差和展望均方偏差的方差都比选模型的大,因此回归自变量的选择应少而精。假如所建模型主要用于展望,应当用哪个准则来权衡回归方程的好坏?答:假如所建模型主要用于展望,则应使用Cp统计量达到最小的准则来权衡回归方程的好坏。试述行进法的思想方法。答:行进法的基本思想方法是:第一因变量Y对所有的自变量x1,x2,...,xm成立m个一元线性回归方程,并计算F查验值,选择偏回归平方和明显的变量(F值最大且大于临界值)进入回归方程。每一步只引入一个变量,同时成立m-1个二元线性回归方程,计算它们的F查验值,选择偏回归平方和明显的两变量变量(F值最大且大于临界值)进入回归方程。在确立引入的两个自变量此后,再引入一个变量,成立m-2个三元线性回归方程,计算它们的F查验值,选择偏回归平方和明显的三个变量(F值最大)进入回归方程。不停重复这一过程,直到没法再引入新的自变量时,即所有未被引入的自变量的F查验值均小于F查验临界值Fα(1,n-p-1),回归过程结束。试述退后法的思想方法。答:退后法的基本思想是:第一因变量Y对所有的自变量x1,x2,...,xm成立一个m元线性回归方程,并计算t查验值和F查验值,选择最不明显(P值最大且大于临界值)的偏回归系数的自变量剔除出回归方程。每一步只剔除一个变量,再成立m-1元线性回归方程,计算t查验值和F查验值,剔除偏回归系数的t查验值最小(P值最大)的自变量,再成立新的回归方程。不停重复这一过程,直到没法剔除自变量时,即所有节余p个自变量的F查验值均大于F查验临界值Fα(1,n-p-1),回归过程结束。行进法、退后法各有哪些优弊端?答:行进法的长处是能够将对因变量有影响的自变量按明显性一一选入,计算量小。行进法的弊端是不可以反应引进新变量后的变化,并且选入的变量就算不明显也不可以删除。退后法的长处是是能够将对因变量没有明显影响的自变量按不明显性一一剔除,保存的自变量都是明显的。退后法的弊端是开始计算量大,当减少一个自变量时,它再也没时机进入了。假如遇到自变量间有有关关系时,行进法和退后法所作的回归方程均会出现不一样程度的问题。试述逐渐回归法的思想方法。答:逐渐回归的基本思想是有进有出。详细做法是将变量一个一个的引入,当每引入一个自变量后,对已选入的变量要进行逐一查验,当原引入变量因为后边变量的应归入而变得不再明显时,要将其剔除。引入一个变量或从回归防方程中剔除一个变量,为逐渐回归的一步,每一步都要进行F查验,以保证每次引入新的变量以前回归方程中只包括明显的变量。这个过程频频进行,直到无明显变量引入回归方程,也无不明显变量从回归方程中剔除为止。这样就防止了行进法和退后法各自的缺点,保证了最后获取的回归子集是最优回归子集。在运用逐渐回归法时,α进和α出的赋值原则是什么?假如希望回归方程中多保存一些自变量,α进应怎样赋值?答:原则是要求引入自变量的明显水平α进小于剔除自变量的明显性水平α出,不然可能出现死循环;若想回归方程多保存自变量,能够增大α进的值,使得更多自变量的P值在α进的范围内,但要注意,α进的值不得超出α出的值。在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通要点建设收入、基本建设贷款送还收入、国家估算调理基金收入、其余收入等。为了成立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量以下:x1为农业增添值(亿元),x2为工业增添值(亿元),x3为建筑业增添值(亿元),x4为人口数(万人),x5为社会花费总数(亿元),x6为受灾面积(万公顷)。据《中国统计年鉴》获取1978—1998年共21个年份的统计数据,见表(P167)。由定性剖析知,所有自变量都与y有较强的有关性,分别用退后法和逐渐回归法作自变量选元。解:退后法SPSS输出结果:逐渐回归法两者结果同样,回归方程为:y=—-+可是回归系数的解说不合理。表的数据是1968-1983年时期与电话线制造有关的数据,各变量的含义以下:x1——年份;x2——公民生产总值(10亿美元);x3——新房动工数(单位:1000);x4——失业率(%);x5——滞后6个月的最惠利率;x6——用户用线增量(%);y——年电话销量(百万尺双线)。(1)成立y对x2~x6的线性回归方程。SPSS输出结果以下:回归方程为:y=+x2+x3x4x5x6此中x、x5的系数未经过查验。2用退后法选择自变量。退后法剔除P值最大的剔除x5,模型的参数均经过明显性查验。(明显性水平α=),得回归方程为:y=+x2+x3x4x6模型表示年电话销量(y)与公民生产总值、新房动工数、失业率、用户用线增量有明显的线性关系。(3)用逐渐回归法选择自变量逐渐回归法引入x3,x5,x4进入回归模型,没有剔除变量,保存x3,x5,x4作为最后模型。回归方程为:y=+—+模型表示年电话销量(y)与新房动工费、失业率、滞后6个月的最惠利率有明显的线性关系。(4)依据以上计算结果剖析退后法和逐渐回归法的差别答:两个方法获取的最后模型是不一样的,退后法第一剔

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论