应用回归分析_第1页
应用回归分析_第2页
应用回归分析_第3页
应用回归分析_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章5.1自变量选择对回归参数的估计有何影响?答:全模型正确而误用选模型时,我们舍去了m-p个自变量,用剩下的p个自变量去建立选模型,参数估计值是全模型相应参数的有偏估计。选模型正确而误用全模型时,参数估计值是选模型相应参数的有偏估计。5.2 自变量选择对回归预测有何影响?(1) 全模型正确而误用选模型的情况估计系数有偏,选模型的预测是有偏的,选模型的参数估计有较小的方差,选模型的预测残差有较小的方差,选模型预测的均方误差比全模型预测的方差更小。(2) 选模型正确而误用全模型的情况全模型的预测值是有偏的,全模型的预测方差的选模型的大,全模型的预测误差将更大。5.3如果所建模型主要用于预测,应

2、该用哪个准则来衡量回归方程的优劣?答:应该用自由度调整复决定系数达到最大的准则。当给模型增加自变量时,复决定系数也随之增大,然而复决定系数的增大代价是残差自由度的减小,自由度小意味着估计和预测的可靠性低。应用自由度调整复决定系数达到最大的准则可以克服样本决定系数的这一缺点,把给予适当的修正,使得只有加入“有意义”的变量时,经过修正的样本决定系数才会增加,从而提高预测的精度。5.4 试述前进法的思想方法。解:主要是变量由少到多,每次增加一个,直至没有可引入的变量为止。具体做法是:首先将全部m个自变量,分别对因变量y建立m个一元线性回归方程,并分别计算这m个一元回归方程的m个回归系数的F检验值,记

3、为,选其最大者,给定显著性水平,若,则首先将引入回归方程,假设。其次,将建立m-1个二元线性回归方程,对这m-1个回归方程中的回归系数进行F检验,计算F值,记为,选其最大的记为,若,则接着将引入回归方程。以上述方法做下去。直至所有未被引入方程的自变量的值均小于为止。5.5 试述后退法的思想方法。首先用全部m个变量建立一个回归方程,然后在这m个变量中选择一个最不重要的变量,将它从方程中剔除。5.6 前进法、后退法各有哪些优缺点?解:都可以挑选出对因变量有显著性影响的自变量,逐个挑选并排除显著性较低的自变量。前进法的缺点:不能反映引进新的自变量后的变化情况。后退法的缺点:开始把全部自变量引入回归方

4、程,计算量很大。一旦自变量被剔除,就不会再被引入回归方程。5.7 试述逐步回归的思想方法。基本思想:有进有出。具体做法:将变量一个个引入,当每引进一个自变量后,对已引入的变量要逐个检验,当原引入的变量由于后面的引入而变得不再显著时,要将其剔除。引入一个变量或从回归方程中提出一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量。直到既无显著的自变量选入回归方程,也无不显著自变量从回归方程中剔除为止。5.8在运用逐步回归法时, 的赋值原则是什么?如果希望回归方程中多保留一些自变量,应如何赋值?答:在运用逐步回归法时,要求引入自变量的显著性水平小于剔

5、除自变量的显著性水平。在运用逐步回归法引入变量时,我们是在时,将x引入方程,所以如果希望回归方程中多保留一些自变量,则引入自变量时的的检验临界值应尽可能地小一些,相应地,应尽可能地大一些。5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元);x2为工业增加值(亿元);x3为建筑业增加值(亿元);x4为人口数(万人);x5为社会消费总额(亿元);x6为受灾面积(万公顷)。

6、据中国统计年鉴获得与变量y有较强的相关性,分别用后退法和逐步回归法作自变量选元。表5.4年份农业x1工业x2建筑业x3人口x4最终消费x5受灾面积x6财政收入y19781018.41607138.2962592239.1507601132.319791258.91769.7143.8975422619.4393701146.419801359.41996.5195.5987052976.1445301159.919811545.62048.4207.11000723309.1397901175.819821761.62162.3220.71016543637.9331301212.319831

7、960.82375.6270.61030084020.534710136719842295.52789316.71043574694.5318901642.919852541.63448.7417.91058515773443702004.819862763.93967525.7107507654247140212219873204.34585.8665.81093007451.2420902199.4198838315777.28101110269360.1508702357.219894228648479411270410556.5469902664.9199050176858859.41

8、1433311365.2384702937.119915288.68087.11015.111582313145.9554703149.51992580010284.5141511717115952.1513303483.419936882.114143.82284.711851720182.148830434919949457.219359.63012.611985026796550405218.119951199324718.33819.612112133635458216242.2199613844.229082.64530.512238940003.946989740819971421

9、1.232412.14810.612362643579.4534298651.1199814599.633429.8526212481046405.95014598765.10表5.5的数据是1968-1983年期间美国与电话线制造有关的数据,各个变量的含义如下:x年份;x国民生产总值(10亿美元);x新房动工数(单位:1000);x失业率(%);x滞后6个月的最惠利率;x用户用线增量(%);y 年电话线销量(百万尺双线)。(1) 建立y对x x的线性回归方程;(2)用后退法选择自变量;(3)用逐步回归法选择自变量;(4)根据以上计算结果分析后退法与逐步回归法的差异。 表5.5xxxxxxy

10、19681969197019711972197319741975197619771978197919801981198219831051.81078.81075.31107.51171.11235.01217.81202.31271.01332.71399.21431.61480.71510.31492.21535.41503.61486.71434.82035.62360.82043.91331.91160.01535.01961.82009.31721.91290.81100.01039.01200.03.63.55.06.05.64.95.68.57.77.06.06.07.27.69.28.85.86.78.46.25.45.99.49.47.26.67.610.614.916.617.516.05.94.54.24.24.95.04.13.44.24.53.94.43.93.1.61.55873785281897494853486887270502060357425940093506540767574197923(1)解:利用SPSS得回归方程为:(2) 用后退发生剔除变量,得最优回归方程:(3) 用逐步回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论