天大matlab大作业逐步回归方法_第1页
天大matlab大作业逐步回归方法_第2页
天大matlab大作业逐步回归方法_第3页
天大matlab大作业逐步回归方法_第4页
天大matlab大作业逐步回归方法_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、逐步回归分析方法在实际中,影响Y的因素很多,这些因素可能存在多重共线性(相关性),这就对系数的估计带来不合理的解释,从而影响对Y的分析和预测。 “最优”的回归方程就是包含所有对Y有影响的变量, 而不包含对Y影响不显著的变量回归方程。选择“最优”的回归方程有以下几种方法:(1) 从所有可能的因子(变量)组合的回归方程中选择最优者;(2)从包含全部变量的回归方程中逐次剔除不显著因子;(3)从一个变量开始,把变量逐个引入方程;(4)“有进有出”的逐步回归分析。 以第四种方法,即逐步回归分析法在筛选变量方面较为理想.逐步回归分析法的思想: 从一个自变量开始,视自变量Y作用的显著程度,从大到小地依次逐个

2、引入回归方程。当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。 引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。 对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。 这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。原理:1、最优选择的标准设n为观测样本数, 为所有自变量构成的集合, 为X的子集。(1)均方误差s2最小 达到最小 (2)预测均方误差最小 达到最小 (3) 统计量最小准则达到最小(4)AIC或BIC准则 或 达到最小 (5)修正R2准则达到最大 2、选择最优回归子集的方

3、法(1)选择最优子集的简便方法: 逐步筛选法(STEPWISE) 向前引入法或 前进法(FORWARD) 向后剔除法或后退法(BACKWARD)(2)计算量最大的全子集法:R2选择法(RSQUARE)Cp选择法(CP)修正R2选择法(ADJRSQ)。 (3)计算量适中的选择法: 最小R2增量法(MINR)最大R2增量法(MAXR)步骤1、前进法:事先给定挑选自变量进入方程的显著性水平,按自变量对因变量y的贡献由大到小依次挑选自变量进入方程,直到方程外没有显著的自变量可引入为止。该方法的特点是:自变量一旦被选入,就永远保留在模型中。(1)将全部m个自变量,分别与因变量y建立一元回归方程;(2)分

4、别计算这m个一元回归方程中回归系数的检验统计量F,记为:取最大值若停止筛选;若选入,不妨设是,进入步骤(3);(3) 分别将自变量组,.,与因变量y建立二元回归方程,计算回归方程中x2,x3,xm的回归系数检验统计量F,记为:取其最大值,若则停止筛选,y与 x1之间的回归方程就是最优的回归方程;若选进xk2 ,不妨设xk2是 x2,进入步骤(4)。(4)对已经选入模型的变量,x1,x2,如同前面的方法做下去,直到所有未被选入模型的自变量的F值都小于相应的临界值为止,这时的回归方程就是最优回归方程。前进法的一般步骤:假设已进行了l步筛选,并选入自变量x1,x2,xl,现进行第l+1步筛选: 分别

5、将自变量组 ,.,与y建立l+1元回归方程;回归方程中的回归系数检验统计量记为:记若停止筛选 ,上一步得到的回归方程,即为最优的回归方程;若将选进模型,进行下一步筛选。 前进法的缺点:不能反映自变量选进模型后的变化情况 。2、 后退法:事先给定从方程中剔除自变量的显著性水平,开始全部自变量都在模型中,然后按自变量对y的贡献由小到大依次剔除,直至方程中没有不显著的变量可剔除为止。 该方法的特点是:自变量一旦被剔除,就不再进入模型 (1)建立全部自变量x1,x2,xm对因变量y的回归方程,对方程中m个自变量的回归系数b1,b2,bm进行F检验,相应的F值记为:取最小值若没有自变量可剔除,此时的回归

6、方程就是最优的回归方程若剔除xk1,不妨设xk1是xm,进入步骤(2)。2) 建立x1,x2,xm-1与因变量y的回归方程 ,对方程中自变量的回归系数进行F检验,相应的F值记为:取最小值若则无自变量可剔除,此时的回归方程即最优的回归方程;若将xk2从模型中剔除,不妨设xk2就是xm-1,进入步骤(3);(3)重复前面的做法,直至回归方程中各变量回归系数的F值均大于临界值,即方程中没有变量可剔除为止,此时的回归方程就是最优的回归方程。后退法的一般步骤:假设已经进行了l步剔除,模型中的自变量为x1,x2,xm-l ,现进行第l+1步剔除:建立x1,x2,xm-l 对y的回归方程,对方程中x1,x2

7、,xm-l的回归系数进行F检验,相应的F统计量记为 :取最小值若则停止筛选, y与x1,x2,xm-l 之间的回归方程即为最优的回归方程;若则剔除,不妨设为 ,进行下一步筛选。 后退法的缺点:开始把全部自变量都引入模型,计算量大。3、逐步筛选法: 该方法在前进法的基础上,引进后退法的思想。即对每一个自变量随着其对回归方程贡献的变化,随时地引入或剔除模型,使得最终回归方程中的变量对y的影响都是显著的,而回归方程外的变量对y的影响都是不显著的,该方法即通常所说的逐步回归法。 设y是因变量,x1,x2,xm是所有自变量,yi,xi1,xi2,xim(i1,2,n)是独立抽取的n组样本。设自变量被选进

8、模型的显著性水平为 ,被剔除模型的显著性水平为,(1)计算离差矩阵S (2)逐步筛选自变量第一步筛选:计算各自变量的贡献:取最大值对的作用是否显著进行统计检验:若则结束所有自变量皆与y无关,不能建立回归方程;若则 将xk1选入模型,并将S转化为 进行第二步筛选;其中第二步筛选:按计算各自变量的贡献模型外自变量的贡献:模型中自变量的贡献:取模型外自变量的最大贡献值,即 计算 F(1,n-2-1)其中若则筛选结束,第一步中所建立的回归方程即最优回归方程;若则选 进入模型,将 化为 ,进行第三步筛选;其中第三步:从第三步开始,先检验已经引入方程中的自变量是否满足显著性水平,若有不满足显著性水平的自变量,依次剔除最不显著的,再从方程外挑选满足著性水平的最显著的自变量进入模型(即从第三步开始,先进行变量的剔除,再进行变量的选进)。逐步回归法筛选自变量的一般步骤为:假设已经进行l步筛选,并且已经选入p个自变量,相应的残差平方和为,离差矩阵为则第步的筛选过程为:(a)计算自变量的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论