版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、4.6 逐步回归分析,4.6.1最优选择的标准,最优回归方程的含义,1)方程中包含所有对因变量影响显著的变量,2)方程中所包含的自变量要尽可能地少,设n为观测样本数,为所有自变量构成的集合,为X的子集,1)均方误差s2最小,达到最小,2)预测均方误差最小,达到最小,3,统计量最小准则,达到最小,4)AIC或BIC准则,或,达到最小,5)修正,准则,达到最大,4.6.2 选择最优回归子集的方法,1)选择最优子集的简便方法: 逐步筛选法(STEPWISE) 向前引入法或 前进法(FORWARD) 向后剔除法或后退法(BACKWARD,2)计算量最大的全子集法,R2选择法(RSQUARE) Cp选择
2、法(CP) 修正R2选择法(ADJRSQ,最小R2增量法(MINR) 最大R2增量法(MAXR,3)计算量适中的选择法,4.6.3逐步回归的基本思想与步骤,基本思想:逐个引入自变量,每次引入对y影响 最显著的自变量,并对方程中的老变量逐个进行 检验,把变得不显著的变量逐个从方程中剔除, 最终的回归方程中既不漏掉对y影响显著的变量, 又不包含对y影响不显著的变量,4.6.3.1前进法(FORWARD,原理,事先给定挑选自变量进入方程的显著性水平, 按自变量对因变量y的贡献由大到小依次挑选自 变量进入方程,直到方程外没有显著的自变量可 引入为止,该方法的特点是:自变量一旦被选入,就永远保留 在模型
3、中,图4.1 逐步回归的基本步骤,步骤 (1)将全部m个自变量,分别与因变量y建立 一元回归方程; (2)分别计算这m个一元回归方程中回归系数 的检验统计量F,记为: , 取最大值 , 若 ,停止筛选; 若 ,选入 ,不 妨设 是 ,进入步骤(3,3)分别将自变量组 , , , 与因变量y建立二元回归方程,计算回归方程中x2,x3,xm的回归系数检验统计 量F,记为: ,取其最大值 ,若 则停止筛选,y与 x1之间的回归方程就是最优的回归方程;若 ,选进xk2 ,不妨设xk2是 x2,进入步骤(4,4)对已经选入模型的变量,x1,x2,如同前 面的方法做下去,直到所有未被选入模型 的自变量的F
4、值都小于相应的临界值为止, 这时的回归方程就是最优回归方程。 前进法的一般步骤: 假设已进行了l步筛选,并选入自变量x1,x2,xl,现进行第l+1步筛选: 分别将自变量组 , , , 与y建立l+1元回归方程;回归,方程中 的回归系数检验统计量记 为: ,记 若 ,停止筛选 ,上一步得到的回归方程,即为最优的回归方程; 若 ,将 选进模型,进行下一步筛选。 前进法的缺点:不能反映自变量选进模型后的变化情况,4.6.3.2 后退法(BACKWARD,原理,事先给定从方程中剔除自变量的显著性水平,开 始全部自变量都在模型中,然后按自变量对y的贡 献由小到大依次剔除,直至方程中没有不显著的 变量可
5、剔除为止,该方法的特点是:自变量一旦被剔除,就不再进入 模型,1)建立全部自变量x1,x2,xm对因变量y的回归方程,对方程中m个自变量的回归系数b1,b2,bm进行F检验,相应的F值记 为: ,取最小值 若 ,没有自变量可剔除,此时的回归方程就是最优的回归方程; 若 ,剔除xk1,不妨设xk1 是xm,进入步骤(2,2)建立x1,x2,xm-1与因变量y的回归方程 ,对方程中自变量的回归系数进行F检验, 相应的F值记为: ,取最小值 ,若 则无自变量可剔除,此时的回归方程即最优的回 归方程; 若 ,将xk2 从模型中剔除,不妨设xk2就是xm-1,进入步骤(3,3)重复前面的做法,直至回归方
6、程中各变量回归系数的F值均大于临界值,即方程中没有变量可剔除为止,此时的回归方程就是最优的回归方程。 后退法的一般步骤: 假设已经进行了l步剔除,模型中的自变量为x1,x2,xm-l ,现进行第l+1步剔除: 建立x1,x2,xm-l 对y的回归方程,对方程中x1,x2,xm-l的回归系数进行F检验,相 应的F统计量记为 : ,取最小值,若 则停止筛选, y与x1,x2,xm-l 之间的回归 方程即为最优的回归方程;若 则剔除 ,不妨设 为 ,进行下一步筛选。 后退法的缺点:开始把全部自变量都引入模型,计算量大,4.6.3.3 逐步筛选法,原理,该方法在前进法的基础上,引进后退法的思想。即对每
7、一个自变量随着其对回归方程贡献的变化,随时地引入或剔除模型,使得最终回归方程中的变量对y的影响都是显著的,而回归方程外的变量对y的影响都是不显著的,该方法即通常所说的逐步回归法,设y是因变量,x1,x2,xm是所有自变量,yi,xi1,xi2,xim(i1,2,n)是独立抽取的n组样本。设自变量被选进模型的显著性水平为 ,被剔除模型的显著性水平为 ,且 。 逐步筛选法的步骤为: (1)计算离差矩阵S,2)逐步筛选自变量 第一步筛选: 计算各自变量的贡献: 取最大值 对 的作用是否显著进行统计检验: F(1,n-1-1,若 ,则结束所有自变量皆与y无关,不能建立回归方程;若 ,则 将xk1选入模
8、型,并将S转化为 ,进行第二步筛选,其中,第二步筛选: 按 计算各自变量的贡献 模型外自变量的贡献: 模型中自变量 的贡献: 取模型外自变量的最大贡献值,即,计算 F(1,n-2-1), 其中 , 若 ,则筛选结束,第一步中所建立的回归方程即最优回归方程; 若 ,则选 进入模型,将 化为 ,进行第三步筛选,其中,第三步: 从第三步开始,先检验已经引入方程中的自变量是否满足显著性水平 ,若有不满足显著性水平 的自变量,依次剔除最不显著的,再从方程外挑选满足著性水平的最显著的自变量进入模型(即从第三步开始,先进行变量的剔除,再进行变量的选进,逐步回归法筛选自变量的一般步骤为: 假设已经进行l步筛选,并且已经选入p个自变量,相应的残差平方和为 ,离差矩阵为 则第步的筛选过程为,a)计算自变量的贡献: (b)检验已选入的自变量是否显著 取模型中变量的最小值,计算 F(1,n-p-1),其中 若 ,将xk剔除,转入(d); 若 ,则xk不能被剔除, 转入(c,c)取模型外变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沈阳理工大学《笔译实践》2023-2024学年第一学期期末试卷
- 合同 假期规定
- 2024年高考地理一轮复习课时练3宇宙中的地球太阳对地球的影响和地球的圈层结构含解析中图版
- 2024工程施工合同管理的意义及工作要点
- 行星科学(天文学教程)
- 2024视讯服务系统合作经营合同模板
- 2024房地产开发全总包合同范例
- 2024车辆买卖合同样本
- 2024行车采购合同范本
- 深圳大学《运动技能学习与控制》2022-2023学年期末试卷
- JJF 1916-2021扫描电子显微镜校准规范
- GB/T 6587-2012电子测量仪器通用规范
- GB/T 4162-2008锻轧钢棒超声检测方法
- GB/T 12244-2006减压阀一般要求
- 泄漏危险源专项辨识与风险评估分析
- 工务段线路车间汇报材料
- 旅游研究方法简介课件
- 4.1《厨房里的物质与变化》优质课件
- 达尔文的“进化论”课件
- 国开电大《建筑测量》实验报告1
- 信息资源组织与管理(第2版)PPT第02章信息的分类与编课件
评论
0/150
提交评论