版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多重线性回归与相关content第一节
多重线性回归的概念与统计推断第二节假设检验及其评价第三节复相关系数与偏相关系数第四节
自变量筛选第五节多元线性回归的应用与注意事项目的:作出以多个自变量估计应变量的多元线性回归方程。资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。更精确意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。第一节
多重线性回归的概念与统计推断变量:应变量1个,自变量k个,共k+1个。样本含量:n数据格式见表13-1回归模型一般形式:一、数据与多元线性回归模型多元回归分析数据格式
条件车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)130020.0800.450.06694822.5692.000.005144423.0570.500.076144021.5792.400.01178626.5641.500.001108428.5593.000.003165223.0840.400.170184426.0731.000.140175629.5720.900.156111635.0922.800.039175430.0760.800.120165620.0831.450.059120022.5691.800.040153623.0571.500.087150021.8770.600.12096024.8671.500.039120027.0581.700.100178423.3830.900.222147627.0650.650.129149627.0650.650.145182022.0830.400.135106026.0581.830.029143628.0682.000.099143628.0682.000.099一般步骤建立回归方程(样本)(2)检验并评价回归方程及各自变量的作用大小二、多元线性回归方程的建立样本估计而得的多重线性回归方程bj为自变量Xj
的偏回归系数(partialregressioncoefficient),是βj的估计值,表示当方程中其他自变量保持常量时,自变量Xj变化一个计量单位,反应变量Y的平均值变化的单位数。
求偏导数(一阶)原理最小二乘法统计软件包第二节假设检验及其评价
1.方差分析法:(一)对回归方程
多元线性回归方差分析表变异来源自由度SSMSFP回归模型40.063960.0159917.59<.0001残差190.017270.00090903总变异230.08123表13-2显示,P<0.0001,拒绝H0。说明从整体上而言,用这四个自变量构成的回归方程解释空气中NO浓度的变化是有统计学意义的。偏回归系数的t检验偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献
自变量筛选的标准与原则(3)t检验不准确,误将应保留在模型中的重要变量舍弃。(4)估计值的正负符号与客观实际不一致。偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献目的:作出以多个自变量估计应变量的多元线性回归方程。理论上最好,建议使用采用此法。第四节
自变量筛选自变量筛选的标准与原则1、非同质资料的合并问题(3)t检验不准确,误将应保留在模型中的重要变量舍弃。对例13-1,由方差分析表可得:SSR=0.偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献复相关系数:确定系数的算术平方根利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。标准化回归系数
变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。不同质:此时应按不同性别分别拟合回归模型。多元线性回归应用的注意事项利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。变量自由度回归系数标准误t值P值标准化偏回归系数截距1-0.141660.06916-2.050.05460X110.000116190.000027484.230.00050.59249X210.004490.001902.360.02890.27274X31-0.000006550.00069083-0.010.9925-0.00110X41-0.034680.01081-3.210.0046-0.44770第三节复相关系数与偏相关系数
确定系数、复相关系数与调整确定系数复相关系数的平方称为确定系数(coefficientofdetermination),或决定系数,记为R2,用以反映线性回归模型能在多大程度上解释反应变量Y的变异性。其定义为
复相关系数:确定系数的算术平方根
对例13-1,由方差分析表可得:SSR=0.06396SSE=0.01727SST=0.08123表示变量Y与k个自变量(X1,X2,…Xk)的线性相关的密切程度。说明,用包含气车流量、气温、气湿与风速这四个自变量的回归方程可解释交通点空气NO浓度变异性的78.74%。表示交通点空气NO浓度与气车流量、气温、气湿与风速等四个变量的复相关系数为0.8703
调整的R2(AdjustedR-Square)当回归方程中包含有很多自变量,即使其中有一些自变量(如本例中的X3
)对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R2
值表现为只增不减,这是复相关系数R2的缺点。调整的R2定义为偏相关系数冷饮销售量(元)X1游泳人数(人)X2气温(oC)X3267722293978143045192431528106632618125333655136934690159335740176136780193137889223138996274939偏相关系数(partialcorrelationcoefficient):一般地,扣除其他变量的影响后,变量Y与X的相关.表13-5空气中NO浓度与各自变量的相关系数和偏相关系数自变量相关系数偏相关系数偏相关系数P值车流X10.808000.696200.0005气温X20.017240.476700.0289气湿X30.27854-0.002180.9925风速X4-0.67957-0.592750.0046(二)对各自变量
指明方程中的每一个自变量对Y的影响(即方差分析和决定系数检验整体)。1.偏回归平方和
各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到结果06396SSE=0.理论上最好,建议使用采用此法。表13-2显示,P<0.目的:使得预报和(或)解释效果好表13-2显示,P<0.(1)参数估计值的标准误变得很大,从而t值变得很小。利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。消除多重共线性:剔除某个造成共线性的自变量,重建回归方程;第四节
自变量筛选第四节
自变量筛选第五节多元线性回归的应用与注意事项标准化回归系数
变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。2.t检验法是一种与偏回归平方和检验完全等价的一种方法。计算公式为结论标准化回归系数
变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数。
注意:
一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时,增加或减少一个单位时Y的平均变化量。不能用各来比较各对的影响大小。
标准化回归系数无单位,用来比较各自变量对应变量的影响大小,越大,对的影响越大。第四节
自变量筛选
目的:使得预报和(或)解释效果好自变量筛选的标准与原则
1.残差平方和(SSE)缩小与确定系数(R2)增大2.残差均方(SSE
)缩小与调整确定系数增大3.CP统计量选择既具有较小CP值,在图中又接近于CP=q直线的模型作为“最优”的准则全局择优法目的:预报效果好意义:对自变量各种不同的组合所建立的回归方程进行比较择优。选择方法:逐步选择法1.
1.前进法,回归方程中的自变量从无到有、从少到多逐个引入回归方程。这种选择自变量的方法基于残差均方缩小的准则,不一定能保证“最优”.此法已基本淘汰。
2.
后退法,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。
3.逐步回归法,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。
第五节多元线性回归的应用与注意事项多元线性回归的应用多元线性回归应用的注意事项1、非同质资料的合并问题
斜率相同(同质):可以利用男、女合并的资料拟合共同的回归模型;不同质:此时应按不同性别分别拟合回归模型。2、指标的数量化
3、样本含量:n=(5~10)m。
4、关于逐步回归:对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例15-3中若将选入标准和剔除标准定为和,选入的变量是,而不是,结果发生了改变。不同回归方程适应于不同用途,依专业知识定。5、多重共线性
即指
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 双联户联户长先进主要事迹(6篇)
- 网络安全漏洞挖掘算法-洞察分析
- 网络安全应急响应机制研究洞察报告-洞察分析
- 《RFID基本原理》课件
- 心理健康与老年痴呆预防-洞察分析
- 土壤养分精准管理效果评估-洞察分析
- 虚拟卡在虚拟现实(VR)和增强现实(AR)技术中的研究-洞察分析
- 医院防火应急预案范文(7篇)
- 人教版教学课件基因和染色体的关系:减数分裂和受精作用
- 农业科技创新的跨学科合作模式
- 2024年-江苏省安全员-A证考试题库及答案
- 2024年青干班培训个人总结
- 2021~2022学年广东广州越秀区八年级上学期期末语文试卷(含答案)
- 固态电池生产(1GWH)项目可行性研究报告模板-立项拿地
- 中建一期工程履带吊安拆方案
- 广东省深圳市坪山区2024学年七年级上学期期末数学试题【含答案】
- 2024游乐新“室”界室内乐园洞察与趋势研究报告
- 校园餐整治存在的问题及建议
- 2024秋期国家开放大学专科《高等数学基础》一平台在线形考(形考任务一至四)试题及答案
- 国开(内蒙古)2024年《创新创业教育基础》形考任务1-3终考任务答案
- 2023建筑施工技术规范
评论
0/150
提交评论