版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多重线性回归与相关
第十三章简单线性回归2多重线性回归
(multiplelinearregression)多重相关
(multiplecorrelation)
3第一节概念及其统计描述
例13-1
为了研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定了30名患者的体重指数BMI(kg/m2)、病程DY(年)、瘦素LEP(ng/mL)、空腹血糖FPG(mmol/L)及脂联素ADI(ng/mL)水平,数据如表13-1所示。一、数据与模型
4脂联素是一种肽,可抑制炎症反应和减少冠心病的发生。瘦素是一种由脂肪组织分泌的激素,人们之前普遍认为它进入血液循环后会参与糖、脂肪及能量代谢的调节,促使机体减少摄食,增加能量释放,抑制脂肪细胞的合成,进而使体重减轻。科学家在去年的研究表明,在婴儿时期摄取瘦素,可能可以固定大脑对食欲的反应,进而一生都不会过度饮食。人们是在对老鼠的实验中得到了这个发现的。注释:56偏回归系数(partialregressioncoefficient)7标准化偏回归系数(standardizedpartialregressioncoefficient)8二、偏回归系数的估计前提条件(LINE):线性、独立、正态和等方差参数估计方法:最小二乘法9图13-1两个自变量时,回归平面示意图1011第二节多重线性回归的假设检验一、整体回归效应的假设检验(方差分析)12
表13-2显示,P<0.0001,拒绝。说明整体而言,用这四个自变量构成的回归方程解释糖尿病患者体内脂联素的变化是有统计学意义的。13二、偏回归系数的t检验14利用SAS软件对例13-1的四个偏回归系数进行t检验,并计算标准化偏回归系数,结果如表13-3所示。
15第三节复相关系数与偏相关系数
一、决定系数、复相关系数与调整决定系数16复相关系数(multiplecorrelationcoefficient)
17调整的R2(AdjustedR-Square)
18二、偏相关系数例:19游泳人数残差冷饮销售量残差P=0.550920偏相关系数(partialcorrelationcoefficient):一般地,扣除其他变量的影响后,变量Y与X的相关。2122第四节自变量筛选23一、自变量筛选的标准与原则
1.残差平方和缩小或决定系数增大242.残差均方缩小或调整决定系数增大253.统计量这条标准的完整意思是选择较小并且值接近未知参数个数的模型作为较优模型的准则。统计建模的原则:一方面入选自变量不能太多,以使方程易于理解和解释并降低工作量及研究费用;另一方面自变量也不能太少,以保证一定的估计和预测精度。故而统计量较小的标准相对得到较多推崇。26二、自变量筛选的常用方法271.所有可能自变量子集选择
(allpossiblesubsetsselection)最优子集回归:根据某种变量选择准则,通过比较各子集符合准则的程度,从中选择出一个或几个最优的回归.对于有p个自变量,所有可能的子集有(2P-1)个。282.前向选择(forwardselection)该方法从仅含常数项的模型开始,首先对每个变量计算反映其进入模型后该变量对新模型贡献量的F值,然后将最大F值与预先指定的临界值(Fin)比较,如果最大F值超过Fin,则将最大F值所对应的自变量引入模型,否则,停止运行;然后在已有一个自变量的模型基础上,重复以上比较过程……这样,每次给模型增添一个变量,直到剩下的变量再不能使最大F值超过Fin值为止。
293.后向选择(backwardselection)
首先建立包含所有p个自变量的全模型,然后逐个计算出剔除某一变量后仅包含p-1个自变量的p个模型,同时计算剔除变量后所致损失的F值,然后将p个F值中的最小者与预先指定的临界值Fout相比较,若最小F值低于Fout,则将最小F值所对应的自变量从模型中剔除,否则,停止运行;然后在含剩下p-1个自变量的模型基础上,重复以上剔除过程……这样,每次剔除一个最可忽略的变量,直到剩下的变量再不能使最小F值低于Fout值为止。
304.逐步选择(stepwiseselection)逐步选择法又称逐步回归,其本质是前向选择法,针对向前选择法在后续变量进入模型后可能使已在方程中的变量变得不重要的现象,同时吸收了向后剔除的做法。即在逐步选择过程中,把经前向选择F检验有意义的变量引入方程后,又对已在方程中的自变量进行一次关于剔除的后向选择F检验,剔除无统计学意义的变量。反复进行引入、剔除过程,直到既没有变量被引入,也没有变量被剔除为止。
31例13-2仍以糖尿病人脂联素数据为例,通过SAS获得所有可能自变量子集的运算结果示于表13-6中。
32表13-6所有可能子集回归的参数估计与统计量34*第五节多重线性回归的应用
35多重共线性(multi-colinearity)例如:有两个预测人体体重的变量:X1是以公斤为单位的重量,X2是以克为单位的重量,显然,X1与X2的相关系数为1。
一、多重共线性问题36例13-3对8名学生的身高(X1)、体重(X2)与肺活量(Y)进行了检测,并由该数据生成新的变量体重指数X3=X2/X1。数据如表13-8所示。
37计算得各变量间的相关系数如表13-9所示。38F=27.77,P=0.0039,显示此回归方程具有统计学意义。39
矛盾出现了:对整体模型而言,获得与整体F检验P=0.0039的结果;但是,对于每一个偏回归系数而言,却没有一个自变量的效应具有统计学意义。问题出在哪里?问题就出在X1,X2和X3与Y共线性,以致偏回归系数极不稳定,因其标准误过大而没有统计学意义。
40例11-2
陈峰(1991)报告了一个实例。有22例胎儿受精龄(Y,周)与胎儿外形测量指标:身长(),头围(),体重()的数据。求得由,,推算的回归方程为:41原因:通过计算发现头围与身长的相关系数等于0.997,头围与体重的相关系数等于0.947,身长与体重的相关系数等于0.944,经检验均有统计学意义。多重共线性
421.逐步筛选变量
2.删除变量
3.主成分回归方法解决办法:43例13-3(续)按照水准,对上例中8名学生的数据进行肺活量(Y)关于身高(X1)、体重(X2)与体重指数体重(X3)的逐步回归分析。整体F检验P=0.000544二、自变量间交互效应的回归模型当一个回归模型中有多于2个自变量时,变量间即可能存在交互效应。此时可建立包含各自变量及某些乘积项的回归模型,通过检验乘积项的统计学意义来考察交互效应是否存在。45例13-4
假若有A、B两种药品都对帕金森综合征有改善作用,而且相信联合用药效果比两种药单独作用之和还要好。为探讨联合用药方案的可行性,进行了随机平行对照临床试验,结果如表13-12所示。46
经用该样本数据拟合包含药品A与药品B交互项的多重线性回归模型,整体模型效应的方差分析结果见表13-13,模型参数估计与假设检验结果如表13-14所示。4748三、非同质资料的合并问题
例13-5利用某社区男性和女性各19对收缩压Y与年龄X的数据如表13-15所示,有人通过计算获得收缩压随年龄变化的三个回归方程如下:
试判断男女性资料合并后回归是否合理?49表13-15不同性别两组年龄(X)与收缩压(Y)数据50
性别是否为一个混杂因素?
分性别的两条回归直线的斜率是否相同?如果两斜率相同,即表示性别与年龄对于收缩压的影响不存在交互效应,可合并两组数据拟合自变量同时包含年龄与性别(但不含二者交互效应)的多重回归方程;否则,就应按不同性别分别拟合年龄与收缩压的回归模型。51判断方法:52性别是一个混杂因素,存在交互作用!53四、通径分析YY:新生儿出生体重X1:母亲年龄X2:产次X3:孕周X4:产前体重X3=a1
X1+a2
X2+e1X4=b1
X1+b2
X2+b3
X3+e2Y=c1
X3+c2
X4+e354Y(X1→
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度软件园场地使用权转让协议2篇
- 二零二四年度音乐餐厅经营权转让合同2篇
- 2025至2030年中国PHS基站电源智能保护器数据监测研究报告
- 二零二五年度劳务施工安全教育培训协议3篇
- 2025年中国自动数显控温仪市场调查研究报告
- 临时活动板房买卖协议模板一
- 2025年中国减压装置市场调查研究报告
- 2025年中国不锈钢抛光麻轮市场调查研究报告
- 伐木机械安全操作研究-深度研究
- 2025至2030年中国高精密吹泡机数据监测研究报告
- 《电力用直流电源系统蓄电池组远程充放电技术规范》
- 《哪吒之魔童降世》中的哪吒形象分析
- 信息化运维服务信息化运维方案
- 汽车修理厂员工守则
- 六年级上册数学应用题100题
- 个人代卖协议
- 公安交通管理行政处罚决定书式样
- 10.《运动技能学习与控制》李强
- 冀教版数学七年级下册综合训练100题含答案
- 1神经外科分级护理制度
- 场馆恶劣天气处置应急预案
评论
0/150
提交评论