第六次课多元线性回归spss_第1页
第六次课多元线性回归spss_第2页
第六次课多元线性回归spss_第3页
第六次课多元线性回归spss_第4页
第六次课多元线性回归spss_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元线性回归分析 SPSS2022/8/22方法:是简单直线回归的推广,研究一个应变量与多个自变量之间的数量依存关系。 。资料:应变量(Y)为定量指标;自变量(xi)全部或大部分为定量指标,若有少量定性或等级指标需作转换。2022/8/23多元线性回归模型的应用条件:1.线性趋势(linear):自变量与因变量的关系是线性的,即Y与Xi间具有线性关系2.独立性(independence):应变量Y的取值相互独立,Cov(ei,ej)= 03.正态性(normality):对任意一组自变量取值,因变量Y服从正态分布,eiN(0,2),4.方差齐性(homogeneity):对任意一组自变量取值,

2、因变量y的方差相同,Var(ei)=2 后两个条件等价于:残差服从均数为0、方差为2的正态分布 这些条件缩写为LINE,是线性回归方程的核心。2022/8/24表2 27名糖尿病人的血糖及有关变量的测量结果 例题1 :有学者认为糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响,现测量了27名糖尿病人的相关指标,资料如下表所示,请对此作分析。2022/8/25方程的求解过程复杂,可借助于SPSS等统计软件来完成SPSS:分析回归线性因变量:Y 自变量:x1-x42022/8/26SPSS的操作界面2022/8/27SPSS结果2022/8/28模型适用条件

3、的检验用张文彤SPSS高级篇中的数据reg为例一、线性趋势(1)散点图矩阵(2)未标准化残差与该自变量(x1、x2)的散点图2022/8/29模型适用条件的检验二、各观测间相互独立:即任两个观测残差的协方差为0,可利用残差图提供直观的信息,对于残差间是否相互独立可通过线性回归中统计量按钮中提供的Durbin-Watson检验进行判断2022/8/210模型适用条件的检验2022/8/211模型适用条件的检验三、残差ei服从正态分布可以通过绘制标准化残差的直方图、PP图(正态概率图)和茎叶图进行。2022/8/212模型适用条件的检验2022/8/213模型适用条件的检验2022/8/214模型

4、适用条件的检验2022/8/215模型适用条件的检验2022/8/216模型适用条件的检验方差齐性:即残差的大小不随所有变量取值水平的改变而改变,上面的plot子对话框提供两绘制反应变量与各种残差的残差图,以标准化残差为Y轴,已标准化预测值为X轴二、逐步选择法 1. 前进法(forward selection):回归方程中的自变量从无到有、从少到多逐个引入回归方程。此法已基本淘汰。2. 后退法(backward elimination):先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。3. 逐步回归法(stepwise regression):是在前述两种方法的基础上,进行双向筛选的

5、一种方法。该方法本质上是前进法。 它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F 检验。2022/8/2181.前进法 (forward selection)自变量从无到有、从少到多 Y对每一个自变量作直线回归,对回归平方和最大的自变量作F 检验,有意义(P小)则引入。在此基础上,计算其它自变量的偏回归平方和,选取偏回归平方和最大者作F 检验,。 局限性:即后续变量的引入可能会使先进入方程的自变量变得不重要。2022/8/2192.后退法(backward elimination) 先将全部自变量放入方程,然后逐步剔除 偏回归平方和最小的变量,作F 检验及相应

6、的P值,决定它是否剔除(P大) 。建立新的回归方程。重复上述过程。 局限性:自变量高度相关时,可能得不出正确的结果。2022/8/2203.逐步回归法(stepwise regression)双向筛选 ;引入有意义的变量(前进法),剔除无意义变量(后退法)“先剔除后选入”原则2022/8/221逐步回归法是进行双向筛选的一种方法。自变量回归平方和最大的Xi首先进入方程,在Xi进入方程的基础上计算其余m-1个自变量分别进入回归方程时的偏回归平方和,其中最大者记为SSj,对Xj进行基于偏回归平方和的F检验,若有意义则进入方程,并重新对Xi进行检验。若Xi退化为无意义,则剔除Xi,同时再对Xj进行检

7、验。若Xj依然有意义则继续选择下一个偏回归平方和最大者并进行检验。重复此过程,直到既没有自变量需要引入方程,也没有自变量从方程中剔除为止,从而得到一个局部最优的回归方程。2022/8/222逐步回归法每引入或剔除一个自变量后都要重新对已进入方程中的自变量进行检验,直到方程外没有有意义的自变量可引入、方程内也没有无意义的自变量可剔除为止。2022/8/223逐步回归法“先剔除后选入”原则入出引入变量的检验水准要小于或等于剔除变量的检验水准。 小样本检验水准a定为0.10或0.15,大样本把a定为0.05。 a值越小表示选取自变量的标准越严。2022/8/224逐步回归法实例(令入0.10,出0.

8、15) 2022/8/225多元线性回归的应用及其注意事项一、多元线性回归的应用1.影响因素分析:控制混杂因素年龄(X1)饮食习惯(X2)吸烟状况(X3)工作紧张度(X4)家族史(X5) 高血压(Y)2022/8/2262.估计与预测: 预测:由自变量值推出因变量Y的值、容许区间和总体均数的可信区间。新生儿体重(Y)=b0+b1胎儿孕龄(X1)+ b2 胎儿头径(X2)+ b3胎儿胸径(X3)+ b4胎儿腹径(X4)心脏表面积(Y)=b0+b1心脏横径(X1)+ b2心脏纵径(X2)+ b3心脏宽径(X3)2022/8/2273.统计控制:利用回归方程进行逆估计,确定Y后控制X。采用射频治疗仪

9、治疗脑肿瘤:脑皮质毁损半径(Y) =b0+b1射频温度(X1)+ b2照射时间(X2)2022/8/228二、多元线性回归应用的注意事项1.指标的数量化 应变量Y为连续变量自变量X可为连续、有序分类或无序分类变量 (1)连续变量:X (2)有序分类变量: 1 轻 X= 2 中 3 重(3)无序分类变量:化为n1个哑变量2022/8/229 在用某些统计方法(如回归分析)时,象治疗方式和疾病的严重程度等多分类变量或有序变量是无法进行统计的。为了能将这类变量进行分析(如回归分析),必须进行数量化处理,哑变量就是把定性资料(如多分类变量和等级变量)数量化后转化为定量资料的一种方法。因为如果将分类指标

10、直接量化,这时的数值是没有意义的:不能这样做,因为各类间你不能说谁大谁小,所以不能直接量化。哑变量的引入,扩大了统计分析方法(如回归分析)的应用范围,但是在建立回归方程时一定要把它们作为一个整体来考虑是否引入方程。 何为哑变量 ?2022/8/2301, 0, 0 表示 I 组0, 1, 0 表示II组0, 0, 1 表示III组0, 0, 0 表示组x1x2x3作为基准 多分类变量定量化一般采用哑变量(dummy,又称指示变量)表示(即0-1法):2022/8/231当自变量为分类变量时的赋值方法自变量为二分类变量时自变量为多分类变量时:假定有k类,则k-1个取值为0或1的哑变量(dummy

11、 variables)完整地标记出这些类别。X=0 男1 女无序分类变量2022/8/232无序多分类自变量的哑变量化原资料姓名性别年龄疗法1150中西2120西3018中4070中5135中西6029西哑变量化 序号性别年龄X1X2115001212010301800407000513501602910西、中西、中三种疗法2022/8/233数据格式回归方程 建立回归方程 b1 :相当A 型相对于O 型的差别b2 :相当B 型相对于O 型的差别b3 :相当AB 型相对于O 型的差别2022/8/234 (3)等级 定量。 一般是将等级从弱到强转换为 或 )如文化程度分为小学、中学、大学、大学以上四个等级。Y为经济收入。解释:b(b1)反映X(X1) 增加1个单位, 增加b个单位(如:500元)。表示中学文化较小学收入多500,大学较中学多500,余类推。2022/8/235b1,b2,b3分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小也可将K个等级转换为K-1个(0,1)变量2022/8/2362.样本含量 n至少是X个数m的510倍3.关于逐步回归 对逐步回归得到的结果不要盲目的信任,结合专业知识。所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。 是否考虑交互作用主要靠专业知识。为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论