版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第24章多元线性回归与相关卫生统计学第24章多元线性回归与相关一、建立回归方程多元线性回归方程b1,b2…bk:为偏回归系数partialregressioncoefficient。表示在其他自变量固定的条件下,xi
改变一个单位时应变量的改变量采用最小二乘法计算偏回归系数见P310,例24-1卫生统计学第24章多元线性回归与相关二、回归方程的假设检验H0:各总体偏回归系数均为0H1:各总体偏回归系数不等于0或不全为0F>F0.05,则多元回归有统计学意义卫生统计学第24章多元线性回归与相关三、标准化偏回归系数由于自变量单位不同,不能用偏回归系数的大小来说明各变量的重要性。需进行标准化变换,再用上述的方法计算多元回归方程的回归系数,即为标准偏回归系数即每一个变量值都减去该变量的平均数后再除以该变量的标准差(Z变换)所得的商就称为标准化量。用标准化量计算得到偏回归系数,没有单位,其绝对值大小在一定程度上反映了各自变量的重要性。卫生统计学第24章多元线性回归与相关四、偏回归系数的统计意义检验不仅要对整个回归方程进行统计意义检验还需对每个自变量的作用,即偏回归系数作统计意义检验x1的偏回归平方和:是该回归方程中由于除去变量x1后回归平方和的减少量卫生统计学第24章多元线性回归与相关以P310例题为例,采用SPSS进行分析数据库见:multiplelinearregressionAnalyze→regression→linearDependent框:yIndependent框:x1、x2、x3Method:选择系统默认的enter(强制纳入回归模型)OK卫生统计学第24章多元线性回归与相关卫生统计学第24章多元线性回归与相关五、复相关系数和偏相关系数1、复相关系数multiplecorrelationcoefficient:表明多个变量间的相关程度卫生统计学第24章多元线性回归与相关SPSS计算复相关系数采用典型相关分析:是研究两组变量之间相关关系的一种多元统计分析方法。常有两方法,其一为:采用类似于主成分分析的方法,在每一组变量中都选择若干个有代表性的综合指标(变量的线性组合),通过研究两组综合指标之间的关系来反映两组变量之间的相关关系。怎样寻找综合指标,使它们之间具有最大的相关性,这就是典型(则)相关canonicalcorrelation卫生统计学第24章多元线性回归与相关当两个变量组均只有一个变量时,典型相关系数即简单相关系数,当一组变量只有一个变量时,典型相关系数即为复相关系数。SPSS可采用Manova过程来拟合,或采用专门提供的宏程序来拟合(使用非常简单,结果又非常详细,故常用后一种方法)卫生统计学第24章多元线性回归与相关Include’SPSS所在路径\canonicalcorrelation.sps’.Cancorrset1=第一组变量列表
/set2=第二组变量列表.Runall即可卫生统计学第24章多元线性回归与相关CorrelationsforSet-1yy1.0000CorrelationsforSet-2x1x2x3x11.0000.1718.6409x2.17181.0000.4522x3.6409.45221.0000CorrelationsBetweenSet-1andSet-2x1x2x3y.6945.5864.7288卫生统计学第24章多元线性回归与相关CanonicalCorrelations1.859Testthatremainingcorrelationsarezero:Wilk'sChi-SQDFSig.1.2638.6923.000.034StandardizedCanonicalCoefficientsforSet-11y1.000RawCanonicalCoefficientsforSet-11y.002StandardizedCanonicalCoefficientsforSet-21x1.541x2.456x3.296卫生统计学第24章多元线性回归与相关RawCanonicalCoefficientsforSet-21x1.163x2.101x3.272CanonicalLoadingsforSet-11y1.000CrossLoadingsforSet-11y.859CanonicalLoadingsforSet-21x1.809x2.683x3.849CrossLoadingsforSet-21x1.695x2.586x3.729卫生统计学第24章多元线性回归与相关RedundancyAnalysis:ProportionofVarianceofSet-1ExplainedbyItsOwnCan.Var.PropVarCV1-11.000ProportionofVarianceofSet-1ExplainedbyOppositeCan.Var.PropVarCV2-1.737ProportionofVarianceofSet-2ExplainedbyItsOwnCan.Var.PropVarCV2-1.614ProportionofVarianceofSet-2ExplainedbyOppositeCan.Var.PropVarCV1-1.452------ENDMATRIX-----卫生统计学第24章多元线性回归与相关2、偏相关系数:固定其他变量,分析某两个变量间的相关关系偏相关系数有效的条件:原始数据必须是多元正态分布数据的取得必须都是随机的不分自变量和应变量卫生统计学第24章多元线性回归与相关SPSS实现偏相关分析Analyze→correlate→partialVariables框:x1x2Controllingfor框:x3Options:选中zeroordercorrelation:continueOK卫生统计学第24章多元线性回归与相关卫生统计学第24章多元线性回归与相关六、逐步回归
stepwiseregressionanalysis多元回归分析中,较理想的回归方程,应包括所有对应变量作用有统计意义的自变量,而不包括作用无统计意义的自变量卫生统计学第24章多元线性回归与相关逐步回归分析的基本原理按每个变量在方程中对应变量作用的大小,由大到小依次引入回归方程。具体作法:每引入一个自变量都要对回归方程中每一个已引入的自变量的作用作统计意义检验,当发现一个或几个已被引入的自变量的作用无统计意义时,即行剔除。每剔除一个自变量后,也要对仍留在回归方程中的自变量逐个作统计意义检验。如果发现方程中还存在作用无统计意义的自变量时,也就剔除,直到没有变是可引入,也无剔除时为止卫生统计学第24章多元线性回归与相关七、SPSS中的逐步回归方法1、Enter:所有纳入自变量框的自变量均进入模型,不涉及变量的筛选问题,为默认选项2、Forward前进法:分别对k个自变量拟合它与应变量的简单线性模型,将P值最小的引入模型,若均无意义停止。第二步,在已引入模型的基础上,再分别拟合k-1个线性回归模型(分别包含已引入变量和其他变量),再取P值最小者,若均无统计意义则停止,反之。重复以上步骤,直到模型外的自变量均无统计学意义为止卫生统计学第24章多元线性回归与相关3、Backward后退法:先拟合包含k个变量的模型,将其中P值最大者剔出模型,若所有自变量P值均有统计意义,则停止。反之重复以上步骤。4、Stepwise逐步法:将上述两种方法结合应用。前两步同前进法,第三步,考察第一步引入模型的自变量是否仍有意义,无统计意义,则剔除。拟合包含第二步引入模型的自变量与除第一步引入的自变量外的k-2个自变量的模型,将其中最小P值者引入,若均无统计意义,则停止。若第一步引的自变量有意义,则进行第四步,在前两个变量的基础上,引入k-2个模型,如此反复卫生统计学第24章多元线性回归与相关5、Remove移去:规定为Remove的自变量被强制剔除出模型。但SPSS会给出如果将其引入模型的参数估计及检验结果卫生统计学第24章多元线性回归与相关八、补充说明1、统计学意义,以options控钮中的entry、removal选项所规定的P值为准,SPSS默认分别为0.05和0.10。实际中,剔除的P值应大于或等于引入的P值,否则为死循环2、自变量组合不同,偏回归系数的检验结果不同,有可能出现有些自变量在前几步中引入模型,而在后面的运算中被剔除卫生统计学第24章多元线性回归与相关3、前进、后退、逐步法的侧重点不同。当自变量间不存在简单线性相关时,三种方法计算结果一致。当自变量间存在一定的简单线性相关时:前进法侧重于向模型中引入单独作用较强的变量后退法侧重于向模型中引入联合作用较强的变量逐步法介于两者之间卫生统计学第24章多元线性回归与相关4、对于不同的自变量纳入方法,在SPSS中可通过“NEXT”按钮将其分为不同的“Block”,决定其进入模型的方式,同一Block中的自变量进入模型的方式相同卫生统计学第24章多元线性回归与相关九、强影响点识别与处理1、强影响点:指对多重线性回归模型参数估计有很强影响的数据点2、标准化残差大于3时几乎可以肯定该条记录为强影响点3、强影响点统计量:除残差外,SPSS中还可通过Save子对话框中的Influencestatistics复选框提供,5种,标准参与P112说明卫生统计学第24章多元线性回归与相关4、检测到数据中有强影响点时,可通过以下途径解决:1)首先,考虑该条记录在数据记录、录入时是否有错误,如果是,应改正。查不到原始记录不能修正者,应将该条记录删除2)考虑该记录是否与数据库中的其他记录分属于不同亚群,若是则应删除3)以上两条不满足是,不宜武断删除,应再审散点图矩阵,考虑拟合其他形式的模型予以修正卫生统计学第24章多元线性回归与相关4)进行稳健回归Robustregression:如加权最小二乘法,以普通多元线性模型的残差为加权变量,进行加权最小二乘法回归分析5)实际情况允许可考虑增加样本量6)进行非参数回归卫生统计学第24章多元线性回归与相关十、多重共线性识别与处理多重共线性:是指自变量间存在线性相关,即一个自变量可用其他一个或几个自变量的线性表达式进行表示。导致偏回归系数存在无穷多个解或无解,出现偏回归系数难以有合乎专业知识的解释卫生统计学第24章多元线性回归与相关多重共线性主要有以下几种类型表现:1)整个模型的方差分析检验结果这P<α,但各自变量的偏回归系数的统计检验结果却P>α2)专业上认为应该有统计学意义的自变量检验结果却无统计意义3)自变量的偏回归系数取值大小甚至符号明显与实际情况相违背,难以解释4)增加或删除一个自变量或一条记录,自变量偏回归系数发生较大变化卫生统计学第24章多元线性回归与相关多重共线性识别通过statistics子对话框中的collinearitydiagnostics复选框实现,提供以下统计量1)容忍度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年小班语言教案生日快乐
- 2024年家居装修设计协议关键条款明细一
- 2024年中外珠宝贸易合作中英文协议样本版B版
- 2024年12月小学法制教育工作计划
- 酒店客房部门的工作计划范文
- 2024年九年级秋季班主任工作计划范文
- 2024年家庭简易装修标准协议模板版A版
- 街道妇联年度重点工作计划
- 初三第一学期班主任工作计划例文
- 学生会十一月工作计划
- 《阅读》校本课程课程纲要
- 承揽业务责任人任命书(精编版)
- 北京市农村科普示范基地项目申报书
- (完整)高中常见沉淀
- 组合数学讲义 2章 母函数
- 施工图审查意见告知书
- 冀教版六年级上册总结连词成句
- 云南省科技管理信息系统使用手册
- 砌体样板验收汇报报告 (5)
- 鼓谱——海阔天空
- 新世纪超市收银员管理制度与处罚标准
评论
0/150
提交评论