spss统计分析视频数据_第1页
spss统计分析视频数据_第2页
spss统计分析视频数据_第3页
spss统计分析视频数据_第4页
spss统计分析视频数据_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

IBM-SPSS第17章

Logistic回归

简单回归模型中,要求因变量为连续型变量,且要符合正态性和方差齐性等条件。然而,在实际资料分析中,有一些因变量是分类变量,那么这样的资料就不能使用前面介绍的线性回归模型进行分析。遇到这种情况,一般采取logistic回归模型对数据进行分析。17.1

二项分类logistic回归

二项分类logistic回归是指因变量为二分类变量时的回归分析。在实际工作中,这样的例子很多,如在采用了某种治疗方案后,的治疗结局是有效或无效、生存或;人们对自己的生存质量是否满意;想探讨胃癌发生的,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量。实例详解例1.

为了评价某新疗法的疗效,某研究者随机 了40名某病患者,治疗后一定时间内观察其康复状况,数据见例17-1.SAV。其中变量Y为康复状况(Y=0表示未康复,Y=1表示康复),X1表示病情严重程度(1表示严重,0表示不严重),X2表示疗法(0表示新疗法,1表示传统疗法)。目的研究评价不同疗法对康复状况的作用有无差别?1.二分类logistic回归分析单击“分析”|“回归”|“二元logistic”,弹出二分类logistic回归分析 框,如图17-1所示。2.方法下拉列表框选择变量进入方程的方法。进入法:全变量模型。向前条件法:基于条件参数估计的前进法。向前LR法:基于偏最大似然估计的前进法。向前Wald法:基于Wald统计量的前进法。向后条件法:基于条件参数估计的后退法。向后LR

法:基于偏最大似然估计的后退法。向后Wald

法:基于Wald统计量的后退法。3.“分类”按钮单击“分类”,弹出如图

17-2所示的框,此对话框是用于多分类变量的比较。(1)分类协变量框:选入多分类协变量,可同时选入多个。选入的协变量后的括弧内表示选定的改变量不同类间的多重比较方法。(2)对比下拉列表框:4.“保存”按钮单击“保存”按钮,弹出如图17-3所示的框,此

框主要用于输出新的变量和参数。5.“选项”按钮单击“选项”按钮,弹出如图17-4所示的框。2.结果解读(1)如图17-6所示为数据一般情况的分析,包括总样本量以及缺失值。(2)如图17-7所示为因变量取值水平编码信息。(3)如图17-8所示为模型中仅含有常数项时的正确 结果,此例中正确义就是,原数据中40个观察结果是57.5%。其意中,未康复的有23人,康复的有17人,如果每一均分类到未康复,则可以得到正确 百分率是57.5%。(4)如图17-9所示中给出的是模型中未引入自变量时常数项的估计值,SE为其标准误,Wals为Wals卡方值,是对总体回归系数是否为零进行假设检验。(5)如图17-14所示反映的是模型中各自变量的偏回归系数(B)、标准误(SE)、Wals卡方值、 度(df)、P值(sig)以及OR值和OR值的95%

区间(CI)。由此

得出结论,自变量X2(疗法)对某病患者的康复情况有影响,采用传统疗法(X2=1)的

比采用新疗法(X2=0)的 更不易康复,换句话说,就是新疗法比传统疗法的疗效更好。17.2

条件logistic回归从统计学的角度来看,控制潜在的混杂因素的干扰有两种办法,一是在设计时加以控制,二是在统计分析时对其进行调整。在设计阶段控制混杂因素的方法就是配对或配比(match)设计。即对每一个符合入组条件的病例,按配比因素寻找一个或几个非病例作为对照,再比较病例和对照各自以往的经历,达到分析的目的。对于配对设计的资料,如果采用logistic回归模型进行分析,就应该采用配对logistic回归模型也称为条件logistic回归。由于SPSS

没有提供专门的分析模块,因此,在实际应用当中常采用分层cox回归模型进行拟合。17.3

有序logistic回归前面介绍的logistic回归应变量为二分类变量,服从二项分布,但当变量水平数大于2并且为有序变量时,如治疗结局为无效、好转、康复三个水平,病情为轻、中、重三个等级,此类资料需要采用有序logistic回归模型进行分析。例2.拟合 和两种治疗方法对某病疗效的影响,疗效的等级为3个等级,具体赋值如下::男=0,女=1;新疗法=1,旧疗法=0

;疗效:1=显效,2=有效,3=无效。试进行分析。1.操作步骤(1)单击“分析”|“回归”|“有序”命令,弹出图17-3-1所示的

框;(2)将因变量“疗效”放入“因变量”框;将因素“ ”、“治疗方法”放入“协变量”列表框;(3)单击“选项”按钮,在置信区间内填入95,单击“继续”按钮,返回主 框。(4)单击“确定”运行,输出结果。2.结果解读(1)首先图17-21给出的是因变量每一类别的频数及构成比。(2)如图17-22所示反映的是对模型进行的似然比检验,p小于0.05表示模型有统计学意义。(3)如图17-23所示反映的是模型的拟合优度检验,分别为Perason卡方检验和Deviance卡方检验,两个拟合优度检验的P值均大于0.05,表示模型拟合较好。(4)如图17-24所示给出的是模型的三种伪决定系数,对于分类数据而言,伪决定系数一般不会太高。(5)如图17-25所示是最重要的结果,是回归系数的参数估计及假设检验结果。本例因变量有3个水平,因此会得出两个回归方程。17.4

多项分类logistic回归

多个因变量的取值有时无大小顺序,如因变量为职业(学生、教师、工人、农民、商人、公务员等)或者居住地(山区、平原、丘陵等)等,这样的变量类型又称为多项无序分类变量,又称名义变量,名义变量与自变量之间建立的回归模型被称为多项分类logistic回归模型。17.4.3实例分析

研究者随机抽取了三个不同的中学,研究和不同课程计划对学生学习方式偏好的影响.具体见数据库mlogit.sav。本例有两个自变量,中学和课程计划;一个因变量:学习方式。其中学校变量有

3个水平(1、2、3),课程计划有2个水平(1常规,2附加),学习方式变量有3个水平(1自修、2小组、3上课)。列出主要的模型拟合的结果;列出主要的参数估计的结果,并给出合理的解释。模块解读1.多项分类logistic回归单击“分析”|“回归”|“多项logistic”命令,弹出多项logistic回归分析 框,如图17-26。因变量选入多项分类的因变量,因子选入分类自变量,协变量选入连续型变量或二分类变量。2.“模型”按钮单击“模型”按钮,可在弹出的

框中定义交互作用以及选择逐步回归模型,如图17-27所示。3.“统计量”按钮单击“统计量”按钮,弹出如图17-28所示的对话框,这里说明模型的拟合信息及输出的参数,具体意义和前面章节类似。2.结果解读(1)

首先会给出因变量每一类别的频数及构成比信息、模型的拟合信息、模型的伪决定系数、似然比检验等,如图17-31~17-36所示,这些信息的意义与前面章节基本相同,请参见前面的解释。(2) 最后输出的是最重要的信息,也就是回归系数的参数估计结果,如图17-36所示。根据图17-36所示,由所建立的模型可以看出,学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论