(21)-chapter17-1知识点1logistic模型医学统计学_第1页
(21)-chapter17-1知识点1logistic模型医学统计学_第2页
(21)-chapter17-1知识点1logistic模型医学统计学_第3页
(21)-chapter17-1知识点1logistic模型医学统计学_第4页
(21)-chapter17-1知识点1logistic模型医学统计学_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

同学好,我们今天学习医学统计学中的logistic回归模型。logistic回归分析回归分析的分类一个因变量y连续型因变量(y)---线性回归分析分类型因变量(y)---Logistic回归分析1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。logistic回归(logisticregression)是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。在流行病学研究中,常需要分析疾病与各种危险因素间的定量关系,同时为了能真实反映暴露因素与观察结果间的关系,需要控制混杂因素的影响。logistic回归分析概念(1)二分类资料logistic回归:因变量为两分类变量的资料,可用非条件logistic回归和条件logistic回归进行分析。(2)多分类资料logistic回归:

因变量为多项分类的资料,可用多项分类logistic回归模型或有序分类logistic回归模型进行分析。logistic回归分析分类二分类资料logistic回归非条件logistic回归:多用于非配比病例-对照研究或队列研究资料。病例与对照不匹配

条件logistic回归:多用于配对或配比资料。病例与对照匹配logistic回归分析分类logistic回归模型

为探讨超重和肥胖对高血压病的影响,某研究者采用整群抽样的方法,对某地6个镇35岁以上的常住人口进行高血压普查,同时收集了身高、体重等相关信息。表1不同体质指数高血压患病率体质指数(X)调查人数患病(Y=1)未患病(Y=0)患病率正常(X=0)67921331546119.60超重或肥胖(X=1)41481656249239.92合计109401987795327.30例

为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表1和表2。试用logistic逐步回归分析方法筛选危险因素。Example表1冠心病8个可能的危险因素与赋值表2冠心病危险因素的病例对照调查资料

为研究60岁及以上患白内障老年人未就诊的影响因素,采用分层整群抽样方法,对某地区1001名老年人进行问卷调查,调查影响因素包括地区、性别、学历、年均收入、患病月数,应变量为(就诊:0,未就诊:1),资料整理见表1Example表1某地区60岁及以上患白内障老年人就诊情况先前学过的方法是否能够解决?患者编号地区

性别

学历

年均收入(元)患病月数是否就诊

11212500331212168195031226047470412120009215312432580…………………100011290025110013212713311Y为分类变量时的分析方法对取值为0、1的因变量进行分析,通常对事件发生的概率进行分析,以π表示事件发生的概率(事件未发生的概率为1-π),并把π看作自变量Xi的线性函数,不同形式的F(·),就有不同形式的模型,最简单的莫过于使F(·)为一线性函数一、logistic回归模型

因π的值一定在区间[0,1]内,而且当π接近于0或1时,自变量即使有很大变化,π的值也不可能变化很大,所以对上式直接用普通最小二乘法进行估计是行不通的

从数学上看,函数π对Xi

的变化在π=0或π=1的附近是不敏感的、缓慢的,且非线性的程度较高。因此,引入π的logit变换。通过logit变换之后,就可将的资料转换为的资料作logit变换后,logistic回归模型可以表示成如下的线性形式:

logit变换:为π的logit变换logitπ称为对数似然比(loglikelihoodratio)

将上式变换得样本的logistic回归模型:

其中,为常数项,为偏回归系数。logistic回归模型的参数估计及假设检验

logistic回归的参数估计

logistic回归模型的参数估计常采用最大似然估计(maximumlikelihoodestimate)。建立一个样本似然函数logistic回归模型的假设检验

1、对模型的假设检验—似然比检(likelihoodratiotest)2、对偏回归系数的假设检验—Wald检验3、对偏回归系数的标准化例

为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表1和表2。试用logistic逐步回归分析方法筛选危险因素。表1冠心病8个可能的危险因素与赋值表2冠心病危险因素的病例对照调查资料

表3进入方程中的自变量及有关参数的估计值学会看结果!最终进入logistic回归模型的危险因素有4个,它们分别是年龄增高、高血脂史、动物脂肪摄入量和A型性格小结:目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。资料:1.应变量为反映某现象发生与不发生的二值变量;

2.自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。用途:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论