




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十五章logistic回归分析Logistic Regression Analysis山东大学公共卫生学院回归分析的分类厂连续型因变量(y)线性回归分析一个 因变V分类型因变量(y) -Logistic回归分析生存时间因变量生存风险回归分析 时间序列因变量时间序列分析多个因变量路径分析结构方程模型分析 logisticII(logistic regression)是研究因变量为二分类或 多分类观察结果与影响因素(自变量)之间关系的一种多 变量分析方法,属概率型非线性回归。在流行病学研究中,常需要分析疾病与各种危险因素间的 定量关系,同时为了能真实反映暴露因素与观察结果间的 关系,需要控制混杂
2、因素的影响。(1) Mantel-Haenszel分层分析:适用于样本量大、分析因 素较少的情况。当分层较多时,由于要求各格子中例数不 能太少,所需样本较大,往往难以做到;当混杂因素较多 时,分层数也呈几何倍数增长,这将导致部分层中某个格 子的频数为零,无法利用其信息。(2)线性回归分析:由于因变量是分类变量,不能满足 其正态性要求;有些自变量对因变量的影响并非线性。logistic回归:不仅适用于病因学分析,也可用于其他方面的研究,研 究某个二分类(或无序及有序多分类)目标变量与有关因素的关 系。logistic回归的分类:(1)二分类资料logistic回归:因变量为两分类变量的资料,可用
3、非 条件logistic回归和条件logistic回归进行分析。非条件logistic回归多用于非配比病例-对照研究或队列研究资料,条件logistic回归多用于配对或配比资料。(2)多分类资料logistic回归:因变量为多项分类的资料,可用多项 分类logistic回归模型或有序分类logistic回归模型进行分析。队列研究(cohort study):也称前瞻性研究、随访研究等。是一种由因及果 的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾 病
4、间存在联系。队列研究验证的暴露因素在研究开始前已存在,研究者知道每个研究对象的暴露情况。调查方向:追踪收集资料暴露疾病 人数比较da/(a+b)c/(c+d)病例非病例合计发病率暴露组abm=a+ba/ ni非暴露组Cdn0=c+dd n0相对危险度(relative risk, RR)也称危险比(risk ratio)或率比(rate ratio)o rr 二人,二 u/、4=a/、Zo = c/n2I。 c / nQRR (相对危险度relative risk):表示暴露组与非暴露组 发病率(或死亡率)的比值。也称为危险比(risk ratio)。 反映了暴露与疾病发生的关联强度。KR表明
5、暴露组发病或死亡的危险是非暴露组的多少倍。病例对照研究(case-control studies): 一种由果及因的回顾性 研究,先按疾病状态确定调查对象,分为病例(case)和对照 (control)两组,然后利用已有的记录、或采用询问、填写调查表 等方式,了解其发病前的暴露情况,并进行比较,推测疾病与 暴露间的关系。调查方向:收集回顾性资料比较人数 暴露疾病a!(a+b)c/(c+J)病例对照原理示意图是否暴露病例对照合计暴露组aba+b(nl)未暴露组Cdc+d(n2)合计a+cb+dn比数比(odds ratio、OR):病例对照研究中表示疾病与暴露问 联系强度的指标,也称比值比。比值
6、(odds):某事物发生的可能性与不发生的可能性之比。病例组暴露的比值心±2、对照组暴露的比值0/亿+ 3)b/a + b)d /(c + d)该暴露因素的优势比: OR = a/(a + b) /c/(c + t/) _b/a + b) d /(c + t/) be相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率之比。只能计算比值比02?值。OK与KA的含义是相同的,也是指暴露组的疾病危险性为非暴露组的多少倍。当疾病发病率小于5%时,07?是RR的极好近似值。欢1,说明该因素是疾病的危险性增加,为危险因素;OKI,说明该因素是疾病的危险性减小,为保护因素;病例对照研究的类
7、型(一)病例与对照不匹配非条件logistic回归在设计所规定的病例和对照人群中,分别抽取一定量的研究 对象,一般对照应等于或多于病例数,此外无其他任何限制。(二)病例与对照匹配-条件logiStic回归匹配或称配比(matching),即要求对照在某些因素或特征 上与病例保持一致,目的是对两组比较时排除混杂因素的干 扰。匹配分为成组匹配和个体匹配。(二)病例与对照匹配-条件logisticU归1、成组匹配(category matching):匹配的因素所占的比例,在对照组和在病例组一致。如病例组中男女各半,65岁以上者占1/3,则对照组 也是如此。2、个体匹配(individual mat
8、ching):以病例和对照的个体为单位进行1:2,匹配叫个体匹配。1:1匹配又叫配对(pair matching),匹配时称为匹配。匹配的特征必须是已知的混杂因子,或者有充分的理由怀疑其为混杂因子,否则不应匹配。(三)巢式病例对照研究也称为队列内的病例对照研究,是将队列研究和病例对照研究相结合的 方法。第一节logistic回归logistic回归模型:设因变量y是一个二分类变量,其取值为丫=1和y=o。 影响丫取值的机个自变量分别为X,X7,X"。在m 个自变量(即暴露因素)作用下阳性结果发生的条件 概率为p = p(y = iX,X2,x,),则 logistic 回归模 型可表示为:p = exp(夕0 +11X +夕2乂2 + 0mXm)1 + exp(/70 + -Xi + 42X2 + + 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论