第05讲logistic回归II_第1页
第05讲logistic回归II_第2页
第05讲logistic回归II_第3页
第05讲logistic回归II_第4页
第05讲logistic回归II_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第5讲讲 logistic族回归族回归(ii)2 南京医科大学流行病与卫生统计学系主要内容主要内容l多元logistic回归l条件logistic回归l多类结果的logistic回归l有序结果的logistic回归llogistic回归的正确应用3 南京医科大学流行病与卫生统计学系2 条件条件logistic回归回归l配比(matched)设计资料l1:1l1:2l2:1ln:m4 南京医科大学流行病与卫生统计学系1:m配比设计的资料格式配比设计的资料格式 配比号观察对象组内编号危险因素x1xp1病例0 x101x10p1对照11x111x11p1对照mmx1m1x1mp2病例0 x201x

2、20p2对照11x211x21p2对照mmx2m1x2mpn病例0 xn01xn0pn对照11xn11xn1pn对照mmxnm1xnmp5 南京医科大学流行病与卫生统计学系配比设计资料的配比设计资料的logistic回归回归1122logit pppxxx6 南京医科大学流行病与卫生统计学系软组织肉瘤与接触苯氧乙酸的关系软组织肉瘤与接触苯氧乙酸的关系 软组织肉瘤接触过未接触过对照接触过34未接触过16304416 or 2=7.2, p=0.0073。7 南京医科大学流行病与卫生统计学系软组织肉瘤与接触苯氧乙酸或氯酚的原始数据软组织肉瘤与接触苯氧乙酸或氯酚的原始数据 编号配比组病例对照是否接触

3、频数matchyxf111132101332111642001653104630147410308400308 南京医科大学流行病与卫生统计学系相应的条件相应的条件logistic回归模型回归模型xp3863. 1logit43863. 1 eor9 南京医科大学流行病与卫生统计学系子宫内膜癌与是否使用了雌激素子宫内膜癌与是否使用了雌激素 1:match配比组(匹配条件:年龄相同)2:yy=1:病例, y=0:对照3:htht=0:无高血压, ht=1:有高血压4:estest=0:未使用过雌激素, est=1:使用过雌激素5:dose剂量:dose=0:未使用过, dose=1:0.1-0.

4、299(mg/day) dose=2:0.3-0.625(mg/day), dose=3:0.625(mg/day)6:drugdrug=0:未使用其他药物, drug=1:使用了其他药物各变量的定义 10 南京医科大学流行病与卫生统计学系条件条件logistic回归回归(考虑是否使用过考虑是否使用过)变量方程aln(or)sezporest 1.93210.4341 4.4510.0006.90ht-0.11040.3380-0.3270.7440.90drug 0.76180.4933 1.5440.1232.14logl-81.67175911 南京医科大学流行病与卫生统计学系条件条件l

5、ogistic回归回归(考虑使用过多少考虑使用过多少)变量方程bln(or)sezpordose0.80820.17594.5950.0002.24ht0.21360.38670.5520.5811.28drug1.06560.55611.9160.0552.90logl-66.17314112 南京医科大学流行病与卫生统计学系3 多类结果变量的多类结果变量的logistic回归模型回归模型 /(| )logitln( )(| )(| )logitln( )(| )ppppp yxpxxxg xp yxp yxpxxxg xp yx1 01111122112 02211222221020y=1

6、表示a类,y=2表示b类,y=0表示c类。设c类为参照组。 13 南京医科大学流行病与卫生统计学系多类结果变量的多类结果变量的logistic回归模型回归模型 )| 0()| 2(ln)| 0()| 1(ln )| 2()| 0()| 0()| 1(ln)| 2()| 1(lnlogit2/1xxxxxxxxxxypypypypypypypypypypp)()( )()()()( 2121222121121121xxggxxxppp14 南京医科大学流行病与卫生统计学系各类概率各类概率|p yxp yxp yx0121( )( )( )( )( )( )( )( )|gxgxgxgxgxgxg

7、xgxpp yxeeepp yxeeepp yxee12112212012111012115 南京医科大学流行病与卫生统计学系产后大出血与妊高症的关系产后大出血与妊高症的关系 分 组无妊高症x=0有妊高症x=1合 计or对照y=0718277451子宫因素y=1142131552.43胎盘因素y=2276335.91合 计88746933718 1327 142or718 627 27or16 南京医科大学流行病与卫生统计学系产后大出血与妊高症的三类结果产后大出血与妊高症的三类结果logistic回归回归llogit p宫宫/对对-1.6206+0.889755x llogit p胎胎/对对-

8、3.2806+1.776555xe0.889755=2.4345331 e1.776555=5.9094650 11exp()or718 1327 14221exp()or718 627 2717 南京医科大学流行病与卫生统计学系两类产后大出血与妊高症、人流史的关系两类产后大出血与妊高症、人流史的关系 分 组 结果变量无妊高症x1=0有妊高症x1=1合 计无人流史x2=0有人流史x2=1无人流史x2=0有人流史x2=1对 照y=0575143189745子宫因素y=1121 21103155胎盘因素y=2 18 9 15 33合 计714173291793318 南京医科大学流行病与卫生统计学

9、系三分类结果的三分类结果的logistic回归回归 变量系数标准误zpor95%可信区间1妊高症x10.94830.35282.6880.0072.581.29 5.15人流史x2-0.3882 0.2425-1.6010.1090.680.42 1.09常数项-1.5548 0.0990-15.710 0.0002妊高症x11.59720.50213.1810.0014.941.85 13.21人流史x20.93750.37092.5280.0112.551.23 5.28常数项-3.5489 0.2412-14.711 0.00019 南京医科大学流行病与卫生统计学系三分类结果的三分类结果

10、的logistic回归回归logit p宫宫/对对-1.5548+0.9483x1-0.3882x2logit p胎胎/对对-3.5489+1.5972x1+0.9375x2log-likelihood=-544.417720 南京医科大学流行病与卫生统计学系有条件限制的有条件限制的多类结果的多类结果的logistic回归回归限制条件 11 21:logit p宫宫/对对-1.5660+1.1100 x1-0.4077x2 logit p胎胎/对对-3.4968+1.1100 x1+ 0.9841x2log-likelihood=-545.0718g2=2-544.4177-(-545.071

11、8)=1.3082 21 南京医科大学流行病与卫生统计学系实例:恶性淋巴瘤的病例实例:恶性淋巴瘤的病例-对照研究对照研究1:2配比设计:病例组:恶性淋巴瘤患者对照1组:其它肿瘤患者对照2组:非血液病非肿瘤患者匹配的条件:年龄(+/-5岁)、性别、民族相同同医院、同期病人22 南京医科大学流行病与卫生统计学系实例:恶性淋巴瘤的病例实例:恶性淋巴瘤的病例-对照研究对照研究因素病例组与对照1组病例组与对照2组or95%cior95%ci环境污染2.1511.0774.298 1.0101.216 6.204有机溶剂1.2670.5602.867 1.4611.07917.219化肥农药1.2320.

12、6302.408 0.9701.188 5.903肿瘤史*0.4710.1961.133 2.0261.20247.890手术史0.4980.2710.917-0.4810.320 1.193家族史*0.7680.4631.274 1.6622.05413.515淡水鱼虾0.6330.3781.060-0.7860.246 0.84223 南京医科大学流行病与卫生统计学系其它对照形式其它对照形式(多分类多分类)l鳞癌、腺癌:正常对照l病例:父母亲对照l病例:配偶:兄妹对照l病例:同单位:不同单位正常对照24 南京医科大学流行病与卫生统计学系4 有序分类资料的有序分类资料的logistic回归回

13、归l设结果变量y为k个等级的有序变量,k个等级分别用1,2,k表示。 l累积概率(cumulative probability) )|()|1()|(xxxjypypjyp25 南京医科大学流行病与卫生统计学系意义意义 jp yj xpp yj xp yj x (| )logitlogit(| )ln1(| )26 南京医科大学流行病与卫生统计学系有序分类结果的有序分类结果的logistic回归定义为回归定义为 lk等级分为两类:1,j 与 j+1,kl在这两类的基础上定义的logit表示:l属于后k-j个等级的累积概率与前j个等级的累积概率的比数之对数,故该模型称为累积比数模型(cumula

14、tive odds model)。 pjjiiipp yj xx 1logitlogit(|) pjiiip yj xx 11(|)1exp 27 南京医科大学流行病与卫生统计学系回归系数的解释回归系数的解释l回归系数 i 表示自变量 xi 每改变一个单位, y 值提高一个及一个以上等级之比数比的对数值。 ior exp() 28 南京医科大学流行病与卫生统计学系儿童智力等级与母亲文化程度的关系儿童智力等级与母亲文化程度的关系 智商等级y母亲文化程度小学初中高中或中专大专及以上合计x=0 x=1x=2x=31=中下22 57 11 1 912=中等81236112 44333=中上301351

15、05102804=上等 3 26 17 7 53 合计1364542452285729 南京医科大学流行病与卫生统计学系儿童智力等级与母亲文化程度的累积比数logistic回归 变量回归系数标准误zpx0.63730.09346.8240.000常数项1-1.45780.1454 21.22540.1358 33.56300.1935jjpx logit0.6373 30 南京医科大学流行病与卫生统计学系概率预测概率预测p ye 1.4578 0.63731(1)0.10961p yee1.2254 0.63731.4578 0.637311(2)0.533311p yee3.5630 0.6

16、3731.2254 0.637311(3)0.306211p ye 3.5630 0.63731(4)10.05091x=1时 31 南京医科大学流行病与卫生统计学系累积比数模型的假定累积比数模型的假定 第一种: 无效,有效、显效、治愈第二种: 无效、有效,显效、治愈第三种: 无效、有效、显效,治愈l无论对哪种分法,治疗方案的效应是相同的。l即自变量的回归系数与分割点j无关。 32 南京医科大学流行病与卫生统计学系二分类结果的回归二分类结果的回归l第一种,1,2、3、4,得:= 1.4653, =0.6309l第二种,1、2,3、4,得: =1.2143, =0.6279l第三种,1、2、3,

17、4,得: =3.6844, =0.719733 南京医科大学流行病与卫生统计学系营养与智力的关系营养与智力的关系 序号影响因素变量名 变量编码1家庭人均月收入x1200元以下=0,200800元=1,800元以上=22足月儿出生体重x22500克以下=0,25004000克=1,4000克以上=23母亲孕期营养x3荤食每周一次及以下=0,每34天一次=1,每12天一次=24婴儿期喂养方式*x4_1人工喂养;x4_2混合喂养;x4_3母乳喂养5三岁前营养状况x5偶尔吃荤食=0,每周一次=1,每23天一次=2 ,每天一次=36牛奶或豆浆x6不喝=0,经常喝(每周34次)=1,每天喝=234 南京医

18、科大学流行病与卫生统计学系单因素分析结果单因素分析结果 变量回归系数标准误zpx1 0.02160.1208 0.1790.858x2-0.04200.1600-0.2620.793x3 0.39420.0829 4.7540.000 x4_2-0.12510.1759-0.7110.477x4_3 0.33250.1456 2.2840.022x5 0.39800.0664 5.9980.000 x6 0.46350.1391 3.3320.00135 南京医科大学流行病与卫生统计学系多因素分析多因素分析变量coefsezporx20.6540 0.39531.6550.098*(x2)2-

19、0.34680.1787 -1.9410.052*x30.2189 0.09042.4210.0151.2447x4_30.3304 0.13952.3680.0181.3915x50.2893 0.07243.9930.0001.3354x60.2964 0.14272.0770.0381.3022or0/1=0.7355 or2/1=0.6795 36 南京医科大学流行病与卫生统计学系其它类型的结果变量其它类型的结果变量l疗效等级l无效、好转、显效、治愈无效、好转、显效、治愈l疾病的严重程度l正常、临界、异常正常、临界、异常l未发病、发病、病死未发病、发病、病死l心功能分级li、ii、iii、iv37 南京医科大学流行病与卫生统计学系5 logistic族回归模型的正确应用族回归模型的正确应用 llogistic族回归模型的应用条件l独立性。各观察对象间是相互独立的。llogitp与自变量的关系是线性关系。l累积比数logistic回归模型假设,自变量的回归系数与分割点j无关。可通过建立多个二分类的logistic回归模型来考察。l队列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论