




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1本人根据方积本人根据方积(fn j)乾老师讲课内容整乾老师讲课内容整理的多元统计分析理的多元统计分析第一页,共42页。2022年7月1日15时16分2Logistic 回归回归(hugu)的背景之一的背景之一第1页/共42页第二页,共42页。2022年7月1日15时16分3例例.1 (横断面研究横断面研究) 与急性心肌梗塞急诊治疗预后与急性心肌梗塞急诊治疗预后 有关的因素有关的因素 数据数据: 200 急性心肌梗塞病例急性心肌梗塞病例 危险因素危险因素: 1X(11X, 救治前休克救治前休克; 01X , 否则否则) 2X(12X, 救治前心衰救治前心衰;02X,否则,否则) 3X(1
2、3X, 12小时内无治疗措施小时内无治疗措施;03X,否则,否则) 结局结局: 0P, 生存生存; 1P, 死亡死亡 第2页/共42页第三页,共42页。2022年7月1日15时16分4 Table 16.1 The outcomes and related risk factors of 200 AMI cases 0Y 1Y 1X 2X 3X N 1X 2X 3X N 0 0 0 35 0 0 0 4 0 0 1 34 0 0 1 10 0 1 0 17 0 1 0 4 0 1 1 19 0 1 1 15 1 0 0 17 1 0 0 6 1 0 1 6 1 0 1 9 1 1 0 6 1
3、1 0 6 1 1 1 6 1 1 1 6 Purpose: Risk factors? To predict the probability 3322110XXXP However, there is no guarantee that the value of Pshould fall in the interval 0,1. 第3页/共42页第四页,共42页。2022年7月1日15时16分5 012345-1-2-3-4-50.10.20.30.40.50.60.70.80.91yp YppeePYY1ln1或第4页/共42页第五页,共42页。2022年7月1日15时16分6Logist
4、ic 回归模型回归模型 kkXX.)P-1Pln(110 kkXX.ln(Odds)110 kkXXP.)(logit110 kkkkXXXXeeP.1101101 ).(11011kkXXeP 第5页/共42页第六页,共42页。2022年7月1日15时16分7 Table 16.1 The outcomes and related risk factors of 200 AMI cases 0Y 1Y 1X 2X 3X N 1X 2X 3X N 0 0 0 35 0 0 0 4 0 0 1 34 0 0 1 10 0 1 0 17 0 1 0 4 0 1 1 19 0 1 1 15 1 0
5、0 17 1 0 0 6 1 0 1 6 1 0 1 9 1 1 0 6 1 1 0 6 1 1 1 6 1 1 1 6 11) 1( , 1) 0(332211033221103322110XXXXXXXXXeYPeeYP )exp(11)exp(1)exp()exp(11)exp(1)exp()exp(11)exp(1)exp(632106321032101030343030403500Lik 10)exp(11)exp(1)exp(3322110332211033221101iiniiiniiiiiikiXXXXXXXXX 第6页/共42页第七页,共42页。2022年7月1日15时16分
6、8Table 16Table 16.2 .2 参数参数估计估计的的结果结果 变量变量 SESE( () ) W Wald ald 2 2 P P- - value value OROR 截截距距 - -2.08582.0858 0.35130.3513 35.263235.2632 0.00010.0001 1X 1.10981.1098 0.34850.3485 10.142210.1422 0.00140.0014 3.0343.034 2X 0.70280.7028 0.32920.3292 4.55874.5587 0.03280.0328 2.0192.019 3X 0.97510.
7、9751 0.34400.3440 8.03658.0365 0.00460.0046 2.6512.651 3210,Lik 寻找寻找(xnzho)适宜的适宜的 使得使得 达到最大达到最大第7页/共42页第八页,共42页。2022年7月1日15时16分93219751. 07028. 01098. 10858. 2)P-1Pln(XXX 3219751. 07028. 01098. 10858. 2ln(Odds)XXX 3219751. 07028. 01098. 10858. 2)(LogitXXXP 3213219751. 07028. 01098. 10858. 29751. 070
8、28. 01098. 10858. 21XXXXXXeeP )9751. 07028. 01098. 10858. 2(32111XXXeP 第8页/共42页第九页,共42页。2022年7月1日15时16分10 什麽是什麽是1? 当当 11X, 32withshock9751. 07028. 01098. 10858. 2)ln(OddsXX 01X, 32ckwithoutsho9751. 07028. 000858. 2)ln(OddsXX 1098. 1)ln(Odds-)ln(Oddsckwithoutshowithshock 1098. 1oddsoddslnckwithoutsho
9、withshock1 比较比较 “有休克有休克” 与与 “没休克没休克”, 优势比优势比 = 0338. 3)1098. 1exp()exp(1 注意注意 : 死死亡率较低时亡率较低时, 优势比优势比 相对相对危险度危险度 若若 P是是死亡死亡, 回归回归系数系数是是正的正的,因而因而,该该变量变量是是危危 险险因素因素;否则否则,它它是是保护保护因素因素。 第9页/共42页第十页,共42页。2022年7月1日15时16分11logistic 模型可用于预测模型可用于预测 )9751. 07028. 01098. 10858. 2(32111XXXeP 患者患者 1: 没有休克没有休克, AM
10、I 5 小时后送医院,出现了症状小时后送医院,出现了症状 01X, 12X,03X 200. 01111)7028. 00858. 2()9751. 07028. 01098. 10858. 2(321eePXXXA 患者患者 2: 休克休克, AMI 18 小时后送医院,出现了症状小时后送医院,出现了症状. 11X, 12X ,13X 669. 01111)9751. 07028. 01098. 10858. 2()9751. 07028. 01098. 10858. 2(321eePXXXB 第10页/共42页第十一页,共42页。2022年7月1日15时16分120H: 模型模型拟合拟合此
11、此数据数据 1H: 模型模型不不拟合拟合此此数据数据 F 对于对于大样本大样本, 0H成立成立时时, Lln2服从服从 chi-square 分分 布布,自由度自由度为为 1kN. 当当 2,2ln2L, 拒绝拒绝0H,模型模型不不拟合拟合观察到观察到的的数据数据 Table16.3 例例 16.1 数据数据对对各各模型模型的的拟合拟合情形情形 模型模型 参数参数 -2lnL P-值值 G 得分得分 1 0 244.346 0.02 - - 2 0, 1 236.736 0.03 7.610 7.854 3 0, 1, 2 227.200 0.06 9.536 6.898 4 0, 1, 2,
12、3 222.616 0.09 4.583 5.309 第11页/共42页第十二页,共42页。2022年7月1日15时16分132. 似然比检验似然比检验 0H: 两模型拟合优度一样两模型拟合优度一样 1H:两模型拟合优度不一样两模型拟合优度不一样 LLLLGln2)ln2(ln2 模型模型 1: Lln2, 1k 个变量个变量 模型模型 2: L ln2, 2k 个变量个变量, 21kk . 对于大样本对于大样本, 0H 成立时成立时, G服从服从 chi-square 分布,分布, 12kk . 若若 P-值值 小于小于 , 则则拒绝拒绝 0H, 取取模型模型 2; 否则否则, 不不拒绝拒绝
13、0H,取取模型模型 1 第12页/共42页第十三页,共42页。2022年7月1日15时16分14模型模型 参数参数 -2lnL P-值值 G 得分得分 1 0 244.346 0.02 - - 2 0, 1 236.736 0.03 7.610 7.854 3 0, 1, 2 227.200 0.06 9.536 6.898 4 0, 1, 2,3 222.616 0.09 4.583 5.309 比较比较 模型模型 3 和和 4 200.227ln2L 616.222ln2L 583. 4616.222200.227)ln2(ln2LLG 13412kk, 05. 0P 模型模型 4 最好最
14、好 第13页/共42页第十四页,共42页。2022年7月1日15时16分153. Wald 检验检验 0H: 0i, 1H: 0i 在在1H条件下作条件下作 logistic 回归回归,得到得到i, 22)(iiiSE 若样本量足够大,若样本量足够大, 当当 0H 成立时成立时, 该统计量近似地服从该统计量近似地服从 chi-square 分布,分布, 自由度为自由度为 1. 由表由表 16.2, 1X (shock) 的的 Wald 2 1422.10)3485. 01098. 1(22 这在向后选择变量是有用这在向后选择变量是有用. 注意注意: 对于大样本对于大样本 n, 似然比检验的结果
15、与似然比检验的结果与 Wald 检验检验 的结果彼此接近。的结果彼此接近。 实践中实践中, 人们比较喜欢似然比检验,其结果比较稳健人们比较喜欢似然比检验,其结果比较稳健. Wald 检验容易计算,但比较保守检验容易计算,但比较保守. 第14页/共42页第十五页,共42页。2022年7月1日15时16分16分层分层 CAT=1 (高高) CAT=0 (低低) CHD 正常正常 CHD 正常正常 AGE55,ECG=0 1 17 7 257 AGE0.05 X7 0.937729 0.405423 2.31 0.05 2 常数常数 0.800787 0.266942 2.99 0.05 X4 0.
16、569390 0.196977 2.89 0.05 X6 -1.27328 0.355932 -3.57 0.01 结论结论: (1) 对于对于腺癌腺癌, 吸烟是重要危险因素。吸烟是重要危险因素。. (2) 对于对于鳞癌鳞癌, 高龄和暴露于高龄和暴露于氡增加风险增加风险, 但但 “年龄年龄” 还没有统计学意义。还没有统计学意义。 (3) 对于肺癌,工龄长增加风险。对于肺癌,工龄长增加风险。 第32页/共42页第三十三页,共42页。2022年7月1日15时16分34不同放射性剂量的不同放射性剂量的花粉花粉致畸实验致畸实验 剂量剂量 A 剂量剂量 B 怀孕母亲怀孕母亲 编号编号 后代数后代数 畸形
17、畸形数数 怀孕母亲怀孕母亲 编号编号 后代数后代数 畸形畸形数数 1 7 0 1 7 5 2 9 6 2 8 0 3 8 3 3 7 2 4 7 1 4 7 1 5 8 1 5 8 2 6 6 0 6 8 0 7 7 2 8 6 0 8 5 4 9 7 0 9 7 3 10 9 0 10 8 0 11 6 2 11 7 0 Total 81 12 12 7 1 13 7 7 14 7 0 15 6 1 Total 106 29 第33页/共42页第三十四页,共42页。2022年7月1日15时16分35(1) Z - test H0: 1 = 2, H1: 1 2 08. 2)8111061)(
18、2193.1 (2193.811210629z 2193.811061229cp p0.05. 拒绝拒绝 H0. (2) Logistic 回归回归 组组B 0 A1 logit P = -1.749+0.7727X Li 似然比检验似然比检验 2=4.352, p=0.037. 拒绝拒绝 H0 第34页/共42页第三十五页,共42页。2022年7月1日15时16分36不同不同窝窝的的畸形畸形发生率发生率各不相同各不相同. 窝窝效应效应 畸形畸形后代后代数数并不并不服从服从概率概率为为常数常数 p 的的二项二项分布分布, p 是是一个一个随机随机变量变量 )()1ln(额外项xpp “额外项额
19、外项”: 随机随机变量变量 or )(exp11额外项xp 因此因此, p 是是一个一个随机随机变量变量 第35页/共42页第三十六页,共42页。2022年7月1日15时16分37(1) Beta-二项二项回归回归模型模型 (Crowder 1978) 额外项额外项 beta 分布分布 (2) Logistic-正态正态回归回归模型模型 (Pierce & sands 1975) uxpp )1ln( 0, ) 1 , 0( Nu (3) Logistic-二项二项回归回归模模型型 (Mauritsen 1984) )5 . 0 , 1 ( , 0 )1ln(Bvvxpp 关于关于 “
20、额外额外( wi)项项”的假设的假设第36页/共42页第三十七页,共42页。2022年7月1日15时16分38(3) 随机效应随机效应 logistic 回归回归 随机效应模型的参数估计随机效应模型的参数估计 参数参数 Beta-二项二项 模型模型 Logistic-正态正态 模型模型 Logistic-二项二项 模型模型 , (I) 85.326 85.326 85.326 , , (II) 56.605 56.393 56.550 , (III) 57.97 57.785 57.401 , , 1, 2 (IV) 56.413 56.328 56.516 (I): logit P= +X (II): logit P = +X+ (III):logit P = + (IV): logit P = +X+1+2X 第37页/共42页第三十八页,共42页。2022年7月1日15时16分39利用利用 logistic-正态模型正态模型 比较比较
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小班性启蒙教育
- 豪华车租赁合同
- 牙齿美白服务协议书
- 新生入学校查验预防接种证培训
- 肾病科中医护理临床进展
- 钢铁企业夏季安全生产培训
- 脑干出血临床表现
- 金融电子支付公司一季度安全生产培训
- 董事高管责任保险对企业跨国并购的影响研究
- 烧伤科基础知识
- 学业规划、职业发展与就业指导课件
- 西南交通大学文科建设发展纲要
- 苏教版数学六年级下册第三单元《解决问题的策略》课课件
- 四年级数学思维训练社团活动(素质拓展)电子教案
- 金属切削过程中的变形 revised课件
- 蒙古族文化课件
- 简明烧伤健康量表
- 传染病布氏菌病 课件
- 商业广告设计课件
- 教会行政管理学课程教案
- SJG 44-2018 深圳市公共建筑节能设计规范-高清现行
评论
0/150
提交评论