Logistic模型应用的方法与技术PPT课件_第1页
Logistic模型应用的方法与技术PPT课件_第2页
Logistic模型应用的方法与技术PPT课件_第3页
Logistic模型应用的方法与技术PPT课件_第4页
Logistic模型应用的方法与技术PPT课件_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、问题提出 可用于慢性非传染性疾病的病例对照资料分析,可用于病例对照研究资料分析,不仅限于病例对照研究资可用于慢性非传染性疾病的病例对照资料分析,可用于病例对照研究资料分析,不仅限于病例对照研究资料分析料分析; ; 样本量要求样本量要求5050以上以上; ; 对调查的因素或变量先做单因素对调查的因素或变量先做单因素LogisticLogistic模型分析,再有意义的因素变量做多因素变量筛选,即可获得模型模型分析,再有意义的因素变量做多因素变量筛选,即可获得模型分析结果分析结果; ;第1页/共30页问题提出 模型分析结果为某一些因素变量有统计学意义,模型拟合良好(模型分析结果为某一些因素变量有统计

2、学意义,模型拟合良好(P P0.82560.8256,P0.05P0.05); ; 模型分析结果与专业解释有矛盾,专业上认为有意义的,检验结果无意义,或虽有统计意义,但符号和方模型分析结果与专业解释有矛盾,专业上认为有意义的,检验结果无意义,或虽有统计意义,但符号和方向相反向相反; ; 自变量为计量资料自变量为计量资料( (数值变量数值变量) )信息最多,变量处理上比较简单,可直接进入模型分析信息最多,变量处理上比较简单,可直接进入模型分析。第2页/共30页Logistic模型应用的方法与技术 适用资料和研究设计类型与模型分析目的适用资料和研究设计类型与模型分析目的 模型的应用条件模型的应用条

3、件 LogisticLogistic模型的样本量模型的样本量 资料准备与变量设置资料准备与变量设置 变量筛选与因素分析变量筛选与因素分析 LogisticLogistic模型的流行病学意义模型的流行病学意义 不同分析目的和设计类型对分析结果选取不同分析目的和设计类型对分析结果选取第3页/共30页适用资料与研究设计类型 病例对照研究资料病例对照研究资料 成组设计成组设计 个体匹配(个体匹配(1:1, 1:M, N:M1:1, 1:M, N:M)和频率匹配)和频率匹配 横断面调查观察资料横断面调查观察资料 队列研究资料(封闭队列)队列研究资料(封闭队列) 随机对照试验资料随机对照试验资料 交叉试验

4、设计资料交叉试验设计资料 药物与毒物剂量反应研究资料药物与毒物剂量反应研究资料第4页/共30页模型的分析目的因素分析 自变量与因变量间有无关联性自变量与因变量间有无关联性 在调整和控制其他因素条件下研究自变量与因变量间的关系在调整和控制其他因素条件下研究自变量与因变量间的关系 可能的危险因素可能的危险因素结合设计与专业问题结合设计与专业问题 剂量反应关系(连续与有序多分类)剂量反应关系(连续与有序多分类) 自变量与因变量关系的形态自变量与因变量关系的形态线性,线性,“”型,型,“”型,对数线性等型,对数线性等第5页/共30页模型分析目的建模预测判别 分析的基础上建立分析的基础上建立 Logis

5、ticLogistic回归方程,用于因变量的预测与判别回归方程,用于因变量的预测与判别 仅对前瞻性研究资料(包括临床随机试验)仅对前瞻性研究资料(包括临床随机试验) 反映模型拟合度的指标要好反映模型拟合度的指标要好 回代符合率与前瞻符合率要高回代符合率与前瞻符合率要高 对模型的适合性有较高要求对模型的适合性有较高要求 有较好专业研究基础有较好专业研究基础第6页/共30页应用条件 Logistic模型是以二项分布为基础 独立,重复,互拆 独立各个体间发病(事件)相互不影响 重复各个体事件发生的条件相同且有一定的重复数,多个调查结果的合并分析与样本量; 互拆只有两种对立的结果(两分类)第7页/共3

6、0页应用条件实例分析 在高血压患病率与危险因素的现况调查中,以高血压病人为病例,非高血压病人为对照,应用在高血压患病率与危险因素的现况调查中,以高血压病人为病例,非高血压病人为对照,应用logisticlogistic模型模型分析影响高血压发病的可能危险因素。(分析影响高血压发病的可能危险因素。(GEEGEE模型)模型) 应用应用logisticlogistic回归模型分析传染病病例对照研究资料,探索传染病发病的可能影响因素回归模型分析传染病病例对照研究资料,探索传染病发病的可能影响因素第8页/共30页Logistic模型的样本量 研究对象个数大于参数个数 一般为自变量个数(参数个数)的510

7、倍 小样本时模型效率较差,传统概念为50 与参数个数、病例与非病例的比例、比数比(OR)大小有关(中国公共卫生,中国卫生统计学) 许多情况下样本量50 仍有效 确切Logistic回归模型第9页/共30页资料准备变量设置 二分类变量直接设置成01变量 无序多分类(计数资料中的多分类),将k类设置成 k-1 个0-1变量血型血型 x1 x2 x3x1 x2 x3 O O型型 0 0 00 0 0 A A型型 1 0 01 0 0 B B型型 0 1 00 1 0 AB AB型型 0 0 10 0 1血型血型 x1 x2 x3x1 x2 x3 O O型型 1 0 01 0 0 A A型型 0 1

8、00 1 0 B B型型 0 0 10 0 1 AB AB型型 0 0 00 0 0第10页/共30页资料准备变量设置 有序多分类变量(等级分组资料) 设置成0,1,2,3,4, 根据专业问题设置成特殊的数量等级关系,如 0,1.5,3,5 转换成k-1 个0-1变量 例如大便隐血试验结果,+,+,+,+, 第11页/共30页隐血试验结果隐血试验结果X1 X2 X3 X4X1 X2 X3 X4 0 0 0 00 0 0 0 1 0 0 01 0 0 0 0 1 0 00 1 0 0 0 0 1 00 0 1 0 0 0 0 10 0 0 1第12页/共30页资料准备变量设置 计量资料(连续性变

9、量) 以原始变量值进入 将原始变量值作适当变换(如对数变换)后进入从专业上和数量关系上先进行探索 将原始变量值中心化、尺度化和标准化 将连续性变量离散成有序多分类,或再转化为0-1变量(探索规律,不十分准确离散较大) 从专业探索与多种方式偿试 Data cleaning第13页/共30页变量筛选与因素分析 单变量分析与多变量分析单变量分析与多变量分析 一般软件中有逐步筛选法、向前法和向后法一般软件中有逐步筛选法、向前法和向后法 变量简单筛选只是最初步分析,可能会产生不变量简单筛选只是最初步分析,可能会产生不理想或有矛盾的结果理想或有矛盾的结果; ; 单变量分析作用单变量分析作用探索计量资料变换

10、规律探索计量资料变换规律 部分因素变量进行多种变量设置后进入模型,部分因素变量进行多种变量设置后进入模型,或调整不同的基础水平或调整不同的基础水平 可区分混杂因素与处理因素,但是相对,混杂可区分混杂因素与处理因素,但是相对,混杂因素设置可粗一些,处理因素设置要精细一些;因素设置可粗一些,处理因素设置要精细一些;第14页/共30页因素分析(实例分析) 妇女年龄与低出生体重的关系分析,年龄在妇女年龄与低出生体重的关系分析,年龄在16451645岁岁 直接输入无统计意义或弱统计意义直接输入无统计意义或弱统计意义 标准化或转换无改变标准化或转换无改变 用用0-10-1变量分析,以低年龄组为基准,中间年

11、龄危险度低,高年龄组危险度高;变量分析,以低年龄组为基准,中间年龄危险度低,高年龄组危险度高; 分别以中间年龄组和高年龄组为基准分别进行分析分别以中间年龄组和高年龄组为基准分别进行分析第15页/共30页可能的矛盾结果及原因分析 因素应有意义,回归系数无统计意义; 回归系数的符号与专业意义相反 变量筛选过程中变量有进有出,变量间作用可能有包含有重叠作用 选用不同的水平,结果相差较大或截然不同的结果 选用不同的基础水平或不同的变量设置或转换方式结果相差较大或相反。第16页/共30页可能的矛盾结果及原因分析 变量(因素)间有相关性共线性 重要直接的变量未调查或未引入模型 样本有偏性或有局限,取值范围

12、较窄 样本量较少 变量设置不合理 研究问题不适合用乘法Logistic回归模型,还有加法模型,幂转换模型、非线性模型或其他模型第17页/共30页可能解决的处理方法 Data cleaning 分析数据结构数据的分布范围、相互关系,因素和变量重新设置,其他多元统计方法先处理或专门的分析模型; 从专业上分析研究问题的重要变量和样本的局限性,取值范围是否较窄; 深入进行因素分析,重新设置变量取值 试用其他分析模型,加法模型,构造非线性模型,广义相对危险度模型第18页/共30页Logistic模型参数意义与结果选取 病例对照研究b0受病例组与对照组从相应总体抽样的抽样比(1,0)影响,其关系为b0=

13、b0*+ln(1 /0); 病例对照研究中,当因素为两分类时,OR=eb; 在任何设计中,当因素为有序多分类或数值变量时,OR=exp(b(xk-x1)第19页/共30页例某研究者欲比较3个不同的药物治疗病情不同的某病的效果,研究数据见表12-1,试对数据进行Logistic回归分析 第20页/共30页第21页/共30页第22页/共30页第23页/共30页Deviance and Pearson Goodness-of-Fit Statistics Criterion DF Value Value/DF Pr ChiSq Deviance 2 0.3749 0.1874 0.8291 Pear

14、son 2 0.3689 0.1844 0.8316 Number of unique profiles: 6 Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 797.017 641.326 SC 801.375 658.757 -2 Log L 795.017 633.326 R-Square 0.2444 Max-rescaled R-Square 0.3268 第24页/共30页Testing Global Nul了 Hypothesis:BETA=0 Test Chi-Square D

15、F Pr ChiSq Likelihood Ratio 161.6907 3 .0001 Score 148.1598 3 .0001 Wald 118.1394 3 ChiSq DRUG 2 95.0859 0.0001 DEGREE 1 47.4607 ChiSq Intercept 1 -1.9594 0.2229 77.2441 0.0001 DRUG 2 1 1.8342 0.2406 58.0936 0.0001 DRUG 1 1 2.2850 0.2479 84.9472 0.0001 DEGREE 1 1.3806 0.2004 47.4607 0.0001 第26页/共30页 log ( ) -1.9594 2.28501 1.83422+1.3806 it PDRUGDRUGDEGREE Odds Ratio Estimates Point 95% Wald Effect Estimate Conf

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论