版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Logistic回归分析的判别预测功能及其应用【摘要】目的:介绍Logistic回归模型在判别分析中的应用。方法:结合实例介绍Logistic回归的判别功能的思想、原理、条件和步骤及其在医学领域的应用前景。结果:Logistic回归应用于判别分析时,显示出了较高的准确性和较好的预测效果。结论:Logistic回归在定性和半定量资料的判别和预测方面有一定的优势,结合计算机网络技术的发展在医学领域有较好的应用前景。【关键词】Logis戤tic回归;判别分析;预测;医学应用毛Logistic回归分析在医学研究淄中应用广泛。目前主要是用于流行病学研究中危险因素的筛选,但它同时具有良好的判别和预测功能,
2、尤其是在资料类型不署能满足Fisher判别和Bayes判渝别的条件时,更显示出Logistic量回归判别的优势和效能。本研究对Log脚istic回归方程的判别分析进行了探睁讨,并用一实例介绍其应用。1多元琉Logistic回归模型介绍在多元哥线性回归模型中,因变量y的取值范围是,具体取值取决于自变量的取值范围,而霆在疾病的危险度分析中,因变量是二分类变量,又称0-1变量,如发病与不发病肢。用率P作为因变量,则P的取值范围为孝,此时要用自变量的线性组合进行变量的畦筛选、作用大小的比较和自变量交互作用的研究,就必须通过一个函数关系将因变懑量P和自变量的线性组合联系起来,这个函数关系便是Logit变
3、换,具体如下茌:设P为暴露因素为x时个体发病的概嫜率,则发病的概率P与未发病的概率1-P之比称为优势比,LogitP定义为笋优势比的对数:LogitP=ln(p隳1-p),此时LogitP的取值范围濯为,多元Logistic回归模型定义为:LogitP=+1x1+2藤x2+mxm(1)将Log潜itP看成因变量,Logistic回条归就与多元线性回归的形式是一样的1蚱,2。2Logistic回归的斫判别预测功能及用法在Bayes判别惦分析中,其后验概率的计算公式为:P(D=1|x)=exp(0+1x1+pxp)1+exp(0+1x1+pxp)(2)此公式和Logistic模型的表达式是完全摆相
4、同的,其区别在于Bayes判别分析殒是在各类内指标服从多元正态分布的前提下用判别函数法估计参数,并且需要知道先验概率,而Logistic回归估计参数却没有这一要求。它是直接根据指标纷情况通过回归模型求出某一事件发生的估计概率。因此,Logistic回归不仅具有判别和预测功能,而且限制条件少,资料要求相对低,适用于定性的或半定廉量的指标,估计各种自变量组合条件下应啐变量各级别的发生概率,在临床判别诊断和危险人群筛检中,应用前景广阔。在Logistic回归中,对两类判别问力题,记第一类y=0,第二类y=1,则呕根据指标可以建立LogitP关于自变猪量x1,x2xm的Logistic喝回归方程:Lo
5、gitP=b0+b1x笤1+b2x2+bmxm(3)得概陬率估计公式:=eb0+b1x1+b2台x2+bmxm1+eb0+b1x溜1+b2x2+bmxm(4)根蕖据估计概率进行判别归类,如果估计概率腺小于,则判为第一类;如果估计概率大于韭,则判为第二类;如果等于,暂不归类。砝对于多分类判别问题,需先建立多分类结果的Logistic回归方程:Lo挞gitPk=lnP(y=k|x)P(郎y=0|x)=bk+bk1x1+bk2x2+bk3x3+bkpxp=稍gk(x)(5)k=1,2,k-遁1各类结果的条件概率为:Pk=P缺y=k|x=egk(x)k-1i=0egk(x),k=1,2,退k-1(6)
6、分别计算各样品属于各类裳之概率,并根据概率大小判别归类,即属婚于哪一类的概率最大就判别为哪一类2訇,3,7。3Logistic回镜归判别法的应用条件应用Logistic回归做判别预测时,应当注意资料的猬分布类型、资料的收集方法,在正确选择茚模型和了解模型中参数的意义的基础上做珏出判别预测。(1)非条件Logis荒tic回归适合于队列研究、病例对照缫研究,同样也适合于现况调查中的病因学李研究。按3种不同抽样方式作Logis疖tic回归,除病例对照研究资料的常呜数项与另外两种不同外,回归系数的意义相同。因此,队列研究和现况调查的非条忉件Logistic回归可直接计算预测踉概率;而病例对照研究的非条
7、件Log对istic回归得不到的估计值,在得举到模型估计参数后,需要对常数项进琪行校正,即:=-lnn1q0n0q1(7)其中n1和n0分别为病仙例和对照的样本含量,q1和q0为特定瞅人群中发病和不发病的先验概率,可以根狁据经验作出估计。然后再用调整后的作馅为Logistic回归方程的常数项就埤可以计算预测概率。(2)条件Log毁istic回归适用于配比资料的Log蝓istic分析。在条件Logisti匹c回归模型中,常数项i是配比组特有使的,它的意义是该配比组的各自变量均为菟0时的基线风险,不同的配比组i可以各不相同。在模型建立的过程中,i因混为同一层病例和对照的基线患病率相同被(抵消了,因
8、此条件Logistic回归毁只估计了表示危险因素作用的m值,即颠LogitP=1x1+2x2+mxm(8)因为没有常数项,条阐件Logistic回归不能直接作概率谔预测,但可以通过估计比数比OR起到预香测的作用。在Logistic回归中,咎回归系数m与衡量危险因素作用大小的皤重要指标OR有一个对应的关系,如比较鳋某一危险因素的两组不同暴露水平xm和跽xm的发病情况,则该因素的比数比为仫OR=expbm(xm-xm)特殊的,如果取暴露组水平xm=1,对守照组水平xm=0,则暴露组与对照组坝发病的比数比OR=exp(bm),多变量联合比数比为各变量比数比的乘积。对于某一个体,可以先确定各个危险因素
9、牖的暴露等级,明确其所属暴露组,然后求抻该暴露组与对照组的多变量联合比数比。藓根据多变量联合比数比的大小可以估计该个体所属暴露组与对照组相比可能的发病情况4。4应用举例在研究医膀院抢救急性心肌梗死病人能否成功的危险搔因素的调查中,某医院收集了5年中该院镌所有的AMI病人的抢救病史,共200佚例,其中P=0表示抢救成功,P=1表掾示抢救未能成功而死亡;x1=1表示抢栋救前已发生休克,x1=0表示抢救前未戕发生休克;x2=1表示抢救前发生心力衰竭,x2=0表示抢救前未发生心力衰榜竭;x3=1表示病人从开始AMI症状耪到抢救已超过12小时;x3=0表示病人从开始AMI症状到抢救未超过12小询时。本例
10、将医院所有AMI病人看作是A铲MI总体中的一个随机样本,属于横断面昵研究,同时考虑3个变量x1,x2,x3的Logistic回归,资料经统计阴软件计算,得到相应的Logistic屯回归表达式为:Logit(P)=-+匹+(10)用似然比检验对模型进行湔拟合优度检验,经检验P=,无统计学意义,说明该模型拟合资料较好,可以用作驵预测。如某AMI病人在有AMI症状后麂5小时送到医院时,未发生休克但已有心荔衰症状,用上述模型计算得到抢救失败的概率是,抢救成功的概率为=,因此预测该病人抢救成功;另一病人在有AMI症钷状后18小时送到医院,已发生休克和心衰症状,用上述模型计算抢救失败的概率钍为,抢救成功的
11、概率为=,因此预测该病人抢救可能失败3。5Logi螋stic回归的判别效能在判别预测问乞题上,我们不能说哪一种判别方法最好。锊无论用哪种判别方法去判断样品的归属问南题,均不会永远作出正确的判断。因为任裢何一种判别方法,所采用的训练样本总是狐有局限性的,不能完全准确地反映总体信碲息,所以依据训练样本得出的判别规则有鸿缺陷是难以避免的。因此,判别效能的提箍高是一个综合的过程。首先要保证训练样憩本的代表性,训练样本应最大限度的代表总体情况,才能保证判别的效果;其次是榆指标的选择,应通过筛选挑出较好的指标斗来建立方程,增加判别函数的稳定性,从锩而提高判别效果;最后是根据资料的类型蹦选择合适的判别方法。
12、如果方法选择不对锇,则会大大降低判别的准确率。Log殿istic回归在定性和半定量资料的判酱别和预测方面有一定的优势。在应用Logistic回归判别时,应注意不同L熊ogistic回归模型的应用条件,在登保证训练样本代表性的基础上,用逐步回埘归过程对指标进行筛选,挑选出对应变量作用最大的指标建立回归方程,通过组内瓷回代、组外考核和拟和优度检验等方法检罐验判别效果。由上述讨论可知,判别分来析在临床判别诊断和危险人群筛检中,方阐便快捷、准确性高。随着计算机的普及、涟动态交互网络技术和数据库技术的飞速发睚展以及人们获取数据手段的多样化,各种锩判别方法在计算机辅助诊断和网上咨询中会有广泛的应用前景和发展空间,并发挥驻不可估量的作用6。【参考文献】1陈景武.卫生管理多因素分析.山东帐大学出版社,1994.2陈锋.医用后多元统计分析方法.中国卫生统计出版社,2001.3方积乾.医学统计学与探电脑试验.第2版.上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年企业内部培训与发展体系手册
- 2025年医疗机构药品管理制度
- 商圈调查培训
- 城市道路施工进度调整制度
- 车站人员培训考核制度
- 2025年医疗器械采购与验收规范
- 财务资产管理制度
- 办公室设备维护保养制度
- 2026年黄埔区九佛街道办事处公开招聘党建组织员和政府聘员5人备考题库及答案详解一套
- 近八年江苏省中考化学真题及答案2025
- 化工厂班组安全培训课件
- 土石方土方运输方案设计
- 2025年压力容器作业证理论全国考试题库(含答案)
- 2025四川成都农商银行招聘10人笔试备考题库及答案解析
- 中职第一学年(会计)会计基础2026年阶段测试题及答案
- 营业执照借用协议合同
- 室外长廊合同范本
- 2025年秋苏教版(新教材)初中生物八年级上册期末知识点复习卷及答案(共三套)
- 2025年小升初学校家长面试题库及答案
- 2025年危化品泄漏应急培训教案
- 2025年资产清查自查报告
评论
0/150
提交评论