Logistic回归在医学中应用_第1页
Logistic回归在医学中应用_第2页
Logistic回归在医学中应用_第3页
Logistic回归在医学中应用_第4页
Logistic回归在医学中应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Logistic回归在医学中应用摘要Logistic回归模型是一种概率模型,适合于病例—对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究。本文在spss环境下利用logistic回归方法分析南非心脏病与那些因素有关。关键词:Logistic回归;心脏病、引言Logistic回归(logisticregression)属于概率型非线性回归,是分析反应变量为独立分类资料的常用统计分析方法,由于对资料的正态性和方差齐性不做要求、对自变量类型也不做要求等,使得近年来Logistic回归模型在医学研究各个领域被广泛用,如流行病学、病因学的队列研究、病例对照研究,临床诊断的判别模型,治疗效果评价等。Logistic回归在单独面对医学领域日益庞大和复杂多变的数据信息时,往往受到一定的限制,无法使数据信息得到充分利用,应用不当还会得出错误结论。因此随着统计学方法的不断发展和新的统计学方法的出现,Logistic回归在越来越多的医学研究的文献资料中常常不再独自出现, 而是与其他方法相互结合取长补短,充分利用资料中的信息,从而得出相对正确的结论。本研究将对近几年Logistic回归在医学研究中与其他方法相互结合及比较应用作简要介绍。Logistic回归模型是一种概率模型,它是以疾病,死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项,多项分类的资料。在临床医学中多用于鉴别诊断,评价治疗措施的好坏及分析与疾病愈后有关的因素等。心脏病学是研究心脏疾病的医疗学科,它是一门既年轻又古老的医疗学科。古老是因为心脏病学起源较早,年轻是因为心脏病学发展比较缓慢,21世纪以后来取得突飞猛进的发展。心脏病学在医学中占着举足轻重的地位,心脏病学的完善发展将关系到人类的健康。二、logistic应用(一)数据简介南非心脏病数据收集了160名患心脏病的病人病历数据,对照组为没有患心脏的正常人302名,收集了10个相关指标变量,希望建立病人患心脏病的关系模型。Chd是目标变量:病人是否患有心脏病。9个影响变量为:sbp(收缩压)、tobacco(累计吸烟量)、ldl(低密度脂蛋白)、adiposity(肥胖指数)、famhist(家族心脏病史)、obesity(脂肪指标)、alcohol(酒精量)、typea(A型行为)、age(年龄)。(二)数据分析DependentVariableEncodingOriginalValuenternalValue健康0患病1上表为因变量赋值情况。BinaryLogistic过程默认以因变量较大取值的概率P(Y=1),而不是以P(Y=0)建立模型。1 、Block0:BeginningBlockClassificationTablePredictedchd是否患病PercentageObserved健康患病CorrectStep0 chd是否患病 健康3020100.0患病1600.0OverallPercentage65.4a・Constantisincludedinthemodel.b.Thecutvalueis.500首先给出的是模型不含任何自变量,而只有常数项时的输出预测分类结果,此时所观察对象都被预测为未康复,总的预测准确率为 65.4%。VariablesintheEquationB S.E. Walddf Sg.Exp(BSte Con6350982061000530P值为0拒绝原假设,模型显著。模型中只有常数项的检验结果

VariablesnotintheEquationScoredfSig.Step Variables sbp收缩压17.0941.0000 tobacco 累计吸烟量41.5021.000Idl低密度脂蛋白31.9691.000adiposity 肥胖指数29.8351.000famhist 家族心脏病史(34.2741.000typeaA型行为4.9161.027obesity脂肪指数4.6291.031alcohol酒精量1.8061.179age年龄64.2681.000OverallStatistics109.0399.000该表反映的是如果将现有模型外的各个变量纳入模型,则整个模型的拟合优度改变是否有统计学意义。若将Sbptobacco、Idl>adiposity、famhist、typea、obesity、age引入,p值<0.05系数不为0,则模型改变有统计意义,而将alcohol引入,系数为0,则模型改变无统计意义。八个因素都与心脏病有关.由于在对某一因素进行单因素分析时没有控制其它因素的干扰,因此结果不可靠.2 、Block1:Method=EnterOmnibusTestsofModelCoefficientsCh-squaredfSig.Step1Step139689.000Block139689.000Model139689.000这是模型总的全局检验,为似然比检验,共给出三个结果:Step统计量为每一步与前一步相比的似然比检验结果; Block统计量是将Block1与Block0相比的似然比检验结果;Model统计量则是上一个模型与现在模型相比的似然比检验结果。Predictedchd 是否患病 |>ercentageObserved健康患病CorrectStep1 chd 是否患病 健康2564684.8患病778351.9OverallPercentage73.4ClassificationTableaa.Thecutvalueis.500该表为引入9个变量的模型对因变量的分类预测情况。预测准确率由 65.4%上升到73.4%,说明新变量的引入对改善模型预测效果的确有意义。

VariablesintheEquationBS.E.WalddfSig.Exp(B)Stepsbp收缩压.007.0061.2881.2561.0071 tobacco累计吸烟量.079.0278.9031.0031.083ldl低密度脂蛋白.174.0608.4981.0041.190adiposity肥胖指数.019.029.4031.5261.019famhist家族心脏病史.925.22816.4881.0002.523typeaA型行为.040.01210.3291.0011.040obesity脂肪指数-.063.0442.0211.155.939alcohol酒精量.000.004.0011.9781.000age年龄.045.01213.9011.0001.046Constant-6.1511.30822.1041.000.002a.Variable(s)enteredonstep1:sbp收缩压,tobacco累计吸烟量,IdI低密度脂蛋白,afamhist家族心脏病史,typeaA型行为,obesity脂肪指数,alcohol酒精量,age年龄.由上最大似然估计分析知,对于变量 sbp、adiposity、obesity、alcohol的Wald检验结果P>0.05表明,收缩压、肥胖指数、脂肪指数、酒精量对心脏病无影响;对于变量tobacco、ldl、famhis、typea、age的Wald检验结果P<0.05表明,累计吸烟量、低密度脂蛋白、家族心脏病史、 A型行为、年龄对心脏病无影响。3.Block1:Method=ForwardStepwise(Wald)VariablesintheEquationBS.E.WaddfSig.Exp(B)S』epage年龄.064.00956.4521.0001.0661Constant-3.522.41671.6561.000.030Sbepfamhis家族心脏病史(1).934.21618.6411.0002.5452age年龄.060.00946.0671.0001.062Constant-3.759.43773.9501.000.023Sceptobacc累计吸烟量.083.02610.4221.0011.0873famhis家族心脏病史(1).975.22019.6281.0002.651age年龄.049.00926.6651.0001.050Constant-3.621.44566.3191.000.027Steptobacc累计吸烟量.083.02610.1391.0011.0874famhis家族心脏病史(1).952.22318.2561.0002.591typea型行为.038.01210.1671.0011.039age年龄.055.01030.6471.0001.057Constant-5.939.88145.4181.000.003S』eptobacc累计吸烟量.080.0269.6461.0021.0845ld低密度脂蛋白.162.0558.6851.0031.176famhis家族心脏病史(1).908.22616.1831.0002.480typea型行为.037.0129.3061.0021.038age年龄.050.01024.4451.0001.052Constant-6.446.92149.0051.000.002\6riable(enteredonstepgt年龄.\ariable(enteredonstejamhs家族心脏病史怡riable(enteredonstejo3aco累计吸烟量\ariable(enteredonsteeplea型行为\ariable(enteredonstepd低密度脂旨蛋白易9除Sbpadiposity、obesity,建立chd与tobacco、Idl、famhist、typea、age的Logistic回归方程chd=exX-6.4460.08tob0.162ldl 0.908fam0.037typ0.05age)chd=1exX-6.4460.08tob0.162dl 0.908fam0.037typ0.05age)三、结论通过logistic回归分析得知,吸烟习惯、肥胖、家族病史和年龄是影响到患心脏病的关键因素。所以,我们要从以下几方面预防心脏病:第一,减肥。肥胖者患心脏病的比例远远高于正常体重的人,特别是“苹果形”身材的人更危险。只要老人减肥3—5公斤,心脏状况就会有很大改善。同时,专家告诫较胖的老人,不要指望自己一下子变成超级模特,要通过平衡饮食和锻炼逐渐达到减肥的目的。第二,少吃

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论