Logistic模型及其应用_第1页
Logistic模型及其应用_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Logistic模型及其应用如果应变量为分类的变量,则不符合一般回归分析模型的要求,可用logistic回归来分析。简单的Logistic回归需调用SAS中LOGISTIC过程完成,一些较复杂的则需要调用CATMOD过程来实现。我们重点介绍LOGISTIC过程的用法,通过实例说明如何实现简单的Logistic回归分析。语法格式proclogisticdata=&据集【选项】;model应变量=自变量/选项;by变量;freq变量;weight变量;outputout=数据集key=新变量名;语法说明LOGISTIC过程,用最大似然法对应变量拟合一个Logistic模型。除了PROClogistic和MODEL语句为必需,其他都可省略。【过程选项】OUTEST=数据集名指定统计量和参数估计输出的新数据集名。NOPRINT禁止统计结果在OUTPUT视窗中输出。ORDER=DATA|FORMATTED|INTERNAL规定拟和模型的应变量的水平顺序DATA:应变量的顺序与数据集中出现的顺序一致FORMATTED:按照格式化值的顺序,为默认的选项,相当于应变量所赋值的大小顺序INTERNAL:按照非格式化值的顺序DESCENDING|DES颠倒应变量的排列顺序,如果同时指定了选项ORDER,则系统先按照ORDER规定的顺序排列,然后则降序排列。就是说,如果应变量的赋值,死亡为1,存活0,为了得到死亡对存活的概率(或者说是死亡的风险),应选择此选项,否则得到的是存活对死亡的概率。【MODEL语句】MODEL语句指定模型的自变量、应变量,模型选项及结果输出选项,如要拟和交互作用项,需先产生一个表示交互作用的新变量。可以拟合带有一个或多个自变量的Logistic回归模型,用最大似然估计法估计模型的参数,打印出模型估计的过程和模型参数的可信区间。MODEL语句中常用的选项有:NOINT在模型中不拟合常数项,在条件的Logistic回归中用到。SELECTION=FORWARD(或F)|BACKWARD(或B)|STEPWISE|SCORE规定变量筛选的方法,分别为向前、向后、逐步和最优子集法。缺省时为NONE,拟合全回归模型。SLE=概率值,指定变量进入模型的显著水平,缺省为0.05SLS=概率值,指定变量保留在模型的显著水平,缺省为0.05CL|WALDCL,要求估计所有回归参数的可信区间CLODDS=PL|WALD|BOTH,要求计算OR值的可信区间PLRL,对所有自变量估计OR的可信区间应用实例例8.4某工作者在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析。表中有关符号意义说明:i:样品序号x1:确诊时患者的年龄(岁)x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级x3:肾细胞癌组织内微血管数(MVC)x4:肾癌细胞核组织学分级,由低到高共W级x5:肾细胞癌分期,由低到高共W期y:肾细胞癌转移情况(有转移y=l;无转移y=0)。假设数据已经存在于C:\user;本题的应变量为二分类变量,用最简单的logistic回归模型进行配合,采用逐步筛选法筛选变量,程序如下:libnamea'c:\user';dataa.bk4_2;inputx1-x5y;cards;243.42103149.8431proclogisticdes;选项des指定按照y=1|y=0的概率来拟合模型modely=x1-x5/selection=stepwise;用逐步回归法拟合模型run;过程名后面如果不指定选项DES,则系统按照Y=0的概率拟和模型(Y=0|Y=1),可尝试一下去掉此选项,会发现不仅应变量的排序水平颠倒了,而且所有的参数估计符号相反,OR值为原来的倒数。程序运行的主要输出结果如下:TheLOGISTICProcedureDataSet:A.BK4_2计算所用的数据集名ResponseVariable:Y应变量ResponseLevels:2应变量的水平数NumberofObservations:26观察单位数LinkFunction:Logit联系函数ResponseProfileOrderedValueYCount1192017根据ORDER和DES选项对应变量的重新排序,给出排序值和及每个水平相应的例数,拟合排序为1对应的应变量水平的概率ModelFittingInformationandTestingGlobalNullHypothesisBETA=0对模型的总的检验,无效假设为总体的B=0,InterceptInterceptandCriterionOnlyCovariatesChi-SquareforCovariatesAIC35.54217.826.SC36.80021.600.-2LOGL33.54211.82621.716with2DF(p=0.0001()相当于似然比X2检验)Score..15.844with2DF(p=0.0004)(相当于Pearsonx2检验)模型的总的检验,P值均小于0.05,故模型总体有意义。AnalysisofMaximumLikelihoodEstimatesParameterStandardWaldPr>StandardizedOddSVariableDFEstimateErrorChi-SquareChi-SquareEstimateRatio自由度参数估计标准误WaldX2P值标准化回归系数比值比INTERCPT1-12.32855.43055.15400.0232..X212.41341.19604.07190.04361.18551011.172X412.09631.08793.71310.05401.2306978.136AssociationofPredictedProbabilitiesandObservedResponses预测数和观测数的关联性分析Concordant=94.1%Somers'D=0.902Discordant=3.9%Gamma=0.920Tied=2.0%Tau-a=0.425(153pairs)c=0.951最后一部分是关于预测概率和观察到的结果的关联性,包括对不同结果的个数和四种秩相关指数的分析。逐步回归法筛选出两个有意义的变量X2和X4,其P值都小于0.05,回归系数B分别为2.4134,2.0963,比数比分别为11.172,8.136,事实上,比数比OR=ebeta。据此,写出本例的回归方程如下:LogitP=-12.3285+2.4134X2+2.0963X4。上面的方程中X4的P值大于0.05,但没有被剔除出去,这是因为所采用的筛选方法为Stepwise

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论