Stata做logistic回归.ppt_第1页
Stata做logistic回归.ppt_第2页
Stata做logistic回归.ppt_第3页
Stata做logistic回归.ppt_第4页
Stata做logistic回归.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用Stata做logistic回归,何保昌,实际生活中经常会遇到因变量只有0和1的二分类变量,不能满足正态性和方差齐性,故不能直接使用线性模型来拟合方程。Logistic回归正是处理因变量是二分类或多分类变量的一种方法。现已广泛应用于队列研究,病例对照研究和试验性研究,成为分类因变量的首选多变量分析模型。,分类,按因变量性质,可分为二分类、无序多分类、有序多分类。按是否匹配可分为非条件和条件logistic回归。,Stata软件专门有一组命令用于做不同类型的logistic回归,例如:logit、blogit、glogit、clogit、mlogit、ologit。,1.Logistic回归,命令:logit因变量自变量,选择项,在进行logistic回归时要注意资料的形式。通常,用于logistic回归的资料有三种形式:(1)分水平频数资料,一般自变量较少,且均为分类变量,常以各变量(包括因变量、自变量)各水平的组合的频数表形式出现。如例1。拟合时仍用上述命令,只是命令中增加fw=频数变量选择项。,(2)分组频数资料,一般自变量较少,且均为分类变量,常以各自变量(不包括因变量)各水平的组合的频数表形式出现,因变量常表达为分子与分母。如例2。用下列命令:blogit阳性数变量总观察数变量,logit命令选择项或glogit阳性数变量总观察数变量,level(#)or(3)个体水平资料,即一个观察对象一条记录。如例3,直接使用logit命令估计即可。拟合模型后可以用指令predict得到预测概率,然后进行模型诊断、应用等。,例1本例是探讨妇女使用雌激素与患子宫内膜癌之间关系的病例-对照研究资料,见表1,请计算OR及其95可信区间。再用logistic回归估计参数,写出回归方程,并说明回归系数与OR的关系。,也可以用logit命令,可以利用例3做逐步回归,Stata用于逐步回归分析的命令是在要执行的命令前增加sw。sw回归命令因变量自变量,筛选变量的P值选择项其中,筛选变量的P值有3种组合pr(#)/*后退法pe(#)/*向前法pr(#)pe(#)/*逐步后退法pr(#)pe(#)forward/*逐步向前法,pr(#)是剔除变量的P值,pe(#)是选入变量的P值,如果只选pr(#),则表示用后退法,如果同时选用pr(#)和pe(#)表示逐步法。应用时,为防止计算进入死循环,pr(#)须略大于pe(#)。例如,pe(0.05),pr(0.051)。,1.用逐步后退法,剔选变量的概率为:pe(0.05),pr(0.06),结果如下:swlogityx1x2x3,pe(0.05)pr(0.06)2.用逐步前进法,剔选变量的概率不变,结果如下:swlogityx1x2x3,pr(0.06)pe(0.05)forward,条件logistic回归,非条件logistic回归适用于平行组设计的病例-对照研究,队列研究,而不适用于配比设计的病例-对照研究。对于配比的病例-对照研究资料需要用条件logistic回归。其命令为:clogit因变量自变量,group(配比变量)level(#)or其中group()是必选项,它是用来区分各配比组的。level(#)及or的意义同logit。,例4在子宫内膜癌与使用雌激素关系的研究中,运用了1:4的病例-对照研究,配比因素为年龄,共调查了20对,100例。,各变量定义如下:1:match配比组2:yy=1:病例,y=0:对照3:htht=0:无高血压,ht=1:有高血压4:estest=0未使用过雌激素,est=1:使用过雌激素5:dose剂量:dose=0:未使用过,dose=1:0.1-0.299(mg/day)6:drugdrug=0:未使用其他药物,drug=1:使用了其他药物,首先,使用ht、est、drug三个变量作条件logistic回归。.clogityhtestdrug,group(match),结果显示,患高血压(ht)及使用其他药物(drug)与子宫内膜癌无关,而使用过雌激素者患子宫内膜癌的可能性比未使用过雌激素者大。因此,可以进一步考虑剂量-反应关系。变量剂量(dose)可以按两种方法处理,先按线性形式进入模型,再以哑变量形式进入模型,并比较两者的结果。clogityhtdosedrug,group(match),结果显示,随着剂量的上升,服用雌激素与患内膜癌间的联系也明显上升,呈现出明显的剂量反应关系。这种关系是否为线性的?dose用哑变量形式是否更好?xi:clogityhti.dosedrug,group(match),多类结果的logistic回归,在医学研究中,常常会遇到结果变量是多分类的情况,如同一种肿瘤的不同亚型;病例-对照研究中的一个对照组,两个或多个病例组;或一个病例组,两个或多个对照组,如医院对照和健康人群对照等。,用于多类结果的logistic回归的命令是mlogit。,mlogit因变量自变量,base(#)constraints(clist)level(#)rrr,例5产后大出血分为两大类:即宫缩乏力性(称为子宫因素)及胎盘因素。在产后大出血与有无妊高症x1及有无人流史x2的关系研究中,将产后出血量400ml的作为病例,并分为上述两类,共调查了933人,其中子宫因素出血的155人,胎盘因素出血的33人,对照745人。结果见表5。本例,结果变量为:y=0为对照(C类)y=1为宫缩乏力性产后大出血(A类)y=2为胎盘因素产后大出血(B类)。,mlogityx1x2fw=count,rrr,同一变量在不同的logit函数中的效应可能相同,亦可能不同,这可以通过test命令来检验。,test1x1=2x1test1x2=2x2,有序结果的累积比数logistic回归,用于有序结果的logistic回归的命令是ologit。ologit因变量自变量,tablelevel(#)其中选择项table用于指定打印出各类的概率;level用于指定显著性水平,例6南通医学院陈佩珍教授研究了儿童智商等级与其母亲文化程度的关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论