版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic(结局分类变量(结局分类变量+时间④1个因变量Y是数变1个自变量②2个以上自变量③多重回Multiple简单回SimpleLogistic回Logistic生存分Cox回回归分Y是分型变① 医医学研究中以分类变量作为结局指标的情况非常普二分类变():生存与、发病与不发病、有效与无效、与未等。有序多分类资料(Y):疾病程度(轻度、中度、重度、治疗效果(治疗、显效、好转、无效)等多项无序分类变量(Y)60年代初学者提出用Logistic回归模型解决因变分类问题,而计因变量Y是连续且服从量和因变量呈线性关线性回归模
logistic回归模变量的分布问题,补充完善了线性回归模型的缺陷2.2.根据设计中病例和对照是否条件Logistic回归:用于分析匹配的病例对照研LogisticLogistic几个基本概 Logistic回归模型简Logistic回归模型的拟 Logistic回归模型用途和注意事例18-为了解某非甾体抗炎药临消化道道;同期没有服用该药的44634例对照中,有96例上消化道。 三个三个基本概念优势、优势比、相度 abcd在服药组(X=1),事件发生(Y=1)即的优势为
Odds a
1 1 1在对照组(X=0),也可算出的优势
优势(odds优势(odds):通常把出现某种结果的概率与不出的概率之比称为~,或称比值,即:odds 1
1 OR
/11/10ˆ含义
1
1
优优势比(OddsRatio,OR):的优势与服药的优势之比,具有概率风险的含义服药组的优势是药组优势的1.5306倍
服药 率
非服药组
相相度(RelativeRisk,RR):即病例组率与对照组率之比含义:服药组率是药组的1.529倍OROR值和RR值的关系当研究出现阳性结果的概率较小时(<0.),反之当概率很大(>.9)时,值和值非常接近,这时可用值近似地表示的大小。1.1.Logistic回归适用条件 出现阳性结果(患病、有效、等Y
出现结果(未患病、无效、存活等自变量:1.数值型连续变量,如顺序型分类变量,如组名义变量(需要转换成哑变量)1个自变量:单自变量Logistic回归如因变量(Y)是二分类变量的情况1阳性结果(患病、有效、等Y0结果(未患病、无效、存活等能否建立类似于线性回归的ˆ
b2X
...
bpX22.建模思路建立函数Y=f(x)用来近似地描述Y和X之间关系:很难找到一个函数方程Y=f(X),当X变化时,对应Y仅取两个或几个有限值。新思路:不直接分析Y与X的关系,分析Y取某值(事件)的概率π与X的关系,其对应的函数值π介于[0,1]间0
1X1
2X
....
iX:依旧存在⑴等号两边取值范围、⑵曲线关联的问1970年,Cox引入了常用于人口学领域的Logit变换优势(odds):出现某种结果的概率与不出现的概率之比
1Logit变换:将odds取以e为底的对数,即称~
ln( 1等式左边(因变量)的取π:发病概0≤π≤1-:不发病概0≤1-π≤ 1
:优势
01
ln ):优势的对数1
ln( )1概概率函数公式的变化及意义logistic回归模型关关
))
01X1
2X
...
pX截(截(Logitmodel)、MixedLogit模型等。logistic回归分析的基本原理可推导出关于概率π的方程为ln
ln(odds)
X ....1
数学变e 0 .... 1e01X12X2 iXi11e(01X12X2....iXi称:Y取值为1或0时,关于某个自变量的Logistic回归模概率π与偏回归系数βi之间的关 βi>0时,呈拉长的S形曲线,π随X的增大而单调增加,称X为自变量发生的。βi=0π随X没有关系βi<0时,呈拉长的反S形曲线,π随X的增大而单调递减,例18-1为了解某药 ;同期没有服用该药464例对照中,有6例上消化道 。赋值Y=1:有消化道Y=0:无消化道
)1
X
odds
e0XX=1,服药组
e(0
e(0X=0,未服药组odds
e(0
e0odds
e0 服药组对未服药组的优势比OR(odds
e0 eβ为X增加一个单位后(存在该),与增加前(不存在)相比,阳性事件(Y=1)发在Logistic回归模型中,自变量X每增加1单位,对应的优势比
OReβX增大是疾病X的变化与疾病无X增大是疾病的保护ln( )ln( )ln(odds)X10 22....iiβ0(常数项):表示在模型中所有自变量X均为0时的lnodds)值,效应事件发(Y=1)生优势(odds)实际意义:在不存在任何潜在/保护因素条自然对数值,或指效应指标Y发生与不发生的概率之
11-1
)-
1-
-
ln(ln( )ln(odds)X10 22....iiβi为自变量Xi的Logistic回归系数,表示在其它自变量取值不变的情形下,Xi每变化一个单位后与增加前相比 logisticlogisticln XXln XX10 回归模回归模YY01X12X2
1模型的解释模型的解释β0、βiei
)-
)eex 1 1e01x1k1
模型解释模型解释β0、例18-为了解某非甾体抗炎药临消化道道;同期没有服用该药的44634例对照中,有96例上消化道。 【案例解析 因变量的类型:二值因变量,单个自变资料收集方法:病例-对照不匹配非条件二项Logistic回归模22×2上消化道与是否服频11000赋值Y=1:有消化道Y=0:无消化道
估计参数:β0、
极大似然检验整个模——似然比检检验单个自e0列出回归方回归方程的统计应
1e0回回归系数的估极大似然估计umlikelihoodestimate,两个模型的对数似然函数变化来进行,其统计量为G(又称Deviance)回回归模型和系数的假设检验⑴似然比检验(likelihoodWald2检验:样本量大时可用,常用于对回⑶得分检验MLEMLE。 的概率大。故这一枪极大可能是猎人打的。 例:有一事件A,它发生的概率只可能是P=0.1,0.3或若一次观测中,事件A竟然发生了,试推想一下P应取何值?你自然会认为事件发生的概率是。最大似然原理:概率大的事件在一次观测中更容易发生。回回归方程和系数的假设检验似然比检验和Wald2检验,二者都是基于MLE,就大加上这样的约束不应该引起似然函数最大值的大幅度降低。Logistic回归分析SPSS拟合模型默认取值水平高的为阳性结伪决定系ModelModelSummaryparameterestimateschangedbylessthan.001.1RSquareRSquare-2LogORVariablesintheB-tp服药11Waldx2aVariable(senteredonstep1服药ln
6.140
0.426回归模型的解释
1常数项是未服用该药品人生症状”优势估自变量X的回归系数是优势估计值的自然对数估计未服用该药品人生症状”的优势为Odds=exp(-总体OR的95%置信区间道症状的。为评价服用非甾体类药物是否引起消化道的状,用回顾性的了47136例服药患者的消化道情况,另外用4例未服药的患者作为对照。logistic回归分析显示:服用非甾体类药物与消化道的 StandPOddalimentary StandPOddalimentary -复(结局分类变量(结局分类变量+时间④1个因变量Y是数变1个自变量②2个以上自变量③多重回Multiple简单回SimpleLogistic回Logistic生存分Cox回回归分Y是分型变① 因变量Y是连续且服从量和因变量呈线性关线性回归模
logistic回归模变量的分布问题,补充完善了线性回归模型的缺陷 logisticlogisticln XXln XX10 回归模回归模YY01X12X2
11-1
)-
)eex 1 1e01x1k1
模型的解释β0、βi
ei估计参数:β0β1β2
极大似然检验整个模——似然比检检验单个自——Wald检3.logistic回归模型拟合步骤列出3.logistic回归模型拟合步骤统计应
e Xe X .... 1e01X12X2 iXi分析影响因素,定量描述其作(一)单个自变量的(一)单个自变量的logistic上消化道与是否服频11000赋值Y=1:有消化道Y=0:无消化道
Logistic回归分析ORVariablesintheB-tp服药11Waldx2aVariable(senteredonstep1服药回归模型的解释ln
6.1400.4261常数项是未服用该药品人生症状”优势估自变量X的回归系数是优势比估计值的自然对数1.样本优势比OR值总体OR的95%置信区间道症状的。思考说明:当解释变量只有一个时,用logistic模型的结果方检验的结果等价,只是logistic提供的信息些βi表示在其它自变量取值不变的情形下,Xi每变化一个单ORi表示在其它自变量取值不变的情形下Xi每变化一个单ln(ln( )ln(odds)X10 22....ii多自变量logistic回
校正混杂因筛选影响因疾病预测与预例例对某医院肿瘤防治中心105例鼻咽癌新发病例与130 肿瘤族害接吸饮锻工压组Y10000000102000101110…010000001X1男:1X1男:1,女X2(岁X3肿瘤否:0,是X4慢性鼻炎否:0,是X5职业接触物否:0,是X6吸否:0,是 饮否:0,是 长期锻否:0,是X9生活工作压否:0,是Y分病例:1,对照女【案例解析因变量的类型:二分类的因变量,单个自变量资料收集方法:病例-对照不非条件二分类Logistic回估计参数:b0b1b2、…列出回归方
极大似然检验整个模——似然比检检验单个自——Wald检e01x1kP1
e0
k回归方程的统计应Logistic回归模型的假设检检验整个模型,即检验因变量与自变量之间的→用似然比检验(likelihood检验单个回归系数是否为,即检验单个自变量对因变量的影响是否存在。→
2检。结果报告一:结果报告一:变量 X纳入模型的方X1男:1,女直接纳X2(岁直接纳X3肿瘤否:0,是直接纳X4慢性鼻炎否:0,是直接纳X5职业接触物否:0,是直接纳X6吸否:0,是直接纳 饮否:0,是直接纳 长期锻否:0,是直接纳X9生活工作压否:0,是直接纳Y分男:1,女直接纳为研究鼻咽癌发病的,对某医院5例鼻咽癌新发病例与名健康人进行病例对照研究,采用非条件logistic回归分析,向后逐步筛选变量(进入标准α=0.05,剔除标准α=0.05),结果显示:肿瘤史、职业有害接触、吸烟是其发病的;长期体育锻炼是其发病的保护因素变量有统计学意义,P<0.001,其OR值的估计值等见下表示。表 鼻咽癌发险因素的logistic回归分析结解释变SE(POR及鼻咽癌9.043(职业有害接2.439(吸4.143(锻-0.255(常数—例2 为研究居民两周患病未治疗的影响因素,采用多阶段分层整群抽样,对某地1,790名农村居民进行了入户 。,790名居民中, 前二周患病者1649人,其中未就医者70人,有关资料如下。••年人均收医疗保距就近医疗点时间自感疾病严重程度发病时指标赋值 变 X1男:0,女X2 <5岁:1,5岁~:2,15岁~:3,45岁~:4X3年人均收 不低于平均水平:0,低于平均水平X4医疗保 有:0,无X5距就近医疗点时间<10min:1X6自感疾病严重程度不严重:1,一般:2,严重XX7发病时分类变量(名义变量慢病两周内发生Y就 就诊:0,未就诊注意:无序分类变量(或称名义变量)110201300110201300。为研究过去两周内患病居民未治疗率的影响因素,采用现况方法,了过去两周内患病者1人,采用非条件logistic回归分析,向后逐步筛选(进入标准α=0.05,剔除标准α=0.05)变量,结果显示:、自感疾病严重程度和发病时间三个变量有统计学意义(P<1),O值的估计值分别为1.262、0.544、0.606(类别1与3相比)和0.71(类别2与3比),OR值的95%置信敬意分别为(1.128,1.412)、(0.468、0.632)、(0.480,0.766)和(0.495,1.022) StandPOddalimentary -【Logistic回归分析的用途筛选,并确定其作用大小校正混杂因素预测:预测某个间的独立性不适合运用于研究间具有性特足够的样本量比较有把握的10个样本变量的赋值数值变 二分变分类变
无序分
多分等距有序分类-
不等距变量的赋值连续型变量:原数据形式、离散化有序分类变二分类变量:用0、10被当作参照水平,出现阳性结果(患病、有效、等Y出现结果(未患病、无效、存活等有序多分类变量按照各水平间合理的、易解释的正确作
哑变量有序多分类变等距资不等距资料:哑变量无序多分类变量:哑变量
整进整模型评价:即评价模型拟合效果,即评价模型的预测值和观测值是否一致,用拟合优度检验。 标准化回归系数:用来评价各自变量对结局变量影响程度的大小关系。 :简单线::线性回:
X多重线回
01X1
2X
....iX分logistic回
只1个或或ln X10e01e0多个X: ln
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人员密集场所应急疏散演练
- 新生儿肺炎的治疗及护理
- 广州电影院租赁合同样本
- 美发师形象设计合同
- 铝单板施工合同住宅小区外墙翻新
- 客户索赔管理办法合同管理
- 网络安全销售合同评审指南
- 体育馆自来水施工安装协议
- 石化弱电工程安装协议模板
- 商业综合体人防设备施工合同
- 口才与演讲实训教程智慧树知到期末考试答案2024年
- 智慧教育发展趋势智慧课堂
- GB/T 43635-2024法庭科学DNA实验室检验规范
- 劳动仲裁:如何处理仲裁证据
- 大酒店劳务派遣服务专项方案
- 诗歌朗诵与表演实践案例
- 医院培训课件:《病室环境管理》
- 中国感染性休克指南
- 人教版劳动教育二年级上册全册教学设计
- 2021年初中部汉语听写大赛题库
- 大数据治理与服务管理解决数据孤岛问题的关键措施
评论
0/150
提交评论