![21医学应用统计分析-第二十一章-多变量间关系的分析_第1页](http://file4.renrendoc.com/view5/M00/2D/03/wKhkGGZr7FqAeIW7AADJcrveFXs817.jpg)
![21医学应用统计分析-第二十一章-多变量间关系的分析_第2页](http://file4.renrendoc.com/view5/M00/2D/03/wKhkGGZr7FqAeIW7AADJcrveFXs8172.jpg)
![21医学应用统计分析-第二十一章-多变量间关系的分析_第3页](http://file4.renrendoc.com/view5/M00/2D/03/wKhkGGZr7FqAeIW7AADJcrveFXs8173.jpg)
![21医学应用统计分析-第二十一章-多变量间关系的分析_第4页](http://file4.renrendoc.com/view5/M00/2D/03/wKhkGGZr7FqAeIW7AADJcrveFXs8174.jpg)
![21医学应用统计分析-第二十一章-多变量间关系的分析_第5页](http://file4.renrendoc.com/view5/M00/2D/03/wKhkGGZr7FqAeIW7AADJcrveFXs8175.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二十一章
多变量间关系的分析主讲老师:陈青山变量1个结果变量与多个影响变量(本章);一个影响变量与多个结果变量;多个影响变量与多个结果变量。分析多变量间关系的方法(本章)一个数值变量与多个数值变量之间的关系:多元相关回归分析;一个数值变量与多个分类变量之间的关系:多因素方差分析、析因设计方差分析;一个数值变量与混合多个变量之间的关系:协方差分析、COX模型;一个分类变量与混合多变量之间的关系:Logistic回归分析,等等。第一节1个数值变量与多个数值变量之间关系的分析——多元线性回归分析概述:简单直线回归分析是分析一个结果变量Y和一个影响变量X之间的数量关系;通常一个结果变量受到多个影响变量的影响,如:糖尿病患者的血糖可能受胰岛素水平、糖化血红蛋白高低、血清胆固醇大小等指标的影响;当结果变量和所有的影响变量均为数值变量时,一般采用多元线性回归分析。基本原理多元线性回归分析原理:假定对例观察对象,逐一测定了结果变量Y与个影响变量X1、X2、X3...的数据,数据格式如表21-1。多元线性回归模型的一般形式为:公式(21-1)β0:常数项,截距;偏回归系数βm
(j=1、2、…m)::在其它自变量保持不变时,Xj增加或减少一个单位时Y的平均变化值。e:残差,去除m个自变量对Y影响后的随机误差。实例例21-1为了研究空气中废气指数与汽车流量等因素的关系,有人测定了某城市交通点在单位时间内过往的汽车数、气温、空气湿度、风速以及空气中的废气指数,数据如表21-2所示。实例分析数据特征结果变量;数值变量,废气指数(Y);影响变量:数值变量,车流(X1)、气温(X2)、气湿(X3)、风速(X4)四种变化指标。分析目的了解废气指数(Y)与车流(X1)、气温(X2)、气湿(X3)、风速(X4)之间的数量关系。统计方法采用多元线性回归分析方法。实例分析例21-1数据是一个数值变量与多个数值变量的数据库数据。其中,结果变量是废气指数(Y),为数值变量;影响变量是车流(X1)、气温(X2)、气湿(X3)、风速(X4)四种变化指标,为数值变量。本例的分析目的是了解废气指数(Y)与车流(X1)、气温(X2)、气湿(X3)、风速(X4)之间的数量关系,采用多元线性回归分析方法。SAS的计算程序SAS的计算结果1.例21-1的SAS计算结果R2(R-squares)=0.787,说明构建的回归方程可解释交通点废气指数变异性的78.7%;F(F)=24.69,P(Prob>F)=0.0001,说明拟合的回归方程解释空气中废气指数的变化是有统计学意义的。使用逐步回归法进行回归系数的估计及检验,最后有三个自变量选入方程,结果表明:废气指数(Y)与车流(X1:F(F)=22.08,P(Prob>F)=0.0001,β1(ParameterEstimate)=0.01161)、气温(X2:F(F)=5.91,P(Prob>F)=0.0246,β2((ParameterEstimate))=0.44948)和风速(X4:F(F)=11.00,P(Prob>F)=0.0034,β4((ParameterEstimate))=-3.46971)有线性回归关系,其中与风速(X4)负相关。建立“最优”回归方程:
Y=-14.200+0.012X1+0.449X2-3.470X4SPSS的操作步骤SPSS的计算结果应用多元线性回归分析表明F=24.687,P=0.000;拟合的回归方程解释空气中废气指数的变化有统计学意义。1.回归方程方差分析计算结果R2=0.787,说明构建的回归方程可解释交通点废气指数变异性的78.7%。2.回归方程拟合评价3.回归系数的估计及检验结果使用逐步回归法对例21-1进行回归系数的估计及检验,最后有三个自变量选入方程,结果表明,废气指数(Y)与车流(X1:t(t)=4.699,P(Sig)=0.000,β1(B)=0.012)、气温(X2:t(t)=2.430,P(Sig)=0.025,β2(B)=0.449)和风速(X4:t(t)=-3.316,P(Sig)=0.000,β4(B)=-3.470)有线性回归关系,其中与风速(X4)负相关。建立“最优”回归方程:Y=-14.200+0.012X1+0.449X2-3.470X4第二节
1个数值变量与多个分类变量之间关系的分析数据特征:结果变量:数值变量;影响变量:多个分类变量,用二维数据库形式呈现的数据分析。2、3个多分类变量对数值变量的影响举例:研究不同喂养方式(母乳喂养、人工喂养、混合喂养)和性别因素对周岁儿童身高的影响;不同饲料及其不同加工方法;不同喂养方法对小白鼠增重的影响……分析方法:1个数值变量与2个分类变量关系的分析两因素设计(即随机区组设计)的方差分析等1个数值变量与3个及以上分类变量关系的分析多因素方差分析等考虑各分类变量不同类别(水平)间的相互影响析因设计的方差分析等随机区组设计的方差分析数据特征结果变量:1个数值变量;影响变量:2个分类变量。分析目的两个分类变量对一个数值变量的影响是否存在差别。实例例21-2为研究甲、乙、丙营养素对小白鼠体重的影响,取6窝不同种系的小白鼠,每窝3只,随机地安排喂养甲、乙、丙3种营养素中的一种,然后测定其体重(g),结果见下表。问喂养不同的营养素对小白鼠体重是否有影响?编号分组窝别体重111642125331370…………173566183646表21-3三种营养素喂养小白鼠的体重(g)注:营养素中1为甲,2为乙,3为丙;窝别分为1,2,…,5,6种。实例分析数据特征结果变量:数值变量,体重weight(g);影响变量:多项无序分类变量,营养素分组(group=1、2、3)和窝别区组(block=1、2、3、4、5、6),组别有甲、乙、丙三种营养素组,区组有6个窝别。分析目的研究不同组别不同窝别小白鼠体重的差别,即两个分类变量对一个数值变量的影响是否存在差别;统计方法采用随机区组设计的方差分析。SAS的计算程序SAS的计算结果1.方差分析结果1.结果解释:对营养素(处理组因素)方差分析得F=31.73,P<0.0001,差异有统计学意义,可认为不同营养素组小白鼠的体重存在差异;对窝别(区组因素)方差分析得F=146.35,P<0.0001,差异有统计学意义,可认为不同窝别小白鼠的体重存在差异。2.两两比较结果结果提示:甲组和乙组小白鼠平均体重相近(有相同的字母B,差异没有统计学意义),而甲、乙组小白鼠体重低于丙组(没有相同的字母,差异有统计学意义)。SPSS的操作步骤SPSS的计算结果处理组(group)间F=31.732,P=0.000<0.05,差异有统计学意义,即不同营养素对小白鼠体重有影响;区组(block)间F=146.346,P=0.000<0.05,差异有统计学意义,即不同窝别对小白鼠体重有影响。1.方差分析结果甲组和乙组小白鼠体重相近(都在同一亚组1中),没有统计学意义;甲、乙两组体重低于丙组(处在不同亚组1、2中),有统计学意义。2.多个样本均数两两比较的SNK检验析因设计的方差分析数据特征结果变量:数值变量;影响变量:两个及以上的分类变量(且每个分类变量有两项及以上)。举例:设A因素为食物的蛋白质含量,有两个水平:含量高(蛋白质含量>10%)和含量低(蛋白质含量<4%);B因素为食物的脂肪含量,有两个水平:含量高(脂肪含量>15%)和含量低(脂肪含量<5%);欲比较不同蛋白质含量及脂肪含量对小鼠体重的影响,属于析因分析的内容。主要指标单独效应指其它分类变量各类别水平固定时,同一分类变量中各类别(水平)的差别。主效应主要研究的分类变量各水平间的差别。交互效应当某分类变量各个类别的单独效应随另一分类变量各类别水平的变化而变化,且类别间的差异超出随机波动范围时,则称这两个因素间存在交互作用。实例例21-3研究不同缝合方法及缝合后时间对家兔轴突通过率(%)的影响,结果见表21-4。问不同缝合方法的轴突通过率(%)有误差别?缝合后时间长短对轴突通过率(%)有无影响?两者间有无交互作用?编号缝合方法缝合后时间轴突通过率(%)111302113031170…………202230注:缝合方法中1为外膜缝合、2为束膜缝合;缝合后时间中1为1月后、2为2月后。表21-4不同缝合方法及缝合后时间的家兔轴突通过率(%)实例分析数据特征结果变量:数值变量,轴突通过率rate(%);影响变量:二分类变量,缝合方法(method=1、2)和缝合后时间(time=1、2)。分析目的研究不同缝合方法和不同缝合后时间对轴突通过率是否有影响以及两因素之间的交互作用。统计分析采用析因设计的方差分析。SAS的计算程序SAS的计算结果1.统计描述缝合方法和缝合后时间不同组合下阵痛时间的均数(mean)、标准差(StdDev)、最小值(Minimum)和最大值(Maximum)。2.析因设计的方差分析计算结果2.结果解释模型(Source=Model)F=2.91,P=0.0666>0.05表明模型无统计学意义;缝合方法(Source=method)F=0.60,P=0.4499<0.0001,不同缝合方法的轴突通过率差异无统计学意义,即不同缝合方法的轴突通过率没有差异时间time(Source=time)F=8.07,P=0.0118<0.0,不同缝合后时间的轴突通过率差异有统计学意义,即不同缝合后时间的轴突通过率不同;缝合方法和时间的交互作用(Source=method*time)F=0.07,P=0.7995>0.05,不同缝合方法和不同缝合后时间各种组合的轴突通过率差异无统计学意义,即两者无交互作用。本例:1月后的轴突通过率高于2月后的轴突通过率。SPSS的操作步骤SPSS的计算结果缝合方法和缝合后时间不同组合下阵痛时间的均数(mean)、标准差(StdDev)、最小值(Minimum)和最大值(Maximum)。1.统计描述2.析因设计的方差分析计算结果2.结果解释:模型(Source=Model)F=2.911,P=0.067>0.05表明模型无统计学意义;缝合方法(Source=method)F=0.600,P=0.450>0.0001,不同缝合方法的轴突通过率差异无统计学意义,即不同缝合方法的轴突通过率没有差异;时间time(Source=time)F=8.067,P=0.012<0.0,不同缝合后时间的轴突通过率差异有统计学意义,即不同缝合后时间的轴突通过率不同;缝合方法和时间的交互作用(Source=method*time)F=0.067,P=0.800>0.05,不同缝合方法和不同缝合后时间各种组合的轴突通过率差异无统计学意义,即两者无交互作用。本例:1月后的轴突通过率高于2月后的轴突通过率。第三节
1个数值变量与混合多个变量之间的关系分析协方差分析概述:协方差分析可排除非处理因素的干扰和影响,从而准确地获得处理因素的效应,对混杂因素进行控制。本质上是将直线回归和方差分析结合起来应用的一种统计方法。协方差分析类型:完全随机设计随机区组设计配伍设计和析因设计等实例例21-4为研究A、B、C三种药物对体重的影响,用猪作为实验对象,在同一饲料中加入不同的药物各喂养8头猪,一段时间后测得每头猪的初始重量(X)和增重(Y)数据见表21-5。试分析三种药物饲料增加猪体重的效果是否相同?表21-5三种饲料喂养猪的初始重量与增重(单位:kg)编号A饲料B饲料C饲料X1Y1X2Y2X3Y3115851797228921383169024913116518100208341276189523955128021103251006169122106271027148419993010581790189432110实例分析数据类型结果变量:数值变量,增重Y(kg);影响变量:多项无序分类变量,分组(group=1、2、3),有A、B、C三种药物饲料;数值变量,初始重量X(kg),可视为混杂因素,在统计分析中又称协变量。分析目的研究三种药物饲料对猪增重效果是否相同。统计方法:若考虑协变量的作用,采用协方差分析。SAS的计算程序SAS的计算结果1.模型拟合情况评价R2=0.9109,说明该模型可解释增重差异的91.09%。2.协方差分析结果F=88.81,P<0.0001,故可认为初始体重(X)对增重(Y)影响显著,即X、Y存在直线关系。调整后的直线方程是Y=35.94+2.40X。F(group)=31.07,P=0.000,可认为在扣除初始体重因素的影响后,三组猪的总体增重均数有差别。3.修正均数Y(A)=94.96,Y(B)=99.50,Y(C)=82.17。因P<0.0001,可以认为三组药物饲料的增重效果不同。SPSS的操作步骤SPSS的计算结果F=88.81,P=0.000,故可认为初始体重(X)对增重(Y)影响显著,即X、Y存在直线关系。调整后的直线方程是Y=35.94+2.40X。F(GROUP)=31.07,P=0.000,可认为在扣除初始体重因素的影响后,三组不同药物饲料组中猪总体增重均数存在差别。1.协方差分析结果2.修正均数Y(A)=94.96,Y(B)=99.50,Y(C)=82.17。因P<0.0001,可以认为三组药物增加体重的效果不同。COX回归模型概述:1个数值变量与n个分类变量、数值变量间关系的分析,根据研究目的不同分析方法不同,如果研究诸多因素(变量)对生存时间的影响,可采用COX回归模型进行分析。COX回归模型假定的风险函数公式h(t/X)=h0(t)exp(β1X1+β2X2+……+βpXp)其中:h(t/X)为风险函数,又称风险率或瞬间死亡率;h0(t)为基准风险函数,是与时间有关的任意函数;Xp、βp分别是观察变量及其回归系数。实例例21-5为探讨某恶性肿瘤的预后,收集了63例病人的生存时间、结局及影响因素。影响因素包括病人的治疗方式、肿瘤的浸润程度、组织学类型、是否有淋巴结转移及病人的性别、年龄,生存时间以月计算。试用COX回归模型分析预后因素。表21-6某恶性肿瘤的影响因素及量化值编号X1X2X3X4X5X6timestatus154000105202570110051035800111351………………………636200112161注:表中X1为年龄(岁),X2为性别(0:女,1:男),X3为组织学类型(0:低分化,1:高分化),X4为治疗方式(0:新疗法,1:传统疗法),X5为淋巴结转移(0:否,1:是)X6为肿瘤浸润程度(0:未突破浆膜层,1:突破浆膜层), time为生存时间(月),status为结局(0:截尾,1:死亡)。实例分析数据一个数值变量与5个分类变量、1个数值变量间的数据库数据。结果变量:数值变量,生存时间time(月),为;影响变量:年龄(X1)、性别(X2)、组织学类型(X3)、治疗方式(X4)、淋巴结转移(X5)、肿瘤浸润程度(X6),其中年龄为数值变量,其余为分类变量。分析目的各个影响变量对一个结果变量预后(生存时间)的影响。统计方法可采用COX模型对其进行分析。SAS的计算程序SAS的计算结果1.待纳入模型变量分析结果X2、X4、X5、X6有统计学意义(P<0.05)。2.纳入COX模型的变量分析结果仅X4、X5纳入模型,且回归系数均为正,相对危险度分别为4.668,2.488。可以认为治疗方式中传统疗法死亡的危险是新疗法的4.668倍,淋巴结是否转移中转移的死亡危险是未转移的2.488倍。SPSS的操作步骤SPSS的计算结果X2、X4、X6有统计学意义(P<0.05)。1.未纳入模型时变量的分析结果2.纳入模型的变量分析结果采用似然比前进法进行COX回归模型进行多因素分析,可知仅X4、X5、X6纳入模型,且回归系数均为正,相对危险度分别为5.068,5.771,5.473。可以认为治疗方式中传统疗法死亡的危险是新疗法的5.068倍,淋巴结是否转移中转移的死亡危险是未转移的5.473倍,肿瘤浸润程度中突破浆膜层的死亡危险是未突破浆膜层的5.473倍。第四节
1个分类变量与混合多变量之间的关系分析概述:1个分类变量与混合多变量之间的关系分析;结果变量:分类变量;影响变量:混合多个变量(有无序分类变量、有序分类变量和数值变量中的两种或两种以上)时;选用Logistic回归分析。举例:研究寻找冠心病发作的危险因素,冠心病发作与否是结果变量,属于二项分类变量;危险因素可以是性别、BMI指数和年龄等多种不同类型的混合变量。实例例21-6为研究急性肾衰竭(ARF)患者死亡的危险因素,经回顾性调查,获得某医院1990-2000年中发生ARF的422名住院患者的临床资料,见表21-7。问影响ARF患者死亡的因素有哪些?表21-7ARF患者的临床资料编号性别年龄治疗方法是否死亡118112191131910411011511010……………42228910注:性别中1为男,2为女;治疗方法中1为A疗法,2为B疗法,3为C疗法,4为D疗法;死亡与否中0为否,1为是。实例分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代商业办公空间的照明艺术
- 现代办公设备与技术概览
- 残障者康复教育与社区资源的联动发展
- Module3 Unit1 What are they doing?(说课稿)-2024-2025学年外研版(三起)英语四年级上册
- 7 我是班级值日生(说课稿)-2024-2025学年统编版道德与法治二年级上册
- Unit 3 Its a colourful world!Part B Let's learn(说课稿)-2024-2025学年外研版(三起)(2024)英语三年级上册
- 2023六年级数学上册 二 分数乘法第3课时 分数与整数相乘说课稿 苏教版
- 5《这些事我来做》(说课稿)-部编版道德与法治四年级上册
- Unit5 My clothes Part A Lets talk (说课稿)-2023-2024学年人教PEP版英语四年级下册001
- 《1 有余数的除法-第二课时》(说课稿)-2023-2024学年二年级下册数学苏教版001
- 职业暴露与防护
- 年产15吨透明质酸生产车间的初步工艺设计
- 大模型在航空航天领域的应用:智能探索宇宙的无限可能
- 酒店行业客源渠道分析
- 2024年中国陪诊服务行业市场发展趋势预测报告-智研咨询重磅发布
- AVL-CRUISE-2019-整车经济性动力性分析操作指导书
- 肠道医学解剖和生理学
- 人教版九年级英语动词时态专项练习(含答案和解析)
- 兰州市规范医疗服务价格项目基准价格表
- 火灾隐患整改登记表
- 普通地质学教材
评论
0/150
提交评论