版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、内容安排内容安排 第一讲第一讲 医学统计分析概述医学统计分析概述 第二讲第二讲 定量资料组间比较的统计分析定量资料组间比较的统计分析 第三讲第三讲 分类资料组间比较的统计分析分类资料组间比较的统计分析 第四讲第四讲 相关性分析与线性回归分析相关性分析与线性回归分析 第五讲第五讲 logistic回归分析回归分析 第六讲第六讲 诊断试验的评价与诊断试验的评价与ROC分析分析 第七讲第七讲 生存分析生存分析第一讲第一讲 医学统计分析概述医学统计分析概述 一、医学统计学的主要内容一、医学统计学的主要内容 包括研究设计、资料收集、数据整理、 数据 分析等一系列过程。 二、医学统计学的主要功能二、医学统
2、计学的主要功能 帮助我们透过现象认识本质,从一堆看似杂乱 无章的数据中发现规律,阐明事物的本质。 三、数据统计分析的一般思路三、数据统计分析的一般思路 1. 确定研究目的,根据研究目的选择方法。确定研究目的,根据研究目的选择方法。 不同研究目的采用的统计方法不同,在医学统计中,常见的研究目的主要有三类: 一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、卡方检验、秩和检验等; 二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析; 三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、cox回归等。 2. 明确数据类型
3、,根据数据类型进一步确定方法明确数据类型,根据数据类型进一步确定方法 定量数据可用的方法:t检验、方差分析、非参数检验、相关分析、线性回归等; 分类资料(定性数据)可用的方法:卡方检验、秩和检验、对数线性模型、logistic回归等。 3. 选定统计方法后,利用统计软件具体实现统计分选定统计方法后,利用统计软件具体实现统计分析过程。析过程。 4. 针对分析结果,结合实际做出合理的专业结论。针对分析结果,结合实际做出合理的专业结论。 四、统计学应用的几个误区四、统计学应用的几个误区 1. 研究目的大而全研究目的大而全 2. 方法一味追求新颖方法一味追求新颖 3. 统计学方法盲目套用统计学方法盲目
4、套用数据的类型数据的类型统计分析的基础是数据,而数据的类型可以分为: 1.定量数据定量数据 又分为连续型数据和离散型数据。连续性数据可以取任意值,比如,身高,体重,化验值等等;离散型数据只能取整数,如发病人数等。 2. 定性数据(分类资料)定性数据(分类资料) 又可分为无序分类资料和有序分类资料两类。 无序分类资料无序分类资料是指所分类别或属性之间无程度和顺序的差别,例如二项分类,性别(男、女),药物反应(阴性、阳性)等。例如多项分类,血型( O、A、B、AB等。 有序分类资料有序分类资料是指各类别之间有程度的差别。如尿糖化验结果按、+、+、+分类;疗效按治愈、显效、好转、无效分类。数据的类型
5、数据的类型数据资料定量数据定性数据(分类资料)连续型变量(如:身高、体重等)离散型变量(如:发病人数等)无序分类资料(如:性别、血型等)有序分类资料(如:疗效等)差异性研究方法差异性研究方法组间差异性比较研究方法组间差异性比较研究方法 1. t 检验检验 主要用于两组定量资料的比较。要求数据满足三个前提条件:独立性、正态性、方差齐性。独立性即各研究对象的观测值是相互独立的,互不影响;正态性即要求两组数据均服从正态分布;方差齐性即两组样本数据所代表的总体方差相等。 2. 方差分析方差分析 主要用于多组连续变量的比较。要求数据满足独立性、正态性、方差齐性的条件。 3. 秩和检验秩和检验 (1)可用
6、于不服从正态分布的定量资料的组间比较; (2)可用于有序分类资料的组间比较; (3)对于不符合正态分布的数据,两组定量数据比较一般用Wilcoxon秩和检验,多组定量数据一般用kruskal-wallis秩和检验,随机区组定量数据一般用friedman秩和检验。 4、 2 检验检验 用于无序分类资料的组间比较。可用于两组或多组率的比较、两组或多组构成比的比较、两个分类变量之间的关联性分析,还可用于特定分布的拟合优度检验等。相关性分析研究方法相关性分析研究方法 影响性分析研究方法影响性分析研究方法 SPSS简介简介uSPSS(Statistics Product and Service Solu
7、tions) ,是目前世界,是目前世界上最优秀的统计分析软件之一。上最优秀的统计分析软件之一。uSPSS是众多统计软件当中比较简是众多统计软件当中比较简单易懂的软件之一;绝大多数操作单易懂的软件之一;绝大多数操作过程仅靠点击鼠标即可完成。过程仅靠点击鼠标即可完成。uSPSS功能齐全,一般的数据分析功能齐全,一般的数据分析和图形处理都可以应付自如。和图形处理都可以应付自如。l nYabX第二讲第二讲 定量资料组间比较的统计定量资料组间比较的统计分析分析定量数据组间差异比较常用统计方法定量数据组间差异比较常用统计方法 1. t 检验检验 主要用于两组定量数据的比较。要求数据满足三个前提条件:独立性
8、、正态性、方差齐性。独立性即各研究对象的观测值是相互独立的,互不影响;正态性即要求两组数据均服从正态分布;方差齐性即两组样本数据所代表的总体方差相等。 2. 方差分析方差分析 主要用于多组连续变量的比较。要求数据满足独立性、正态性、方差齐性的条件。 3. 秩和检验秩和检验 (1)主要用于不服从正态分布的定量资料的组间比较; (2)对于不符合正态分布的数据,两组定量数据比较一般用Wilcoxon秩和检验,多组定量数据一般用kruskal-wallis秩和检验,随机区组定量数据一般用friedman秩和检验。分析思路分析思路1. 确定分析方法确定分析方法 该研究目的是比较两组人群的血磷值,属于差异
9、性检验。分析变量是血磷值,为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。2.2.建立数据文件建立数据文件EG0201EG0201。共 2个变量: (1)group(分组):1=急性克山病患者,2=健康者; (2)p(血磷数值)。3. 数据的正态性检验数据的正态性检验 “分析”“描述统计” “探索” 打开“探索”对话框 因变量列表:血磷数值(glu) 因子列表:分组group 绘制 : 带检验的正态图 从Shapiro-Wilk检验结果可以看到,group1的正态性检验P=0.835,group2的正态性检验P=
10、0.316,都可以认为近似服从正态分布。4. 独立样本独立样本t检验检验 “分析”“比较均值” “独立样本T检验” ,打开“独立样本T检验”对话框 检验变量:p 分组变量:group 定义组:1 25.5.结果及解释结果及解释 本例数据满足方差齐性(P=0.791),t检验统计量=2.576,P=0.017,故两组人群的差异是有统计学意义的。二、两组非正态分布资料的比较二、两组非正态分布资料的比较 例2.2 某医生为研究幽门螺杆菌与血清胃泌素-17之间的关系,在某地随机抽取幽门螺杆菌阳性和阴性对象各30例,测量两组人群的血清胃泌素-17水平。数据如表EX0202.欲比较两组人群的血清胃泌素-1
11、7水平是否有统计学差异。分析思路分析思路1. 确定分析方法确定分析方法 该研究目的是比较两组人群的血清胃泌素-17是否有差异,属于差异性检验。分析变量为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。2.2.建立数据文件建立数据文件EX0202EX0202。共 2个变量: (1)group(分组):1=阴性,2=阳性; (2)g(血清胃泌素-17水平)。3. 数据的正态性检验数据的正态性检验 “分析”“描述统计” “探索” 打开“探索”对话框 因变量列表:血清胃泌素-17水平(g) 因子列表:分组group 绘制
12、: 带检验的正态图 从Shapiro-Wilk检验结果可以看到,阴性组不符合正态分布( P0.05, 治疗前后的血红蛋白含量的差异无统计学意义。 例例2.7 某医生为观察某颈椎疼痛治疗仪治疗颈椎疼痛某医生为观察某颈椎疼痛治疗仪治疗颈椎疼痛的效果,随机抽取了的效果,随机抽取了30名颈椎疼痛患者,记录他们名颈椎疼痛患者,记录他们的的VAS评分,然后采用该治疗仪治疗评分,然后采用该治疗仪治疗10个疗程,再记个疗程,再记录下他们的录下他们的VAS评分,数据存于评分,数据存于EX0207(部分数据(部分数据见表见表2.6)。欲比较治疗后的)。欲比较治疗后的VAS评分是否比治疗前评分是否比治疗前有所降低。
13、有所降低。 患者序号患者序号 1 2 3 4 5 6 30 治疗前治疗前 5 8 7 5 5 4 4 治疗后治疗后 4 6 7 2 2 3 3 分析思路分析思路 1、明确研究目的 该研究目的是通过比较30名颈椎疼痛患者治疗前后的VAS评分,以推断治疗前后的VAS评分是否有差异,属于差异性检验。该研究是比较同一人群的两次测量结果,属于配对设计。配对设计的分析一般以两组差值作为分析指标。分析方法可根据数据的分布考虑使用配对t检验或配对秩和检验。2.2.建立数据文件建立数据文件EX0207EX0207。 两个变量: (1 1)VAS0: VAS0: 治疗期的评分; (2 2)VAS1: VAS1:
14、治疗后的评分。3.数据的正态分布检验数据的正态分布检验 “分析”“描述统计” “探索” 打开“探索”对话框 因变量列表:VAS0 VAS1 绘制 : 带检验的正态图 结果显示两个变量都不服从正态分布,所以选用配对秩和检验。 4、配对符号秩检验、配对符号秩检验 “分析” “非参数检验” “2个相关样本” , 打开“两个关联样本检验”对话框 检验对:VAS0VAS1 检验类型: Wilcoxon 5. 5. 结果及解释结果及解释 使用的方法是Wilcoxon符号秩检验,检验的 P0.0001,即治疗前后的VAS评分的差异有显著性意 义。本例中,治疗后VAS评分低于治疗前评分。七、七、 随机区组设计
15、的方差分析随机区组设计的方差分析lnYabX 七、随机区组资料的分析七、随机区组资料的分析 例例2.8 某研究生研究异常应力下椎间盘内蛋白多糖的变化,实验某研究生研究异常应力下椎间盘内蛋白多糖的变化,实验设计采用了随机区组设计,按体重、窝别等因素,每设计采用了随机区组设计,按体重、窝别等因素,每3只健康纯只健康纯种成年新西兰大白兔配成一个区组,共种成年新西兰大白兔配成一个区组,共8个区组。每个区组内的个区组。每个区组内的3只大白兔随机分入对照组、颈椎制动组和颈椎加压组,然后测只大白兔随机分入对照组、颈椎制动组和颈椎加压组,然后测定各组椎间盘内蛋白多糖的光密度值并进行比较。数据存于定各组椎间盘内
16、蛋白多糖的光密度值并进行比较。数据存于EX0208. 表表2.8 三组的光密度值三组的光密度值 对照组对照组 0.37 0.41 0.39 . 0.32 颈椎制动组颈椎制动组 0.39 0.27 0.26 . 0.28 颈椎加压组颈椎加压组 0.31 0.25 0.21 . 0.20 分析思路分析思路1、确定分析方法、确定分析方法 该研究目的是比较光密度值在三组间是否有差异,属于差异该研究目的是比较光密度值在三组间是否有差异,属于差异性检验。该研究采用了随机区组设计,研究前已经将研究对性检验。该研究采用了随机区组设计,研究前已经将研究对象的各种可能影响因素进行了平衡。分析指标是光密度值,象的各
17、种可能影响因素进行了平衡。分析指标是光密度值,为连续性变量。分析方法可以根据资料的正态性,考虑随机为连续性变量。分析方法可以根据资料的正态性,考虑随机区组的方法分析或随机区组的秩和检验即区组的方法分析或随机区组的秩和检验即Friedman检验。检验。2、建立数据文件、建立数据文件EX0208. 共共3个变量:个变量: (1)group(表示分组因素):(表示分组因素): 1=对照组,对照组,2=颈椎制动组,颈椎制动组,3=颈椎加压组;颈椎加压组; (2)block(8个不同区组);个不同区组); (3)den(光密度值)。(光密度值)。3、正态性检验、正态性检验 三组数据均服从正态分布,故采用
18、随机区组的方差分析方法。三组数据均服从正态分布,故采用随机区组的方差分析方法。 4、方差分析、方差分析 “ “分析分析” “” “一般线性模型一般线性模型” “” “单变量单变量” ,打开“单变量”对话框 因变量列表因变量列表:weight 固定因子:group、block 模型 设定 (custom) 模型: group / block 在模型中包含截距 两两比较(Post Hoc) 两两比较检验: group LSD S-N-K 选项 描述性 方差同质性检验(方差齐性检验) 5、结果分析、结果分析结果显示,组间差异有统计学意义(结果显示,组间差异有统计学意义(F=10.064,P=0.00
19、2),区组间),区组间差异无统计学意义(差异无统计学意义(F=0.876,P=0.548)。)。 根据两两比较结果,对照组和制动组之间差别有统计学意义(P=0.021),对照组和加压组之间差别有统计学意义(P=0.001),制动组和加压组之间差别在0.1水平上有统计学意义(P=0.085)。 定量数据组间比较的分析方法小结定量数据组间比较的分析方法小结1、两组独立样本比较、两组独立样本比较 两组独立数据的比较首先应看资料是否符合正态分布,是否符合方差齐性。(1)两组资料符合正态分布,且方差齐,采用t检验;(2)两组资料符合正态分布,但方差不齐,可采用 Satterthwate t检验;(3)资
20、料不符合正态分布,可采用非参数检验,如 Wilcoxon秩和检验。2、两组配对资料比较、两组配对资料比较 两组配对资料比较主要看两组差值是否符合正态分布。(1)两组差值服从正态分布,采用配对t检验;(2)两组差值不服从正态分布,采用Wilcoxon配对秩检验。 3、多组独立样本比较、多组独立样本比较(1)资料符合正态分布,且各组方差齐,直接采用完全随机的方差分析。如果检验结果为组间差异有统计学意义,可进一步作两两比较。两两比较的方法有S-N-K法、Bonferroni法等;(2)资料不符合正态分布,可采用非参数检验的Kruskal-Wallis法。如果检验结果为组间差异有统计学意义,可进一步作
21、两两比较。两两比较可以采用公式法计算,也可采用基于秩的方差分析法。4、多组随机区组样本比较、多组随机区组样本比较(1)资料符合正态分布,且各组方差齐,直接采用随机区 组的方差分析。(2)资料不符合正态分布,可采用非参数检验的Friedman 法。第三讲第三讲 分类资料组间比较的统计分类资料组间比较的统计分析分析分类资料组间差异比较常用统计方法分类资料组间差异比较常用统计方法 1、 2 检验检验 用于无序分类资料的组间比较。可用于两组或多组率的比较、两组或多组构成比的比较、两个分类变量之间的关联性分析,还可用于特定分布的拟合优度检验等。 2、秩和检验、秩和检验 用于有序分类资料的组间比较。 一、
22、四格表资料的分析一、四格表资料的分析例3.1 某研究所为探索幽门螺杆菌感染与胃黏膜病变进展之间的关系,在某地随机抽取了2200名非胃癌居民,对幽门螺杆菌感染状况进行血清学检测,根据检测结果分为幽门螺杆菌阳性组和阴性组。随访5年后,共有1889例研究对象完成了全部的胃镜检查和胃黏膜病理学诊断。其中幽门螺杆菌阳性组中病变进展者35人,未进展者443人;阴性组中病变进展者164人,未进展者1247人。整理成表3.1的四格表形式,欲分析幽门螺杆菌阳性组与阴性组的病变进展率是否有差异。 表表3.1 病变无进展病变无进展 病变进展病变进展 合计合计 阴性阴性 1247 164 1411 阳性阳性 443
23、35 478 合计合计 1690 199 1889 分析思路分析思路1、确定分析方法、确定分析方法 该研究目的是比较两组的病变进展率是否有统计学差异,属于差异性检验。数据为分类资料,分组变量是幽门螺杆菌的感染状况,分析变量是病变进展情况,均为二分类变量。结合研究目的,首选的方法是四格表资料的卡方检验。当然还可以考虑用Logistic回归,但卡方检验更为简便通用,因此采用卡方检验进行分析。2. 建立数据文件建立数据文件 EX0301。 有3个变量: (1) hp(感染状况):1=阴性,2=阳性; (2) progression (病变进展):1=无进展,2=进展; (3)f(频数)。2. 统计分
24、析:统计分析: (1) “数据”“加权个案”, 打开“加权个案”对话框 加权个案: f (2)“分析” “描述统计” “交叉表” , 打开“交叉表”对话框 行:hp 列: progression 统计量 卡方(Chi-square) 风险 单元格 观察值 期望值 行3. 结果及解释结果及解释 本次研究结果表明,幽门螺杆菌阴性组和阳性组的病变进展率差异有统计学意义( 2 =7.007,P=0.008),幽门螺杆菌阳性人群发生病变进展的危险是阴性人群的1.587倍(95%CI:1.1192.552),提示幽门螺杆菌感染是胃黏膜病变进展的危险因素。 二、二、R2表资料的分析表资料的分析例3.2 某医
25、院在某胃癌高发地区随机抽取了2646名当地居民,根据胃黏膜病理检查结果,将人群分为浅表性胃炎(SG)或轻度慢性萎缩性胃炎(CAG)、重度CAG、肠上皮化生(IM)和异型增生(DYS)四组,每组人群检测其幽门螺杆菌感染状况,结果列于表3.2.欲比较四组人群的幽门螺杆菌阳性率是否有差异。 表表3.2 不同胃黏膜病变的幽门螺杆菌阳性率不同胃黏膜病变的幽门螺杆菌阳性率 阴性阴性 阳性阳性 合计合计 SG或轻度或轻度CAG 413 609 1022 重度重度CAG 29 190 219 IM 182 677 859 DYS 120 426 546 合计合计 744 1902 2646 分析思路分析思路1
26、、确定分析方法、确定分析方法 该研究目的是比较四组的阳性率是否存在统计学差异,属于差异性检验。分组变量是胃病理状况,为多分类变量,分析指标是幽门螺杆菌感染状况,为二分类变量,属于R2列联表。本例分组指标为病变严重程度,尽管属于有序分类变量,但无序和无序变量不同方法的选择是根据分析指标而定。只要分析指标为无序变量,则不论分组指标是有序还是无序,均可采用卡方检验进行分析。如果组间总的差异有统计学意义,还可进一步做两两比较。2. 建立数据文件建立数据文件 EX0302。 有3个变量: (1) path(病变程度): 1=SG或轻度CAG,2=重度CAG, 3=IM,4=DYS; (2) hp(感染状
27、况):1=阴性,2=阳性; (3)f(频数)。3. 统计分析:统计分析: (1) “数据”“加权个案”, 打开“加权个案”对话框 加权个案: f (2)“分析” “描述统计” “交叉表” , 打开“交叉表”对话框 行:path 列: hp 统计量 卡方(Chi-square) 4. 结果及解释结果及解释 本次研究结果表明,不同胃黏膜病变组的幽门螺杆菌感染率差异有统计学意义( 2 =13.988,P0.0001。结合具体数值可以发现,阳性率有随着病变严重程度增加而增加的趋势,并且这种趋势有统计学意义(根据Linear-By-Linear Association检验结果,P0.0001)。 5、两
28、两比较、两两比较 上述结果只是表明了一种总的差异和趋势,结论只能认为四组之间的感染率总的有统计学差异。我们还需要进一步了解具体是哪两组之间存在差异,即进行组间两两比较。 本例共有4组,假设研究目的是想以SG或轻度CAG组为对照,比较其他病变组的感染率是否高于SG或轻度CAG组。则校正后的检验水平为 也就是说,两两比较时,P值小于0.0167,才算差别有统计学意义。通过选择个案,可以比较其他三组与SG或轻度CAG组之间的差异,结果如下: 对比组 卡方值 P值 SG或轻度CAG组 VS. 重度VAG 58.056 0.0001 SG或轻度CAG组 VS. IM 79.752 0.0001 SG或轻
29、度CAG组 VS. DYS 53.89 0.0001 结果表明,其他三组与SG或轻度CAG组比较有统计学差异。0.050.01674 1 6、最终结论、最终结论 本次研究结果表明,不同胃黏膜病变组的幽门螺杆菌感染率差异有统计学意义( 2 =13.988,P0.0001)。幽门螺杆菌感染率有随着病变严重程度增加而增加的趋势(P5,选用卡方检验;(2)例数大于40,所有理论数1,且有理论数5,选用校正的卡方检验或Fisher精确概率检验法;(3)例数小于40,或有理论数1,选用Fisher精确概率检验法; 2、 2C表资料的统计分析思路表资料的统计分析思路 2C表资料指行变量为二分类的分组指标,列
30、变量为多分类的分析指标。(1)如果分析指标为无序分类变量,可用卡方检验分析组间构成比是否有差异,如果例数小于40或有理论频数小于1,可以采用Fisher精确概率检验法;(2)如果分析指标为有序分类变量,可用Wilcoxon秩和检验。3、R2表资料的统计分析思路表资料的统计分析思路 R2表指行变量为多分类的分组指标,列变量为二分类的分析指标。组间差异比较可采用卡方检验。如果组间差异有统计学意义,可进一步作两两比较,以分析具体哪几组之间的差别有统计学意义。4、RC表资料的统计分析思路表资料的统计分析思路 RC表指行变量为多分类的分组指标,列变量为多分类的分析指标。(1)行变量为无序或有序的分组指标
31、,列变量为无序的分析指标,可用卡方检验分析组间构成比是否有差异。如果组间差异有统计学意义,可进一步作两两比较。(2)行变量为无序或有序的分组指标,列变量为有序的分析指标,可用Kruskal-Wallis秩和检验方法。如果组间差异有统计学意义,可进一步作两两比较。5、配对分类资料的统计分析思路、配对分类资料的统计分析思路 两种方法之间的差异性比较,可用McNemar检验作配对的卡方检验。第六章第六章 相关分析及相关分析及SPSS实现实现 6.1 定量资料的相关分析定量资料的相关分析 6.2 分类资料的相关分析分类资料的相关分析6.1 定量资料的相关分析定量资料的相关分析 定量资料的相关分析主要采
32、用线性相关,线性相关主要研究定量资料的相关分析主要采用线性相关,线性相关主要研究两个或多个变量之间相互依存的关系,可分为简单相关和偏两个或多个变量之间相互依存的关系,可分为简单相关和偏相关。相关。 常用的线性相关的度量指标有常用的线性相关的度量指标有Pearson相关系数相关系数Spearman相关系数。相关系数。 Pearson相关系数主要用于正态分布资料,相关系数主要用于正态分布资料,Spearman相关相关系数主要用于非正态分布资料或等级资料。系数主要用于非正态分布资料或等级资料。 例例6.1 某疾病预防控制中心调查了辖区内公务员的体重指数、某疾病预防控制中心调查了辖区内公务员的体重指数
33、、血压、总胆固醇、空腹血糖等指标,以了解他们的健康状况。血压、总胆固醇、空腹血糖等指标,以了解他们的健康状况。现从中随机抽取现从中随机抽取20人的体重指数、总胆固醇、空腹血糖三个人的体重指数、总胆固醇、空腹血糖三个指标,分析这三个指标的相关性。指标,分析这三个指标的相关性。 分析思路分析思路 1、确定分析方法、确定分析方法 该研究的目的是分析三个指标之间的关系,三个指标均为定该研究的目的是分析三个指标之间的关系,三个指标均为定量资料,可选择线性相关,具体可根据资料是否符合正态分量资料,可选择线性相关,具体可根据资料是否符合正态分布选择布选择Pearson相关或相关或Spearman相关。相关。
34、 2、资料的正态性检验、资料的正态性检验 由于样本量小于由于样本量小于2000,故正态性检验采用,故正态性检验采用Shapiro-Wilk法。法。Bmi和和tc的的P值均远远大于值均远远大于0.05,fbg的的P值仅略大于值仅略大于0.05(P=0.085)。为了稳妥起见,下面分别按正态分布和非正)。为了稳妥起见,下面分别按正态分布和非正态分布进行线性相关分析,即分别采用态分布进行线性相关分析,即分别采用Pearson和和Spearman相关分析。相关分析。 3、Pearson相关分析和相关分析和Spearman相关分析相关分析 “分析分析” “相关相关” “双变量双变量” 变量:变量:bmi
35、 tc fbg 相关系数:相关系数: Pearson Spearman 根据Pearson相关分析的结果,bmi与tc之间的相关系数为0.718,有统计学意义(P0.001);bmi与fbg之间的相关系数为0.403,无统计学意义(P=0.078);tc与fbg之间的相关系数为0.609,有统计学意义(P=0.004)。 根据Spearman相关分析的结果,bmi与tc之间的相关系数为0.752,有统计学意义(P0.001);bmi与fbg之间的相关系数为0.354,无统计学意义(P=0.126);tc与fbg之间的相关系数为0.576,有统计学意义(P=0.008)。 4、偏相关分析、偏相关
36、分析 上述结果给出的是三个变量之间粗鲁的关系,也就是说,两上述结果给出的是三个变量之间粗鲁的关系,也就是说,两个变量之间的相关可能掺杂了另外变量的作用。例如个变量之间的相关可能掺杂了另外变量的作用。例如bmi与与fbg的关系可能混有的关系可能混有tc的影响,如果我们想研究变量之间的的影响,如果我们想研究变量之间的纯关系,需要采用偏相关来校正其他变量的影响。假定我们纯关系,需要采用偏相关来校正其他变量的影响。假定我们要了解体重指数(要了解体重指数(bmi)与胆固醇()与胆固醇(fbg)的纯相关,则可)的纯相关,则可进行偏相关分析。进行偏相关分析。 “分析分析” “相关相关” “偏相关偏相关” 变
37、量:变量:bmi fbg 控制:控制:tc结果表明,剔除结果表明,剔除tc的影响后,的影响后,bmi和和fbg的相关性变成了负相关的相关性变成了负相关(-0.062),而且这种相关微乎其微(),而且这种相关微乎其微(P=0.8)。)。 5、结论、结论 偏相关分析表明,校正了偏相关分析表明,校正了tc后,后,bmi和和fbg的相关性变得非常的相关性变得非常小,与简单相关系数差别很大。这提示小,与简单相关系数差别很大。这提示tc对对bmi和和fbg的关的关系影响非常大,或者说系影响非常大,或者说bmi与与fbg的相关性主要是由的相关性主要是由tc造成造成的,一旦消除了的,一旦消除了tc的作用,的作
38、用,bmi与与fbg的关系也随之消失。的关系也随之消失。因此对于多个指标的相关性分析,如果有可能,最好采用偏因此对于多个指标的相关性分析,如果有可能,最好采用偏相关,以找出变量间的真正关系,否则容易被结果误导。相关,以找出变量间的真正关系,否则容易被结果误导。6.2 分类资料的相关分析分类资料的相关分析线性回归分析线性回归分析例例7.2 某研究生研究某研究生研究“冠状动脉缓慢血流现象冠状动脉缓慢血流现象”的影响因素。的影响因素。“冠状冠状动脉缓慢血流现象动脉缓慢血流现象”以前降支、回旋支、右冠状动脉三支血管的平均以前降支、回旋支、右冠状动脉三支血管的平均TIMI帧计数(帧计数(MTFC)表示,
39、调查的影响因素有年龄()表示,调查的影响因素有年龄(AGE,岁)、收岁)、收缩压(缩压(SBP,mmHg)、舒张压()、舒张压(DBP,mmHg)、白细胞()、白细胞(WBC, /L),目的是寻找影响),目的是寻找影响MTFC变化的因素。数据存于变化的因素。数据存于LI0702。910 分析思路分析思路1、确定研究方法、确定研究方法 该研究目的是寻找影响因变量的各种可能因素,且变量很明确该研究目的是寻找影响因变量的各种可能因素,且变量很明确地分为因变量和自变量,因此可用回归分析。该研究的因变量地分为因变量和自变量,因此可用回归分析。该研究的因变量为连续变量,因而可考虑用多元线性回归,但是否合适
40、还需进为连续变量,因而可考虑用多元线性回归,但是否合适还需进一步验证。一步验证。2、对线性回归的应用条件进行检验、对线性回归的应用条件进行检验第二讲第二讲 T 检验检验 T检验是进行检验是进行两组定量数据差异性比较两组定量数据差异性比较的检的检验方法,在医学统计学中,验方法,在医学统计学中,t 检验是非常活跃的检验是非常活跃的一类假设检验方法。适用条件:当样本含量一类假设检验方法。适用条件:当样本含量n较较小时小时(如如n0.05,接受原假设,接受原假设,认为该山区成年男子的脉搏数与健康男子的差异无统计认为该山区成年男子的脉搏数与健康男子的差异无统计学意义。学意义。1.2 配对样本配对样本t检
41、验检验(Paired Samples T Test) 配对样本配对样本t检验,也称成对检验,也称成对t检验,适用于配检验,适用于配对设计的计量资料,主要适用于下列三种情况:对设计的计量资料,主要适用于下列三种情况: 1、将同一样本(如血样)分成两半,用两种不、将同一样本(如血样)分成两半,用两种不同的方法来测定;同的方法来测定; 2、自身比较,即同一样本处理前后的比较;、自身比较,即同一样本处理前后的比较; 3、将某些因素相同的样本组成配伍组,随机分、将某些因素相同的样本组成配伍组,随机分成两组。成两组。 配对样本配对样本t检验是检验配对差值的样本均数检验是检验配对差值的样本均数 与与已知总体
42、均数已知总体均数 0=0是否有差别的参数方法检验。是否有差别的参数方法检验。配对样本配对样本t检验检验分析步骤分析步骤 1.1.建立数据文件建立数据文件EG0202EG0202。两个变量: (1 1)before:before:治疗期的含量; (2 2)after: after: 治疗后的含量。2.统计分析:统计分析: (1)正态分布检验:)正态分布检验:“分析分析” “” “非参数检验非参数检验” ” “1-1-样本样本K-S”K-S”,打开“单样本K-S检验”对话框 检验变量列表(T): before, after 常规(正态分布) (2)配对样本)配对样本t 检验检验:“分析分析” “”
43、 “比较均值比较均值” ” “配对样本配对样本T T 检验检验” ,打开“配对样本T检验”对话框 成对变量成对变量:before after 3. 结果及解释结果及解释 P=0.7220.05, 治疗前后的血红蛋白含量的差异无统计学意义。1.3 两组独立样本两组独立样本t 检验检验(Independent Samples T Test) 两组独立样本两组独立样本t 检验,用于两个总体的样检验,用于两个总体的样本均值的比较。本均值的比较。 要求数据满足以下条件:要求数据满足以下条件: 1正态性:两个样本都来自于正态分正态性:两个样本都来自于正态分 布的总体;布的总体; 2方差齐性:两个总体方差相
44、等。方差齐性:两个总体方差相等。分析思路:分析思路: 该研究目的是比较两组人群的血磷值,属于差异性检验。分析变量是血磷值,为连续性变量。结合研究目的,可以考虑的分析方法有独立样本的t检验或wilcoxon秩和检验,具体还应进一步看数据是否服从正态分布。分析步骤分析步骤1. 建立数据文件建立数据文件EG0303EG0303。共 2个变量: (1)group(分组):1=急性克山病患者,2=健康者; (2)p(血磷数值)。2. 数据的正态性检验数据的正态性检验 (1)“数据” “拆分文件” 打开“分割文件”对话框 比较组 分组方式: 组别group (2)“分析”“非参数检验” “旧对话框” “旧
45、对话框” “1-“1-样本样本K-S”K-S”,打开“单样本K-S检验”对话框 检验变量列表(T): 血磷数值(p) 常规(正态分布) 从输出结果可以看到,group1的正态性检验P=0.991,group2的正态性检验P=0.781,都可以认为近似服从正态分布。故利用独立样本t检验方法。3. 合并数据合并数据 : “数据” “拆分文件” 打开“分割文件”对话框 分析所有个案,不创建组 4. 独立样本独立样本t检验检验 “分析”“比较均值” “独立样本T检验” ,打开“独立样本T检验”对话框 检验变量:p 分组变量:group 定义组:1 2 5. 5.结果及解释结果及解释 本例数据满足方差齐
46、性(P=0.791),t检验统计量=2.576,P=0.017,故两组人群的差异是有统计学意义的。第三讲 方差分析 方差分析(方差分析( ANOVA )用于多组(两组)用于多组(两组以上)连续变量均值的差异性比较,其应用以上)连续变量均值的差异性比较,其应用条件为:条件为: 各组观察值均服从正态分布;各组观察值均服从正态分布; 各样本的总体方差相等。各样本的总体方差相等。 方差分析的基本思想是:把总变异分为组间变方差分析的基本思想是:把总变异分为组间变异和组内变异,通过分析研究不同来源的变异对总异和组内变异,通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影变异的贡献大
47、小,从而确定可控因素对研究结果影响力的大小。响力的大小。方差分析的方差分析的SPSS操作操作 单因素方差分析(单个因素各个水平之间单因素方差分析(单个因素各个水平之间的比较):的比较): “分析分析” “” “比较均值比较均值” “” “单因素单因素ANOVA”ANOVA” 多因素方差分析(包括随机区组设计、析多因素方差分析(包括随机区组设计、析因设计):因设计): “分析分析” “” “一般线性模型一般线性模型” “” “单单变量变量” 3.1 单因素方差分析单因素方差分析 单因素方差分析是单个因素的各个水平单因素方差分析是单个因素的各个水平之间有无显著性差异的统计检验。之间有无显著性差异的
48、统计检验。采用完采用完全随机化的分组方法,将全部试验对象分全随机化的分组方法,将全部试验对象分配到配到g个处理组(水平组),各组分别接受个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,以推断处理因间的差别有无统计学意义,以推断处理因素的效应。素的效应。 例例3-1 某药厂研发一种新的降糖药,将试验药分为大剂量组和小剂量组,并采用某公认的阳性药物为对照。试验方法采用完全随机设计,按照一定的纳入和排除标准共选择90例研究对象,将研究对象随机分为3组,分别服用相应的药物。治疗12周后,观察其餐后2小时的血糖降低值,数据存
49、于EG0301中。欲比较三组的血糖降低值是否有统计学差异。 分析思路: 该研究目的是比较对照药组、试验药大剂量组、小剂量组的血糖降低值是否有差异,属于差异性检验。该研究为完全随机设计,分析变量为连续性变量。因此可以考虑方差分析或kruskal-wallis秩和检验,具体还应进一步看数据是否服从正态分布。分析步骤分析步骤1.1.建立数据文件建立数据文件EG0301EG0301。共 2个变量: (1)group(分组):1=对照组,2=小剂量组,3=大剂量组; (2)glu(血糖变化值)。2. 数据的正态性检验数据的正态性检验 (1)“数据” “拆分文件” 打开“分割文件”对话框 比较组 分组方式
50、: 组别group (2)“分析”“非参数检验” “旧对话框” “旧对话框” “1-“1-样本样本K-S”K-S”,打开“单样本K-S检验”对话框 检验变量列表(T): 血糖变化值(glu) 常规(正态分布) 结果显示,三组数据均符合正态分布( P分别为0.638、0.971、0.987 ),因此可以采用方差分析进行组间比较。然后合并数据然后合并数据 : “数据” “拆分文件” 打开“分割文件”对话框 分析所有个案,不创建组 3. 单因素方差分析单因素方差分析 “分析分析” “” “比较均值比较均值” “” “单因素单因素ANOVA”ANOVA” ,打开“单因素方差分析”对话框 因变量列表因变
51、量列表:no 因子:group 选项 描述性 方差同质性检验(方差齐性检验) 两两比较 LSD S-N-K 4.4.结果及解释结果及解释 (1)在方差齐性检验中,P=0.4530.05,可认为方差具有齐性; (2)在ANOVA表中,F=3.917,P值=0.0240.05,故三组人群的差异有统计学意义; (3)在随后的两两比较中,结果显示,1组和3组、1组和2组的差异有统计意义,2组和3组的差异无统计意义。3.2 随机区组设计的方差分析随机区组设计的方差分析lnYabX 例例3.2 某厂某厂12名氟作业工人名氟作业工人24h内不同时间尿氟量(内不同时间尿氟量(mL/L)排除数据存于文件排除数据
52、存于文件EG0302,试分析氟作业工人在工前、,试分析氟作业工人在工前、工中(上班第工中(上班第4小时)和工后(下班后第小时)和工后(下班后第4小时)尿氟排小时)尿氟排出量的差别有无统计学意义。出量的差别有无统计学意义。 分析:如果不仅考虑氟作业工人在工前、工中和工后尿分析:如果不仅考虑氟作业工人在工前、工中和工后尿氟排出量的差别,还考虑工人之间(区组因素)的不同,氟排出量的差别,还考虑工人之间(区组因素)的不同,此时就构成随机区组资料(不同时刻,不同区组)的分此时就构成随机区组资料(不同时刻,不同区组)的分析。分析方法可以根据资料的正态性,考虑随机区组的析。分析方法可以根据资料的正态性,考虑
53、随机区组的方差分析或随机区组的秩和检验(即方差分析或随机区组的秩和检验(即Friedman检验)。检验)。1、建立数据文件、建立数据文件EG0302. 共共3个变量:个变量: (1)group(表示三个不同时刻):(表示三个不同时刻): 1=工前,工前,2=工中,工中,3=工后;工后; (2)block(12个不同区组);个不同区组); (3)weight(尿氟排出量)。(尿氟排出量)。2、统计分析。、统计分析。 (1)分组对三组数据作正态性检验(三组数据均服从正态分布);)分组对三组数据作正态性检验(三组数据均服从正态分布); (2)方差分析)方差分析 :“分析分析” “” “一般线性模型一
54、般线性模型” “” “单变量单变量” ,打开“单变量”对话框 因变量列表因变量列表:weight 固定因子:group、block 模型 设定 (custom) 模型: group / block 在模型中包含截距 两两比较(Post Hoc) 两两比较检验: group LSD S-N-K 选项 描述性 方差同质性检验(方差齐性检验) 3、结论、结论 结果显示,组间差异有统计学意义(F=12.152,P0.001),根据两两比较的结果,工中与工前、工中与工后的差异有统计学意义,工前与工后的差异无统计学意义。 区组间差异无统计学意义(F=2.013,P=0.078)。3.3 多因素方差分析多因
55、素方差分析 多因素方差分析不仅可以考虑多个因素对多因素方差分析不仅可以考虑多个因素对试验结果的影响,还能够分析因素之间的试验结果的影响,还能够分析因素之间的交互作用是否对试验结果产生影响,从而交互作用是否对试验结果产生影响,从而最终找到一个最优组合。最终找到一个最优组合。 例3.3 在数据3.3中,以手术时间“time”为观察值,探讨不同手术方式“pt”、不同疾病部位“da”及不同性别“sex”三个因素对手术时间的影响是否显著。 1、打开数据文件、打开数据文件3.3; 2、统计分析:、统计分析:“分析分析” “” “一般线性模型一般线性模型” “” “单变单变量量” , 打开“单变量”对话框
56、因变量列表:time 固定因子:pt, da, sex 模型 设定 (custom) 模型: pt, da, sex 在模型中包含截距 选项 描述性 方差同质性检验(方差齐性检验) 3、结果及解释结果及解释 pt对手术时间有显著性的影响,da和sex的差异无统计学意义。3.4 析因设计资料的方差分析析因设计资料的方差分析 析因试验设计(析因试验设计(factorial experimental design)是将两个或多个处理因素的各个水)是将两个或多个处理因素的各个水平进行排列组合,交叉分组进行试验,用于平进行排列组合,交叉分组进行试验,用于分析各因素间的交互作用,比较各因素不同分析各因素间
57、的交互作用,比较各因素不同水平的平均效应和因素间的不同水平组合下水平的平均效应和因素间的不同水平组合下的平均效应,寻找最佳组合。在析因试验设的平均效应,寻找最佳组合。在析因试验设计的资料分析中,应先计的资料分析中,应先重点考察各因素间是重点考察各因素间是否存在交互作用否存在交互作用,因为当因素间存在明显的,因为当因素间存在明显的交互作用时,往往会掩盖主效应的显著性。交互作用时,往往会掩盖主效应的显著性。 例例3.4 用用A、B两种药治疗血色素低下的病人。现将两种药治疗血色素低下的病人。现将48名病人完全随机地分成名病人完全随机地分成4组,按组,按A、B两种药的使用两种药的使用与否对与否对4组病
58、人观察他们的血色素增加值,数据如下组病人观察他们的血色素增加值,数据如下所示(部分):所示(部分): lnYabX 分析思路分析思路 该研究共两个分组因素,分别为A药和B药,各有两个水平,交叉形成四组。研究目的不仅要看A药、B药各自对血色素增加值的影响,还要分析A药+B药对血色素增加值的影响,即分析两个因素之间的交互作用。该研究采用了析因设计,分析也应采用析因设计的方法,考虑因素间的交互作用。该研究分析指标是血色素增加值,为连续型变量。分析方法可用方差分析或Kruskal-Wallis秩和检验,具体还应进一步看资料是否符合正态分布 1、建立数据文件、建立数据文件EG0304。有3个变量: (1
59、)a:1=用A药,0=不用A药; (2)b:1=用B药,0=不用B药; (3)value:血色素增加量。 2、四组数据的正态性检验(均服从正态分布)、四组数据的正态性检验(均服从正态分布) 3、统计分析:、统计分析: “分析分析” “” “一般线性模型一般线性模型” “” “单变量单变量” ,打开“单变量”对话 框 因变量列表:value 固定因子:a,b 模型 设定 (custom) 模型: a、b、a*b 在模型中包含截距 选项 描述性 4、结果及解释、结果及解释 单用A药或者单用B药,都有显著性疗效,并且A、B两药联合使用有很好的交互作用,能加强疗效(均数为2.358),比单用A药或单用
60、B药的效果都好。第三讲第三讲 2检验检验 2检验(卡方检验),主要用于检验(卡方检验),主要用于 (1 1)检验某无序分类变量(如:性别)各)检验某无序分类变量(如:性别)各水平出现的概率是否等于指定概率;水平出现的概率是否等于指定概率; (2 2)检验某两个分类变量是否相互独立。)检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:有,无)有关;吸道疾病(二分类变量:有,无)有关; (3 3)检验某个分类变量出现各类的概率是)检验某个分类变量出现各类的概率是否等于指定概率。如抛硬币时,正反两面否等于指定概率。如抛硬币时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年饭店员工劳动合同及员工培训及晋升机制3篇
- 二零二五年度鲁0832执恢255号智能穿戴设备研发生产合同4篇
- 二零二五年度鸡蛋进出口贸易合同样本3篇
- 2025年度临时教育培训基地场地租赁合同4篇
- 2025年度智能家电产品研发与生产合同4篇
- 灾后重建政府购买服务合同范文
- 2024年创新科技项目合同
- 2024年环保技术转让合同
- 石油化工产业投资合同
- 机器人产业项目合作合同
- 一年级科学人教版总结回顾2
- 格式塔心理咨询理论与实践
- 精神发育迟滞的护理查房
- 有效排痰的护理ppt(完整版)
- 鲁教版七年级数学下册(五四制)全册完整课件
- 英语六级词汇(全)
- 算法向善与个性化推荐发展研究报告
- 聚合物的流变性详解演示文稿
- 电气设备预防性试验安全技术措施
- 医院出入口安检工作记录表范本
- 内科学教学课件:免疫性血小板减少症(ITP)
评论
0/150
提交评论