




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Medical Statistics 医学统计学相关分析Correlation Analysis主要内容引言数值变量的相关相关的定义(掌握)相关的图示(掌握)相关系数的计算(掌握)相关系数的假设检验(掌握)相关系数的区间估计(了解)两样本相关系数的比较(了解)分类和等级变量的相关行列表资料的关联性(熟悉)等级资料的关联性(熟悉)相关分析的正确应用(掌握)一个分析实例:3岁男童体重与体表面积编号体重X体表面积Y111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016
2、.06.411合计133.457.266分析方法之一将10名儿童按体重分为两组(三组)结论:体重较重的一组3岁男童,体表面积也较大。体重分组体表面积均数组间比较13.5Kg5.37 103cm2t=-6.0413.5Kg6.09 103cm2P0.001分析方法之二如果想得到的结论为:体重越重,体表面积越大。关联的密切程度 相关分析体重为X时,体表面积估计为多少?数量依存关系 回归分析相关关系与确定性关系所谓确定性关系是指两变量间的关系是函数关系。已知一个变量的值,另一个变量的值可以通过这种函数关系精确计算出来。C =2RS=vt非确定性关系是指两变量在宏观上存在关系,但并未精确到可以用函数关
3、系来表达。青少年身高随年龄增长而增高;体表面积与体重有关数值变量的相关相关的定义(掌握)相关的图示(掌握)相关系数的计算(掌握)相关系数的假设检验(掌握)相关系数的区间估计(了解)两样本相关系数的比较(了解)相关的定义当两个数值变量之间出现如下情况:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,也就是有相关关系(correlation) 。若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positive correlation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negative correlation)。直线相关(l
4、inear correlation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。 相关系数用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数(correlation coefficient),又称为积差相关系数(coefficient of product-moment correlation),Pearson相关系数 。总体相关系数用希腊字母表示,而样本相关系数用r表示,取值范围均为-1,1。绘制散点图!体重 X体表面积Y1112131415165.05.56.06.5X(1)Y(2)11.05.28311.85.29912.0
5、5.35812.35.29213.15.60213.76.01414.45.83014.96.10215.26.07516.06.411r=0r=0r-1r1完全正相关完全负相关零相关零相关0r1-1r0r=0 r=0零相关正相关负相关零相关直线相关的图示r =-1-1r 0r =0直线相关的图示与相关系数的关系0r 1r =1直线相关系数的计算离均差积和离均差平方和体重(kg),X体表面积(103cm2)Y1112131415165.05.56.06.5绘制散点图相关系数的计算相关系数的假设检验H0:0,两变量间无直线相关的关系;H1:0,两变量间有直线相关的关系。例试对例10.1资料相关关
6、系是否存在进行假设检验,并估计总体相关系数。H0:体重与体表面积无相关关系;H1:体重与体表面积有相关关系。=0.05。 = n-2=10-2=8按自由度 =8查附表2 t界值表,得P0.001。按=0.05水准,拒绝H0,接受H1,故可认为3岁男童的体重与体表面积之间有正相关关系。总体相关系数的区间估计(了解)从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。 相关系数的抽样分布( = - 0.8)-0.8-0.6-0.4-0.20.00100200300-1.0在一个总体相关系数为-0.8的总体中,进行随机抽样,每次抽取10个个体,测量其X和Y值,并计算样本相关系数,重复1000
7、次,将所得的相关系数绘制成频数图。相关系数的抽样分布( = 0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相关系数的抽样分布( =0.8) 00.20.40.60.81.00100200300R.A. Fisher(1921) 的 z 变换 z 近似服从均数为 ,标准差为 的正态分布。 相关系数的z 值的抽样分布( = - 0.8)00.51.01.52.0050100150200相关系数的z 值的抽样分布( = 0)-2-1012050100150200相关系数的z 值的抽样分布( = 0.8) 01234050100150200相关系数
8、的可信区间估计将 r 变换为 z ;根据 z 服从正态分布,估计 z 的可信区间;再将 z 变换回 r 。相关系数的可信区间估计 Fishers 变换 r z 正态近似 Fishers 反变换 的95CI z的95CI 检验系数是否等于已知常数?H0:c;H1:c。两样本相关系数的比较 某医院分别测定正常成年男子12人和正常成年女子12人的心率(X,次/分)与心脏左室电机械收缩时间QS(Y,毫秒) ,试比较男子和女子的心率(次/分)与心脏左室电机械收缩时间QS(毫秒)的相关是否相同。 男子女子心率,X(次/分)收缩时间,Y(毫秒)心率,X(次/分)收缩时间,Y(毫秒)5740556391613
9、93594106339763387664006737467380673856838368376693767037870382723847538875370793667935083370873578634594329Step 1: 散点图 5060708090100300350400450心率(次/分)收缩时间(毫秒)5060708090300350400450100收缩时间(毫秒)心率(次/分)男女Step 2: 计算样本相关系数男子的相关系数:女子的相关系数:Step 3: 检验两总体相关系数是否为0=122=10,则P10.001,P20.20,故尚不能认为男子和女子的心率与心脏左室电机械
10、收缩时间间的相关系数不等。分类和等级变量的相关定性资料的关联性(熟悉)四格表资料的列联相关系数RC表资料的列联相关系数等级资料的关联性(熟悉)其他的一些关联性考察(了解)定性资料的关联性分析(association)定性指标间的相关程度和方向常用列联系数(contingency coefficient)来表示。例:四格表资料的相关分析某中医师采用两种方法观察舌象200例,试分析两种观察方法的结果有无联系?乙法甲法合计84(a)16(b)100(a+b)20(c)80(d)100(c+d)合计104(a+c)96(b+d)200(n)相关系数计算列联相关系数的假设检验乙法(分组)甲法合计组60(
11、60%)40(40%)100组60(60%)40(40%)100合计12080200乙法甲法合计84(84%)16(16%)10020(20%)80(80%)100合计10496200r=0r=0.64列联相关系数的假设检验如果两法没有相关性,那么在乙法判断为阳性和阴性的病例中,甲法判断为阳性的比例应该相同!即a/(a+b)=c/(c+d)检验行间的构成比或者率!2检验乙法甲法合计aba+bcdc+d合计a+cb+dnH0:两种方法观察舌象的结果无相关;H1:两种方法观察舌象的结果有相关。=0.05。=1查附表3 2界值表,得P0.005,按=0.05水准,拒绝H0,接受H1,认为甲乙两种方法
12、观察舌象的结果有相关关系。当用0、1分别编码“”、“”时,点相关系数等于Pearson系数。id甲法结果X乙法结果Y11(+)1 (+)21 (+)1 (+)841 (+)1 (+)850(-)1 (+)1000 (-)1 (+)1011 (+)0 (-)1201 (+)0 (-)1210 (-)0 (-)2000 (-)0 (-)行列表资料的相关分析 Cramr修正列联系数C较适合于定性资料的相关C的取值范围在01之间,0表示不相关;越接近于1表示关系越密切;1表示完全相关。C只表示两指标间的相关程度,并不表示相关方向。 某人按两种血型系统统计某地6094人的血型分布,结果见表10.5,问两
13、种血型的分布间有无关系? ABO血型MN血型合计MNMNO4314909021823A3884108001598B4955879502032AB137179325641合计1451166629776094注意: Cramr修正列联系数对行或者列的顺序信息是不敏感的!等级资料的相关Spearman等级相关将各变量X,Y分别编秩RX, RY;计算RX与RY的Pearson相关;所得结果即为Spearman等级相关rS。-1rs1例 抗白指数与临床疗效的关系某研究所用野百合治疗白血病,并作抗白血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系? 病例号 抗白指数X 临床疗效Y(1)
14、(2)12+23+39+410+511+630735845955+1070+11881290RX(3)123456789101112RY(4)99911.511.53336.56.533将X,Y分别由小到大编秩。其中Y有相同等级,分别取平均秩次。计算等级相关系数rs。将有关数据代入上式得:等级相关的假设检验H 0:S0,抗白指数与疗效无相关关系;H 1: S0,抗白指数与疗效有相关关系。 = 0.05。当n50时,用查“等级相关界值表”;当n50时,用 t 检验:t 服从自由度为n-2的 t 分布。本例,n=12,查附表15 rs界值表得,双侧 (0.05,12) =0.587,P50,计算t
15、值查附表2 t界值表,P0.05,说明儿童智力等级与母亲文化程度间存在正等级相关关系。等级相关的含义等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。例1 XY1122334455例2 XY112439416525例3XY1121.131.241.351.4例4XY1 12 103 1004 10005 10000定性变量和等级变量的相关如果一个变量是2分类,另一个是等级的,用Spearman相关是可行的;如果一个变量是多分类,另一个是等级的,用Ridits。A Logistic Regression Model is recommended!构建一个有序结果变量和无序分组变量间
16、的模型,以描述其关联性。各种资料间的相关定性资料等级资料定量资料定性资料等级资料定量资料列联相关Ridits;Logistic Modelspearman相关spearman相关Pearson相关Spearman相关当有一个变量带有次序信息时,结合使用回归模型会得到更为详细的结果。相关分析的正确应用相关关系是一种共变关系,不一定是因果关系。谨防多个变量间的相关性所带来的虚假关系充分利用散点图判断线性趋势判断离群值排除资料的间杂性直线相关分析对资料本身的要求:双变量正态分布当样本含量较大时,统计学检验的作用减小;多个变量间的相关分析要使用多重相关。(multiple correlation)关联
17、性和差异性是辨证统一的!组内相关散点图的作用飞行员的着陆次数(x)与焦虑程度(Y)散点图的作用识别离群值;PQ离群值对相关的影响排除间杂性(a)(b) 样本甲观察点 样本乙观察点样本的间杂性对相关和回归的误导二元正态分布二元正态分布的密度函数为:二元正态分布曲面(11=1,22=1,12=0) 二元正态分布曲面(11=1,22=1,12=0) 二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面剖面(11=1,22=1/2,12=0.75)XZY多个变量间的相关因此,谈
18、到多个变量间的相关性时,往往要说在扣除了其他变量的影响后,考察某两个变量的相关性。偏相关(Partial Correlation)关联性和差异性何为关联?两个变量中一个发生变化,另一个也随之变化如果X为分组变量,Y为观察结果那么所谓关联性,意味着X的取值变化(对应于不同分组),Y的平均水平(均数、率)出现有统计学意义的变化。故关联性=差异性!例:关联性=差异性某医院用某新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/l)如下,问新药与常规药物的疗效有无差别? t = 1.0195,P = 0.3215新药与常规药物的疗效无差别。新药组:243625142634
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国糠醇行业市场深度调研及投资价值研究报告
- 建筑项目施工管理流程规范
- 水表更换施工方案范本
- 一年级数学(上)计算题专项练习汇编
- 地面隔断处理方案范本
- 金华小型振动锤施工方案
- 妇产科管理方案范本
- 2024-2025学年学校体育活动推广计划
- 企业债券融资操作流程
- 客服中心工作职责及工作流程
- Lesson 10 Rain and Sun(教学设计)-2023-2024学年冀教版(三起)英语四年级下册
- 智联招聘国企笔试题库
- 《妇幼保健学》课件-第三章 儿童期保健
- GB/T 15597.2-2024塑料聚甲基丙烯酸甲酯(PMMA)模塑和挤出材料第2部分:试样制备和性能测定
- 2023年南充市委组织部南充市遴选(考调)公务员考试真题
- 婚内忠诚协议书范本电子版
- 2024年安徽省初中(八年级)学业水平考试初二会考生物试卷真题
- 2024年重庆市重庆市选调生考试(公共基础知识)综合能力题库含答案
- 国开2024《人文英语4》边学边练参考答案
- 质量手册(质量保证手册,压力容器)
- 20210年中考英语复习:阅读理解信息归纳摘录考题汇编(含答案)
评论
0/150
提交评论