卫生统计学课件:第11章 两变量关联性分析_第1页
卫生统计学课件:第11章 两变量关联性分析_第2页
卫生统计学课件:第11章 两变量关联性分析_第3页
卫生统计学课件:第11章 两变量关联性分析_第4页
卫生统计学课件:第11章 两变量关联性分析_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 两变量关联性分析两变量关联性分析 第十一章第十一章 本章主要内容:本章主要内容: 1、两个定量变量间的线性相关关系、两个定量变量间的线性相关关系 2、两个分类变量间的关联问题、两个分类变量间的关联问题 第一节第一节 线性相关线性相关 一、线性相关的概念及其统计描述一、线性相关的概念及其统计描述 例例11-111-1 在某地一项膳食调查中,随机抽取了14名40-60岁的 健康妇女,测得每人的基础代谢(KJ/day)与体重(kg)数据, 见表11-1。据此数据如何判断这两项指标间有无关联? 表11-1 14例中年健康妇女的基础代谢与体重的测量值 No. 基础代谢基础代谢 (KJ/day) 体重(

2、体重(Kg)No. 基础代谢基础代谢 (KJ/day) 体重(体重(Kg) 14175.650.7 83970.648.6 24435.053.7 93983.244.6 33460.237.1 105050.158.6 44020.851.7 115355.571.0 53987.447.8 124560.659.7 64970.662.8 134874.462.1 75359.767.3 145029.261.5 散点图: 图11-1 14例中老年健康妇女基础代谢与体重的散点图 线性相关线性相关(linear correlation): 两个随机变量X、Y 之间呈线性趋势的关系,又称简单相

3、关简单相关(simple correlation) 。 (1)(2) (3)(4) 正相关正相关 负相关负相关 曲线相关曲线相关 无相关无相关 相关的种类: 1.正相关(positive correlation) 2.负相关(negative correlation) 3.非线性相关( nonlinear correlation ) 4.零相关(zero correlation) 二、相关系数的意义及计算二、相关系数的意义及计算 n又称 Pearson积矩相关系数(Pearson product moment coefficient) 相关系数 = )(的方差的方差 的协方差和 YX YX 线

4、性相关系数 (linear correlation coefficient) n总体相关系数总体相关系数:若0, 称 X 和 Y 线性相关, 简称相关;若0, 则简称 X 和 Y 不相关。 n样本相关系数样本相关系数 r 协方差协方差(covariance)的定义、含义的定义、含义 X的样本方差 = Y的样本方差 = X和Y的样本协方差 = 1 )( 1 2 n XX n i i 1 )( 1 2 n YY n i i 1 )( 1 n YYXX n i ii 图图11-3 双变量协方差示意图双变量协方差示意图 n i n i ii n i ii YYXX XY YYXX YYXX ll l

5、r 11 22 1 )()( )( 式中 分别表示X的离均差平方和、Y的离均差平方 和、X与Y的离均差乘积和。 XYYYXX lll, 2 11 2 1 n i i n i iXX X n Xl 2 11 2 1 n i i n i iYY Y n Yl n i i n i i n i iiXY YX n YXl 111 1 相关系数的特点: 1.相关系数相关系数 是一个无量纲的数值,且是一个无量纲的数值,且-1 1; 2. 0为正相关,为正相关, 0为负相关,为负相关, = 0为零相关;为零相关; 3. 的绝对值的绝对值越接近于,说明相关性越强,越接近越接近于,说明相关性越强,越接近 于,说

6、明相关性越弱。于,说明相关性越弱。 例例11-2 计算例11-1中基础代谢Y与体重X之间的样本 相关系数。 由公式分别先算出 5771.1144 XX l 0121.4645447 YY l 2329.70303 XY l 964. 0 YYXX XY ll l r 再代入公式 说明基础代谢随体重增大而升高,两变量呈正相关。说明基础代谢随体重增大而升高,两变量呈正相关。 三、相关系数的统计推断三、相关系数的统计推断 H H0 0: :0 0 H H1 1: :00 1.查相关系数临界值表(附表13) 2.t 检验,统计量为: r r S r t 0 2 1 2 n r Sr 常用的检验方法:

7、例例11-3 继例继例11-2中算得中算得r0.964后后, 试检验相关是试检验相关是 否具有统计学意义否具有统计学意义。 检验假设为检验假设为 :0, :0, = 0.05 0 H 1 H 方法一方法一:由自由度 ,查r临界值表可得 =0.532, =0.780, 从而P0.001,即相关系数有统计学意义。 可以认为,基础代谢与体重之间存在线性相关。 12214 12,05. 0 r 12,001. 0 r 方法二:方法二:t 检验检验 根据公式: 据自由度 查 t 临界值表, 得双侧 t , P0.001, 故拒绝 。可以认 为基础代谢与体重之间存在正相关。此结果与查表检 验的结果是一致的

8、。 559.12 214 )964. 0(1 964. 0 2 r t 12214 318. 4,12 2001. 0 t 0 H 注意:注意: P P 值越小并不表示相关性就越强!值越小并不表示相关性就越强! 总体相关系数的区间估计:总体相关系数的区间估计: 1 1 ln 2 1 r r z 3/,3/ 2/2/ nZznZz 1 1 2 2 z z e e r 双曲正切变换双曲正切变换 反双曲正切变换反双曲正切变换 (1) (2) (3) 例例11-311-3(续):继例(续):继例11-211-2中算得中算得r r0.9640.964后后, , 试估试估 计总体相关系数的计总体相关系数的

9、95%95%置信区间。置信区间。 9996. 1) 964. 01 964. 01 ln( 2 1 ) 1 1 ln( 2 1 r r z 5906) 4086,(. 2. 1 8872. 0 1 1 1 1 )4086. 1(2 4086. 12 2 2 e e e e Z Z)( 9888. 0 1 1 1 1 )5906. 2(2 5906. 22 2 2 e e e e Z Z)( 从而,从而,95%95%置信区间为置信区间为 。 )9888. 08872. 0,( 四、相关分析应注意的问题四、相关分析应注意的问题 1. 在进行相关分析前应先绘出在进行相关分析前应先绘出散点图散点图。

10、2. 线性相关分析要求两个变量是服从线性相关分析要求两个变量是服从双变量正态双变量正态 分布的随机变量分布的随机变量。 3. 出现出现异常值异常值时慎用相关。时慎用相关。 4. 相关关系不一定是相关关系不一定是因果关系因果关系。 5. 分层资料分层资料盲目合并盲目合并易出假象。易出假象。 A medical article once pointed with great alarm to an increase in cancer among milk drinkers. Cancer, it seems, was becoming increasingly frequent in New E

11、ngland, Minnesota, Wisconsin, and Switzerland, where a lot of milk is produced and consumed, while remaining rare in Ceylon, where milk is scarce. For further evidence it was pointed out that cancer was less frequent in some Southern states where less milk was consumed. Also, it was pointed out, mil

12、k-drinking English women get some kinds of cancer eighteen times as frequently as Japanese women who seldom drink milk. - 1960s 图图11- 5 误用相关的几种情况误用相关的几种情况 一、一、 秩相关的概念及其统计描述秩相关的概念及其统计描述 第二节第二节 秩相关秩相关 nPearson相关相关对资料的要求 n秩相关(秩相关(rank correlation),),也称等级相关 例例11-4:某研究者研究某研究者研究10例例6个月个月-7岁的贫血患儿岁的贫血患儿 的血红

13、蛋白含量与贫血体征之间的相关性,结果的血红蛋白含量与贫血体征之间的相关性,结果 见表见表11-2,试作秩相关分析。,试作秩相关分析。 病人病人 编号编号 血红蛋白含量血红蛋白含量 X 秩次秩次 p 贫血体征贫血体征 Y 秩次秩次 q (1) (2) (3) (4) (5) +10.0 +8.0 + +6.0 - -3.0 + +8.0 + +8.0 - -3.0 - -3.0 - -3.0 - -3.0 合计 55 55 1 2 3 4 5 6 7 8 9 10 5.0 5.8 6.1 7.3 8.8 9.1 11.1 12.3 13.5 13.8 1 2 3 4 5 6 7 8 9 10 表

14、11-2 贫血患儿的血红蛋白含量(g/dL)和贫血体征 5 .82 pp l5 .70 qq l5 .56 pq l 741. 0 qqpp pq s ll l r H H0 0: :s s 0 0 H H1 1: :s s 0 0 1.查相关系数临界值表(附表14) 2.t 检验,统计量为: s s r s r S r t 0 2 1 2 n r S s rs 检验方法: 第三节第三节 分类变量的关联性分析分类变量的关联性分析 对两个定量变量的关联性,我们可用对两个定量变量的关联性,我们可用Pearson积矩积矩 相关系数或秩相关系数来描述;对两个分类变量,通常相关系数或秩相关系数来描述;对

15、两个分类变量,通常 是先根据交叉分类计数所得的是先根据交叉分类计数所得的列联表列联表进行进行两种属性独立两种属性独立 性的检验性的检验,然后计算,然后计算关联系数关联系数。 一、交叉分类一、交叉分类2 22 2表的关联分析表的关联分析 例例11-6: 研究吸烟方式与患慢性气管炎是否有关,某研究者随 机调查了200例年龄相仿的吸烟者,对每个个体分别观察慢性 气管炎与否和吸烟方式两种属性,22种结果分类记数如表 11-3所示。试分析两种属性的关联性。 吸烟方式吸烟方式 慢性气管炎慢性气管炎 合合 计计 有有无无 自卷纸烟自卷纸烟225375 过滤嘴过滤嘴15110125 合合 计计37163200

16、 表11-3 吸烟习惯与患慢性气管炎的关系吸烟习惯与患慢性气管炎的关系 属性属性 X 属性属性 Y 合合 计计 Y1Y2 X1A11(11)A12(12)n1 (r1) X2A21(21)A22(22)n2(r2) 合合 计计m1(c1)m2(c2) n(1.0) 表表11-4 22交叉分类频数表的一般形式及概率表达交叉分类频数表的一般形式及概率表达 从概率角度考虑,所谓两属性X和Y互相独立互相独立 (independence)是指在交叉分类表中每一格子中同 时具有两种属性的联合概率等于相应属性的边际概率 的乘积 2 , 1,ji cjriij : 两种属性之间两种属性之间互相独立互相独立;

17、: 两种属性之间两种属性之间互相关联互相关联。 统计量 0 H 1 H ji ij ijij T TA , 2 2 )( 交叉分类资料独立性检验交叉分类资料独立性检验与比较两独立样本频率比较两独立样本频率的 假设检验所用的检验公式、理论频数计算公式和自 由度的计算公式完全相同。但是,必须注意,这两这两 类问题的研究目的、设计方案、数据结构以及最后类问题的研究目的、设计方案、数据结构以及最后 对于结果的解释都是不同的对于结果的解释都是不同的。 现就例11-6的数据作两种属性的关联性分析。 :吸烟方式与慢性气管炎有无之间互相独立 :吸烟方式与慢性气管炎有无之间有关联 =0.05 将表中各数据代入公

18、式(9-7) 0 H 1 H 341. 9 1633712575 200)155311022( 2 2 88. 7 1 ,005. 0 22 ,P0.005,拒绝原假设。可以认为慢 性气管炎有无与吸烟方式之间存在着关联性。 Pearson列联系数列联系数 (contingency coefficient) n r 2 2 211. 0 200341. 9 341. 9 2 2 n r 列联系数介于列联系数介于0和和1之间之间, 假设检验等假设检验等 价于两种属性独立性的价于两种属性独立性的 检验。检验。 2 例例11-711-7:有132份食品标本,把每份标本一分为二, 分别用两种检验方法作沙

19、门氏菌检验,检验结果如 表11-5,试问两种检验方法的结果是否存在关联? 二、二、2 22 2配对资料的关联性分析配对资料的关联性分析 甲法甲法 乙乙 法法 合合 计计 + - - + 90 - - 42 合合 计计 132 80 31 111 10 11 21 表表11-5 两种检验方法的结果两种检验方法的结果 注:注:“+ +”表示检出沙门氏菌,表示检出沙门氏菌,“- -”表示未检出沙门氏表示未检出沙门氏 菌菌 :两种检验方法的结果之间互相独立 :两种检验方法的结果之间互相关联 =0.05 将本例数据代入公式(9-7), 0 H 1 H 05. 084. 3867. 4 211114290 132)31101180( 2 2 P 188. 0 132867. 4 867. 4 2 2 n r 三、三、R RC C表分类资料的关联性分析表分类资料的关联性分析 例例11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论