版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 两变量关联性分析 第十一章本章主要内容:1、两个定量变量间的线性相关关系2、两个分类变量间的关联问题 第一节 线性相关 一、线性相关的概念及其统计描述例11-1 在某地一项膳食调查中,随机抽取了14名40-60岁的健康妇女,测得每人的基础代谢(KJ/day)与体重(kg)数据,见表11-1。据此数据如何判断这两项指标间有无关联?表11-1 14例中年健康妇女的基础代谢与体重的测量值 No.基础代谢(KJ/day)体重(Kg)No.基础代谢(KJ/day)体重(Kg)14175.650.7 83970.648.624435.053.7 93983.244.633460.237.1 105050
2、.158.644020.851.7 115355.571.053987.447.8 124560.659.764970.662.8 134874.462.175359.767.3 145029.261.5散点图:图11-1 14例中老年健康妇女基础代谢与体重的散点图线性相关(linear correlation): 两个随机变量X、Y之间呈线性趋势的关系,又称简单相关(simple correlation) 。 (1)(2)(3)(4)正相关负相关曲线相关无相关相关的种类:正相关(positive correlation) 负相关(negative correlation) 非线性相关( no
3、nlinear correlation ) 零相关(zero correlation)二、相关系数的意义及计算 又称 Pearson积矩相关系数(Pearson product moment coefficient) 相关系数 = 线性相关系数 (linear correlation coefficient)总体相关系数:若0, 称X和Y线性相关, 简称相关;若0, 则简称X和Y不相关。样本相关系数r 协方差(covariance)的定义、含义 X的样本方差 = Y的样本方差 = X和Y的样本协方差 = 图11-3 双变量协方差示意图 式中 分别表示X的离均差平方和、Y的离均差平方和、X与Y的
4、离均差乘积和。 相关系数的特点: 相关系数是一个无量纲的数值,且-1 1; 0为正相关, 0为负相关, = 0为零相关;的绝对值越接近于,说明相关性越强,越接近 于,说明相关性越弱。例11-2 计算例11-1中基础代谢Y与体重X之间的样本相关系数。 由公式分别先算出 再代入公式 说明基础代谢随体重增大而升高,两变量呈正相关。三、相关系数的统计推断 H0:0H1:0查相关系数临界值表(附表13)t 检验,统计量为: 常用的检验方法:例11-3 继例11-2中算得r0.964后, 试检验相关是否具有统计学意义。 检验假设为 :0, :0, = 0.05方法一:由自由度 ,查r临界值表可得 =0.5
5、32, =0.780, 从而P0.001,即相关系数有统计学意义。可以认为,基础代谢与体重之间存在线性相关。 方法二:t 检验 根据公式: 据自由度 查t临界值表, 得双侧 t , P0.001, 故拒绝 。可以认为基础代谢与体重之间存在正相关。此结果与查表检验的结果是一致的。注意: P 值越小并不表示相关性就越强! 总体相关系数的区间估计: 双曲正切变换反双曲正切变换(1)(2)(3)例11-3(续):继例11-2中算得r0.964后, 试估计总体相关系数的95%置信区间。从而,95%置信区间为 。 四、相关分析应注意的问题 1. 在进行相关分析前应先绘出散点图。 2. 线性相关分析要求两个
6、变量是服从双变量正态分布的随机变量。3. 出现异常值时慎用相关。 4. 相关关系不一定是因果关系。 5. 分层资料盲目合并易出假象。 A medical article once pointed with great alarm to an increase in cancer among milk drinkers. Cancer, it seems, was becoming increasingly frequent in New England, Minnesota, Wisconsin, and Switzerland, where a lot of milk is produced
7、 and consumed, while remaining rare in Ceylon, where milk is scarce. For further evidence it was pointed out that cancer was less frequent in some Southern states where less milk was consumed. Also, it was pointed out, milk-drinking English women get some kinds of cancer eighteen times as frequently
8、 as Japanese women who seldom drink milk. - 1960s图11- 5 误用相关的几种情况 一、 秩相关的概念及其统计描述第二节 秩相关Pearson相关对资料的要求秩相关(rank correlation),也称等级相关 例11-4:某研究者研究10例6个月-7岁的贫血患儿的血红蛋白含量与贫血体征之间的相关性,结果见表11-2,试作秩相关分析。病人编号血红蛋白含量X 秩次 p 贫血体征Y 秩次 q(1) (2) (3) (4) (5)+10.0+8.0 +6.0 -3.0 +8.0 +8.0 -3.0 -3.0 -3.0 -3.0 合计 55 55 1
9、 2 3 4 5 6 7 8 9105.05.86.17.38.89.111.112.313.513.8 1 2 3 4 5 6 7 8 910表11-2 贫血患儿的血红蛋白含量(g/dL)和贫血体征 H0:s 0H1:s 0查相关系数临界值表(附表14)t 检验,统计量为: 检验方法:第三节 分类变量的关联性分析 对两个定量变量的关联性,我们可用Pearson积矩相关系数或秩相关系数来描述;对两个分类变量,通常是先根据交叉分类计数所得的列联表进行两种属性独立性的检验,然后计算关联系数。一、交叉分类22表的关联分析例11-6: 研究吸烟方式与患慢性气管炎是否有关,某研究者随机调查了200例年龄
10、相仿的吸烟者,对每个个体分别观察慢性气管炎与否和吸烟方式两种属性,22种结果分类记数如表11-3所示。试分析两种属性的关联性。吸烟方式慢性气管炎合 计有无自卷纸烟225375过滤嘴15110125合 计37163200 表11-3 吸烟习惯与患慢性气管炎的关系 属性 X属性 Y 合 计Y1Y2X1A11(11)A12(12)n1 (r1)X2A21(21)A22(22)n2(r2)合 计m1(c1)m2(c2) n(1.0)表11-4 22交叉分类频数表的一般形式及概率表达从概率角度考虑,所谓两属性X和Y互相独立(independence)是指在交叉分类表中每一格子中同时具有两种属性的联合概率
11、等于相应属性的边际概率的乘积 : 两种属性之间互相独立; : 两种属性之间互相关联。 统计量 交叉分类资料独立性检验与比较两独立样本频率的假设检验所用的检验公式、理论频数计算公式和自由度的计算公式完全相同。但是,必须注意,这两类问题的研究目的、设计方案、数据结构以及最后对于结果的解释都是不同的。现就例11-6的数据作两种属性的关联性分析。 :吸烟方式与慢性气管炎有无之间互相独立 :吸烟方式与慢性气管炎有无之间有关联 =0.05将表中各数据代入公式(9-7) ,P0.005,拒绝原假设。可以认为慢性气管炎有无与吸烟方式之间存在着关联性。 Pearson列联系数 (contingency coef
12、ficient)列联系数介于0和1之间, 假设检验等价于两种属性独立性的 检验。 例11-7:有132份食品标本,把每份标本一分为二,分别用两种检验方法作沙门氏菌检验,检验结果如表11-5,试问两种检验方法的结果是否存在关联? 二、22配对资料的关联性分析甲法 乙 法 合 计 +-+ 90- 42合 计 132 80 31111101121表11-5 两种检验方法的结果注:“+”表示检出沙门氏菌,“-”表示未检出沙门氏菌 :两种检验方法的结果之间互相独立 :两种检验方法的结果之间互相关联 =0.05 将本例数据代入公式(9-7),三、RC表分类资料的关联性分析 例11-8 欲探讨职业类型与胃病
13、类型是否有关联,某医生将收治的310名胃病患者按主要的职业类型与胃病类型两种属性交叉分类,结果见表11-6问职业类型与胃病类型间有无关联? 表11-6 310名胃病患者两种属性的交叉分类表职业胃病 合 计浅表性胃炎 慢性胃炎胃溃疡805220机关干部工厂工人公交车司机486222 41210132126 52 152 132 26 310合计 : 胃病类型与职业无关联 : 胃病类型与职业有关联 =0.05P0.005例11-9 某省随机抽查了1043位居民的ABO血型与MN血型,资料如表11-7所示。问两种血型之间有无关联性? ABO血型MN血型合 计MNMNO 85 100150335A 56 78
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年文化旅游产业融合发展项目投资合同
- 2024年度人力资源服务合同:某人力资源公司与企业之间的人力资源服务合同
- 2024年度知识产权许可使用合同:知识产权持有者许可他人使用其知识产权
- 2024年度房屋建筑施工物流运输合同3篇
- 2024年度物流配送合同协议
- 2024年度茶楼排水系统维修合同
- 2024年度中介服务代理销售二手房合同
- 2024年度特许经营合同书
- 二零二四年度网络安全监测与维护合同
- 肖邦销售合同范本
- 超声药物透入疗法对临床常见痛症治疗课件
- 数据中心机房运维服务
- 室内足球项目融资计划书
- 双层套管施工方案
- CPK数据图表生成器
- 现代汉语语法研究最全试题集自考含答案
- 2023-2024学年高中主题班会 200天大有作为-高考倒计时200天主题班会课件
- 《C语言程序设计(第2版)》课后习题参考答案
- 办公家具投标方案
- 第六章 1弯曲变形课件
- 先进生产(工作者)申-报-表
评论
0/150
提交评论