卫生统计学 第十一章两变量关联性分析_第1页
卫生统计学 第十一章两变量关联性分析_第2页
卫生统计学 第十一章两变量关联性分析_第3页
卫生统计学 第十一章两变量关联性分析_第4页
卫生统计学 第十一章两变量关联性分析_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学

流行病与卫生统计学系1第十一章

两变量关联性分析2

单一变量的统计分析

分析两变量之间的关系

3本章主要内容:

线性相关秩相关分类变量的关联性分析4第一节线性相关5例11-1随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间(秒),判断这两项指标间有否相关?表11-1

15名健康成人凝血时间与凝血酶浓度测量值记录受试者号123456789101112131415凝血酶浓度1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7凝血时间141315151314161714161516141517问题6一、直线相关的概念及其统计描述如果两个随机变量中,一个变量由小到大变化时,另一个变量也相应地由小到大(或由大到小)地变化,并且直线趋势,就称这两个变量存在直线相关关系是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法71、散点图8相关的类型★正相关★负相关★完全正相关★完全负相关★零相关

92、相关系数它又称为积差相关系数(Pearson相关系数),以符号r来表示相关系数。它是说明两变量间相关关系的密切程度和相关方向。10

描述两个随机变量X,Y之间的关系的量,用以刻画变量X变化时对随机变量Y变化的影响的大小

11r无单位,-1≤r≤1r值为正——正相关,为负——负相关|r|=1---完全相关|r|=0---零相关12

13二、相关系数的假设检验检验r是否来自总体相关系数为零的总体方法有两种:1、查表法(r界值表)2、采用t检验

14例11-3前面所得r值,检验健康成人凝血浓度与凝血时间间是否有直线相关。

15三、线性相关应用中应注意的问题1、样本的相关系数接近零时并不意味着两变量间一定无相关性2、一个变量的数值人为选定时莫作相关3、出现异常点时慎用相关4、相关未必真有内在联系5、分层资料盲目合并易出假象16第二节秩相关17

一、秩相关的概念及其描述又称等级相关,适用于下列资料(1)不服从双变量正态分布(2)总体分布类型未知(3)等级资料下面介绍最常用的Spearman等级相关18例11-4某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性。

病人编号血小板秩次p2现血症状秩次q2pq(1)(2)(3)(4)(5)(6)(7)(8)112111+++11.5132.511.5213824++9.08118316539+7.049214310416-3.512.25145426525++9.081456540636++9.081547740749-3.512.2524.581060864-3.512.252891260981-3.512.2531.510129010100-3.512.253511143811121++++11.5132.25126.512200412144-3.512.2542合计_78650_78630451实例19一、Spearman等级相关

等级相关系数

rs也应假设检验,在n小于等于50时用查表法,当n大于50时计算统计量t值20

本例

21

二、秩相关系数的统计推断

查rs临界值表,

<22第三节分类变量的关联性分析23两个定量变量间线性联系--pearson积差相关或秩相关两个定性变量间的联系--根据两个定性变量交叉分类计数所得的频数资料作关联(association)分析(关于两独立性的卡方检验)24

一、交叉分类2*2表的关联性分析

例11-6为观察婴儿腹泻是否与喂养方式有关,收集消化不良的婴儿82例,观察腹泻与否和喂养方式两种属性,试分析两种属性的关联性。

表11-3婴儿腹泻与喂养方式的关系

喂养方式腹泻合计有无人工301040母乳172542合计47358225

表11-4

2*2交叉分类频数表的一般形式

独立(independence):是指属性X的分布的概率与属性Y的概率分布无关,否则称这两种属性之间存在关联性。

从概率的角度考虑,独立是指在交叉分类表每一格子中同时具有两种属性的联合概率等于相应属性的边际概率的乘积。属性X属性Y合计Y1Y2X1A11(11)A12(12)n1(r2)X2A21(21)A22(22)n2(r2)合计m1(c2)m2(c2)n26检验统计量仍采用卡方检验:

27

H0:喂养方式与腹泻之间互相独立

H1:喂养方式与腹泻之间有关联=0.05

则拒绝原假设,说明婴儿腹泻与喂养方式之间存在着关联性。

>28

Pearson列联系数

(contingencycoefficient):

本例列联系数为:

列联系数介于0与1之间,理论上也应就总体列联系数是否为0作假设检验,但这个假设检验等价于上述的卡方检验。

29

二、2*2配对资料的关联性分析

例11-7有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长情况,问两种培养基的结果有无关联?

表11_5两种白喉杆菌培养结果

甲培养基乙培养基合计+_+221840_21416合计24325630H0:两种培养基之间互相独立

H1:两种培养基之间有关联=0.05

则拒绝原假设,两种培养基之间存在着关联性。进一步计算列联系数。

>31

列联系数介于0与1之间,理论上也应就总体列联系数是否为0作假设检验,但这个假设检验等价于上述的卡方检验。

32三、R*C分类资料的关联性

例11-8

为探讨较甲状腺肿与祖籍是否有关联,按甲状腺肿类型与祖籍两种属性交叉分类,问甲状腺肿与祖籍有无关系?

表11-6某地居民按甲状腺肿类型与祖籍两属性的交叉分类表祖籍甲状腺肿类型合计弥漫型结节发型混合型

甲4862

4

492乙13326051

444丙10031585500合计719577140143633:甲状腺肿类型与祖籍无关联

:甲状腺肿类型与祖籍有关联

=0.0534在有关系的前提,若须进一步分析关系的密切程度时,可计算Pearson列联系r。列联系数取值范围在0-1之间.35

例11-9测得某地1043人的ABO血型和MN血型结果如果下表,问两种血型系统之间是否有关联?

表11-7某地1043人的血型ABO血型MN血型合计

MNMNO85100150335A5678120254B98132170400AB2325654合计262335446104336r37小结掌握:利用散点图确定两个变量之间是否有线性关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论