双变量关联性分析.ppt_第1页
双变量关联性分析.ppt_第2页
双变量关联性分析.ppt_第3页
双变量关联性分析.ppt_第4页
双变量关联性分析.ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、授课教师:殷菲,双变量 关联性分析,单变量分析方法(univariate analysis):t检验、u检验、方差分析 双变量分析方法(bivariable analysis) :直线回归与相关、秩相关等,直线相关,直线相关的概念,用相关系数描述两变量间直线关系的密切程度和方向 相关系数又称Pearson 积矩相关系数,样本相关系数用r表示,总体相关系数用 表示,相关的种类,0 r 1,-1 r 0,r = 1,r = -1,r = 0,r = 0,相关的种类,正相关:0 r 1 完全正相关: r 1 负相关:-1 r 0 完全负相关: r -1 零相关:r 0 相关系数没有单位,其值为-1r

2、1,相关系数的意义,相关密切程度:用r的大小表示,r的绝对 值越接近于1,说明相关越密切 相 关 方 向 : 用r的正负号表示,P164 例13.1,某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,数据如表13.1所示。据此回答两变量是否有关联?其方向与密切程度如何?,直线相关的计算步骤,绘制散点图:观察散点是否随一变量的变化而变化,所有散点是否呈直线关系,图13.1 15名正常成年人体重和双肾体积的散点图,体重 (kg) x,双肾体积 (ml) y,直线相关的计算步骤,计算样本相关系数(本例r =0.875),离均差积和,相关系数的假设检验,检验r是否来自总体相关系数为

3、零的总体。 常用t检验:,Ho: 0,两变量间无直线相关关系 H1: 0 两变量间有直线相关关系 0.05 查附表3,t界值表,得p0.001,拒绝Ho,可以认为体重和双肾体积之间有直线相关关系。,相关分析应用中应注意的问题,1. 进行相关分析前应先绘制散点图 散点图能使我们直观地看出两变量间有无线性关系并发现可能的离群点(outlier),当散点有线性趋势时,才能进行相关分析。,2. 出现离群点时慎用相关,3. 分层资料不可盲目合并,3. 分层资料不可盲目合并,3. 分层资料不可盲目合并,3. 分层资料不可盲目合并,直线回归与直线相关的区别与联系,区 别,1、资料要求不同 回归:y服从正态分

4、布,x没有特别的 要求 相关:x和y服从双变量正态分布 (若x数值系人为选定,莫作相关 例 药物的剂量-反应关系),区 别,2、应用情况不同 回归:反映两变量间的数量关系(b) 相关:反映两变量间互依的程度和方向(r),提问方式不同 年龄增加,血压发生什么样的变化? 年龄和血压之间有关系吗?,联 系,1、方向一致:对同一组数据若同时计算r和b,其正负号是一致的 Question: r和b的大小有关系吗?r较大,是否b也较大?,联 系,2、假设检验等价:r和b的假设检验是等价的,即对同一样本,两者的t值相等,检验结果完全一致,联 系,3、用回归解释相关 r的平方称为决定系数,决定系数r2,表示回

5、归平方和占总平方和的比例,即应变量y的总变异中由自变量x可以解释的比例。 SS回越接近于SS总,则r2越接近于1,说明引入相关变量的效果越好 当相关系数较小时,若引入回归,可能由于减少的误差太少而无实际意义,example,如 r0.20,n100时,P0.05,r有统计学意义。但r20.04,表示SS回在SS总中仅占4,说明两变量相关分析的实际意义不大。,应用直线回归和相关的注意点,1、作回归和相关分析之前,先绘制散点图 2、据资料的性质正确选用回归和相关 3、用回归方程进行预测的时候,应当谨慎。X不能偏离实测范围太远,否则偏差太大。,example,x:2050妇女年龄 y:血压 x0时,

6、,应用直线回归和相关的注意点,4、相关关系不一定是因果关系,也可能是伴随关系,如某生春种一植物,不久长出幼苗。恰邻院盖楼,细心观测,苗长楼增。计算发现,苗高与楼高具有相关性。 两者是否真有内在联系?,例:18751920,美国年铁制品产量与英国年出生率相关系数为-0.98 因素:社会、经济、技术,应用直线回归和相关的注意点,5、不能只根据相关系数的绝对值大小来判断相关的密切程度,应首先作假设检验 例:r=0.601 n=8 p=0.100.20 r=0.401 n=42 p=0.0050.01,应用直线回归和相关的注意点,6、 和 为零仅说明没有变量间没有直线关系,不能说明变量间没有关系,秩

7、相 关,秩相关适用条件,原始数据只能以等级表示 总体分布未知 不服从双变量正态分布,P169 例13.4,某研究者对15例3050岁成年男子的舒张压(mmHg)与夜间最低血氧含量分级进行研究,结果见表13.2,试分析两者的关联性。,rs的计算,将x及y的秩次直接代入直线相关系数的计算公式可得到rs 。,rs的假设检验,当n50时,检验s是否为零可用查表法(查附表15,rs界值表)。 当n50时,按式(13-4)和(13-5)计算检验统计量。,分类变量的关联性分析,对一组观察对象, 分别观察其两种分类变量的表现, 归纳成双向交叉排列的统计表, 这类统计表用以描述行变量和列变量之间的关系 , 亦称

8、为列联表(contingency table)。,什么是关联性分析?,单一样本,按两种属性分级,故称双向有序列联表 分析目的:推断两种属性标志间有无关系,关联性分析,22 列联表 RC列联表,例13.6 为研究青少年在校情况与对艾滋病知晓情况之间的关系,某研究者在某地共调查了384名青少年,并对每名青少年按是否在校和对艾滋病是否知晓两种属性交叉分类,如表13.3所示。试问两变量是否存在关联性?,表13.3 交叉分类表,两种方法有无关系关联性分析,两法检验的结果有无关系,:两变量互相独立(无关系) :两变量互相关联(有关系) =0.05 查附表9, 得P0.05, 按=0.05水准拒绝, 故可以认为青少年是否在校与对艾滋病是否知晓之间有关联 。,上述检验说明有无关联,若需了解两个分类变量的关联程度,需进一步计算列联系数。,列联系数取值范围为01,数值越接近1,关联性越强。,关联性分析,22 列联表 RC列联表,例13.7为研究自我效能感与领导行为类型是否有关,某研究者抽样调查了来自某省各三甲医院的238名护士长,并对每个个体按自我效能感和领导行为类型两种属性交叉分类,如表13.5所示。试分析两变量的关联性。,表13.5 自我效能感与领导行为交叉分类表,1.建立检验假设,H0:自我效能感与领导行为类型间无关联 H1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论