spss授课_correlate.ppt_第1页
spss授课_correlate.ppt_第2页
spss授课_correlate.ppt_第3页
spss授课_correlate.ppt_第4页
spss授课_correlate.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,相关分析(Correlate),基本统计学原理 相关分析的概念 相关分析的类型 几种常见的相关分析方法 SPSS操作 Bivariate Partial Distance,2,相关分析的概念,医学上人的身高与体重、血压与年 龄、药物剂量与疗效、肺活量与体重和 胸围等均有一定的联系。说明客观事物 或现象相互间协同变化的密切程度并用 适当的统计指标表示出来,这就是统计 学上相关分析要回答的问题。统计学上 通过计算一定的相关系数来说明变量间 的密切程度。,3,注意点: 相关分析关心是两个变量间是否有协同 变化的关系,变化的趋势,变化的密切程度 和方向。两个变量间不一定具有因果关系, 它们往往是伴

2、随或共存关系。,X,Y,X,X,X,Y,Y,Y,W,4,相关分析的类型,统计量 意义 资料类型 直线(Pearson) 两个变量间 二元正态 相关系数 的直线相关性 分布资料 等级(Spearman) 两个变量间 二元非正态 相关系数 的等级相关性 分布或等级资料 复相关系数 一个变量与一 多元正态 组变量间的相关性 分布资料 典型相关系数 两组变量的 多元正态 相关性 分布资料 偏相关系数 固定其它变量时 两个变量间相关性,5,几种常见的相关分析方法,直线相关(pearman相关) 直线相关就是研究变量X和Y的直线相关 关系。我们用直线相关系数(记为 r)表示 变量间的相关程度。 ( X -

3、 X )( Y- Y ) r = ( X - X )2 ( Y - Y )2,Cov(x,y) r = Sx Sy,6,或 L xx r = L xx L yy,其值为 -1 r 1。 r 值为正表示正相关, 即X和Y 同增加或减少,变化趋势是同向的;反 之,r 值为负表示负相关,即X和Y呈反向变化。 r 等于零为零相关,表示X和Y无直线相关关系; r 值的绝对值为1表示完全相关,即X和Y严格服 从直线关系。在生物界由于影响因素众多,因 此r值一般介于-11之间。r越的绝对值越接近1, 表示两变量间直线相关程度越高。,7,例:某地区10名健康儿童头发与全血中 的硒含量(1000ppm),数据如

4、上 ,问发硒 与血硒间有无直线相关?,编号 发硒(X) 血硒(Y) 1 74 13 2 66 10 3 88 13 4 69 11 5 91 16 6 73 9 7 66 7 8 96 14 9 58 5 10 73 10,8,9,10,11,12,偏相关(partial correlate),多元线性相关:是研究多个变量间的线性 关系的一种统计分析方法。在简单的相关 分析中,变量只有两个(X,Y),相关系 数只有一个。但在多元相关分析中变量有 三个或更多,变量间的相关系数一般有三 种类型:简单相关系数、偏相关系数、复 相关系数。 例:儿童肺活量(Y)与身高(X1)及 体重(X2)关系。,13

5、,偏相关系数:亦称部分相关系数。它是当 其它变量固定时,说明某两个变量间相关 程度和方向的统计指标。 例如:分析三个变量(X1、X2 、X3)间 的关系时有三个偏相关系数 :r12.3 ,r13.2 , r23.1 。 零级偏相关 一级偏相关 二级偏相关,14,肺活量(Y),身高(X1),体重(X2),实际上,在研究多个变量中两两之间的 相关性时,把两变量之外的其他变量作为固 定变量所求得的偏相关系数更能真实地反映 两变量之间的相关程度。,15,例1 某地29名13岁男童身高(cm)X1,体重 (Kg)X2及肺活量(L)Y的实测数据如表所 示,试求肺活量对身高、体重的多元线性回 归方程。,16

6、,17,18,偏相关系数计算公式:,变量 y、变量 x 1、变量 x 2,ryi - ryj rij R yi.j = ( 1 - ryj2 ) ( 1 - rij2),19,偏相关系数计算公式:,变量 x1、变量 x 2 、变量 x 3,r12 - r13 r23 R 12.3 = ( 1 - r132 ) ( 1 - r232),20,偏相关系数计算公式:,变量 x1、变量 x 2 、变量 x 3,r13 - r23 r12 R 13.2 = ( 1 - r232 ) ( 1 - r122),21,偏相关系数计算公式:,变量 x1、变量 x 2 、变量 x 3,r23 - r13 r12

7、R 23.1 = ( 1 - r132 ) ( 1 - r122),22,例: 研究肺活量时测得10名名女中学生体重X1(kg)、胸围X2(cm)、呼吸差X3(cm)及肺活量 y(ml),数据如下,试作两两变量间的直线相关分析,然后再作固定体重时肺活量与胸围和呼吸差的偏相关分析。,23,24,25,26,27,PARTIAL CORRELATION COEFFICIENTS Controlling for. X1 X2 X3 YX2 1.0000 .4524 .6590 ( 0) ( 7) ( 7) P= . P= .221 P= .054X3 .4524 1.0000 .5137 ( 7)

8、( 0) ( 7) P= .221 P= . P= .157Y .6590 .5137 1.0000 ( 7) ( 7) ( 0) P= .054 P= .157 P= .(Coefficient / (D.F.) / 2-tailed Significance) . is printed if a coefficient cannot be computed,28,附:复相关系数,复相关系数亦称多元相关系数 或 全相关系 数。在多元线性相关分析中 ,应变量Y与各 个自变量(X1,X2,X m)间的线性回归关 系是否密切可以用复相关系数来说明 。它 记作RY12m,简记为R,计算公式为 SS回

9、 R = Lyy,29,应变量的离均差平方和Lyy可以分解为回归 平方和SS回及剩余平方和SS剩两部分 ,即: Lyy= SS回 + SS剩 故上式也可改写为 SS剩说明各实测值y与回归估计值 Y 间的离差。 SS剩越小,则R越大,说明各实测值与回归 平面越近 ,应变量与自变量间的线性关系,Lyy - SS剩,Lyy,SS剩=(Y - Y)2,30,越密切。复相关系数取正值,0R 1。复 相关系数的平方R2称决定系数。它说明应变 量 的 变异中各自变量的改变而引起的占多 少,如R2=0.8,则说明应变量的变异中有80 %由自变量的改变而引起。,31,32,33,等级相关(spearman相关),等级资料的相关分析称等级相关,这 是一种非参数统计方法。分析两事物数量 间的直线关系时,对下列情况宜用等级相 关: 、两事物的量,有的不能准确 测量,只能按大小、程度 、优劣或 综合判断给出顺序号。 、虽可测量 ,但是总体数据的 分布未知或已知不是正态双变量,不 能作pearson相关分析。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论