统计学-课件13相关分析均数检验方差分析、正态性_第1页
统计学-课件13相关分析均数检验方差分析、正态性_第2页
统计学-课件13相关分析均数检验方差分析、正态性_第3页
统计学-课件13相关分析均数检验方差分析、正态性_第4页
统计学-课件13相关分析均数检验方差分析、正态性_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学相关分析Correlationysis1

问题的提出统计方法均数:t检验/方差分析、正态性检验(u检验)率:卡方检验、正态性检验(u检验)中位数:秩和检验、正态性检验(u检验)仅限于

一个指标如何

两个指标间的关系?R1R2R3S

R2

3.14

12

3.14(cm)1

1S

R2

3.14

1.52

7.07(cm)2

2S

R2

3.14

22

12.56(cm)3

3theRelationshipType

OnetheRelationshipType

Two2

确定性关系与相关关系确定性的函数关系:两变量间的函数关系

。圆的周长与半径的关系:

C=2R速度、时间与路程的关系:L=ST随机性的相关关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与 的关系;体重与体表面积的关系;直线相关分析的目的:目的:探讨两指标(变量)间的直线关系的方向及强度相关分析:主要内容相关的概念直线相关的概念直线相关的图示相关关系与确定性关系直线相关系数的计算直线相关系数的假设检验和区间估计两样本相关系数的比较相关的注意事项当两个数值变量之间出现如下情况:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,也就是有相关关系。两个变量同时增加或减少,变化趋势同向,则成为正相关;若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关;体表面积(103cm2),Y111215165.56.5y,存活率(%)x,

月份0

1

213

143

体重4

(kg5),X

67

8

9

10

11

120205.04060801006.0直线相关的概念直线相关(linear

correlation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数(correlation

coefficient)。总体相关系数用希腊字母ρ表示,而样本相关系数用r表示,取值范围均为[-1,1]。r=0r=0r=-1完全正相关r=1完全负相关零相关零相关0<r<1-1<r<0r=0r=0零相关正相关负相关零相关直线相关的图示直线相关系数的计算r

X

X

2

Y

Y

相关系数的含义(了解)X与Y的协方差X的方差Y的方差r

i

iiiS

xy

Sx

SylXYlXX

lYYr

n

1

n

1n

1

(

xi

X

)(

yi

Y

)(

x

X

)2

(

y

Y

)2(

xi

X

)(

yi

Y

)(

x

X

)2

(

y

Y

)2相关系数:协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。例10名3岁男童体重与体表面积X(1)Y(2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266绘制散点图!体重(kg),X体表面积(103cm2),Y1112131415165.05.56.06.55.9396

0.957924.90401.5439r

lXXX

13.44Y

5.72

29.9040

lYY

1.5439

lXY

5.9396相关系数的假设检验H0:ρ=0,两变量间无直线相关的关系;H1:ρ≠0。t

rsr1n

2总体相关系数的区间估计从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。相关系数的抽样分布(

=-0.8)-0.8-0.6-0.4-0.2

0.03002001000-1.0相关系数的抽样分布(

=0)-1.0-0.8-0.6-0.4-0.20.0

0.2

0.4

0.6

0.8

1.03002001000相关系数的抽样分布(

=0.8)00.20.40.60.81.02001000300R.A.

Fisher(1921)

的z

变换

1

1

e2

ze2

zr

2

1

r

z

1

ln

1

r

z

近似服从均数为,ln12(1

r)

/(1

r)标准差为

1/

的正态分布。n

3相关系数的z

值的抽样分布(

=-0.8)00.51.01.52.0200150100500相关系数的z值的抽样分布(

=

0)-2-1012200150100500相关系数的z

值的抽样分布(

=0.8)01234200150100500相关系数的

区间估计将r变换为z

;根据

z

服从正态分布,估计

z

的 区间;1n

3再将z

变换回r

。z

u

sz

z

u相关系数的区间估计Fisher’s

变换rz正态近似Fisher’s

反变换的95%CIz的95%CI例试对例10.1资料相关关系是否存在进行假设检验,并估计总体相关系数。H0:体重与体表面积无相关关系;H1:体重与体表面积有相关关系。=0.05水准,H0,接受H1,故可认为3岁男童的体重与体表面积之间有正相关关系。0.9579

9.43691

0.95792n

2 10

2

=

n-2=10-2=8按

=8查附表2

t界值表,得P<0.001。按1

r

2r=0.05。t

计算相关系数的

区间第一步:计算z的 区间1

0.9579z

1

ln()

1.91982

1

0.95791.9198

1.96

0.3780

=

(1.1789,2.6607)第二步:计算的区间e2

z1r

e2

z

1两个相关系数的比较男女的心率和收缩时间男子心率,X(次/分)收缩时间,Y(毫秒)心率,X(次/分)收缩时间,Y(毫秒)574055639161393594106339763387664006737467380673856838368376693767037870382723847538875370793667935083370873578634594329分析思路:两组资料的相关性如何?两个相关系数是否相等?由于相关系数并

从正态分布,因此对两个相关系数的差别的假设检验可以通过z变换的原理,对两个z变换值 设检验得到。24名成年男女的心率(X)与收缩时间(Y)的散点图女性506090

10030040045070

80心率(次/分)收缩时间(毫秒)35050609030035040045010070

80心率(次/分)1427.3333r

0.8827858.6667

3044.9167男2351.25r

0.91791338.9167

4900.2500女分别对两相关系数是否为0进行假设检验。=12-2=10,则P1<0.001,P2<0.001。故可以认为无论男子和女子,其心率与心脏左室电机械收缩时间均呈负相关关系。12r2r1

0.8827t

5.93981

r

2

1

(0.8827)21n

212

20.9179t

7.31491

r

21

(0.9179)212

22n

2H0:男子心率与心脏左室电机械收缩时间的相关与女子的相等,1=2;H1:男子心率与心脏左室电机械收缩时间的相关与女子的不等,1≠2。

=0.10。21

2 1

0.9179

1

ln

1

0.9179

-1.5755

2 1

0.8827z

1

ln

1

0.8827

-1.3879,

z1

2s

z

zz1

z2u

1

1

n1

3

n2

3s

z1

z21

11.3879

(1.5755)u

0.398012

3 12

3P>0.20,故尚不能认为男子和女子的心率与心脏左室电机械收缩时间间的相关系数不等。等级资料的相关(了解)Spearman等级相关将各变量X,Y分别编秩RX,RY;计算RX与RY的Pearson相关;所得结果即为Spearman等级相关rS。-1≤rs≤1例

抗白指数与临床疗效的关系某

用野百合治疗白血病,并作抗白血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系?病例号抗白指数X(1)临床疗效Y(2)RX(3)RY(4)12++1923++2939++39410+++411.5511+++511.5630–63735–73845–83955+96.51070+106.51188–1131290–123RXRY(3)(4)192939411.5511.563738396.5106.5113123sr

==-0.6894等级资料的相关(了解)XXYYlXYl

l等级相关的假设检验H

0:S=0,抗白指数与疗效无相关关系;H

1:S0,抗白指数与疗效有相关关系。

=0.05。当n≤50时,用查“等级相关界值表”;当n>50时,用t

检验:t

服从

度为n-2的

t

分布。(1

r

2)

(n

2)t

SrS资料的假设检验本例n=12,

查界值表,得:rs(0.05,12)=0.587即,若H0

成立,则等级相关系数有95%的可能在(-0.587,0.587)之间。现rs

=-0.6894,故P

<0.05。可以认为,抗白指数与疗效有等级相关关系。例母亲文化程度智商的关系母亲文化程度(X)中下儿童智商等级

(Y)中等

中上合计上等小学2281303初中26454高中或中专1111210517245大专及以上1410722合计9143328053857rs=0.2261大样本时的等级相关检验本例n

=857,大于50,用t

检验:P<0.01。可以认为,母亲文化程度 智商等级间存在相关关系,母亲文化程度越高,儿童智商等级亦高。

0.22612857

21

0.2261

/

6.787,

857

2

855t

12.相关的注意事项相关是共变,而非因果。充分利用散点图判断线性趋势判断离群值谨防虚假关系对资料本身的要求:双变量正态分布相关是共变,而非因果!树长高了,所以孩子长高了?散点图的作用(1)直观判断是否存 性相关关系市男中小学生12个组的平均身高紫外光对新生小鼠背皮ATP酶阳性的郎格

细胞(LC)照射不同时间的细胞密度(个/mm3)某肿瘤的生存率大白鼠进食量(X,g)与体重增加(Y,g)的关系26名 的胃液的pH值及尿中亚硝酸盐浓度的散点图尿中亚硝酸盐的浓度胃液的pH值建湖县1978~1985年疟疾逐月发病数月份月发病人数我国1940~1988

不同月份的婴儿

率(‰)的季节性分析男性婴儿死亡率(‰)月份散点图的作用(2)识别离群值;PQ离群值对相关的影响谨防虚假相关排除间杂性。样本甲观察点样本乙观察点(a)

(b)样本的间杂性对相关性的误导定量资料两变量间的直线相关二元正态分布,r=0.75定量资料两变量间的直线相关二元正态分布,r=0.25定量资料两变量间的直线相关二元正态分布,r=0两变量线性相关系数r=0.7,下列说法正确的是(

)A.相关系数较大,可认为两变量相关非常密切B.决定系数较小,两变量之间不存在相关关系

C.可以根据回归系数的大小判断有无线性相关D.应根据总体相关系数的 区间,作出统计推断线性相关系数可以表达的两变量间(

)A、线性相关程度、因果关系

B、线性相关方向、因果关系C、线性相关程度、线性相关方向D、线性相关程度、线性相关方向、因果关系某实验测得12只大鼠肾重与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论