医学统计学课件:两指标间的关系分析_第1页
医学统计学课件:两指标间的关系分析_第2页
医学统计学课件:两指标间的关系分析_第3页
医学统计学课件:两指标间的关系分析_第4页
医学统计学课件:两指标间的关系分析_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

两指标间的关系分析

线性相关

LinearCorrelationMedicalStatistics医学统计学2

主要内容问题的提出相关关系散点图Pearson相关系数

正确应用有其父,必有其子名师出高徒瑞雪兆丰年……3

问题的提出4

问题的提出2008年,甲型H1N1流感爆发的几周前……5

问题的提出谷歌工程师提前预测了美国冬季H1N1流感的传播。GinsbergJ,MohebbiGinsbergJ,etal.Nature,2009,457(7232):1012-1014.6

图A:2003年~2008年流感传播情况图B:2008年5月流感爆发前几周传播情况图1Google预测流感传播(黑线)与实际流感传播(红线)的比较GinsbergJ,etal.Nature,2009,457(7232):1012-1014.Google预测速度比美国疾控中心还要快1~2周;不仅预测了全美范围的传播,而且还可以预测具体到特定的地区和州。7

问题的提出利用了两个不同来源的数据:搜索引擎上的5000万个高频词条流感有哪些症状?哪些是治疗咳嗽和发热的药物?……美国疾控中心近5年的流感传播数据8

问题的提出9

特定词条搜索数流感发病数问题的提出Relationship!问题的提出联系与相互影响是普遍的现象Relationship!人的体重往往随着身高的增加而增加。二者之间是否存在某种关联?某地区肺癌发病率是否和该地空气中PM2.5浓度有关?吸烟量与肺功能之间是否有联系?11

以往方法仅限于研究一个变量实际情况不局限于研究一个变量问题的提出两变量之间的分析方法线性相关线性回归12

问题的提出寻找变量间的关系是科学研究的首要目的;变量间关系的分类13

问题的提出R1R1R2问题的提出15

问题的提出确定性的函数关系:两变量间的函数关系。

随机性的相关关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。

圆的周长与半径的关系:C=2R

速度、时间与路程的关系:L=ST

青少年身高与年龄的关系;体重与体表面积的关系;确定性关系与相关关系xyxy确定性关系与相关关系一一对应确定性函数关系变量y随变量x一起变化,并完全依赖于x

各观测点落在一条线上不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定各观测点分布在直线周围18

主要内容问题的提出相关关系散点图Pearson相关系数

正确应用当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。相关关系正相关(positivecorrelation):若两个变量同时增加或减少,变化趋势是同向的;负相关(negativecorrelation):若一个变量增加时,另一个变量减少,变化趋势是反向的。相关关系直线相关(linearcorrelation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。相关关系SirFrancisGalton(1822-1911)优生学家遗传学家探险家地理学家气象学家发明家统计学家心理学家Heredityexperimentsleadtoinitialconceptsofcorrelationandregression.Sweetpeasexperiment (1875)Symmetricstudiesofstature (1885)相关关系相关关系Sweetpeasexperiment1875年,Galton把7包甜豌豆种子分发给7位朋友,朋友们种下这些种子,又把收获的豆子寄还给Galton;Galton研究了亲代种子和子代种子之间的关系。Table1DataonDiametersofParentandDaughterSeedsGeneratedfromGalton(1894)Table2inNaturalInheritance.DiameterofParentSeed

(0.01inch)DiameterofDaughterSeed

(0.01inch)1516.771617.281716.921817.351917.692018.282118.29相关关系26

Correlation

existsbetweentwovariableswhenoneofthemisrelatedtotheotherinsomeway.相关关系27

主要内容问题的提出相关关系散点图Pearson相关系数

正确应用

散点图(Scatterplot

)在平面直角坐标系上标识两变量(x,y)间关系的统计图。散点图16.51717.51818.515161718192021Figue1PlotofDiameterofDaughterSeedversusDiameterofParentSeedfromthedatainTable1.(0.01inch)Symmetricstudiesofstature为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数据画散点图。水平轴X代表父亲身高,垂直轴Y代表儿子身高。30

散点图31

它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,线性,其主要部分是一个椭圆。BSA(103cm2),Y32

Weight(kg),X1112131415165.05.56.06.5y,Survivalrate(%)x,Month012345678910111202040608010033

主要内容问题的提出相关关系散点图Pearson相关系数

正确应用反映两定量指标间的相关关系用Pearson相关系数,r;Pearsoncorrelationcoefficient;用以说明具有直线关系的两个数值变量间相关关系的密切程度和相关方向的指标。Pearson相关系数Pearson相关系数计算含义性质假设检验可信区间X的离均差平方和:Y的离均差平方和:X与Y间的离均差积和:

Pearson相关系数Galton曾探讨成年时身高是否与两岁时的身高(单位:英寸)有关。两岁时的身高(英寸)3930323435363630成年身高(英寸)7163636768687064Pearson相关系数绘制散点图Y

成年后身高(单位:英寸)X2岁时的身高(单位:英寸)3032343638406365676971Pearson相关系数Pearson相关系数成年时身高与两岁时的身高的相关系数为0.9456。10名3岁男童体重与体表面积的关系

编号体重(X,kg)体表面积(Y,103cm2) 1 11.0 5.283 2 11.8 5.299 3 12.0 5.358 4 12.3 5.292 5 13.1 5.602 6 13.7 6.014 7 14.4 5.830 8 14.9 6.102 9 15.2 6.075 10 16.0 6.411

合计 133.4 57.266Pearson相关系数10名3岁男童体重与体表面积散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)Pearson相关系数Table1DataonDiametersofParentandDaughterSeedsGeneratedfromGalton(1894)Table2inNaturalInheritance.DiameterofParentSeed

DiameterofDaughterSeed

1516.771617.281716.921817.351917.692018.282118.29Pearson相关系数Pearson相关系数Pearson相关系数计算含义性质假设检验可信区间协方差标准差协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。Pearson相关系数的含义Pearson相关系数计算含义性质假设检验可信区间-1≤r≤1r>0为正相关r<0为负相关r=0为零相关或无相关相关系数绝对值越大,两变量间相关程度越密切;相关系数越接近于0,表示相关越不密切。Pearson相关系数的性质50

完全负相关零相关完全正相关零相关负相关正相关Pearson相关系数的性质51

SignMagnitudeStrengthDirectionr=+0.8Pearson相关系数的性质-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加Pearson相关系数的性质r=-1-1<r<0r=00<r<1r=1Pearson相关系数的性质相关系数的大小示意图54

SignMagnitudeStrengthDirectionr=+0.8Pearson相关系数的性质Pearson相关系数的性质Pearson相关系数计算含义性质假设检验可信区间57

XY=0总体Pearson相关系数的假设检验58

XYXY样本=0总体Pearson相关系数的假设检验H0:=0,亲代种子直径与子代无相关关系;H1:0,亲代种子直径与子代有相关关系。=0.05。t服从自由度为n-2的t

分布。Pearson相关系数的假设检验自由度=7-2,P=0.0022拒绝H0,接受H1,差别有统计学意义。可以认为亲代种子直径与子代之间有正相关关系,相关系数为0.93。Pearson相关系数的假设检验H0:=0,体重与体表面积无相关关系;H1:0,体重与体表面积有相关关系。=0.05。t

服从自由度为n-2的t

分布。Pearson相关系数的假设检验自由度=10-2,P<0.001拒绝H0,接受H1,差别有统计学意义。可以认为3岁男童体重与体表面积之间有正相关关系。Pearson相关系数的假设检验Pearson相关系数计算含义性质假设检验可信区间总体相关系数的区间估计从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。相关系数的抽样分布(=-0.8)-0.8-0.6-0.4-0.20.00100200300-1.0相关系数的抽样分布(=0)-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.00100200300相关系数的抽样分布(=0.8)

00.20.40.60.81.00100200300R.A.Fisher(1921)的z

变换

z近似服从均数为,标准差为

的正态分布。

相关系数的z值的抽样分布(=-0.8)00.51.01.52.0050100150200相关系数的z值的抽样分布(=0)-2-1012050100150200相关系数的z值的抽样分布(=0.8)

01234050100150200相关系数的可信区间估计将r变换为z;根据z服从正态分布,估计z的可信区间;再将z变换回r。73

Fisher’s变换

rz

正态近似

Fisher’s反变换

的95%CIz的95%CI相关系数的可信区间估计相关系数的可信区间估计75

主要内容问题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论