医学统计学:双变量关联性分析_第1页
医学统计学:双变量关联性分析_第2页
医学统计学:双变量关联性分析_第3页
医学统计学:双变量关联性分析_第4页
医学统计学:双变量关联性分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

双变量关联性分析单变量分析方法(univariateanalysis):t检验、z检验、方差分析双变量分析方法(bivariableanalysis):直线回归与相关、秩相关等

直线相关关联性分析的目的检查两变量间存在的关联性是否具有统计学意义;

两变量间的关联方向和密切程度。例13.1某医师为了解胎儿宫内发育迟缓患者的出生体重与2型纤溶酶原激活物抑制剂(PAI-2)的关系,测量了26例患儿的出生体重(g)和PAI-2含量(ng/ml),结果如表13.1。请你据此回答两变量是否有关联?其方向与密切程度如何?

绘制散点图:观察散点是否随一变量的变化而变化,所有散点是否呈直线关系表13.1

26例胎儿宫内发育迟缓患者的出生体重和PAI-2含量图13.126例胎儿宫内发育迟缓患者的出生体重和PAI-2含量的散点图直线相关的概念

用相关系数描述两变量间直线关系的密切程度和方向相关系数又称Pearson积矩相关系数,样本相关系数用r表示,总体相关系数用表示相关的种类0<r<1

-1<r<0

r=1

r=-1r=0

r=0

相关的种类正相关:0<r<1完全正相关:r=1负相关:-1<r<0完全负相关:r=-1零相关:r=0相关系数没有单位,其值为-1≤r≤1相关系数的意义相关密切程度:用r的大小表示,r的绝对值越接近于1,说明相关越密切相关方向:用r的正负号表示直线相关的计算步骤计算样本相关系数(本例r=0.875)离均差积和计算样本相关系数(本例r=0.738)相关系数的假设检验

检验r是否来自总体相关系数

为零的总体。常用t检验:Ho:

=0,两变量间无直线相关关系

H1:

≠0两变量间有直线相关关系

=0.05查附表3,t界值表,得p<0.001,可以认为宫内发育迟缓患者的出生体重和PAI-2含量之间有线性相关关系。相关分析应用中应注意的问题1.进行相关分析前应先绘制散点图散点图能使我们直观地看出两变量间有无线性关系并发现可能的离群点(outlier),当散点有线性趋势时,才能进行相关分析。2.Pearson积矩相关系数的统计推断要求两个随机变量均服从正态分布

直线相关适用于二元正态分布资料,对于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料,都不宜用Pearson积矩相关系数来分析相关性。3.出现离群点时慎用相关.4.相关关系不一定是因果关系,有可能是伴随关系。

进行两变量因果分析时,还需结合专业知识和其他研究方法。5.分层资料不可盲目合并3.分层资料不可盲目合并3.分层资料不可盲目合并3.分层资料不可盲目合并秩相关概念

采用秩相关(rankcorrelation),也称等级相关,来分析两个变量间相关的方向与密切程度。该法不以特定的总体分布为前提,属于非参数统计方法。直线回归与直线相关的区别与联系1.资料要求不同回归:y服从正态分布,x没有特别的要求。相关:x和y服从双变量正态分布(若x数值系人为选定,莫作相关

例药物的剂量-反应关系)区别区别2.应用情况不同回归:反映两变量间的数量关系(b)相关:反映两变量间互依的程度和方向(r)提问方式不同年龄增加,血压发生什么样的变化?年龄和血压之间有关系吗?联系1.方向一致:对同一组数据若同时计算r和b,其正负号是一致的Question:r和b的大小有关系吗?r较大,是否b也

较大?2.假设检验等价:r和b的假设检验是等价的,即对同一样本,两者的t值相等,检验结果完全一致联系3.用回归解释相关

r的平方称为决定系数联系决定系数r2表示回归平方和占总平方和的比例,即应变量y的总变异中由自变量x可以解释的比例。SS回越接近于SS总,则r2越接近于1,说明引入相关变量的效果越好当相关系数较小时,若引入回归,可能由于减少的误差太少而无实际意义example如r=0.20,n=100时,P<0.05,r有统计学意义。但r2=0.04,表示SS回在SS总中仅占4%,说明两变量相关分析的实际意义不大。应用直线回归和相关的注意点1、作回归和相关分析之前,先绘制散点图2、据资料的性质正确选用回归和相关3、用回归方程进行预测的时候,应当谨慎。X不能偏离实测范围太远,否则偏差太大。example

x:20~50妇女年龄

y:血压

x=0时,应用直线回归和相关的注意点4、相关关系不一定是因果关系,也可能是伴随关系如某生春种一植物,不久长出幼苗。恰邻院盖楼,细心观测,苗长楼增。计算发现,苗高与楼高具有相关性。两者是否真有内在联系?例:1875~1920,美国年铁制品产量与英国年出生率相关系数为-0.98因素:社会、经济、技术应用直线回归和相关的注意点5、不能只根据相关系数的绝对值大小来判断相关的密切程度,应首先作假设检验例:r=0.601n=8p=0.10~0.20r=0.401n=42p=0.005~0.016、和为零仅说明没有变量间没有直线关系,不能说明变量间没有关系直线回归与直线相关分析的联系与区别联系对于服从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,相关系数与回归系数正负号一致。本例:r=0.762b=2.11对于同一样本,相关系数与回归系数的假设检验等价。tb=tr对于服从双变量正态分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论