版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、直线相关与回归直线相关与回归 中山大学公共卫生学院中山大学公共卫生学院医学统计与流行病学系医学统计与流行病学系林爱华林爱华主要内容主要内容 直线相关直线相关 等级相关等级相关 直线回归直线回归 直线相关与回归的区别与联络直线相关与回归的区别与联络 前面我们讨论了对单个变量的统计分析方法,前面我们讨论了对单个变量的统计分析方法,着重于比较该单个变量的组间差别。着重于比较该单个变量的组间差别。 医学研讨中常需分析变量间的关系,如血压与年医学研讨中常需分析变量间的关系,如血压与年龄。龄。 相关相关(correlation) 与回归与回归(regression)是研讨是研讨两个或多个随机变量之间相互关
2、系的重要的两个或多个随机变量之间相互关系的重要的统计分析方法,运用广泛。统计分析方法,运用广泛。 相关是研讨随机变量之间相互联络的亲相关是研讨随机变量之间相互联络的亲密程度和方向。密程度和方向。 回归是研讨随机变量之间的数量依存关回归是研讨随机变量之间的数量依存关系。系。本章引见两个变量间的直线回归与相关,本章引见两个变量间的直线回归与相关,及等级相关。及等级相关。第一节第一节 直线相关直线相关 一、直线相关的概念:一、直线相关的概念: 当两目的间不独立那么为相关,即某一目当两目的间不独立那么为相关,即某一目的的取值与另一目的的取值多少有关。讨论的的取值与另一目的的取值多少有关。讨论两个正态分
3、布的随机变量有无直线关系时,两个正态分布的随机变量有无直线关系时,统计学中用一个统计量描画直线相关的亲密统计学中用一个统计量描画直线相关的亲密程度和方向,这个统计量称相关系数,记为程度和方向,这个统计量称相关系数,记为r r。 相关系数的绝对值必然在相关系数的绝对值必然在0 0到到1 1之间,即:之间,即: 11 r相关系数的大小表示相关的亲密程度,相关系数的大小表示相关的亲密程度,例:体重与肺活量,胸围与肺活量例:体重与肺活量,胸围与肺活量 相关系数的符号表示相关的方向,相关系数的符号表示相关的方向, 例:身高与体重,年龄与钙的吸收量例:身高与体重,年龄与钙的吸收量 从研讨总体随机抽取从研讨
4、总体随机抽取n n个对象,每个对象察看个对象,每个对象察看X X和和Y Y两项目的,或者从曾经配成对子的研讨总体中两项目的,或者从曾经配成对子的研讨总体中随机抽取随机抽取n n对对象,每对对象察看同一目的。对对象,每对对象察看同一目的。要求:独立随机的成对样本,并且要求:独立随机的成对样本,并且X X 和和Y Y来自正态来自正态总体,这样的研讨所获得的资料就可以做直线相关总体,这样的研讨所获得的资料就可以做直线相关分析。分析。二二. 相关分析的资料来源:相关分析的资料来源:例例12-1 某医生随机抽查了某医生随机抽查了12名糖尿病患者的名糖尿病患者的空腹血糖及胰岛素值,数据见下表,试做相空腹血
5、糖及胰岛素值,数据见下表,试做相关分析。关分析。三、直线相关的统计描画:三、直线相关的统计描画: 1 1散点图:散点图: 调查相关性最简单而直观的方法是散点调查相关性最简单而直观的方法是散点图。以两条相互垂直的座标轴分别表示两图。以两条相互垂直的座标轴分别表示两个变量,个变量,n n对察看值对应于座标平面的对察看值对应于座标平面的n n个个点,便构成一幅散点图。点,便构成一幅散点图。 本资料绘制成散点图本资料绘制成散点图Scatter Scatter plotplot如下:如下: 2. 相关系数的计算:相关系数的计算: YYXXXYlll)YY()XX()YY( )XX(r 22 nXXXXl
6、XX222 nYYYYlYY222 ( (分子决议正负号分子决议正负号) ) nYXXYYYXXlxy本例,本例,213.1X 123.70Y 24012.55X 21311.87Y 2122.40XY 228.25XXl36.73YYl74.31XYl 代入公式,得代入公式,得74.310.8115228.25 36.73XYXX YYlrll 根据例根据例12-1的资料,散点图已察看两变量之间的资料,散点图已察看两变量之间有直线趋势,现计算相关系数。有直线趋势,现计算相关系数。四相关系数的假设检验:四相关系数的假设检验:常用方法有常用方法有t 检验和查表法。检验和查表法。 一一 t 检验:
7、检验:1. 检验假设:检验假设:H0:=0 H1:0 =0.05 2102 n/rrSrtrrSrSr为相关系数为相关系数r r的规范误的规范误自在度为自在度为 2 n 2.2.计算检验统计量:计算检验统计量:392. 4)8115. 0(12128115. 02 rt3确定确定P值和判别结果:值和判别结果: =12-2=10, 查查t值表值表t0.01(10)=3.169, 本例的本例的tr=4.392 t0.01(10) , P0.01, 按按=0.05的水准,回绝的水准,回绝H0,接受,接受H1, 以为糖尿病患者血糖和胰岛素之间存在负的以为糖尿病患者血糖和胰岛素之间存在负的直线相关关系。
8、直线相关关系。 根据自在度,查相关系数根据自在度,查相关系数r界值表,查界值表,查出出r0.05( ),假设,假设r r0.05( ) ,那么以为,那么以为P0.05,不回绝,不回绝H0。 假设假设r r0.05( ) , 那么以为那么以为P0.05,回,回绝绝H0,接受,接受H1。 本 例本 例 = 1 2 - 2 = 1 0 , 查, 查 r 界 值 表 ,界 值 表 ,r0.05(10)=0.576,r0.01(10)=0.708, r =0.8115 r0.01(13) , P rs(10,0.02) ,那么,那么P t0.01(13) ,P0.01,按,按=0.05水准,回绝水准,回
9、绝H0 ,接受,接受H1,以,以为糖尿病患者血糖和胰岛素之间存在负的直线回为糖尿病患者血糖和胰岛素之间存在负的直线回归关系。归关系。 10212 四、四、 回归方程的运用:回归方程的运用: 1. 描画两个变量之间的数量依存关系。描画两个变量之间的数量依存关系。 2. 利用回归方程进展预测:由利用回归方程进展预测:由X预测预测Y的值。的值。 3. 利用回归方程进展控制:由利用回归方程进展控制:由Y值控制值控制X的的取值范围。取值范围。 知空气氮氧化物知空气氮氧化物(Y )的污染与汽车流量的污染与汽车流量(X )的回归关系,当确定的回归关系,当确定Y的规范后,控制的规范后,控制X的的值。值。 第四
10、节第四节 直线相关与回归分析的关系直线相关与回归分析的关系1.区别:区别:资料上资料上: 相关要求相关要求X与与Y为随机变量,且为随机变量,且X和和Y服从正态分布服从正态分布(双变量正态分布双变量正态分布)。回归要求回归要求Y为随机变量,服从正态分布;为随机变量,服从正态分布;X可人为取值,称可人为取值,称型回归。型回归。X与与Y为随机变量,均服从正态分布;为随机变量,均服从正态分布;称称型回归。型回归。 一、直线回归与相关的区别和联络:一、直线回归与相关的区别和联络:运用上运用上: : 阐明变量间的依存变化关系用回归;阐明变量间的依存变化关系用回归;阐明变量间的相互变化关系用相关。阐明变量间
11、的相互变化关系用相关。总总回回SSSSll/ll .llrYYXXXYYYXXXY 2222. 联络:联络: (1)同一组资料,同一组资料,r与与b正负号一致。正负号一致。 (2)同一样本,同一样本,tr =tb 。 (3)用回归解释相关。用回归解释相关。(r2为确定系为确定系数。数。二、运用相关与回归分析时应留意的问题:二、运用相关与回归分析时应留意的问题: 1 1要求应变量要求应变量Y Y服从正态分布,通常自变量服从正态分布,通常自变量X X为可以准确丈量或严厉控制的要素。为可以准确丈量或严厉控制的要素。 2. 2. 进展相关与回归分析时要有实践意义。进展相关与回归分析时要有实践意义。 3
12、. 3. 相关关系不一定是因果关系,也能够仅相关关系不一定是因果关系,也能够仅是外表上的伴随关系。是外表上的伴随关系。 4. 4. 不能只根据相关系数绝对值的大小来推不能只根据相关系数绝对值的大小来推断两事物景象之间有无相关以及相关的亲密断两事物景象之间有无相关以及相关的亲密程度,而必需进展相关系数的假设检验。程度,而必需进展相关系数的假设检验。5. 不要把相关系数有统计学意义误解为两事物或不要把相关系数有统计学意义误解为两事物或景象相关的亲密程度。景象相关的亲密程度。6回归方程普通只适用于自变量回归方程普通只适用于自变量X实测数据的范实测数据的范围内,不能随不测推。围内,不能随不测推。7进展回归和相关分析之前,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版场项目投标失败后合同执行监督及违约责任合同3篇
- 2024年甲乙双方关于2024年卡塔尔世界杯赛事转播权的合同
- 2024年工程清包分阶段合同3篇
- 2024年度广告传媒合作经营合同7篇
- 2024版二手车买卖及二手车交易纠纷调解协议3篇
- 2024年度货物买卖合同:电子产品供应商与零售商2篇
- 2024年门卫安全管理责任协议:全面安全保障合同3篇
- 2024年二手房买卖范本3篇
- 康复学病例汇报
- 2024版个人股东股权代持与股权信托管理协议3篇
- 220t锅炉课程设计 李学玉
- 综合与实践《我们身体上的“尺”》教材分析
- 电动给水泵液力耦合器基础知识ppt课件
- 监理公司各部门职责
- 253种中药材粉末显微鉴别主要特征
- 论辛弃疾词作的愁情主题及其审美价值
- 新形势下我国保险市场营销的现状、问题及对策
- LTE无线网络优化PPT课件
- 动态血压监测在社区高血压患者管理的意义
- 管道中英文对照表
- 240灯控台_说明书
评论
0/150
提交评论