版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学一元相关与回归第一页,共五十四页,编辑于2023年,星期五掌握:积差相关等级相关线性回归的概念线性回归方程的计算回归系数的假设检验相关与回归的区别与联系了解:曲线拟合教学目的和要求第二页,共五十四页,编辑于2023年,星期五重点讲解积差相关等级相关线性回归的概念回归系数的假设检验相关与回归的区别与联系介绍曲线拟合教学内容提要
第三页,共五十四页,编辑于2023年,星期五第一节两变量相关相关分析是研究客观事物或现象之间关系的密切程度(不存在函数关系)。线性相关是研究两变量之间是否存在线性关系。线性相关的类型积差相关等级相关第四页,共五十四页,编辑于2023年,星期五为研究父亲与成年儿子身高之间的关系,皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上。X上的数代表父亲身高,Y上的数代表儿子的身高。1078个点形成图形是一个散点图。一、积差相关1、散点图第五页,共五十四页,编辑于2023年,星期五一、积差相关
1、散点图第六页,共五十四页,编辑于2023年,星期五2、
积差相关系数
定量描述X与Y两变量间直线相关方向和相关密切程度的统计指标。
积差相关系数(参数检验法)r,ρ
等级相关系数(非参数检验法)
Pearson相关系数,简称相关系数,适用于x、y都服从正态分布(称为双变量正态分布)的资料。
第七页,共五十四页,编辑于2023年,星期五积差相关系数的计算r没有单位取值范围:-1≤r≤1Lxy=∑XY-(∑X)(∑Y)/nLxx=∑X2-(∑X)2/nLyy=∑Y2-(∑Y)2/n协方差第八页,共五十四页,编辑于2023年,星期五
r的特点没有单位-1≤r≤1
r=-1完全负相关,-1≤r
<0负相关
r=1完全正相关,0<r≤1正相关
r=0零相关第九页,共五十四页,编辑于2023年,星期五散点图第十页,共五十四页,编辑于2023年,星期五
【例9-1】一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间是否存在相关关系?是正相关还是负相关?3、积差相关分析第十一页,共五十四页,编辑于2023年,星期五编号
(1)尿雌三醇mg/24h(2)产儿体重kg(3)编号
(1)尿雌三醇mg/24h(2)产儿体重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2
待产妇尿雌三醇含量与产儿体重关系
第十二页,共五十四页,编辑于2023年,星期五1)绘制散点图第十三页,共五十四页,编辑于2023年,星期五2)积差相关系数的计算∑X=534;∑Y=99.2;∑X2=9876∑Y2=324.8;∑XY=1750;第十四页,共五十四页,编辑于2023年,星期五3)相关系数的假设检验上例中r=0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。=0时,由于抽样误差,可能导致r≠0。对r进行假设检验,判断r≠0是由于抽样误差所致,还是两个变量之间确实存在相关关系。
第十五页,共五十四页,编辑于2023年,星期五3)相关系数的假设检验
总体相关系数ρ=0表示总体中两变量x和y无直线相关关系a.用t作检验统计量
b.直接用r作检验统计量
r的标准误为sr=根据t分布性质来检验样本相关系数r是否来自ρ=0的总体:tr=(r-ρ)/sr=(r-0)/sr=r/=r
用r和自由度v=n-2,查附表18,相关系数界值表第十六页,共五十四页,编辑于2023年,星期五H0:ρ=0H1:ρ≠0
ν=n-2=31-2=29查附表7,t0.0005/2,28=3.9351,t0.0002/2,28=4.2754,0.0002<
P<0.0005,拒绝H0,接受H1,认为待产妇尿中雌三醇含量与产儿体重之间有正相关关系。第十七页,共五十四页,编辑于2023年,星期五第二节直线回归一、回归方程二、回归系数三、回归系数的假设检验四、直线回归的应用一个人的快乐,不是因为他拥有的多,而是因为他计较的少休息第十八页,共五十四页,编辑于2023年,星期五二、等级相关(秩相关)
①不服从正态分布的资料;②总体分布类型不知的资料;③用等级或相对数表示的资料;④数据一端或两端有不确定值的资料用等级相关(或称秩相关)分析(属非参数统计法)。
第十九页,共五十四页,编辑于2023年,星期五秩相关系数Spearman相关系数(rs)Kendall相关系数(rk)用等级相关系数表示两个变量间直线关系密切程度和方向。第二十页,共五十四页,编辑于2023年,星期五先分别将两个变量按原始数值由小到大编秩(遇相同观察值时取平均秩),计算每对观察值的秩之差d。
n为对子数;d为配对秩次之差;Tx(或Ty)=Σ(tj3-tj)/12;tj为x(或y)中第j个相同秩次的个数。查附表19确定P的大小。
1)Spearman相关系数(rs)第二十一页,共五十四页,编辑于2023年,星期五【例9-2】12名2~7岁急性白血病患儿的血小板数与出血症状资料见下表,分析两者之间有无直线关系:第二十二页,共五十四页,编辑于2023年,星期五H0:ρ=0,H1:ρ≠0
rsc==-0.4222
查统计用附表19,r0.05/2(12)=0.587,P>0.05不能以=0.05水准拒绝H0,不能认为2~7岁急性白血病患儿的血小板数与出血症状之间有直线相关关系。第二十三页,共五十四页,编辑于2023年,星期五2)Kendall相关系数在X的秩从小到大排列后,计算配对的Y每个秩下面更大者的个数,合计值记为S,计算rK并在相同秩次较多时校正:其中,n为对子数,Ux或Uy=∑(tj2-tj)/2,tj为第j个相同秩次的个数。查附表20确定P的大小。第二十四页,共五十四页,编辑于2023年,星期五三、相关系数应用注意事项有实际意义在两个变量的变化范围内进行相关不是因果关系,但可做为进一步考证有无因果关系的基础第二十五页,共五十四页,编辑于2023年,星期五四、直线相关的应用
一般说来,当n>100,并对r进行假设检验,有统计学意义时:∣r∣>0.7,则表示两个变量高度相关;0.4<∣r∣≤0.7时,则表示两个变量之间中度相关;0.2<∣r∣≤0.4时,则两个变量低度相关。
第二十六页,共五十四页,编辑于2023年,星期五
待产妇尿中雌三醇含量和产儿体重之间成正相关。那么,如果我们知道了一位待产妇的尿雌三醇含量,能推断出产儿的体重吗?或产儿的体重可能在什么范围内呢?身高与体重之间也成正相关关系。那么,身高每增加1厘米,体重增加多少克呢?上面的相关关系分析不能提供给我们需要的答案。这些要用直线回归的方法来解决。
第二十七页,共五十四页,编辑于2023年,星期五某保险公司承保汽车5万量,平均每量保费收入为1000元,则该保险公司汽车承保总收入为5000万元。承保总收入:Y
承保汽车量数:XY=1000XX与Y两个变量间完全表现为一种确定性关系,即函数关系。第二节一元回归第二十八页,共五十四页,编辑于2023年,星期五第二十九页,共五十四页,编辑于2023年,星期五银行的1年期存款利息年息为2.25%,存入的本金用X表示,到期的本息用Y表示,则
Y=X+2.25%X
这里Y与X仍表现为一种线性函数关系。第三十页,共五十四页,编辑于2023年,星期五另外一种情况:两事物之间有着密切的联系,但密切的程度并没有达到由一个可以完全确定另一个的程度。例如:
•生长发育阶段动物体重增量与食量
•
广告费支出与商品销售额第三十一页,共五十四页,编辑于2023年,星期五由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为一元回归方程,这种关系为一元回归。第三十二页,共五十四页,编辑于2023年,星期五第二节一元回归一、直线回归分析绘制散点图求直线回归方程绘制回归直线回归系数的假设检验用直线方程描述两个变量间的数量依存关系。第三十三页,共五十四页,编辑于2023年,星期五①一般形式:
a:截距b:回归系数(回归直线斜率)1.直线回归方程的求法
b>0x↑y↑;b<0x↑y↓
b:意义为x每变化一个单位,y变化的平均值
x:自变量,要求容易测定、容易控制:y
的估计值,y称因变量,要求在不同的x的时候其分布为正态分布第三十四页,共五十四页,编辑于2023年,星期五y②a、b的计算(用最小二乘法原理估计b)n:对子数(数据对)剩余误差,残差:各实测值y至回归直线纵向距离。剩余平方和或残差平方和最小。SSe=Σ(y-)2SS总=SSR+SSe
第三十五页,共五十四页,编辑于2023年,星期五决定系数(determiningcoefficient,R2):回归平方和在总平方和中所占的比例。R2=SS回
/SS总R2=(n-1)sy2r2/
(n-1)sy2
=r2
R2是评价回归强度的一个重要指标。0≤R2
≤1,→1,回归效果越好,强度↑。临床研究中,R2≥0.7认为回归效果不错。2.回归方程拟合效果评价(决定系数)第三十六页,共五十四页,编辑于2023年,星期五编号
(1)尿雌三醇mg/24h(2)产儿体重kg(3)编号
(1)尿雌三醇mg/24h(2)产儿体重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2
第三十七页,共五十四页,编辑于2023年,星期五尿雌三醇x(mg/24h)(1)X2
(2)产儿体重Y(kg)(3)
Y2
(4)XY
(5)7492.56.2517.59812.56.2522.59812.56.2522.5121442.77.2932.4141962.77.2937.8162562.77.2943.2…………………………224844.016.0288.0256253.915.2197.5245764.318.49103.2
534
987699.2324.181750.0第三十八页,共五十四页,编辑于2023年,星期五(1)绘制散点图(2)求直线回归方程第三十九页,共五十四页,编辑于2023年,星期五第四十页,共五十四页,编辑于2023年,星期五(3)绘制回归直线
在自变量的变化范围内选两点做直线(0,a)(X,Y)这两点可以用来核对图线绘制是否正确。例题中得到的直线回归方程一定经过(0,2.15)(17.23,3.2)两点。第四十一页,共五十四页,编辑于2023年,星期五第四十二页,共五十四页,编辑于2023年,星期五直线回归方程从样本资料计算而得,有抽样误差。需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。总体的回归系数一般用β表示。
是否能说明雌三醇与产儿体重之间一定存在回归关系?
第四十三页,共五十四页,编辑于2023年,星期五t-检验
H0:β=0
(直线回归方程不成立)
H1:β≠0(直线回归方程成立)进行β=0的假设检验(即X与Y间无直线回归关系)
t检验或F检验相关系数的检验代替(4)回归系数的假设检验第四十四页,共五十四页,编辑于2023年,星期五υ=n-2第四十五页,共五十四页,编辑于2023年,星期五H0:β=0H1:β≠0α=0.05第四十六页,共五十四页,编辑于2023年,星期五υ=31-2=29,查表t0.0005/2,28=3.9351,P<0.0005拒绝H0,接受H1,认为待产妇尿中雌三醇含量与产儿体重之间存在直线回归关系。第四十七页,共五十四页,编辑于2023年,星期五二、直线回归方程的应用估计:描述两变量间的依存关系
通过回归系数的假设检验,若认为两变量之间存在直线回归关系,则可用直线回归来描述。
利用回归方程进行预测把自变量代入回归方程,对应变量进行估计。例如,已知某待产妇的尿雌三醇浓度,估计产儿的体重范围。利用回归方程进行统计控制胰岛素与血糖制定正常值范围血细胞,血红蛋白等第四十八页,共五十四页,编辑于2023年,星期五三、曲线拟合对呈曲线关系的资料,可用散点图分析曲线的类型,建立曲线回归方程。常用曲线的类型:对数:=a+blnX
指数:ln=a+bX
幂函数:ln=a+blnX
Logistic:第四十九页,共五十四页,编辑于2023年,星期五四、相关与回归分析注意事项
1.实际意义进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。
2.相关关系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一年级数学(上)计算题专项练习汇编
- 规范校外培训合同(2篇)
- 小丑电影课件教学课件
- 老师课件制作教学
- 南京工业大学浦江学院《土力学与地基基础》2023-2024学年第一学期期末试卷
- 南京航空航天大学《法律文书》2022-2023学年期末试卷
- soc芯片课件教学课件
- 石林县风貌改造施工组织设计书(二标段)
- 南京工业大学浦江学院《企业家精神创新精神与商业规划》2022-2023学年第一学期期末试卷
- 《咏柳》的说课稿
- 建筑工程危险源辨识风险评价表
- 三年级上册美术课件-4前前后后 |人教新课标 (共20张PPT)
- 《城市生态学》考试复习题库(含答案)
- 幼儿卫生保健 第七章幼儿常见意外事故及急救课件
- 六年级上册数学课件-7.4 长方体和正方体整理与复习丨苏教版 (共14张PPT)
- 建筑节能工程竣工验收报告3篇(施工单位节能验收报告)
- 内科学-骨髓增生异常综合征(MDS)
- SYB(全)新版最新课件
- 医学研究中安全防护与相关法规叶索夫整理
- 低温余热回收利用及节能技术
- 四年级上册数学课件 - 第五单元 第6课时《认识梯形》 人教版(共12张PPT)
评论
0/150
提交评论