卫生统计学直线相关与回归课件_第1页
卫生统计学直线相关与回归课件_第2页
卫生统计学直线相关与回归课件_第3页
卫生统计学直线相关与回归课件_第4页
卫生统计学直线相关与回归课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章直线回归与相关Dec,8,2009前言单变量统计(univariatestatistics):描述某一变量的统计特征或比较该变量的组间差别,如t、u、F检验双变量统计(bivariatestatistics):研究两个变量之间的关系如何。糖尿病人的血糖与胰岛素水平年龄与高血压抗菌药的浓度与琼脂糖抑菌斑的直径Dec,8,2009本章只介绍两个变量间的直线关系的分析1.回归关系:描述变量间的依存关系,即数量关系,2.相关关系:描述变量间的相互关系,即互依关系Dec,8,2009Dec,8,2009Dec,8,2009直线回归:在直角坐标系中绘制散点图,所有散点并不都在一条直线上,但有一种直线趋势回归方程:区别与线性函数,线性函数要求变量间有严格的函数关系──一一对应。Dec,8,2009二、直线回归方程的求法最小二乘估计法:要求各实测点到回归直线的纵向距离的平方和最小。离均差积和Dec,8,2009Dec,8,2009表10-110名胎儿的股骨径长度和出生体重的数据编号(1)股骨径长度X(cm)(2)出生体重Y(g)(3)XY(4)X2(5)Y2(6)16.50272017680.042.2526.80284019312.046.2437.20345024840.051.8447.12316022499.250.6956.90283019527.047.6167.87398031322.661.9376.56247016203.243.0385.79174010074.633.5296.39248015847.240.83107.00332023240.049.00合计68.1328990200545.8466.96Dec,8,2009

3.求回归系数b、截距a,列出方程。Dec,8,2009根据回归方程式作图,在自变量X取值范围内任取两个X值,带人方程式,得Y的估计值,连接两点,即回归直线。回归直线过(0,a)和(,)。4.绘制直线回归直线(0,-4516.99)和(6.813,2899)Dec,8,2009●●三、回归分析中的统计推断P点的纵坐标被回归直线与均数截成三段:1.方差分析Dec,8,2009所有点平方求和,因有SS总=SS回+SS剩总=回+剩总=n-1回=1剩=n-2反映了Y的总变异度反映了Y的总变异中可以用X和Y的直线关系解释的那部分变异反映除了X对Y的线性影响之外一切因素对Y的变异作用Dec,8,2009回=1,剩=n-2构造检验统计量Dec,8,2009表10.2回归分析的方差分析表变异来源离均差平方和自由度均方F总

回归1误差

Dec,8,2009(1)建立假设:

H0:β=0,胎儿的股骨径长度与胎儿体重之间无直线回归关系

H1:β≠0,胎儿的股骨径长度与胎儿体重之间有直线回归关系

α=0.05

(2)计算检验统计量SS剩=SS总-SS回=3460690-3305742.71=154947.29Dec,8,2009表10.3例10.2资料的方差分析计算表变异来源SSνMSF总变异34606909回归3305742.7113305742.71170.67剩余154947.29819368.41查附表3.1方差分析表,得F0.05,(1,8)=5.32,F>F0.05,(1,8),所以P<0.05,按α=0.05水准,拒绝H0,接受H1,故认为胎儿的股骨径长度与胎儿体重之间存在直线回归关系。(3)确定P值,作出统计推断Dec,8,2009式中Sb为回归系数的标准误,计算公式为:2.t检验=n-2Dec,8,2009

=n-2=8Dec,8,20093.直线回归的区间估计(1)总体回归系数的区间估计

例10-3试用例10-1所计算的样本回归系数b=1088.51估计其总体回归系数的95%可信区间。(1088.51-2.306×83.32,1088.51+2.306×83.32)=(896.37,1280.65)Dec,8,20094.直线回归方程的应用(1)描述两变量的依存关系(2)利用回归方程进行预测(3)利用回归方程进行统计控制(4)应用回归方程应注意的问题1)做回归分析要有实际意义2)在进行直线回归分析前,应绘制散点图3)直线回归方程的适用范围一般为自变量的取值范围Dec,8,2009线性相关(linearcorrelation)

又称简单相关(simplecorrelation)用相关系数(r)来表示两个变量间的直线关系。线性相关的性质可由散点图来直观地说明一、线性相关和相关系数的概念适用于服从双变量正态分布的双随机变量。第二节直线相关Dec,8,20090<r<1-1<r<0.r=0正相关负相关零相关r=-1完全相关零相关完全相关零相关零相关r=1..r=0.r=0.r=0Dec,8,2009二、相关系数的意义相关系数(correlationcoefficient)又称为积差相关系数(coefficientofproduct-momentcorrelation)它是说明具有直线关系的两变量间相关关系的密切程度与相关方向的指标。相关系数r没有单位,-1≤r≤1。Dec,8,2009计算r的公式为:三、相关系数的计算Dec,8,2009例10-8就例10-1资料试计算胎儿股骨径长度和胎儿体重的相关系数。由例10-1中已计算出的lXX=2.79、lYY=3460690、lXY=3036.93按公式(10-20)计算Dec,8,2009四、相关系数的假设检验H0:=0H1:≠0α=0.05=n-2Dec,8,2009例10-9就例10-8所得r值,检验胎儿股骨径长度和胎儿体重间是否有直线相关关系。建立假设检验:H0:ρ=0H1:ρ≠0=0.05计算检验统计量

=n-2=8查t界值表,得P<0.05,拒绝H0。Dec,8,2009相关:相关关系1.区别(1)资料要求不同回归:I型(Y正态分布)、II型都可以。相关:II型资料(双变量正态分布)(2)应用情况不同回归:依存关系五、直线回归与相关的区别和联系Dec,8,2009(1)方向一致(2)假设检验等价(3)用回归解释相关(4)r的平方称为决定系数(coefficientofdetermination):反映了Y的总变异中由X变量可以解释的部分。2.联系Dec,8,2009直线回归与相关应用的注意事项根据专业知识确定自变量和应变量;不能把毫无关联的两种现象勉强作回归或相关;在研究两变量之间的密切程度时,不但要求总体相关系数ρ≠0,而且要求样本的r不能太小,否则即使假设检验认为两变量之间有直线相关关系,但由于r太小,而使得这种关系变得毫无意义|r|≥0.70高度相关,0.4≤|r|<0.70中度相关,|r|<0.4低度相关要绘制散点图直线回归用于预测时,其适用范围一般不超过样本中自变量的取值范围Dec,8,2009(3)特别是有率或构成比等相对数作变量,或本来就是等级资料。(1)不服从双变量正态分布;(2)总体分布类型未知;第三节等级相关Dec,8,2009总体等级相关系数的假设检验H0:ρs=0H1:ρs≠0,或单侧ρs<0(或ρs>0)相关系数rs的公式为:当n>50时直接查rs界值表。当n>50时Dec,8,2009相同秩次较多时,rs的校正:Dec,8,2009第五节曲线拟合医学现象中并非所有的两变量间关系都表现为前面所述的直线形式,其较为典型的是服药后血药浓度-时间曲线或毒理学动物实验中动物死亡率与给药剂量的关系就非直线形式。当散点图中应变量Y和自变量X间表现出非线性趋势时,可以通过曲线拟合(curvefitting)方法来刻画两变量间数量上的依存关系。Dec,8,2009一、曲线拟合的基本方法据专业知识及过去经验(或文献)选择曲线类型。算术格纸、半对数格纸、双对数格纸等,将实测数据制成点图。目前已使用不多。如果既无前人经验作参考,又无合适的格纸可作散点图趋势分析,则可先在普通格

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论