医学统计学 第九章 第二十二讲_第1页
医学统计学 第九章 第二十二讲_第2页
医学统计学 第九章 第二十二讲_第3页
医学统计学 第九章 第二十二讲_第4页
医学统计学 第九章 第二十二讲_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.2.1直线回归的概念

直线回归是处理两变量间线性依存关系的的一种统计分析方法

注:其中至少一个是随机变量直线回归是回归分析中最基本、最简单的一种,故又称简单回归分析直线回归分析的目的:建立一个线性函数,来描述具有相关关系的两个变量间依存关系。回归分析中两变量的地位是不相同的:

通常把一个变量称为自变量,用X表示;另一个变量称为应变量,用Y表示。9.2直线回归进食量与体重增加量的散点图:散点图的带状分布有线性趋势

图9.1大白鼠进食量与体重增加量的散点图进食量(g)1000900800700600增加量(g)190180170160150140130120110直线回归分析在于找出两个变量有依存关系的直线方程,以确定一条能代表这些数据关系的、最接近各实测点的直线,使各实测点的与该线的纵向距离的平方和为最小。为了区别于一般的函数方程,我们称之为直线回归方程

65075085095010501150110140170200直线回归方程的一般表达式为:

a是回归直线在Y轴上的截距,即X=0时的值;b为回归系数,即直线的斜率。b>0,表示直线从左下方走向右上方,即Y随X的增大而增大;b<0,表示直线从左上方走向右下方,即Y随X的增大而减小;b=0,表示回归直线与X轴平行,即X,Y无回归关系。9.2.2回归方程的建立与检验b

的统计意义:X每增(减)一个单位,Y平均改变b个单位例如体表面积Y与体重X的关系=2.5212+0.2385

X

体重每增加1kg,

则体表面积平均增加0.2385(103cm2)

1112131415165.05.56.06.5求回归方程的关键是要求a和b的值,根据数学上的最小二乘法原理,使各实测值Y与回归直线上对应的估计值之差的平方和为最小:,

为残差:点到直线的纵向距离。可导出a、b的最小二乘法估计如下:【例9.3】现仍用例9.1的资料,试分析大白鼠进食量与体重增加量的关系试作直线回归分析。进行回归分析前要先作散点图,以判断两变量间是否线性趋势求直线回归方程

a=-23.9472,b=0.23053.绘制回归直线

在自变量X的实测范围内任取相距较远且易读的两个X值,代入直线回归方程求得两点坐标,过这两点作直线即为所求回归直线。4.回归系数的假设检验(1)回归系数假设检验的意义所求得的回归方程是否能表达X、Y存在直线关系,这是回归分析首要考虑的问题。总体回归系数与样本回归系数b

存在抽样误差(2)回归系数的t检验总体回归系数β,与样本回归系数b间存在抽样误差:即使X、Y的总体回归系数β为零(X,Y并不存在回归关系),由于存在抽样误差,其样本回归系数b也不一定为零;因此,当用样本求得不等于零的回归系数b后,还不能立即认为β≠0,即X与Y间存在回归关系,必须考虑回归系数的抽样误差问题,因此需对β是否为零进行假设检验;检验方法:可用按Y服从正态分布的假定,回归系数的假设可用方差分析或t检验。检验假设为:H0:总体回归系数β=0,即大白鼠进食量与体重增加量间无回归关系。H1:总体回归系数β≠0,即大白鼠进食量与体重增加量间有回归关系。

检验水准α=0.05,双侧假设检验。检验统计量式中Sb为样本回归系数的标准误:为剩余标准差,亦称标准估计误差:将数据代入计算公式可得:查t界值表,t0.001(10)=4.587,>t0.001(10),P<0.001;统计结论:按α=0.05水准,拒绝H0,接受H1,认为在某代乳粉营养价值试验中,大白鼠进食量与体重增加量之间存在直线回归关系,即所拟合的样本直线回归方程有意义。

查表确定p值

查t界值表,得p<0.001附表4t界值表概率,p自由度单侧0.100.050.0250.010.0050.0010.0005

双侧0.200.100.0500.020.010.0020.00113.0786.31412.70631.82163.657318.363621.8862.9204.3036.9659.92522.331101.3721.8122.2282.7643.1694.1444.587111.3631.7962.2012.7183.1064.0254.4371.描述两变量间的依存关系

通过回归系数的假设检验,若认为两变量间存在着直线回归关系,则可用直线回归方程来描述两变量间的依存关系

可用于描述大白鼠进食量与体重增加量的定量关系9.2.3回归方程的应用2.利用回归方程进行预测

所谓预测就是把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计,其波动范围可按求Y值容许区间的方法计算。如预测大白鼠进食950克时的体重增加量,将X=950代入得3.利用回归方程进行统计控制

统计控制是利用回归方程进行逆估计,如果要求应变量Y在一定范围内波动,可以通过控制自变量X的取值来实现.如【例9.5】血糖水平Y与胰岛素X的关系为:只要把胰岛素水平控制在32.71mU/L以上,就有95%可能使血糖不超过正常值范围的上限6.72mmol/L.9.4.1直线相关与回归的区别与联系一、直线相关与回归的区别与联系1.区别:(1)在资料要求上,相关分析中,X,Y地位平等;回归分析中,二者地位不同

在回归分析中:如果X可以精确测量和严

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论