




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
简单线性回归Linearregression第11讲简单线性回归回归是设法找出变量间在数量上的依存变化关系,用函数表达式表达出来,这个表达式称之为回归方程。第11讲简单线性回归两变量间的关系确定性关系:两变量间的函数关系
圆的周长与半径的关系:C=2R
速度、时间与路程的关系:L=STX与Y的函数关系:Y=a+bX非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;身高与体重的关系:标准体重(kg)=身高(cm)-105药物浓度与反应率的关系;第11讲简单线性回归一、线性回归的概念当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系。其中X为自变量(independentvariable);Y是因变量(dependentvariable)。但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或线性回归。
第11讲简单线性回归小插曲:为什么叫”回归“?
F.GaltonK.Pearson第11讲简单线性回归二、回归参数的估计式中的是由自变量X推算应变量Y的估计值,a是回归直线在Y轴上的截距;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。计算原理:最小二乘法,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方程最能代表实测数据所反映出的直线趋势。第11讲简单线性回归第11讲简单线性回归例12-1某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得20名正常成年男性的有关数据,散点图如下。第11讲简单线性回归年龄与运动后最大心率的回归方程第11讲简单线性回归回归系数和回归方程的意义及性质b的意义a的意义的意义的意义的意义第11讲简单线性回归b
的意义斜率(slope)=301.3124-3.218X年龄每增加1岁,其运动后最大心率平均减少3.218(次/分钟)b
的单位为(Y的单位/X的单位)第11讲简单线性回归
b>0,yincreasewiththeincreaseofX
b<0,ydecreasewiththeincreaseofX
b=0,nolinearcorrelationbetweentwovariables.XYbistheregressioncoefficientandtheslopeoftheline。statisticalsignificanceofb
:whenXchangedaunit,theYchangedbunitsonaverage.b>0b<0b=0第11讲简单线性回归a的意义a截距(intercept,constant)X=0时,Y的估计值a的单位与Y值相同当X可能取0时,a才有实际意义。第11讲简单线性回归估计值的意义X=46时,=153.2844,即年龄为46岁的正常成年男性,其平均运动后最大心率估计值为153.2844(次/分钟);给定X时,Y的估计值。当时,第11讲简单线性回归的意义
为残差:实测点到回归直线的纵向距离。1112131415165.05.56.06.5第11讲简单线性回归残差平方和(residualsumofsquares).综合表示点距直线的纵向距离。在所有的直线中,回归直线的残差平方和是最小的。(最小二乘)的意义第11讲简单线性回归三、总体回归系数的假设检验与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。总体的回归系数用β表示。
第11讲简单线性回归一般步骤H0:β=0回归方程无意义H1:β≠0回归方程有意义
α=0.05选择合适的假设检验方法(方差分析或t检验),计算统计量计算概率值P做出推论:统计学结论和专业结论第11讲简单线性回归方差分析法第11讲简单线性回归因变量总变异的分解X
P
(X,Y)Y第11讲简单线性回归Y的总变异分解未引进回归时的总变异:(sumofsquaresaboutthemeanofY)引进回归以后的变异(剩余):(sumofsquaresaboutregression)回归的贡献,回归平方和:(sumofsquaresduetoregression)第11讲简单线性回归Y的总变异分解
第11讲简单线性回归剩余标准差(1)扣除了X的影响后Y方面的变异;(2)引进回归方程后,Y方面的变异。
第11讲简单线性回归回归系数检验的基本思想如果X与Y无线性回归关系,在SS回归和SS剩余都是其他随机因素对Y的影响,由此,MS回归≈MS剩余,总体回归系数β=0,反之,β≠0。所以用F检验对X与Y之间有无回归关系进行检验。第11讲简单线性回归公式第11讲简单线性回归查F界值表,F0.05(1,18)=4.41,F>F0.05(1,18),P<0.05,拒绝H0
H0:β=0H1:β≠0α=0.05第11讲简单线性回归t检验法Sb是样本回归系数的标准误第11讲简单线性回归H0:
=0,H1:
≠0,
=0.05。年龄与运动后最大心率间存在回归关系。第11讲简单线性回归决定系数
(coefficientofdetermination)取值在0到1之间,反映了回归贡献的相对程度。决定系数除了作为回归拟合效果的概括统计量,还可利用它对回归方程做假设检验。第11讲简单线性回归四、回归问题的区间估计回归系数的可信区间估计估计值的可信区间估计个体Y值的容许区间估计第11讲简单线性回归总体回归系数
的可信区间估计根据
t分布原理估计:-3.218±2.101×0.2777=-3.8014~-2.6346第11讲简单线性回归的可信区间估计
总体回归线的95%置信带
样本总体Y的总平均给定X时Y的平均(Y的条件均数)根据
t分布原理:第11讲简单线性回归的容许区间估计
个体Y值的容许区间给定X时Y的估计值是Y的均数的一个估计。给定X时Y值的容许区间是Y
值的可能范围。的100(1-
)%容许限:第11讲简单线性回归的可信区间与Y的容许区间可信区间是针对条件均数的,而容许区间是针对Y的取值范围的。X=46时,的可信区间为:149.7501~156.8187(次/分),
表示:年龄为46岁的男子,估计其运动后最大心率为153.2844,95%可信区间为(149.7501,156.8187)(次/分),
X=46时,Y的容许区间为:141.7543~164.8145(次/分),
表示:年龄为46岁的男子,估计有95%的人其运动后最大心率在141.7543~164.8145(次/分)之间。第11讲简单线性回归可信区间与容许区间示意
(confidenceband&toleranceband)1112131415164.55.05.56.06.57.0第11讲简单线性回归五、残差分析第11讲简单线性回归线性回归的应用条件(LINE):(1)线性(linear)(2)独立(independent)(3)给定X时,Y正态分布(normal)(4)等方差(equalvariance)
可通过散点图、残差图等方法来判断数据是否满足这些条件。第11讲简单线性回归给定X时,Y是正态分布、等方差示意图第11讲简单线性回归给定X时,Y是正态分布、不等方差示意图第11讲简单线性回归残差及残差分析残差是指观察值Yi与预测值之间的差值,其表达式为:它反映了方程拟合数据优劣的信息。残差分析(residualanalysis)旨在通过残差深入了解数据与方程之间的关系,评价实际资料是否符合回归方程的假设,识别离群值等。第11讲简单线性回归残差图标准残差:(残差-均值)/标准差以自变量(或因变量)为横坐标,标准残差为纵坐标,构成的散点图称之为残差图。运动后最大心率Y和回归残差图第11讲简单线性回归残差图示意图第11讲简单线性回归残差图示意图含义以上给出几种以自变量取值为横坐标、以标准化残差为纵坐标的残差图的常见类型。在此残差图中:情况(a)、情况(b)和情况(f)表示残差不满足等方差的条件;情况(c)显示存在非线性关系;情况(d)显示有点处于
2倍标准差以外,可能是离群值;只有情况(e)显示残差呈随机分布,满足回归条件。第11讲简单线性回归六、线性回归分析的注意事项1.进行相回归分析要有实际意义。2.充分利用散点图。3.在回归分析中要求因变量Y是随机变量,服从正态分布,自变量X可以是随机变量也可以是给定的变量。4.自变量的选择:因果中的因、容易测量的、变异小的。
第11讲简单线性回归4.注意线性回归模型的应用条件:LINE5.建立回归方程后,须对回归系数进行假设检验。6.使用回归方程估计时,在建立方程时的自变量的取值范围内。第11讲简单线性回归七、线性相关和回归的
区别和联系第11讲简单线性回归联系:1.b和r符号一致2.b和r的检验是等价的3.用回归解释相关第11讲简单线性回归区别1.资料要求不同:回归要求y服从正态分布,x是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;相关要求两个变量服从双变量正态分布。这种资料若进行回归分析称为Ⅱ回归,可计算两个方程。I型回归:X是精确控制的;II型回归:X是随机的。由X推算Y:由Y推算X:2.研究目的不同:回归用来说明两变量数量上的依存变化关系,相关说明变量间的相关关系。第11讲简单线性回归小结简单线性回归是研究两个变量间线性关系的数量表达式。根据最小二乘法原则,计算回归方程。进行简单线性回归分析需要满足线性、独立、正态与等方差4个条件。在简单线性回归分析中,对回归方程的检验等价于对回归系数的假设检验,可通过方差分析或t检验完成。第11讲简单线性回归案例原文题目《高效毛细管电泳法测定血浆中布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 卫生间给排水施工方案
- 变配电施工方案
- 中甸别墅施工方案
- 屋顶楼板伸缩缝施工方案
- 通信管道施工方案
- 咸阳混凝土马路施工方案
- 双十一古风活动策划方案
- 2025年锰酸锂项目建议书
- 交通安全发言稿
- 初中家长会家长发言稿
- 开封市第一届职业技能大赛美容项目技术文件(世赛项目)
- 《全科医学概论》课件-以家庭为单位的健康照顾
- 医院窗帘、隔帘采购 投标方案(技术方案)
- 控制计划课件教材-2024年
- 自来水厂安全施工组织设计
- 川教版2024-2025学年六年级下册信息技术全册教案
- 《无人机测绘技术》项目1任务3无人机测绘基础知识
- 招标代理机构遴选投标方案(技术标)
- 彩钢瓦雨棚施工技术标准方案
- 2024年新疆(兵团)公务员考试《行测》真题及答案解析
- KTV商务礼仪培训
评论
0/150
提交评论