3.1.1线性回归思想_第1页
3.1.1线性回归思想_第2页
3.1.1线性回归思想_第3页
3.1.1线性回归思想_第4页
3.1.1线性回归思想_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3.1回归分析的基本思想及其初步应用(一)高二数学 选修2-37/27/20221复习一 变量之间的关系 1 确定性的函数关系 2 不确定性的相关关系: 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系,相关关系是一种非确定的关系7/27/20222.年龄脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄脂肪5833.56035.26134.6如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?二 线性回归分析的步骤 :7/27/20223下面我们以年龄为横轴,脂

2、肪含量为纵轴建立直角坐标系,作出各个点,称该图为散点图。如图:O20253035404550556065年龄脂肪含量5101520253035401 画散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图像叫散点图7/27/20224从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。但有的两个变量的相关,如下图所示:如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。 作出散点图发现,它们散布在从左上角到右下角的区域内。又如汽车的载重和汽车每消耗1升汽油所行使的平均路程,称它们成负相关

3、.注:可考虑让学生思考书P77的思考.O(1)正相关,负相关7/27/20225我们再观察它的图像发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做回归直线,该直线叫回归方程。那么,我们该怎样来求出这个回归方程?请同学们展开讨论,能得出哪些具体的方案?20253035404550556065年龄脂肪含量0510152025303540(2) 线性相关7/27/20226我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式:以上公式的推导较复

4、杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。(参看如书P80)2 回归方程的求解 7/27/20227 线性回归分析的步骤 :1、画散点图4、用回归直线方程进行预报3、求回归直线方程 2、求 8 最小二乘估计公式 :称为样本点的中心。9三 描述两个变量之间线性相关关系的强弱的相关系数r10课前检测: 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。使用年限x 23456维修费用y 2.23.85.56.57.0若由资料知,y对x呈线性相关关系。试求:(1)线性回归方程 的回归系数 ;()估计使用年限为10年时,维修费用

5、是多少?使用年限为10年时,维修费用是:12.38万元11 2008年5月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加.“身高标准体重”该指标对于学生形成正确的身体形态观具有非常直观的教育作用. “身高标准体重”从何而来?我们怎样去研究?创设情境:12例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。问题呈现:女大学生的

6、身高与体重13解; 1.由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y3.回归方程:2. 散点图;4.本例中, r=0.7980.75这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。14探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。15例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。编号12345678身高/cm165165157170175165155170体重/

7、kg4857505464614359女大学生的身高与体重16我们可以用下面的线性回归模型来表示:y=bx+a+e, (3)其中a和b为模型的未知参数,e称为随机误差。y=bx+a+e,E(e)=0,D(e)= (4) 在线性回归模型(4)中,随机误差e的方差 越小,通过回归直线 (5)预报真实值y的精度越高。随机误差是引起预报值 与真实值y之间的误差的原因之一,其大小取决于随机误差的方差。另一方面,由于公式(1)和(2)中 和 为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一个原因。17 假设 1:身高和随机误差的不同不会对体重产生任何影响,

8、 54.554.554.554.554.554.554.554.5体重/kg170155165175170157165165身高/cm87654321编号54.5kg怎样研究随机误差?185943616454505748体重/kg170155165175170157165165身高/cm87654321编号 假设2:随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。 怎样研究随机误差?19 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为残差。例如,编号为6的女大学生,计算随机误差的效应(残差)为:20我们可以用相关指数R2来刻

9、画回归的效果,其计算公式是如何衡量预报的精度?显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。 如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。21学以致用:1、在对两个变量,进行线性回归分析时有下列步骤:对所求出的回归方程作出解释,收集数据(,)求线性回归方程,求相关系数,根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量,具有线性相关结论,则在下列操作顺序中正确的是()22学以致用:2、对于相关指数,下列说法正确的是()、的取植越小,模型拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值越接近,模型拟合效果越好、以上答案都不对23学以致用:3、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的实验结果体现,两变量有更强的线性相关性甲乙丙丁24学以致用:4、 已知两个变量x和y之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论