




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章成对数据的统计分析8.2一元线性回归模型及应用8.2.1一元线性回归模型1.样本相关系数:2.相关系数的性质:
复习回顾①
当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③
当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.新课导入通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.思考是否可以能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型来刻画两个变量之间的相关关系?并通过模型进行预测?下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.一元线性回归模型知识梳理一元线性回归模型:我们称
为Y关于x的____________模型,其中,Y称为
或
,x称为
或
;a和b为模型的未知参数,a称为
参数,b称为
参数;e是Y与bx+a之间的
.一元线性回归因变量响应变量自变量解释变量截距斜率随机误差新知探究生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182问题1由样本相关系数可以得到什么结论?问题2这两个变量之间的关系可以用函数模型来刻画吗?儿子身高和父亲身高之间不是函数关系,故不能用函数模型刻画.但由于父子的身高有较强的线性相关,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,而把影响儿子身高的其他因素作为随机误差,得到刻画两个变量之间关系的线性回归模型.若用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为新知探究
我们称(1)式为Y关于x的一元线性回归模型.
其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由
x所确定,后一部分是随机的.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.例1判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?(1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平方米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.(1)(2)(3)(4)(5)回归模型,(6)(7)函数模型.跟踪训练1若某地财政收入x与支出y满足一元线性回归模型y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入为10亿元,年支出预计不会超过A.9亿元B.9.5亿元C.10亿元D.10.5亿元√因为财政收入x与支出y满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,所以y=0.7x+3+e.当x=10时,得y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元.最小二乘法和经验回归方程问题3在一元线性回归模型中,表达式Y=bx+a+e刻画的是变量Y与x之间的线性相关关系,其中参数a和b未知,确定参数a和b的原则是什么?提示使表示成对样本数据的这些散点在整体上与一条适当的直线尽
可能地接近.知识梳理最小二乘法:我们将
称为Y关于x的
,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做
,求得的
叫做b,a的
,经验回归方程最小二乘法最小二乘估计注意点:例2(1)某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:气温x(℃)181310-1用电量y(度)24343864A.68度
B.66度C.28度 D.12度√(2)某商场为了迎接暑期旅游旺季,确定暑期营销策略,进行了投入促销费用x和商场实际销售额y的试验,得到如下四组数据.①画出上述数据的散点图,并据此判断两个变量是否具有较强的线性相关关系;投入促销费用x(万元)2356商场实际销售额y(万元)100200300400散点图如图所示.从散点图上可以看出两个变量具有较好的线性相关关系.③若该商场计划实际销售额不低于600万元,则至少要投入多少万元的促销费用?所以若该商场计划实际销售额不低于600万元,则至少要投入9万元的促销费用.跟踪训练2
(1)若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为y=6.5x+17.5,则表中m的值为x24568y3040m5070A.60 B.55 C.50 D.45√(2)重楼,中药名,具有清热解毒、消肿止痛、凉肝定惊之功效,具有极高的药用价值.近年来,随着重楼的药用潜力被不断开发,野生重楼资源已经满足不了市场的需求,巨大的经济价值提升了家种重楼的热度,某机构统计了近几年某地家种重楼年产量y(单位:吨),统计数据如表所示.年份2016201720182019202020212022年份代码x1234567年产量y/吨130180320390460550630①根据表中的统计数据,求出y关于x的经验回归方程;年份2016201720182019202020212022年份代码x1234567年产量y/吨130180320390460550630=13020,②根据①中所求方程预测2024年该地家种重楼的年产量.由题可知,2024年的年份代码为9,即x=9,将x=9代入经验回归方程,所以预测2024年该地家种重楼的年产量为805吨.线性回归分析知识梳理1.残差:对于响应变量Y,通过观测得到的数据称为
,通过经验回归方程得到的
称为
,
减去
称为残差.2.残差分析:
是随机误差的估计结果,通过对
的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为
.3.残差平方和法残差平方和
越
,模型的拟合效果越好.观测值预测值观测值预测值残差残差残差分析小知识梳理4.决定系数R2可以用R2=1-
来比较两个模型的拟合效果,R2越
,模型的拟合效果越
,R2越
,模型的拟合效果越
.大好小差例3
(1)(多选)对变量y和x的一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则A.残差平方和越大,模型的拟合效果越好B.在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表
示回归效果越好C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关
关系√√(2)假定小麦基本苗数x与成熟期有效穗y之间存在线性相关关系,今测得5组数据如下表:x15.025.830.036.644.4y39.442.942.943.149.2①计算各组残差,并计算残差平方和;②求R2.反思感悟刻画回归效果的三种方法(1)残差图法:残差点比较均匀地落在水平带状区域内说明选用的模型比较合适.跟踪训练3已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并借助残差平方和及R2说明回归模型拟合效果的好坏.列出残差表为所以回归模型的拟合效果很好.课堂小结1.知识清单:(1)一元线性回归模型.(2)最小二乘法、经验回归方程的求法.(3)线性回归分析:残差图法、残差平方和法和R2法.2.方法归纳:数形结合、转化化归.3.常见误区:混淆残差图法、残差平方和法和R2法的概念,导致刻画回归效果出错.随堂演练1.收集一只棉铃虫的产卵数y与温度x的几组数据后发现两个变量有相关关系,按不同的曲线来拟合y与x之间的关系,并算出了对应的决定系数R2如表所示,拟合曲线直线指数曲线抛物线二次曲线回归模型y=19.8x-463.7y=e0.27x-3.84y=0.367x2-202
R20.7460.9960.9020.002则应选择拟合最好的回归模型为A.y=19.8x-463.7
B.y=e0.27x-3.84√由决定系数R2来刻画回归效果,R2的值越大越接近1,说明模型的拟合效果最好.由表可知指数模型的决定系数最接近1.拟合曲线直线指数曲线抛物线二次曲线回归模型y=19.8x-463.7y=e0.27x-3.84y=0.367x2-202
R20.7460.9960.9020.0022.(多选)已知变量y与x具有线性相关关系,统计得到6组数据如下表:x247101522y8.19.41214.418.524√√x247101522y8.19.41214.418.524即当x=12时,y的估计值为16,故D错误.x247101522y8.19.41214.418.5243.某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据列(个数x,加工时间y)为:(10,62),(20,a),(30,75),(40,81),(5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中信息科技学科开展游戏化教学的策略分析
- 家居物流安装行业深度调研及发展战略咨询报告
- 废气在线监测系统行业跨境出海战略研究报告
- 食品级天然防腐剂行业深度调研及发展战略咨询报告
- 柔道训练中心行业跨境出海战略研究报告
- 2025年金刚石膜热沉材料项目建议书
- 民族医医院AI智能设备企业制定与实施新质生产力战略研究报告
- 淡化黑眼圈眼霜行业深度调研及发展战略咨询报告
- 智能家居节能系统安装企业制定与实施新质生产力战略研究报告
- 快递区域网络企业制定与实施新质生产力战略研究报告
- 暨南大道西延惠山段(江阴界-S261)新建工程报告书
- 消费行为影响机制-深度研究
- 健康咨询与服务推广协议
- 教师语言与沟通艺术知到智慧树章节测试课后答案2024年秋温州大学
- DeepSeek入门到精通-实操+进阶玩法培训
- 护士N1晋级N2述职报告
- 2025中国建材集团有限公司招聘6人笔试参考题库附带答案详解
- 2025年吉林铁道职业技术学院单招职业技能测试题库必考题
- 车辆运输安全管理制度
- 2025年北京电子科技职业学院高职单招语文2018-2024历年参考题库频考点含答案解析
- 食堂食材配送采购投标方案(技术标)
评论
0/150
提交评论