版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教A版(新教材)高中数学选择性必修第三册PAGEPAGE1§8.2一元线性回归模型及其应用第1课时一元线性回归模型及参数的最小二乘估计学习目标1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义.2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.导语通过前面的学习我们已经知道,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等,那么当两个变量线性相关时,我们如何利用成对样本数据建立统计模型进行预测?一、一元线性回归模型与函数模型生活经验告诉我们,儿子的身高与父亲的身高具有正相关的关系,为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表所示:编号1234567父亲身高174170173169182172180儿子身高176176170170185176178编号891011121314父亲身高172168166182173164180儿子身高174170168178172165182我们画出散点图(课本105页图8.2-1)并通过计算得到样本相关系数r≈0.886.问题1由样本相关系数可以得到什么结论?〖提示〗由散点图的分布趋势表明儿子的身高与父亲的身高线性相关,通过样本相关系数可知儿子的身高与父亲的身高正线性相关,且相关程度较高.问题2这两个变量之间的关系可以用函数模型来刻画吗?〖提示〗不能.因为这两个变量之间不是函数关系.可以用新的模型——一元线性回归模型表示.知识梳理一元线性回归模型:我们称eq\b\lc\{\rc\(\a\vs4\al\co1(Y=bx+a+e,,Ee=0,De=σ2))为Y关于x的一元线性回归模型,其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.例1判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画?(1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.解(1)(2)(3)(4)(5)回归模型,(6)(7)函数模型.反思感悟在函数关系中,变量X对应的是变量Y的确定值,而在相关关系中,变量X对应的变量Y的概率分布.换句话说,相关关系是随机变量之间或随机变量与非随机变量之间的一种数量依存关系,对于这种关系,通常运用统计方法进行研究.通过对相关关系的研究又可以总结规律,从而指导人们的生活与生活实践.跟踪训练1若某地财政收入x与支出y满足一元线性回归模型y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.9亿元 B.9.5亿元C.10亿元 D.10.5亿元〖答案〗D〖解析〗因为财政收入x与支出y满足一元线性回归模型y=bx+a+e,其中b=0.7,a=3,所以y=0.7x+3+e.当x=10时,得y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出预计不会超过10.5亿元,故选D.二、最小二乘法和经验回归方程问题3在一元线性回归模型中,表达式Y=bx+a+e刻画了变量Y与x之间的线性相关关系,其中参数a和b未知,确定参数a和b的原则是什么?〖提示〗使表示成对样本数的各散点在整体上与一条适当的直线尽可能地接近.问题4下列确定直线的四种方法中最具有可行性的是哪一个?方法(1):先画出一条直线,测量出各点到直线的距离,然后移动直线,到达一个是距离和最小的位置,测量出此时的斜率和截距,就得到一条直线.方法(2):可以在散点图中选两点画一条直线,使得直线两侧点的个数基本相同,把这条直线作为所求直线.方法(3):在散点图中多取几对点,确定出几条直线,再分别求出这些直线的斜率截距的平均数作为所求直线的斜率和截距.方法(4):我们可以考虑使各组数据的随机误差e的和最小来确定直线的斜率和截距.〖提示〗方法(1),(2),(3)虽然有一定道理,但是比较难操作,方法(4)可以利用点到直线的距离来刻画散点与该直线的接近程度,然后利用所有距离之和刻画所有样本观测数据与该直线的接近程度(具体推导过程参考课本108~109页).知识梳理最小二乘法:我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估计,其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).注意点:(1)经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过点(eq\x\to(x),eq\x\to(y)).(2)eq\o(b,\s\up6(^))的常用公式eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2).例2某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070求经验回归方程.解列出下表,并用科学计算器进行有关计算.i12345xi24568yi3040605070xiyi60160300300560xeq\o\al(2,i)416253664eq\x\to(x)=5,eq\x\to(y)=50,eq\i\su(i=1,5,x)eq\o\al(2,i)=145,eq\i\su(i=1,5,x)iyi=1380则eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(1380-5×5×50,145-5×52)=6.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=50-6.5×5=17.5.故所求的经验回归方程是eq\o(y,\s\up6(^))=6.5x+17.5.反思感悟求经验回归方程的步骤(1)列:列表表示xi,yi,xeq\o\al(2,i),xiyi.(2)算:计算eq\x\to(x),eq\x\to(y),eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi.(3)代:代入公式计算eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))的值.(4)写:写出经验回归方程.跟踪训练2某班5名学生的数学和物理成绩如表:学生学科ABCDE数学成绩(x)8876736663物理成绩(y)7865716461求物理成绩y对数学成绩x的经验回归方程.解eq\x\to(x)=eq\f(1,5)×(88+76+73+66+63)=73.2,eq\x\to(y)=eq\f(1,5)×(78+65+71+64+61)=67.8.eq\i\su(i=1,5,x)iyi=88×78+76×65+73×71+66×64+63×61=25054.eq\i\su(i=1,5,x)eq\o\al(2,i)=882+762+732+662+632=27174.所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(25054-5×73.2×67.8,27174-5×73.22)≈0.625,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)≈67.8-0.625×73.2=22.05.所以所求经验回归方程是eq\o(y,\s\up6(^))=0.625x+22.05.三、利用经验回归方程进行预测例3某研究机构对高三学生的记忆力x和判断力y进行统计分析,得如表数据:x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.参考公式:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)解(1)散点图如图所示.(2)eq\x\to(x)=eq\f(6+8+10+12,4)=9,eq\x\to(y)=eq\f(2+3+5+6,4)=4,eq\i\su(i=1,4,x)eq\o\al(2,i)=62+82+102+122=344,eq\i\su(i=1,4,x)iyi=6×2+8×3+10×5+12×6=158,eq\o(b,\s\up6(^))=eq\f(158-4×9×4,344-4×92)=eq\f(14,20)=0.7,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=4-0.7×9=-2.3,故经验回归方程为eq\o(y,\s\up6(^))=0.7x-2.3.(3)由(2)中经验回归方程可知,当x=9时,eq\o(y,\s\up6(^))=0.7×9-2.3=4,即预测记忆力为9的同学的判断力为4.反思感悟(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图.(2)求经验回归方程,注意运算的正确性.(3)根据经验回归方程进行预测估计:估计值不是实际值,两者会有一定的误差.跟踪训练3从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得eq\i\su(i=1,10,x)i=80,eq\i\su(i=1,10,y)i=20,eq\i\su(i=1,10,x)iyi=184,eq\i\su(i=1,10,x)eq\o\al(2,i)=720.(1)求家庭的月储蓄y对月收入x的经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),其中eq\x\to(x),eq\x\to(y)为样本平均值.解(1)由题意知n=10,eq\x\to(x)=eq\f(1,n)eq\i\su(i=1,n,x)i=eq\f(80,10)=8,eq\x\to(y)=eq\f(1,n)eq\i\su(i=1,n,y)i=eq\f(20,10)=2,又eq\i\su(i=1,n,x)eq\o\al(2,i)-neq\x\to(x)2=720-10×82=80,eq\i\su(i=1,n,x)iyi-neq\x\to(x)eq\x\to(y)=184-10×8×2=24,则eq\o(b,\s\up6(^))=eq\f(24,80)=0.3,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=2-0.3×8=-0.4,故所求经验回归方程为eq\o(y,\s\up6(^))=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入经验回归方程可以预测该家庭的月储蓄为eq\o(y,\s\up6(^))=0.3×7-0.4=1.7(千元).1.知识清单:(1)一元线性回归模型.(2)最小二乘法、经验回归方程的求法.2.方法归纳:数形结合、转化化归.3.常见误区:不判断变量间是否具有线性相关关系,盲目求解经验回归方程致误.1.工人工资y(元)与劳动生产率x(千元)的相关关系的经验回归方程为eq\o(y,\s\up6(^))=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工人工资为130元B.劳动生产率提高1000元时,工人工资平均提高80元C.劳动生产率提高1000元时,工人工资平均提高130元D.当月工资为250元时,劳动生产率为2000元〖答案〗B〖解析〗因为经验回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1000元时,工人工资平均提高80元.2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据成对样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为eq\o(y,\s\up6(^))=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.经验回归直线过点(eq\x\to(x),eq\x\to(y))C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可判定其体重必为58.79kg〖答案〗D〖解析〗当x=170时,eq\o(y,\s\up6(^))=0.85×170-85.71=58.79,体重的估计值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度股权质押资产重组合同示范文本3篇
- 二零二五年度钢材仓储物流服务合同9篇
- 二零二五年度路灯照明设施安全检测合同样本2篇
- 二零二五年度:劳动合同法实务操作与案例分析合同3篇
- 二零二五年度船舶建造与设备安装合同2篇
- 二零二五年度农产品质量检测合同范本3篇
- 二零二五年度安置房买卖合同电子支付与结算规范3篇
- 3、2025年度绿色出行接送机服务合同范本2篇
- 二零二五年度文化创意产业合作开发合同范本3篇
- 家里陪护合同(2篇)
- 手术室护理实践指南2023年
- 电力安全工作规程(变电部分)课件
- 新人教版六年级下册数学全册课件
- 环保设施安全风险告知卡
- 卵石地层桩基旋挖钻施工方案
- 江苏对口单招英语考纲词汇总结
- (完整word版)手卡模板
- GB/T 4091-2001常规控制图
- GB/T 13912-2020金属覆盖层钢铁制件热浸镀锌层技术要求及试验方法
- GB 18399-2001棉花加工机械安全要求
- 陕西省延安市各县区乡镇行政村村庄村名居民村民委员会明细
评论
0/150
提交评论