版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1课时一元线性回归模型及参数的最小二乘估计学习任务1.了解一元线性回归模型的含义,了解模型参数的统计意义.(数学抽象)2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.(数学抽象)3.针对实际问题,会用一元线性回归模型进行预测.(数据分析、数学运算)某地区从某一年开始进行了环境污染整治,得到了如下数据:第x年1234567污染指数y6.15.24.54.73.83.43.1作出这些成对数据的散点图,判断污染指数y与x是否线性相关?在知道y与x线性相关的前提下,你能找出近似描述y与x之间关系的一次函数表达式吗?根据所得到的关系式,你能估计出该地区第8年的污染指数吗?知识点1一元线性回归模型Y=bx+a+e,Ee=0,De=σ2,为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量.a和b1.具有相关关系的两个变量,其样本点散布在某一条直线y=bx+a的附近,可以用一次函数y=bx+a来描述两个变量之间的关系吗?[提示]不能.知识点2经验回归方程(1)有关概念y=bx+a称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,求经验回归方程的方法叫做最小二乘法,求得的b,a叫做(2)计算公式b==,a=(1)经验回归直线过点(x,y),不一定过成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(2)经验回归直线的截距a和斜率b都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差.(3)经验回归方程y=ax+b中的b表示x增加1个单位时,y的平均变化量为b,而a表示2.正相关、负相关与b的符号有何关系?[提示]Y与X正相关的充要条件是b>0,Y与X负相关的充要条件是b<0.1.思考辨析(正确的画“√”,错误的画“×”)(1)随机误差是一个随机变量. ()(2)经验回归方程最能代表观测值x,y之间的线性关系,且回归直线过样本点的中心(x,y). ((3)求经验回归方程前可以不进行相关性检验. ()(4)利用经验回归方程求出的值是准确值. ()[答案](1)√(2)√(3)×(4)×2.下列有关经验回归方程y=bx+a①反映y与x之间的函数关系;②反映y与x之间的函数关系;③表示y与x之间不确定关系;④表示最接近y与x之间真实关系的一条直线.①④[y=bx+a表示y与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与3.某地区近十年居民的年收入x与支出y之间的关系大致符合y=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则年支出估计是________亿元.12.1[∵y=0.8x+0.1,∴y=0.8×15+0.1=12.1(亿元).]类型1一元线性回归模型的理解【例1】在一元线性回归模型Y=bx+a+e中,下列说法正确的是()A.Y=bx+a+e是一次函数B.响应变量Y是由解释变量x唯一确定的C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生C[对于A中,一元线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A说法错误;对于B中,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C中,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D中,随机误差是不能避免的,只能将误差缩小,所以D错误.故选C.]明确一元线性回归模型的含义是解题的关键,其中a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.[跟进训练]1.关于一元线性回归模型Y=bx+a+e,①表达式Y=bx+a+e刻画的是变量Y与变量x之间的线性相关关系;②bx+a反映了由于x的变化而引起的Y的线性变化;③误差项e是一个期望值为0的随机变量,即E(e)=0;④对于所有的x值,e的方差σ2都相同.其中正确的是________(填序号).①②③④[根据一元线性回归模型的含义可知,以上说法均正确.]类型2求经验回归方程【例2】随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量y(单位:次)之间的对应数据如表所示:x/件24568y/次3040506070(1)根据表中数据画出散点图;(2)根据表中的数据,求出y关于x的经验回归方程;(3)当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少.[解](1)散点图如图所示.(2)根据散点图可得,变量x与y之间具有线性相关关系.根据数据可知,代入公式得b==1390-5×5×50145-5故所求的经验回归方程是y=7x+15.(3)根据上面求出的经验回归方程,当成交量突破100件(含100件),即x=y-157≥100时,y≥715求经验回归方程的基本步骤(1)画出散点图,从直观上分析数据间是否存在线性相关关系;(2)(3)代入公式求出y=bx+a(4)写出经验回归方程并对实际问题作出估计.提醒:只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.[跟进训练]2.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如表所示.年份x20182019202020212022储蓄存款额y/千亿元567810为了计算方便,工作人员将上表的数据进行了处理,令t=x-2017,z=y-5,得到下表.t12345z01235(1)作z关于t的散点图,求z关于t的经验回归方程;(2)通过(1)中的方程,求出y关于x的回归方程.[解](1)作散点图,直观看z与t具有线性相关关系.根据z关于t的表格数据,得t=15(1+2+3+4+5)=3z=15(0+1+2+3+5)=2.2且∴b==45-5×a=z-bt=2.2-1.2×3所以z关于t的经验回归方程为z=1.2t-1.4.(2)z=1.2t-1.4,代入t=x-2017,z=y-5,得y-5=1.2(x-2017)-1.4,即y=1.2x-2416.8.故y关于x的经验回归方程为y=1.2x-2416.8.类型3利用经验回归方程进行预测【例3】(源自湘教版教材)一个车间为了估计加工某种新型零件所花费的时间,进行了10次试验,测得的数据如表所示:零件个数x102030405060708090100加工时间y/min626875818995102108115122(1)y与x之间是否具有相关关系?(2)如果y与x之间具有相关关系,求经验回归方程(结果保留三位小数).(3)据此估计加工110个零件所用的时间.[解](1)x=10+20+30+40+50+60+70+80+90+10010=55y=62+68+75+81+89+95+102+108+115+12210=91.7i=55950-10×55因此y与x之间具有显著的正相关关系.(2)设所求的经验回归方程为y=则b==55950-10×a=y-bx=91.7-0.668×55即所求的经验回归方程为y=0.668x+54.96.(3)当x=110时,y的估计值y=0.668×110+54.96=128.44.因此,估计加工110个零件所用的时间为128.44min.(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图.(2)求经验回归方程,注意运算的正确性.(3)根据经验回归方程进行预测估计:估计值不是实际值,两者会有一定的误差.[跟进训练]3.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得如表数据:x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程y=(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.参考公式:b=,a=y-bx.[解](1)散点图如图所示.(2)x=6+8+10+124=9,y=2+3+5+64=iib=158-4×a=y-bx=4-0.7×9故经验回归方程为y=0.7x-2.3.(3)由(2)中经验回归方程可知,当x=9时,y=0.7×9-2.3=4,即预测记忆力为9的同学的判断力为4.1.某样本点(xi,yi)(i=1,2,…,n)的经验回归方程为y=0.5x+0.7,当x=8时,y的实际值为4.5,则当x=8时,预测值与实际值的差值为()A.0.1B.0.2C.0.3D.0.4B[当x=8时,y的预测值y=4.7,4.7-4.5=0.2.故选B.]2.对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i=1,2,3,…,8),其经验回归方程为y=16x+a,且x1+x2+x3+…+x8=6,y1+y2+y3+…+y8=9,则a的值为(A.-2 B.2C.-1 D.1D[x=68=34,y=98,由于经验回归直线方程过样本中心点,将343.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的经验回归方程:y=0.254x+0.321.由经验回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.0.254[由于y=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.]4.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为y=bx+1,则b=________.0.8[由题图知x=0+1+3+44=2,y=0.9+1.9+3.2+4.44=2.6,将(2,2.6)代入y=bx回顾本节知识,自主完成以下问题:1.经验回归直线一定过哪个点?提示:经验回归直线一定过样本中心点(x,y2.y与x正、负相关的充要条件各是什么?提示:y与x正相关的充要条件是b>0,y与x负相关的充要条件是b<0.3.b的实际意义是什么?提示:当x增大一个单位时,y增大b个单位.“回归”一词的由来统计学中的“回归”一词,是统计学家高尔顿引入的.早在19世纪80年代,高尔顿就开始了亲代与子代(即父母亲与子女)之间相似特征(身高、性格等)的研究.他收集了一些亲代的身高x与子代的身高y的成对数据,并作出了散点图,发现y与x的关系可以借助一次函数来近似表示,而且总体上亲代的身高增加时,子代的身高也增加.但是,高尔顿在研究过程中,发现了一个有趣的现象.他收集的数据显示,总体上亲代的平均身高为68英寸(约为172.72cm),子代的平均身高为69英寸,子代的平均身高比亲代的平均身高大1英寸(约为2.54cm).于是,一个自然的推想是:平均身高为63英寸的亲代,其子代的平均身高应约为64英寸;平均身高为72英寸的亲代,其子代的平均身高应约为73英寸.但实际数据显示:平均身高为63英寸的亲代,其子代的平均身高为67英寸,增加量为4英寸;平均身高为72英寸的亲代,其子代的平均身高为71英寸,增加量为-1英寸.也就是说,平均身高不同的亲代,其子代的平均身高增加量并不相等,但子代的平均身高有回归于中心(即总体平均值)的趋势.正是由于这种现象的存在,高尔顿引入了“回归”一词.虽然不是所有相关关系中都会发生类似的现象,但从那以后,“回归”就成了相关关系讨论中一个约定俗成的词了.课时分层作业(二十)一元线性回归模型及参数的最小二乘估计一、选择题1.对于经验回归方程y=bx+a(b>0),下列说法错误的是()A.当x增加一个单位时,y的值平均增加b个单位B.点(x,y)一定在y=bx+C.当x=t时,一定有y=bt+aD.当x=t时,y的值近似为bt+aC[经验回归方程是一个模拟函数,它表示的是一系列离散的点大致所在直线的位置及其大致变化规律,故有些散点不一定在经验回归直线上.]2.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得经验回归方程可能为()A.y=0.4x+2.3B.y=2x-2.4C.y=-2x+9.5D.y=-0.3x+4.4A[由x与y正相关,排除选项C,D.将x=3,y=3.5代入选项A,B3.根据如下成对样本数据得到的经验回归方程为y=bx+a,则()x345678y4.02.5-0.50.5-2.0-3.0A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<0B[画出散点图,知a>0,b<0.]4.(多选)数据(x,y)的5组测量值(xi,yi)(i=1,2,3,4,5),已知i=1若y对x的经验回归方程记作y=bx+a,则()A.b=1.2B.a=0.2C.y与x正相关D.x=8时,y的估计值为7ABCb==112-5×4a=y-bx=5-1.2×4=0.2,所以经验回归方程为y=1.2x+0.2.因为b=1.2>0,所以y与x5.(多选)中国女排的影响力早已超越体育本身的意义,不仅是时代的集体记忆,更是激励国人持续奋斗、自强不息的精神符号.以下是某届世界杯比赛最终结果的相关数据,记前6名球队中,每个队的胜场数为变量x,积分为变量y(只列出了前6名).排名123456胜场数x11108766积分y322823211918若y与x之间具有线性相关关系,根据表中数据可求得y关于x的经验回归方程为y=2.59x+a,则下列说法正确的有()A.a的值为2.78B.a的值为2.14C.若整队在此次比赛中获胜的场数是4,根据经验回归方程其得分约为13分D.由经验回归方程可知,当某个队伍胜场增加1场时,其积分约增加2.59分ACD[由题意知,x=8,代入经验回归方程y=2.59x故A正确,B不正确;将x=4代入经验回归方程y=2.59x+2.78,得y=13.14≈13,故C正确;经验回归方程中x的系数是2.59,故D正确.]二、填空题6.若根据5名儿童的年龄x(单位:岁)和体重y(单位:kg)的数据用最小二乘法得到用年龄预报体重的经验回归方程是y=2x+18,已知这5名儿童的年龄分别是3,5,2,6,4,则这5名儿童的平均体重是________kg.26[由题意:x=3+5+2+6+45=4,由于经验回归方程过样本的中心点(x,y),所以y=27.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知x=20,由最小二乘法求得经验回归方程为y=0.6x+48,则y1+y2+y3+y4+y5=________.300[∵经验回归直线过点(x,y∴将x=20代入经验回归方程得∴y1+y2+y3+y4+y5=5y=300.]8.某产品的广告费用x(单位:万元)与销售额y(单位:万元)的统计数据如表:广告费用x/万元3456销售额y/万元25304045根据上表可得经验回归方程y=bx+a中的b为7,据此模型,若广告费用为10万元,则预计销售额为________万元.73.5[由题意得x=3+4+5+64=4.5,y=25+30+40+454=∵经验回归方程y=bx∴35=7×4.5+a,解得a=3.5,∴y=7x+3.5.∴当x=10时,y=7×10+3.5=73.5(万元).]三、解答题9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.68.89销量y/件908483807568(1)求经验回归方程y=bx+a,其中b=-20;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解](1)由于x=16×(8+8.2+8.4+8.6+8.8+9)=8.5y=16×(90+84+83+80+75+68)=80所以a=y-bx=80+20×8.5=250,从而经验回归方程为y=-(2)设工厂获得的利润为L元,依题意得L=x·(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.故当单价定为8.25元时,工厂可获得最大利润.10.若某地财政收入x与支出Y满足一元线性回归模型Y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.9亿元 B.9.5亿元C.10亿元 D.10.5亿元D[因为财政收入x与支出Y满足一元线性回归模型Y=bx+a+e,其中b=0.7,a=3,所以Y=0.7x+3+e.当x=10时,得Y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤Y≤10.5,所以年支出预计不会超过10.5亿元.]11.(多选)湖北潜江素有“中国小龙虾之乡”之称,是我国小龙虾的主要产区.已知某种饲料的投放量x(单位:吨)与小龙虾的产量y(单位:吨)的统计数据如表:投放量x/吨23456产量y/吨3142526473由表中的数据,得到经验回归方程为y=10.6x+a,则下列结论正确的是()A.a=9B.产量y与投放量x正相关C.经验回归直线y=10.6x+a过点(4,52.4)D.当x=8时,小龙虾产量的预测值是93.8BC[由表可知,投放量x的均值x=2+3+4+5+65=4小龙虾的产量y的均值y=31+42+52+64+735=52.4所以经验回归直线恒过定点(4,52.4),故选项C正确;代入经验回归方程y=10.6x+a经验回归方程为y=10.6x+10,故选项B正确;当x=8时,y=10.6×8+10=94.8,故选项D错误.]12.某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨)的几组对应数据如表,现发现表中有个数据看不清,已知经验回归方程为y=6.3x+6.8,下列说法正确的是()x23456y1925★4044A.看不清的数据★的值为33B.回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨C.据此模型预测产量为8吨时,相应的生产能耗为50.9吨D.经验回归直线y=6.3x+6.8恰好经过点(4,★)D[对于A,因为x=2+3+4+5+65=4将x=4代入y=6.3x+6.8,故y=6.3×4+6.8=32,∴★=32×5-(19+25+40+44)=32,故A错误;对于B,回归系数6.3的含义是产量每增加1吨,相应的生产能耗大约增加6.3吨,故B错误;对于C,当x=8时,y=6.3×8+6.8=57.2,故C错误;对于D,因为x=4,y=32,故y=6.3x+6.8必经过点(4,32)13.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用经验回归分析的方法,预测小李该月6号打6小时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专用版全新幼儿园承包协议模板下载版A版
- 2024铁矿石销售合同中的环境保护附加条款规范3篇
- 2025年度厂房建设施工后期维护合同范本4篇
- 二手服务器租赁服务详细合同2024年版一
- 二零二五年度生态修复工程出渣承包服务协议3篇
- 2024遗产房产继承转让合同
- 2025年度拆除工程竣工验收合同样本下载4篇
- 2024年能源管理服务协议
- 二零二四年城市绿化带设施维护劳务分包服务协议3篇
- 二零二五版地磅租赁与物流配送一体化服务协议
- 钉钉OA办公系统操作流程培训
- 新生儿科年度护理质控总结
- GB/T 15934-2024电器附件电线组件和互连电线组件
- 《工贸企业有限空间作业安全规定》知识培训
- 高层次人才座谈会发言稿
- 垃圾清运公司管理制度(人员、车辆、质量监督、会计管理制度)
- 《建筑工程设计文件编制深度规定》(2022年版)
- 营销人员薪酬考核方案
- 2024至2030年中国it外包服务行业市场深度分析及发展趋势预测报告
- 工程项目计价结算付款情况统计表
- GB/T 20554-2024海带
评论
0/150
提交评论