新教材人教a版选择性必修第三册8.2.1-8.2.2一元线性回归模型一元线性回归模型参数的最小二乘估计学案_第1页
新教材人教a版选择性必修第三册8.2.1-8.2.2一元线性回归模型一元线性回归模型参数的最小二乘估计学案_第2页
新教材人教a版选择性必修第三册8.2.1-8.2.2一元线性回归模型一元线性回归模型参数的最小二乘估计学案_第3页
新教材人教a版选择性必修第三册8.2.1-8.2.2一元线性回归模型一元线性回归模型参数的最小二乘估计学案_第4页
新教材人教a版选择性必修第三册8.2.1-8.2.2一元线性回归模型一元线性回归模型参数的最小二乘估计学案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2一元线性回归模型参数的最小二乘估计核心知识目标核心素养目标1.经历用不同估算方法描述两个变量线性相关的过程.2.知道最小二乘法的思想,能根据给出的经验回归方程系数公式建立经验回归方程.1.通过对线性回归的分析,培养数据分析的素养.2.借助回归模型的建立,培养数学建模、数据分析及数学运算的素养.Y=bx+a+e,E(a和b为模型的未知参数,a称为截距参数,b称为斜率参数.e是Y与bx+a之间的随机误差.y^=b^x+a^称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.求经验回归方程的方法叫做最小二乘法,求得的b公式:b^=∑i=1n(xi-x对于响应变量Y,通过观测得到的数据称为观测值.通过经验回归方程得到的y^称为预测值,观测值减去预测值称为残差2(1)残差平方和为∑i=1n(yi-y(2)决定系数R2=1-∑i=1n(y1.在两个变量Y与x的回归模型中,分别选择了4个不同的模型,它们的决定系数R2如下,其中拟合效果最好的模型是(A)(A)模型1的决定系数R2(B)模型2的决定系数R2(C)模型3的决定系数R2(D)模型4的决定系数R2解析:R2越大,拟合效果越好.故选A.2.(2020·广东深中、华附、省实、广雅四校联考)如图是一组成对样本数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为y^=b^x+1,则b^解析:由题图知x=0+1+3+44=2,y=0将(2,2.6)代入y^=b^x+1中,解得答案:3.已知x,Y的取值如表所示,由散点图分析可知Y与x线性相关,且经验回归方程为y=0.95x+2.6,那么表格中的数据m的值为.

x0134Ym解析:x=0+1+3+44=2,y=2.2+4把(x,y)代入经验回归方程得11.3+解得m=6.7.答案:求经验回归方程[例1]某5G科技公司对2020年1月份至6月份某款5G产品的销售量及销售单价进行了调查,销售单价x和销售量Y之间的一组成对样本数据如表所示:月份123456月销售单价x/百元98月销售量Y/万件687580838490(1)由散点图可知变量x,Y具有线性相关关系,根据1至6月份的数据,求出Y关于x的经验回归方程;(2)预计在今后的销售中,月销售量与月销售单价仍然服从(1)中的关系,若该种产品的成本是350元/件,那么该产品的月销售单价应定为多少元才能获得最大月利润?(注:利润=销售收入-成本)参考公式和数据:∑i=16(xi-x)(yi-y)=-14,y^=b^x+a^,其中b^=∑解:(1)根据表中数据,可得x=16×y=16×∑i=16(xi-x)2=(9-8.5)2+(8.8-8.5)2+(8.6-8.5)2+(8.4-8.5)2+(8.2-8.5)2因为∑i=16(xi-x)(yi所以b^=∑i=1a^=y-b^x所以Y关于x的经验回归方程为y^(2)设该产品的月销售单价为x百元,月利润为z百万元,则由z=(x-3.5)y^,得z=(x-3.5)(250-20x)=-20x2所以当x=8时,zmax=405百万元,所以月销售单价应定为800元,才能获得最大月利润.解决回归分析问题的一般步骤(1)画散点图.根据已知成对样本数据画出散点图.(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求线性回归参数,然后写出经验回归方程.(3)实际应用.依据求得的经验回归方程解决问题.变式训练1:(2021·湖北武汉高二期末)某地随着经济的发展,居民收入逐年增长,下表是该地某银行连续五年的储蓄存款额(年底余额),如表1:年份x20112012201320142015储蓄存款Y/千亿元567810为了研究和计算的方便,工作人员将表1的数据进行了处理,t=x-2010,z=Y-5得到表2:时间代号t12345z01235(1)求z关于t的经验回归方程;(2)用所求经验回归方程预测到2021年年底该地储蓄存款额可达多少.(附:对于经验回归方程y^=b^x+a^,其中b^=∑i=1n解:(1)t=3,z=2.2,∑i=15tizib^=45a^=z-b^所以z^(2)t=x-2010,z=Y-5,代入z^得到y^即y^所以y^×所以预测到2021年年底,该地储蓄存款额可达16.8千亿元.求非线性经验回归方程[例2](2020·山东聊城二模)公民依法诚信纳税是义务,更是责任,现将自2016年至2020年的个人所得税收入统计如表:年份20162017201820192020时间代号x12345个税收入Y/千亿元并制作了时间代号x与个人所得税收入Y的散点图如图.根据散点图判断,可用①y^=menx与②y^=p^x2xyzw∑i=15(xi-∑i=15(wi-31110374∑i=15(xi-x)(zi∑i=15(wi-w)(yi表中z=lny,w=x2,z=15∑i(1)根据所给数据,分别求出①②中Y关于x的经验回归方程;(2)已知2021年个人所得税收入为13.87千亿元,用2021年的数据验证(1)中所得两个经验回归方程,哪个更适宜作为Y关于时间代号x的经验回归方程?(3)你还能从统计学哪些角度来进一步确认哪个经验回归方程更适宜?(只需叙述,不必计算)附:对于一组成对样本数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线v^=a^+β^u的斜率和截距的最小二乘估计分别为β^=∑i=1n解:(1)由y^=menx,得lny^=n^设z^=lny^,lnm^则由表中数据可得n^=∑i=1r^=z-n^x×3=1.68,即lnm^=r^,所以建立z关于x的经验回归方程为z^=1.68+0.16x,所以y^由y^=p^x2+q^由表中数据可得p^=∑i=1q^=y-p^w×(2)2021年对应的时间代号为6,当x=6时,由y^由y^2而当x=6时,实际个人所得税收入为13.87千亿元,故y^(3)从统计学角度分析,这里是由5组数据建立回归方程,数据较少,故应增加数据建立方程,再用残差及决定系数R2来检验拟合效果.非线性经验回归问题的解题步骤(1)根据原始数据作出散点图.(2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性经验回归方程求解.(4)在上面的基础上通过相应的变换,即可得非线性经验回归方程.变式训练2:(2020·山东淄博模拟)某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量x(单位:亿元)对年销售额Y(单位:亿元)的影响.该公司对历史数据进行对比分析,建立了两个函数模型:①y^=α^+β^x2,②y^现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i=1,2,…,12,并对这些成对样本数据作了初步处理,得到了散点图及一些统计量的值.令ui=xi2,vi=lnyxy∑i=112(xi-∑i=112(yi-uv2066770200460∑i=112(ui-∑i=112(ui-(yi-y)∑i=112(vi-∑i=112(xi-(vi-v)31250002150014(1)设{ui}和{yi}的样本相关系数为r1,{xi}和{vi}的样本相关系数为r2,请从样本相关系数的角度,选择一个拟合程度更好的模型;(2)(i)根据(1)的选择及表中数据,建立Y关于x的经验回归方程(系数精确到0.01);(ii)若下一年销售额需达到90亿元,预测下一年的研发资金投入量x是多少亿元.附:①样本相关系数r=∑i经验回归直线y^=a^+b^x中斜率和截距的最小二乘估计公式分别为b^=∑i=1n②参考数据:308=4×77,90≈9.4868,e4.4998≈90.解:(1)由题意,r1=∑i=112(ui-r2=∑i=112(xi-则|r1|<|r2|,因此从样本相关系数的角度,模型y^=e(2)(i)先建立v关于x的经验回归方程,由y^=eλx+t,得lny^=t^+λ由于λ^=∑i=1t^=v-λ^所以v关于x的经验回归方程为v^所以lny^=0.02x+3.84,则y^(ii)下一年销售额需达到90亿元,即y^代入y^=e,得90=e又e4.4998≈90,所以4.4998≈0.02x+3.84,所以x≈4.所以预测下一年的研发资金投入量约是32.99亿元.线性回归分析[例3]假定小麦基本苗数x与成熟期有效穗Y之间存在相关关系,今测得5组成对样本数据如表:xY(1)以x为解释变量,Y为响应变量,作出散点图;(2)求Y与x之间的经验回归方程,对于基本苗数56.7,估计成熟期有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几.(参考数据:∑i=15xi2=5101.56,∑i解:(1)成对样本数据的散点图如图.(2)由(1)中散点图看出,成对样本数据点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用经验回归方程刻画它们之间的关系.设经验回归方程为y^=b^x+a^,x∑i=15x·y=1320.66,x2∑i=15xi则b^=∑i=15xiy故所求的经验回归方程为y^当x=56.7时,y^×估计成熟期有效穗为51.143.(3)由于y^i=b^xi+a^,可以算得e^i=yi-y^i分别为e^1=0.35,(4)∑i=15(yi-y)2=50.18,故R2线性回归问题应先通过成对样本数据的散点图来分析两变量间的关系是否线性相关,然后再利用求经验回归方程的公式求解经验回归方程,并利用残差图或R2来分析函数模型的拟合效果,在此基础上,借助经验回归方程对实际问题进行分析.变式训练3:关于x与Y有如表数据:x24568Y3040605070有如下的两个线性经验回归方程:(1)y^=6.5x+17.5;(2)y解:由(1)可得yi-y^i与yi-yi-y10yi-y-20-1010020所以∑i=15(yi-y^i)2=(-0.5)2+(-3.5)2+10∑i=15(yi-y)2=(-20)2+(-10)2+102+02所以R12=1-∑i由(2)可得yi-y^i与yi-yi-y-1-58-9-3yi-y-20-1010020所以∑i=15(yi-y^i)2=(-1)2+(-5)2+82∑i=15(yi-y)2=(-20)2+(-10)2+102+02所以R22=1-∑i由于R12=0.845,所以R12>所以模型(1)的拟合效果好于模型(2)的拟合效果.1.已知x与Y之间的一组成对样本数据:x01234Y13579则Y与x的经验回归直线y^=b^x+(A)(1,2) (B)(5,2)(C)(2,5) (D)(2.5,5)解析:经验回归直线一定过点(x,y).由x=0+1+2+3+45=2,y=1+3+5+7+9故必过点(2,5).故选C.2.(多选题)下列说法正确的是(ABC)(A)有相关关系的两个变量不是因果关系(B)散点图能直接反映数据的相关程度(C)经验回归直线最能代表线性相关的两个变量之间的关系(D)任意一组成对样本数据都有经验回归方程解析:并不是每一组成对样本数据都有经验回归方程,故D不正确,其余均正确.故选ABC.3.已知x,Y之间的一组数据如表所示:x0124Ya7Y关于x的经验回归方程是y^=3.2x+0.8,则a等于解析:由表中数据,计算得x=14×(0+1+2+4)=7y=14×(a+3.9+7+14.1)=a代入经验回归方程y^=3.2x+0.8中,得a+254答案:4.若一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为.

解析:因为ei恒为0,所以成对样本数据点(x1,y1),(x2,y2),…,(xn,yn)均落在直线y=bx+a上,所以变量x,Y成函数关系,即R2=1.答案:1[例题](多选题)19世纪中期,英国著名的统计学家弗朗西斯·高尔顿搜集了1078对夫妇及其儿子的身高数据,发现这些成对样本数据的散点图大致呈直线状态,即儿子的身高Y(单位:cm)与父母平均身高x(单位:cm)具有线性相关关系,通过成对样本数据(xi,yi)(i=1,2,…,n),求得经验回归方程y^(A)经验回归直线至少过(x1,y1),(x2,y2),…,(xn,yn)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论