版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.9线性回归分析课标要求精细考点素养达成1.了解相关关系的统计含义,会作两个相关关系的数据散点图;会利用散点图认识两个变量间的相关关系,解样本相关系数与标准化数据向量夹角的关系,会用公式求相关系数相关关系的判断通过计算相关系数,求回归方程,提升学生的数学运算素养线性回归方程及回归分析2.了解最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;针对实际问题,会用一元线性回归模型进行预测线性回归与概率等知识综合通过学习线性回归方程和概率等知识相结合的问题,培养学生数学建模的核心素养1.(概念辨析)(多选)判断下面结论正确的是().A.相关关系与函数关系都是一种确定性的关系,也是一种因果关系B.“名师出高徒”可以解释为教师的教学水平与学生水平成正相关关系C.线性回归方程对应的直线y^=b^x+a^至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yD.在回归分析中,r=0.98的模型比r=0.81的模型拟合的效果更好答案BD2.(对接教材)下列四个散点图中,变量x与y之间具有负的线性相关关系的是().A B C D答案D3.(对接教材)某小吃店的日盈利y与当天气温x之间有如下数据:x21012y54221则y对x的线性回归直线方程为().A.y^=1.2x+2.6B.y^=x+2.8C.y^=x+3D.y^=0.7答案B解析因为x=0,y=2.8,所以线性回归直线方程为y^=x+2.84.(易错自纠)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程为y^=0.67x+54.9零件数x/个1020304050加工时间y/min62■758189现发现表中有一个数据模糊看不清,则该数据为.
答案68解析设表中那个模糊看不清的数据为m.由表中数据得x=30,y=m+3075,所以样本点的中心为30,m+3075.因为样本点的中心在回归直线上,所以m+3075=0.67×30+545.(真题演练)(2023·新高考天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,则下列说法正确的是().A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245答案C解析根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;由于r=0.8245是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.8245,D选项错误.相关关系的判断典例1(1)有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系.其中具有相关关系的是().A.①②③ B.①②C.②③ D.①③④答案D解析根据变量间相关关系的含义可知,①③④中两个变量具有相关关系;而对于②,曲线上的点定了,该点的坐标也就随之确定,这两个变量间的关系为确定性关系.(2)对四组变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数.①n=7,r=0.9545;②n=15,r=0.3812;③n=17,r=0.4985;④n=8,r=0.9870.则变量y与x具有线性相关关系的是.
答案①④解析相关系数r的绝对值越大,线性相关程度越高.(3)x和y的散点图如图所示,若用y=c1ec2x拟合时的决定系数为R12,用y^=b^x+a^拟合时的决定系数为R答案R解析由题图知,用y=c1ec2x拟合的效果比y^=b^x+a^拟合的效果要好,所以R判断相关关系的两种方法:(1)散点图法,如果所有的样本点都落在某一函数的曲线附近,那么变量之间就有相关关系;如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r|越趋近于1,线性相关性越强.训练1(1)如图,去掉D(3,10)后,下列说法错误的是().A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与响应变量y的相关性变强答案B(2)(多选)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到线性回归方程y^=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y^=b2x+a2,相关系数为r2.则(A.r1=r2 B.r1<r2C.r1>r2 D.r1,r2∈(1,0)答案CD解析由散点图可知这两个变量为负相关,所以r1,r2<0.因为剔除点(10,21)后,剩下点的数据更具有线性相关性,|r2|更接近1,所以1<r2<r1<0.线性回归方程及回归分析典例2某中学学生会为了激发学生们对中国古典文学的爱好,提升古典文学素养,在暑假开学返校后的第一个月组织了一个古典文学研究协会,在接下来的四个月内,该协会的会员人数如下表:月份x第一个月第二个月第三个月第四个月第五个月会员人数y912172127(1)求会员人数与时间变量(记第一个月为x=1,第二个月为x=2,…,以此类推)的线性回归方程;(∑i=15xiyi=303,∑(2)根据(1)中所求的线性回归方程,预测12个月后,会员人数能否突破60人.参考公式:回归方程y^=b^x+a^中斜率和截距的最小二乘估计公式分别为b^=∑i=1nx解析(1)由题意可得,x=15(1+2+3+4+5)=3,y=15(9+12+17+21+27)=17.因为∑i=15xiyi=303,∑i=15xi2=55,所以b^=∑i=15xiyi-5xy∑i=15xi2-5x2=303−5×3×17.255−5×32=4.(2)根据(1)中所求的线性回归方程,将x=12代入该回归方程中,得y=4.5×12+3.7=57.7<60,即预测12个月后,会员人数不能突破60人.求线性回归方程时的注意点(1)正确理解计算r,b^的公式和准确的计算是求线性回归方程的关键(2)回归直线方程y^=b^x+a^必过样本点的中心点(x,y(3)在分析两个变量之间的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.训练2造林绿化对生态发展特别是在防风固沙、缓解温室效应、净化空气、涵养水源等方面有着重要意义.某苗木培养基地为了对某种树苗的高度偏差x(单位:cm)与树干最大直径偏差y(单位:mm)之间的关系进行分析,随机挑选了8株该品种的树苗,得到它们的偏差数据(偏差是指个别测定值与测定的平均值之差)如下表:树苗序号12345678高度偏差x2015133251018直径偏差y6.53.53.51.50.50.52.53.5(1)若x与y之间具有线性相关关系,求y关于x的线性回归方程;(2)若这种树苗的平均高度为120cm,树干最大直径平均为31.5mm,试由(1)的结论预测高度为128cm的这种树苗的树干最大直径为多少毫米.参考数据:∑i=18xiyi=324,∑i=18参考公式:回归直线方程y^=a^+b^x中斜率和截距的最小二乘估计为b^=∑i=1解析(1)x=18×[20+15+13+3+2+(5)+(10)+(18)]=5y=18×[6.5+3.5+3.5+1.5+0.5+(0.5)+(2.5)+(3.5)]=9b^=∑i=1nxiyi-nxy∑i=1nxi故y关于x的线性回归方程为y^=14x+(2)当树干高度为128cm时,高度偏差x=128120=8(cm),y^=14×8+12=2.5所以树干直径约为2.5+31.5=34(mm),即预测高度为128cm的这种树苗的树干最大直径为34毫米.非线性回归问题1.建立非线性回归模型的基本步骤:①确定研究对象,明确哪个是解释变量,哪个是预报变量;②画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);③由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、指数函数、对数函数模型等);④通过换元,将非线性回归方程模型转化为线性回归方程模型;⑤按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;⑥消去新元,得到非线性回归方程;⑦得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否合适等.2.常见的非线性回归方程的转化:曲线方程变换公式变换后的线性关系式y=axbc=lna,v=lnx,u=lnyu=c+bvy=aebxc=lna,u=lnyu=c+bxy=aec=lna,v=1x,u=lnu=c+bvy=a+blnxv=lnxy=a+bv典例1(幂函数型)某新能源汽车公司从2019年到2023年汽车年销售量y(单位:万辆)的散点图如下:记年份代码为x(x=1,2,3,4,5).(1)根据散点图判断,模型①y=a+bx与模型②y=c+dx2,哪一个更适宜作为年销售量y关于年份代码x的回归方程?(给出判断即可,不必说明理由)(2)根据(1)的判断结果,建立y关于x的回归方程.(3)预测2024年该公司新能源汽车销售量.参考数据:y∑∑∑i=15x∑i=134559796572805参考公式:回归方程y^=a^+b^x中斜率和截距的最小二乘估计公式分别为b^=∑i=1n(解析(1)由散点图可知:散点图与一次函数偏差较大,与二次函数较接近,故模型②y=c+dx2更适合.(2)令t=x2,则∑i=15ti2=∑i=15xi4=979,∑i=15tiyi=∑i=15xi2y对于回归方程y^=c^+d可得d^=∑i=15tiyi-5t·y∑i=15ti2-5t2=2805−5×11×34979−5×11故回归方程为y^=6.5+2.5t,即y^=6.5+2.5x(3)由(2)可得y^=6.5+2.5x2令x=6,则y^=6.5+2.5×62=96.5预测2024年该公司新能源汽车销售量为96.5万辆.典例2(指数函数型)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2019年至2023年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型y=c1ec2x(其中e为自然对数的底数)拟合,设z=lny年份2019年2020年2021年2022年2023年年份代码x12345云计算市场规模y/千万元7.4112036.654.6z=lny22.433.64由上表可得经验回归方程z=0.52x+a^,则2026年该科技公司云计算市场规模y的估计值为()A.e5.08 B.e5.6C.e6.12 D.e6.5答案B解析因为x=3,z=3,所以a=z0.52x=33×0.52=1.44,即经验回归方程z=0.52x+1.44,当x=8时,z=0.52×8+1.44=5.6,所以y=ez=e5.6,即2026年该科技公司云计算市场规模y的估计值为e5.6.训练(对数函数型)某剧场的座位数量是固定的,管理人员统计了最近在该剧场举办的五场表演的票价xi(单位:元)和上座率yi(上座人数与总座位数的比值)的数据,其中i=1,2,3,4,5,并根据统计数据得到如下的散点图.(1)由散点图判断y=bx+a与y=clnx+d哪个模型能更好地对y与x的关系进行拟合(给出判断即可,不必说明理由),并根据你的判断结果求回归方程;(2)根据(1)所求的回归方程,预测票价为多少时,剧场的门票收入最多.参考数据:x=240,y=0.5,∑i=15xi2=365000,∑i=15xiyi=457.5;设zi=lnxi,则∑i=15zi≈27,∑i=15zi2≈147.4,∑i=15ziyi≈12.7;e参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=α^+β^u的斜率和截距的最小二乘估计分别为β^=α^=vβ^解析(1)y=clnx+d能更好地对y与x的关系进行拟合.设z=lnx,先求y关于z的线性回归方程.由已知得z=15∑i=15zi≈27所以c^=∑i=15ziyi-5zy∑d^=yc^z=0.5(0.5)×5.4=3所以y关于z的线性回归方程为y=0.5z+3.2,所以y关于x的回归方程为y=0.5lnx+3.2.(2)设该剧场的总座位数为M,由题意得门票收入为M(0.5xlnx+3.2x),设函数f(x)=0.5xlnx+3.2x,则f'(x)=0.5lnx+2.7,当f'(x)<0,即x>e5.4时,函数单调递减;当f'(x)>0,即0<x<e5.4时,函数单调递增,所以f(x)在x=e5.4≈220处取最大值,所以预测票价为220元时,剧场的门票收入最多.一、单选题1.在变量y与x的回归模型中,根据下面四个的相关系数|r|,判断拟合效果最好的是().A.模型1的相关系数|r|为0.2 B.模型2的相关系数|r|为0.3C.模型3的相关系数|r|为0.9 D.模型4的相关系数|r|为0.8答案C2.若某地财政收入x与支出y满足一元线性回归模型y^i=b^xi+a^+εi(单位:亿元,i=1,2,…),其中b^=0.8,a^=2,|εi|<0.5,如果今年该地区财政收入有10亿元A.10亿元 B.9亿元C.10.5亿元 D.9.5亿元答案C解析y^=0.8×10+2+εi=10+εi,因为|εi|<0.5,所以9.5<y^<10.5.故选3.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得线性回归方程可能为().A.y^=0.4x+2.3 B.y^=2x2.4C.y^=2x+9.5 D.y^=0.3答案A解析因为变量x和y正相关,所以回归直线的斜率为正,排除C,D;将点(3,3.5)代入选项A和B的方程中检验,排除B.4.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元23456销售额y/万元1925343844根据上表可得经验回归方程为y^=6.3x+a^,则下列说法正确的是(A.经验回归直线y^=6.3x+a^必经过样本点(2,19),(6,B.这组数据的样本点的中心(x,y)未必在经验回归直线y^=6.3x+aC.回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元D.据此模型预报广告费用为7万元时销售额为50.9万元答案D解析由表格中的数据可得x=2+3+4+5+65=4,y=19+25+34+38+445=32,将点(x,y)代入经验回归方程得6.3×4+a^=32,解得a^=6.8,所以经验回归方程为y^=6.3对于A选项,当x=2时,y^=6.3×2+6.8=19.4,A选项错误对于B选项,这组数据的样本点的中心(x,y)必在经验回归直线y^=6.3x+a^上,B对于C选项,回归系数6.3的含义是广告费用每增加1万元,销售额约增加6.3万元,C选项错误;对于D选项,当x=7时,y^=6.3×7+6.8=50.9,所以据此模型预报广告费用为7万元时销售额为50.9万元,D选项正确二、多选题5.关于相关系数r,下面说法正确的是().A.r∈[1,1]B.若r=0,则两个变量线性不相关C.若r<0,则一个变量增加,另一个变量有减少的趋势D.相关系数0<r<1,表示变量x,y之间具有负相关关系答案ABC解析r∈[1,1],故A正确;若r=0,则两个变量线性不相关,故B正确;若r<0,则一个变量增加,另一个变量有减少的趋势,C正确;相关系数0<r<1,表示变量x,y之间具有正相关关系,所以D不正确.6.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2015年到2023年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2015年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是().A.销售额y与年份序号x呈正相关关系B.销售额y与年份序号x线性相关不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2024年“年货节”期间的销售额约为8454亿元答案AC解析根据图象可知,散点从左下到右上分布,销售额y与年份序号x呈正相关关系,故A正确;因为0.936>0.75,靠近1,销售额y与年份序号x线性相关显著,故B错误;根据三次函数回归曲线的相关指数0.999>0.936,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,故C正确;由三次多项式函数y=0.168x3+28.141x229.027x+6.889,当x=10时,y≈2698.719亿元,故D错误.三、填空题7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn互不相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=2x+100上,则这组数据的相关系数为.
答案1解析由题意,因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=2x+100上,所以这组数据完全负相关,即相关系数为1.8.随机变量x与y的数据如下表所示,其中少了一个数值,已知y关于x的线性回归方程为y^=0.9x+3,则缺少的数值为.x23456y56▲79答案6解析设缺少的数值为m,由于回归直线y^=0.9x+3过样本中心点(x,y),且x=2+3+4+5+65=4,代入,得y=0.9×4+3=6.6,所以y=5+6+7+9+m5=6.6,四、解答题9.某公司在市场调查中,发现某产品的单位定价x(单位:万元/吨)对月销售量y(单位:吨)有影响.对不同定价xi和月销售量yi(i=1,2,…,8)数据作了初步处理,得到相关统计量的值如下表:xyz∑∑∑i=18xi∑i=18zi0.244390.164820683956表中z=1x.经过分析发现可以用y=a+bx来拟合y与x(1)求y关于x的回归方程;(2)若生产1吨产品的成本为1.6万元,则预计价格定为多少时,该产品的月利润取得最大值,求此时的月利润.参考公式:b^=∑i=1nxiyi-解析(1)令z=1x,则y^=a^+因为b^=∑i=18za^=yb^z=所以y^=2+5z所以y关于x的回归方程为y^=2+5(2)月利润T=y(x1.6)=5x-2(x1.6)=8.22x+8x≤8.22当且仅当2x=8x,即x=2时取等号所以预计价格定为2万元/吨时,该产品的月利润取得最大值,最大值为0.2万元.10.下图是某地2017年至2023年生活垃圾无害化处理量(单位:吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),并预测2025年此地生活垃圾无害化处理量.附:参考数据:∑i=17yi=9.32,∑i=17tiyi=40.17,∑i=17(yi-y)2=0.55,7≈2.646.参考公式:相关系数r=∑i=1n解析(1)由折线图中数据和附注中的参考数据得t=4,∑i=17(ti-t)∑i=17(tit)(yiy)=∑i=17tiyit∑i=17yi=40.17则r≈2.890.55×2×2.646≈0.99因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由y=9.327≈1.331
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 威海海洋职业学院《认知心理学基础》2023-2024学年第一学期期末试卷
- 冷链仓库储存合同范例
- 2025煤炭海上运输买卖合同范本
- 废弃油脂收购合同范例
- 瓷买卖合同范例
- 定金合同过户合同范例
- 广东建设工程勘察合同范例
- 经营资质合同范例
- 印刷费用合同范例
- 景观雕塑服务合同范例
- Unit 2 Different families(教学设计)-2024-2025学年人教PEP版英语三年级上册
- 西师大版五年级上册小数混合运算题100道及答案
- 2022年7月国家开放大学本科《中国法律史》期末纸质考试试题及答案
- 行政文秘笔试题
- 2024年部门年终工作总结参考(四篇)
- 主题四 第1课 节气与我们的生活(教学设计)教科版五年级下册综合实践活动
- 二年级数学上册口算天天练
- 肯耐珂萨题库
- 2024国家开放大学电大本科《液压气动技术》期末试题及答案
- 冷凝集素综合征治疗与护理研究进展
- 商务服务机器人技术现状与未来发展趋势研究
评论
0/150
提交评论