2025-高考科学复习解决方案-数学-基础版第二章第3节 第1课时 成对数据的统计分析含答案_第1页
2025-高考科学复习解决方案-数学-基础版第二章第3节 第1课时 成对数据的统计分析含答案_第2页
2025-高考科学复习解决方案-数学-基础版第二章第3节 第1课时 成对数据的统计分析含答案_第3页
2025-高考科学复习解决方案-数学-基础版第二章第3节 第1课时 成对数据的统计分析含答案_第4页
2025-高考科学复习解决方案-数学-基础版第二章第3节 第1课时 成对数据的统计分析含答案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025-高考科学复习解决方案-数学-基础版第二章第三节成对数据的统计分析第1课时变量间的相关关系及回归模型课标解读考向预测1.结合具体实例,了解一元线性回归模型的含义,了解模型中参数的统计意义,了解最小二乘原理,掌握一元线性回归模型中参数的最小二乘估计方法,会使用相关的统计软件.2.针对实际问题,会用一元线性回归模型进行预测.预计2025年高考,变量间的相关关系、回归模型主要以应用题的方式出现,需要在复杂的题目描述中找出数量关系,建立数学模型,并且运用数学模型解决实际问题,考查分析问题和处理数据的能力.必备知识——强基础1.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做eq\x(\s\up1(01))散点图.利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.(3)正相关和负相关①当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量eq\x(\s\up1(02))正相关.②负相关:当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量eq\x(\s\up1(03))负相关.(4)线性相关①一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在eq\x(\s\up1(04))一条直线附近,我们就称这两个变量线性相关.②一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:r=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up8(-))),\r(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up8(n),\s\do8(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up8(n),\s\do8(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)).(2)相关系数r的性质①当r>0时,称成对样本数据eq\x(\s\up1(05))正相关;当r<0时,称成对样本数据eq\x(\s\up1(06))负相关;当r=0时,成对样本数据间没有线性相关关系.②样本相关系数r的取值范围为eq\x(\s\up1(07))[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越eq\x(\s\up1(08))强;当|r|越接近0时,成对样本数据的线性相关程度越eq\x(\s\up1(09))弱.3.一元线性回归模型经验回归方程与最小二乘法我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估计,其中eq\b\lc\{(\a\vs4\al\co1(\o(b,\s\up8(^))=\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)=\x(\s\up1(10))\f(\o(∑,\s\up8(n),\s\do8(i=1))xiyi-n\o(x,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(n),\s\do8(i=1))xeq\o\al(2,i)-n\o(x,\s\up8(-))2),,\o(a,\s\up8(^))=\o(y,\s\up8(-))-\o(b,\s\up8(^))\o(x,\s\up8(-)).))4.残差与残差分析(1)残差:对于响应变量Y,通过观测得到的数据称为eq\x(\s\up1(11))观测值,通过经验回归方程得到的eq\o(y,\s\up8(^))称为eq\x(\s\up1(12))预测值,eq\x(\s\up1(13))观测值减去eq\x(\s\up1(14))预测值称为残差.(2)残差分析:残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(3)刻画回归效果的方式①残差图法作图时纵坐标为残差,横坐标为自变量x,这样作出的图形称为残差图.在残差图中,残差点比较均匀地分布在以取值为0的横轴为对称轴的水平的带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.②残差平方和法残差平方和为eq\o(∑,\s\up8(n),\s\do8(i=1))(yi-eq\o(y,\s\up8(^))i)2,残差平方和eq\x(\s\up1(15))越小,模型拟合效果越好.③利用决定系数R2刻画回归效果R2=1-eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(^))i)2,\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2),R2越eq\x(\s\up1(16))大,模型拟合效果越好;R2越eq\x(\s\up1(17))小,模型拟合效果越差.1.求解经验回归方程的关键是确定回归系数eq\o(a,\s\up8(^)),eq\o(b,\s\up8(^)),应充分利用回归直线过点(eq\o(x,\s\up8(-)),eq\o(y,\s\up8(-))).2.根据经验回归方程计算的eq\o(y,\s\up8(^))值,仅是一个预测值,不是真实发生的值.1.概念辨析(正确的打“√”,错误的打“×”)(1)经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^))中,若eq\o(a,\s\up8(^))<0,则变量x和y负相关.()(2)经验回归直线eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.()(4)残差平方和越大,线性回归模型的拟合效果越好.()答案(1)×(2)×(3)√(4)×2.小题热身(1)甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的R2分别如下表:甲乙丙丁R20.980.780.500.85建立的回归模型拟合效果最好的是()A.甲 B.乙C.丙 D.丁答案A解析R2越大,表示回归模型的拟合效果越好.(2)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中,最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+blnx答案D解析由散点图分布可知,散点图分布在一个对数型函数图象的附近,因此最适宜作为发芽率y和温度x的回归方程类型的是y=a+blnx.故选D.(3)(人教A选择性必修第三册复习参考题8T2改编)在一元线性回归模型Y=bx+a+e中,下列说法正确的是()A.Y=bx+a+e是一次函数B.响应变量Y是由解释变量x唯一确定的C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生答案C解析对于A,一元线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D,随机误差是不能避免的,只能将误差缩小,所以D错误.(4)若某商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表所示的对应数据:x24568y2040607080根据表中数据,利用最小二乘法求得y关于x的经验回归方程为eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+1.5,当广告费支出为10万元时,销售额的估计值为________万元.答案106.5解析eq\o(x,\s\up8(-))=eq\f(1,5)×(2+4+5+6+8)=5,eq\o(y,\s\up8(-))=eq\f(1,5)×(20+40+60+70+80)=54,所以样本中心为(5,54),将其代入经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+1.5中,有54=5eq\o(b,\s\up8(^))+1.5,解得eq\o(b,\s\up8(^))=10.5,所以经验回归方程为eq\o(y,\s\up8(^))=10.5x+1.5,当x=10时,eq\o(y,\s\up8(^))=10.5×10+1.5=106.5.考点探究——提素养考点一变量间相关关系的判断例1(1)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3答案A解析由散点图知图①与图③是正相关,故r1>0,r3>0,图②与图④是负相关,故r2<0,r4<0,且图①与图②的样本点集中在一条直线附近,因此r2<r4<0<r3<r1.(2)(2023·河北邢台阶段考试)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=-0.957,则()A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性答案C解析因为线性相关系数r1=0.837,r2=-0.957,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性.故选C.【通性通法】判断相关关系的方法(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)经验回归方程:当eq\o(b,\s\up8(^))>0时,正相关;当eq\o(b,\s\up8(^))<0时,负相关.【巩固迁移】1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.-eq\f(1,2) D.1答案A解析因为所有样本点都在直线y=-eq\f(1,2)x+1上,呈现完全负相关,所以样本相关系数为-1.2.(2023·天津高考)调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.8245,下列说法正确的是()A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245答案C解析因为相关系数r=0.8245>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以A,B错误,C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也可能会发生变化,所以D错误.故选C.考点二样本相关系数、决定系数的应用例2(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9并计算得eq\o(∑,\s\up8(10),\s\do8(i=1))xeq\o\al(2,i)=0.038,eq\o(∑,\s\up8(10),\s\do8(i=1))yeq\o\al(2,i)=1.6158,eq\o(∑,\s\up8(10),\s\do8(i=1))xiyi=0.2474.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数r=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\r(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)),eq\r(1.896)≈1.377.解(1)设这种树木平均一棵的根部横截面积为eq\o(x,\s\up8(-)),平均一棵的材积量为eq\o(y,\s\up8(-)),则eq\o(x,\s\up8(-))=eq\f(0.6,10)=0.06,eq\o(y,\s\up8(-))=eq\f(3.9,10)=0.39.(2)r=eq\f(\o(∑,\s\up8(10),\s\do8(i=1))xiyi-10\o(x,\s\up8(-))\o(y,\s\up8(-)),\r((\o(∑,\s\up8(10),\s\do8(i=1))xeq\o\al(2,i)-\a\vs4\al(10\o(x,\s\up8(-)))2)(\o(∑,\s\up8(10),\s\do8(i=1))yeq\o\al(2,i)-\a\vs4\al(10\o(y,\s\up8(-)))2)))=eq\f(0.2474-10×0.06×0.39,\r((0.038-10×0.062)×(1.6158-10×0.392)))=eq\f(0.0134,\r(0.002×0.0948))=eq\f(0.0134,0.01×\r(1.896))≈eq\f(0.0134,0.01377)≈0.97.(3)设所有这种树木的根部横截面积总和为X,总材积量为Y,则eq\f(X,Y)=eq\f(\o(x,\s\up8(-)),\o(y,\s\up8(-))),故Y=eq\f(0.39,0.06)×186=1209(m3).【通性通法】经验回归方程的拟合效果,可以利用相关系数r判断,当|r|越趋近于1时,两变量的线性相关性越强.或利用决定系数R2判断,R2越大,拟合效果越好.【巩固迁移】3.我国机床行业核心零部件对外依存度较高,我国整机配套的中高档功能部件大量依赖进口,根据中国机床工具工业协会的数据,国内高档系统自给率不到10%,约90%依赖进口.因此,迅速提高国产数控机床功能部件制造水平,加快国产数控机床功能部件产业化进程至关重要.通过对某机械上市公司近几年的年报公布的研发费用x(单位:亿元)与产品的直接收益y(单位:亿元)的数据进行统计,得到下表:年份2016201720182019202020212022x234681013y15222740485460根据数据,可建立y关于x的两个回归模型:模型①:eq\a\vs4\al(\o(y,\s\up8(^)))=4.1x+10.9;模型②:eq\o(y,\s\up8(^))=21.3eq\r(x)-14.4.(1)根据表格中的数据,分别求出模型①,②的决定系数R2的大小(结果保留三位有效数字);(2)(ⅰ)根据(1)选择拟合精度更高、更可靠的模型;(ⅱ)若2023年该公司计划投入研发费用17亿元,使用(ⅰ)中的模型预测可为该公司带来多少直接收益?回归模型模型①模型②eq\o(∑,\s\up8(7),\s\do8(i=1))(yi-eq\o(y,\s\up8(^))i)279.1318.86附:R2=1-eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(^))i)2,\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2),eq\r(17)≈4.1.解(1)因为eq\o(y,\s\up8(-))=eq\f(15+22+27+40+48+54+60,7)=38,所以eq\o(∑,\s\up8(7),\s\do8(i=1))(yi-eq\o(y,\s\up8(-)))2=232+162+112+22+102+162+222=1750,则模型①的决定系数Req\o\al(2,1)=1-eq\f(\o(∑,\s\up8(7),\s\do8(i=1))(yi-\o(y,\s\up8(^))i)2,\o(∑,\s\up8(7),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)=1-eq\f(79.13,1750)≈0.955,模型②的决定系数Req\o\al(2,2)=1-eq\f(\o(∑,\s\up8(7),\s\do8(i=1))(yi-\o(y,\s\up8(^))i)2,\o(∑,\s\up8(7),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)=1-eq\f(18.86,1750)≈0.989.(2)(ⅰ)由(1)知,Req\o\al(2,1)<Req\o\al(2,2),所以模型②的拟合精度更高、更可靠.(ⅱ)由经验回归方程eq\o(y,\s\up8(^))=21.3eq\r(x)-14.4,可得当x=17时,eq\o(y,\s\up8(^))=21.3eq\r(17)-14.4≈72.93,所以若2023年该公司计划投入研发费用17亿元,大约可为该公司带来72.93亿元的直接收益.考点三回归分析(多考向探究)考向1一元线性回归模型例3已知某绿豆新品种发芽的适宜温度在6~22℃之间,一农学实验室研究人员为研究温度x(单位:℃)与绿豆新品种发芽数y(单位:颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8~14℃的温度环境下进行实验,得到如下散点图:其中eq\o(y,\s\up8(-))=24,eq\o(∑,\s\up8(7),\s\do8(i=1))(xi-eq\o(x,\s\up8(-)))(yi-eq\o(y,\s\up8(-)))=70,eq\o(∑,\s\up8(7),\s\do8(i=1))(yi-eq\o(y,\s\up8(-)))2=176.(1)运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?(2)求出y关于x的经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^)),并预测在19℃的温度下,种子的发芽颗数.参考公式:相关系数r=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\r(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)),经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^)),其中eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-)).参考数据:eq\r(77)≈8.77.解(1)根据题意,得eq\o(x,\s\up8(-))=eq\f(1,7)×(8+9+10+11+12+13+14)=11.eq\o(∑,\s\up8(7),\s\do8(i=1))(xi-eq\o(x,\s\up8(-)))2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2=28,eq\r(\o(∑,\s\up8(7),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2\o(∑,\s\up8(7),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)=eq\r(28×176)=8eq\r(77)≈70.16.因而相关系数r=eq\f(\o(∑,\s\up8(7),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\r(\o(∑,\s\up8(7),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2\o(∑,\s\up8(7),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2))≈eq\f(70,70.16)≈0.998.由于|r|≈0.998很接近1,∴可以用线性回归模型拟合y与x的关系.(2)eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(7),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(7),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)=eq\f(70,28)=eq\f(5,2),eq\o(a,\s\up8(^))=24-eq\f(5,2)×11=-eq\f(7,2),∴y关于x的经验回归方程为eq\o(y,\s\up8(^))=eq\f(5,2)x-eq\f(7,2).若x=19,则eq\o(y,\s\up8(^))=eq\f(5,2)×19-eq\f(7,2)=44颗,∴在19℃的温度下,预测种子的发芽颗数为44.【通性通法】求经验回归方程的步骤【巩固迁移】4.(2023·安徽马鞍山第三次教学质量监测)为了研究某果园的一种果树的产量与种植密度的关系,某中学的数学兴趣小组在该果园选取了一块种植区域进行了统计调查,他们将每株果树与其直线距离不超过1米的果树株数x记为其密度,在记录了该种植区域内每株果树的密度后,从中选取密度为0,1,2,3,4的果树,统计其产量的平均值y(单位:kg),得到如下统计表:x01234y15121198(1)小组成员甲认为y与x有很强的线性相关关系,请你帮他利用最小二乘法求出y关于x的经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^));(2)小组成员乙提出:若利用经验回归方程计算的平均产量的估计值eq\o(y,\s\up8(^))i与实际的平均产量yi(1≤i≤n,n∈N*)满足eq\f(1,n)eq\o(∑,\s\up8(n),\s\do8(i=1))|yi-eq\o(y,\s\up8(^))i|>0.5,则应该修正模型,寻找更合适的函数拟合x与y的关系.统计知种植密度分别为5,6的果树的平均产量为5.5kg、4.4kg,请你以这七组数据为依据判断(1)中得到的经验回归方程是否需要修正?参考公式:eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))xiyi-n\o(x,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(n),\s\do8(i=1))xeq\o\al(2,i)-n\o(x,\s\up8(-))2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-)).解(1)eq\o(x,\s\up8(-))=2,eq\o(y,\s\up8(-))=11,eq\o(∑,\s\up8(5),\s\do8(i=1))xiyi=93,eq\o(∑,\s\up8(5),\s\do8(i=1))xeq\o\al(2,i)-5eq\o(x,\s\up8(-))2=10,故eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(5),\s\do8(i=1))xiyi-5\o(x,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(5),\s\do8(i=1))xeq\o\al(2,i)-5\o(x,\s\up8(-))2)=-1.7,eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-))=14.4,所以经验回归方程为eq\o(y,\s\up8(^))=-1.7x+14.4.(2)令x=0,1,2,3,4,5,6,代入eq\o(y,\s\up8(^))=-1.7x+14.4,分别得|eq\o(y,\s\up8(^))-y|=0.6,0.7,0,0.3,0.4,0.4,0.2,从而eq\f(1,7)eq\o(∑,\s\up8(7),\s\do8(i=1))|yi-eq\o(y,\s\up8(^))i|=eq\f(2.6,7)<0.5,故不需要修正.考向2非线性回归模型例4某工厂生产一种产品,从该种产品中随机抽取6件合格产品,测得数据如下:尺寸x/mm384858687888质量y/g16.818.820.722.42425.5(1)若按照检测标准,合格产品的质量y与尺寸x之间近似满足关系式y=c·xd(c,d为大于0的常数),求y关于x的经验回归方程;(2)已知合格产品的收益z(单位:千元)与合格产品尺寸和质量的关系为z=2y-0.32x,根据(1)中经验回归方程分析,当合格产品的尺寸x约为何值时(结果用整数表示),收益z的预报值最大?附:①参考数据:eq\o(∑,\s\up8(6),\s\do8(i=1))(lnxi·lnyi)=75.3,eq\o(∑,\s\up8(6),\s\do8(i=1))(lnxi)=24.6,eq\o(∑,\s\up8(6),\s\do8(i=1))(lnyi)=18.3,eq\o(∑,\s\up8(6),\s\do8(i=1))(lnxi)2=101.4.②参考公式:对于样本(vi,ui)(i=1,2,…,n),其经验回归直线eq\o(u,\s\up8(^))=eq\o(b,\s\up8(^))v+eq\o(a,\s\up8(^))的斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(vi-\o(v,\s\up8(-)))(ui-\o(u,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(vi-\o(v,\s\up8(-)))2)=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))viui-n\o(v,\s\up8(-))\o(u,\s\up8(-)),\o(∑,\s\up8(n),\s\do8(i=1))veq\o\al(2,i)-n\o(v,\s\up8(-))2),eq\o(a,\s\up8(^))=eq\o(u,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(v,\s\up8(-)),e≈2.7182.解(1)对y=c·xd(c,d>0)两边取自然对数得lny=lnc+dlnx.令vi=lnxi,ui=lnyi,则eq\o(u,\s\up8(^))=eq\o(d,\s\up8(^))v+eq\o(a,\s\up8(^)),其中eq\o(a,\s\up8(^))=lneq\o(c,\s\up8(^)).根据所给统计量及最小二乘估计公式得eq\o(d,\s\up8(^))=eq\f(\o(∑,\s\up8(6),\s\do8(i=1))viui-6\o(v,\s\up8(-))\o(u,\s\up8(-)),\o(∑,\s\up8(6),\s\do8(i=1))veq\o\al(2,i)-6\o(v,\s\up8(-))2)=eq\f(\o(∑,\s\up8(6),\s\do8(i=1))(lnxi·lnyi)-\f(\o(∑,\s\up8(6),\s\do8(i=1))(lnxi)·\o(∑,\s\up8(6),\s\do8(i=1))(lnyi),6),\o(∑,\s\up8(6),\s\do8(i=1))(lnxi)2-\f([\o(∑,\s\up8(6),\s\do8(i=1))(lnxi)]2,6))=eq\f(75.3-24.6×18.3÷6,101.4-24.62÷6)=eq\f(0.27,0.54)=eq\f(1,2),eq\o(a,\s\up8(^))=eq\o(u,\s\up8(-))-eq\o(d,\s\up8(^))eq\o(v,\s\up8(-))=eq\f(\o(∑,\s\up8(6),\s\do8(i=1))(lnyi),6)-eq\o(d,\s\up8(^))×eq\f(\o(∑,\s\up8(6),\s\do8(i=1))(lnxi),6)=eq\f(18.3,6)-eq\f(1,2)×eq\f(24.6,6)=1,又eq\o(a,\s\up8(^))=lneq\o(c,\s\up8(^))=1,所以eq\o(c,\s\up8(^))=e,所以y关于x的经验回归方程为eq\o(y,\s\up8(^))=e·xeq\s\up7(\f(1,2)).(2)由(1)得eq\o(y,\s\up8(^))=e·xeq\s\up7(\f(1,2)),所以eq\o(z,\s\up8(^))=2eeq\r(x)-0.32x=-0.32(eq\r(x))2+2eeq\r(x).令t=eq\r(x),则当t=eq\f(e,0.32)时,eq\o(z,\s\up8(^))取得最大值,此时x=t2≈72,所以当合格产品的尺寸x约为72时,收益z的预报值最大.【通性通法】非线性回归分析的步骤【巩固迁移】5.(2024·淄博诊断)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱.其幼苗从观察之日起,第x天的高度为ycm,测得数据如下:0479111213数据的散点图如图所示:为近似描述y与x的关系,除了一次函数y=bx+a,还有y=beq\r(x)+a和y=bx2+a两个函数可选.(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程(eq\o(b,\s\up8(^))保留到小数点后1位);(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由.参考公式:eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))xiyi-n\o(x,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(n),\s\do8(i=1))xeq\o\al(2,i)-n\o(x,\s\up8(-))2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-)).参考数据(其中ui=eq\r(xi),ti=xeq\o\al(2,i)):eq\o(x,\s\up8(-))=20,eq\o(u,\s\up8(-))=4,eq\o(t,\s\up8(-))=668,eq\o(y,\s\up8(-))=8,eq\o(∑,\s\up8(7),\s\do8(i=1))xeq\o\al(2,i)=4676,eq\o(∑,\s\up8(7),\s\do8(i=1))ueq\o\al(2,i)=140,eq\o(∑,\s\up8(7),\s\do8(i=1))teq\o\al(2,i)=7907396,eq\o(∑,\s\up8(7),\s\do8(i=1))xiyi=1567,eq\o(∑,\s\up8(7),\s\do8(i=1))uiyi=283,eq\o(∑,\s\up8(7),\s\do8(i=1))tiyi=56575.解(1)从散点图可以看出,曲线的形状与函数y=eq\r(x)相似,故选择函数y=beq\r(x)+a拟合y与x的关系.eq\o(b,\s\up8(^))=eq\f(283-7×4×8,140-7×42)=eq\f(59,28)≈2.1,eq\o(a,\s\up8(^))≈8-2.1×4=-0.4,其经验回归方程为eq\o(y,\s\up8(^))=2.1eq\r(x)-0.4.(2)将y=1000,1001分别代入经验回归方程,得2.1eq\r(x1)-0.4=1000和2.1eq\r(x2)-0.4=1001,故x2-x1=eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1001.4,2.1)))eq\s\up12(2)-eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1000.4,2.1)))eq\s\up12(2)≈454,显然454>365,所以,说法“高度从1000cm长到1001cm所需时间超过一年”成立.课时作业一、单项选择题1.(2024·湘豫名校模拟)根据下表样本数据:x23456y42.5-0.5-2-3得到的经验回归方程为eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^)),则()A.eq\o(a,\s\up8(^))>0,eq\o(b,\s\up8(^))>0 B.eq\o(a,\s\up8(^))>0,eq\o(b,\s\up8(^))<0C.eq\o(a,\s\up8(^))<0,eq\o(b,\s\up8(^))>0 D.eq\o(a,\s\up8(^))<0,eq\o(b,\s\up8(^))<0答案B解析由表中的数据可得,变量y随着x的增大而减小,则eq\o(b,\s\up8(^))<0,eq\o(x,\s\up8(-))=eq\f(2+3+4+5+6,5)=4,eq\o(y,\s\up8(-))=eq\f(4+2.5-0.5-2-3,5)=0.2,又经验回归直线eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^))经过点(4,0.2),可得eq\o(a,\s\up8(^))>0.2.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析的方法分别求得样本相关系数r与残差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?()A.甲 B.乙C.丙 D.丁答案D解析r的绝对值越大,m越小,线性相关性越强.3.(2023·河北高三校联考期末)下列四幅残差分析图中,与一元线性回归模型拟合精度最高的是()答案D解析用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,显然D项的拟合精度最高.故选D.4.已知某地的财政收入x与支出y满足经验回归方程eq\a\vs4\al(\o(y,\s\up8(^)))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^))+e(单位:亿元),其中eq\o(b,\s\up8(^))=0.8,eq\o(a,\s\up8(^))=2,|e|≤0.5,如果今年该地区的财政收入为10亿元,那么支出预计不会超过()A.9亿元 B.10亿元C.9.5亿元 D.10.5亿元答案D解析eq\o(y,\s\up8(^))=0.8×10+2+e=10+e≤10.5.5.用模型y=cekx拟合一组数据时,为了求出经验回归方程,设z=lny,其变换后得到经验回归方程为eq\o(z,\s\up8(^))=0.5x+2,则eq\o(c,\s\up8(^))=()A.0.5 B.e0.5C.2 D.e2答案D解析因为y=cekx,两边取对数得lny=ln(cekx)=lnc+lnekx=kx+lnc,则eq\o(z,\s\up8(^))=eq\o(k,\s\up8(^))x+lneq\o(c,\s\up8(^)),而eq\o(z,\s\up8(^))=0.5x+2,于是得lneq\o(c,\s\up8(^))=2,即eq\o(c,\s\up8(^))=e2.6.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn),求得经验回归方程为eq\o(y,\s\up8(^))=1.5x+0.5,且eq\o(x,\s\up8(-))=3.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则()A.去除两个误差较大的样本点后,y的估计值增加速度变快B.去除两个误差较大的样本点后,重新求得的经验回归直线一定过点(3,4)C.去除两个误差较大的样本点后,重新求得的经验回归方程为eq\o(y,\s\up8(^))=1.2x+1.4D.去除两个误差较大的样本点后,样本点(2,3.75)对应的残差为0.05答案C解析对于A,因为1.5>1.2,所以去除两个误差较大的样本点后y的估计值增加速度变慢,故A错误;对于B,当eq\o(x,\s\up8(-))=3时,eq\o(y,\s\up8(-))=3×1.5+0.5=5,设去掉两个误差较大的样本点后,横坐标的平均值为eq\o(x,\s\up8(-))′,纵坐标的平均值为eq\o(y,\s\up8(-))′,则eq\o(x,\s\up8(-))′=eq\f(x1+x2+…+xn-6,n-2)=eq\f(3n-6,n-2)=3,eq\o(y,\s\up8(-))′=eq\f(y1+y2+…+yn-10,n-2)=eq\f(5n-10,n-2)=5,故B错误;对于C,因为去除两个误差较大的样本点后,重新求得经验回归直线l的斜率为1.2,所以5=3×1.2+eq\o(a,\s\up8(^)),解得eq\o(a,\s\up8(^))=1.4,所以去除两个误差较大的样本点后的经验回归方程为eq\o(y,\s\up8(^))=1.2x+1.4,故C正确;对于D,当x=2时,eq\o(y,\s\up8(^))=1.2×2+1.4=3.8,y-eq\o(y,\s\up8(^))=3.75-3.8=-0.05,故D错误.二、多项选择题7.下列说法中正确的是()A.经验回归分析中,R2的值越大,说明残差平方和越小B.若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2=1C.经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D.画残差图时,纵坐标为残差,横坐标一定是编号答案ABC解析对于A,经验回归分析中,R2的值越大,说明模型的拟合效果越好,则残差平方和越小,A正确;对于B,若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2=1,B正确;对于C,经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,C正确;对于D,残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重的估计值等,D错误.8.下列有关经验回归分析的说法中正确的是()A.经验回归直线必过点(eq\o(x,\s\up8(-)),eq\o(y,\s\up8(-)))B.经验回归直线就是散点图中经过样本数据点最多的那条直线C.当样本相关系数r>0时,两个变量正相关D.如果两个变量的相关性越弱,则|r|就越接近于0答案ACD解析对于A,经验回归直线必过点(eq\o(x,\s\up8(-)),eq\o(y,\s\up8(-))),故A正确;对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;对于C,当样本相关系数r>0时,则两个变量正相关,故C正确;对于D,如果两个变量的相关性越弱,则|r|就越接近于0,故D正确.故选ACD.三、填空题9.(2023·广东广州模拟)某车间为了提高工作效率,需要测试加工零件所花费的时间,为此进行了5次试验,这5次试验的数据如下表:零件数x(个)1020304050加工时间y(min)62a758189若用最小二乘法求得经验回归方程为eq\o(y,\s\up8(^))=0.67x+54.9,则a的值为________.答案68解析由已知得eq\o(x,\s\up8(-))=eq\f(10+20+30+40+50,5)=30,eq\o(y,\s\up8(-))=eq\f(62+a+75+81+89,5)=61+eq\f(2+a,5),所以61+eq\f(2+a,5)=0.67×30+54.9,解得a=68.10.用模型y=ekx-1去拟合一组数据时,已知如下数据:eq\o(∑,\s\up8(6),\s\do8(i=1))xi=18,y1y2y3y4y5y6=e48,则实数k的值为________.答案3解析由y=ekx-1得lny=kx-1,所以y1y2y3y4y5y6=e48⇒keq\o(∑,\s\up8(6),\s\do8(i=1))xi-6=18k-6=48,则k=3.11.(2023·海南调研)在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-eq\f(1,2)附近波动,经计算eq\o(∑,\s\up8(6),\s\do8(i=1))xi=12,eq\o(∑,\s\up8(6),\s\do8(i=1))yi=14,eq\o(∑,\s\up8(6),\s\do8(i=1))xeq\o\al(2,i)=23,则实数b的值为________.答案eq\f(17,23)解析令t=x2,则非线性经验回归方程变为线性经验回归方程,即y=bt-eq\f(1,2),此时eq\o(t,\s\up8(-))=eq\f(\o(∑,\s\up8(6),\s\do8(i=1))xeq\o\al(2,i),6)=eq\f(23,6),eq\o(y,\s\up8(-))=eq\f(\o(∑,\s\up8(6),\s\do8(i=1))yi,6)=eq\f(14,6),代入y=bt-eq\f(1,2),得eq\f(14,6)=b×eq\f(23,6)-eq\f(1,2),解得b=eq\f(17,23).12.新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2023年某企业的前5个月碳酸锂的价格与月份的统计数据:月份代码x12345碳酸锂价格y(万元/kg)0.50.61m1.5根据表中数据,得出y关于x的经验回归方程为eq\o(y,\s\up8(^))=0.28x+eq\o(a,\s\up8(^)),根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=________.答案1.4解析由题设,1.5-eq\o(y,\s\up8(^))=1.5-(0.28×5+eq\o(a,\s\up8(^)))=-0.06,可得eq\o(a,\s\up8(^))=0.16.又eq\o(x,\s\up8(-))=eq\f(1+2+3+4+5,5)=3,eq\o(y,\s\up8(-))=eq\f(0.5+0.6+1+m+1.5,5)=eq\f(3.6+m,5),所以0.28×3+0.16=eq\f(3.6+m,5),可得m=1.4.四、解答题13.某研究机构为调查人的最大可视距离y(单位:米)与年龄x(单位:岁)之间的关系,对不同年龄的志愿者进行了研究,收集数据得到下表:x2025303540y167160150143130(1)根据上表提供的数据,求出y关于x的经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^));(2)根据(1)中求出的经验回归方程,估计年龄为50岁的人的最大可视距离.参考公式:经验回归方程eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))x+eq\o(a,\s\up8(^))中斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))xiyi-n\o(x,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(n),\s\do8(i=1))xeq\o\al(2,i)-n\o(x,\s\up8(-))2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-)).解(1)由题意可得eq\o(x,\s\up8(-))=eq\f(20+25+30+35+40,5)=30,eq\o(y,\s\up8(-))=eq\f(167+160+150+143+130,5)=150,eq\o(∑,\s\up8(5),\s\do8(i=1))xiyi=20×167+25×160+30×150+35×143+40×130=22045,eq\o(∑,\s\up8(5),\s\do8(i=1))xeq\o\al(2,i)=202+252+302+352+402=4750,所以eq\o(b,\s\up8(^))=eq\f(22045-5×30×150,4750-5×302)=eq\f(-455,250)=-1.82,则eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-))=150+1.82×30=204.6,故所求经验回归方程为eq\o(y,\s\up8(^))=-1.82x+204.6.(2)当x=50时,eq\o(y,\s\up8(^))=-1.82×50+204.6=113.6,即年龄为50岁的人的最大可视距离约为113.6米.14.数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛,赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:x1234567y990990450320300240210(1)现用y=a+eq\f(b,x)作为经验回归模型,请利用表中数据,求出该经验回归方程;(2)请用(1)中的结论预测,小明经过20天训练后,每天解题的平均速度y约为多少秒?参考数据eq\b\lc\(\rc\)(\a\vs4\al\co1(其中ti=\f(1,xi))):eq\o(∑,\s\up8(7),\s\do8(i=1))tiyi=1845,eq\o(t,\s\up8(-))=0.37,eq\o(∑,\s\up8(7),\s\do8(i=1))teq\o\al(2,i)-7eq\o(t,\s\up8(-))2=0.55.参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线eq\o(v,\s\up8(^))=eq\o(α,\s\up8(^))+eq\o(β,\s\up8(^))u的斜率和截距的最小二乘估计公式分别为eq\o(β,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))uivi-n\o(u,\s\up8(-))\o(v,\s\up8(-)),\o(∑,\s\up8(n),\s\do8(i=1))ueq\o\al(2,i)-n\o(u,\s\up8(-))2),eq\o(α,\s\up8(^))=eq\o(v,\s\up8(-))-eq\o(β,\s\up8(^))eq\o(u,\s\up8(-)).解(1)由题意得eq\o(y,\s\up8(-))=eq\f(1,7)×(990+990+450+320+300+240+210)=500,令t=eq\f(1,x),则y关于t的经验回归方程为eq\o(y,\s\up8(^))=eq\o(b,\s\up8(^))t+eq\o(a,\s\up8(^)),则有eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(7),\s\do8(i=1))tiyi-7\o(t,\s\up8(-))\o(y,\s\up8(-)),\o(∑,\s\up8(7),\s\do8(i=1))teq\o\al(2,i)-7×\o(t,\s\up8(-))2)=eq\f(1845-7×0.37×500,0.55)=1000,eq\o(a,\s\up8(^))=500-1000×0.37=130,所以eq\o(y,\s\up8(^))=1000t+130,又t=eq\f(1,x),所以y关于x的经验回归方程为eq\o(y,\s\up8(^))=eq\f(1000,x)+130.(2)当x=20时,eq\o(y,\s\up8(^))=180,所以经过20天训练后,小明每天解题的平均速度约为180秒.15.(多选)(2024·河北三河市开学考试)某企业秉承“科学技术是第一生产力”的发展理念,投入大量科研经费进行技术革新,该企业统计了最近6年投入的年科研经费x(单位:百万元)和年利润y(单位:百万元)的数据,并绘制成如图所示的散点图,已知x,y的平均值分别为eq\o(x,\s\up8(-))=7,eq\o(y,\s\up8(-))=10,甲统计员得到的经验回归方程为eq\o(y,\s\up8(^))=1.69x+eq\o(a,\s\up8(^)),乙统计员得到的经验回归方程为eq\o(y,\s\up8(^))=2.52e0.17x.若甲、乙二人计算均未出现错误,则以下结论正确的是()A.当投入年科研经费为20(百万元)时,按乙统计员的经验回归方程可得年利润估计值为75.6(百万元)(取e3.4=30)B.eq\o(a,\s\up8(^))=-1.83C.经验回归方程eq\o(y,\s\up8(^))=1.69x+eq\o(a,\s\up8(^))比eq\o(y,\s\up8(^))=2.52e0.17x拟合效果好D.y与x正相关答案ABD解析将x=20代入eq\o(y,\s\up8(^))=2.52e0.17x,得eq\o(y,\s\up8(^))=75.6,投入年科研经费为20(百万元)时,按乙统计员的经验回归方程可得年利润估计值为75.6(百万元),A正确;将eq\o(x,\s\up8(-))=7,eq\o(y,\s\up8(-))=10代入eq\o(y,\s\up8(^))=1.69x+eq\o(a,\s\up8(^)),得eq\o(a,\s\up8(^))=-1.83,B正确;由散点图可知,经验回归方程eq\o(y,\s\up8(^))=2.52e0.17x比eq\o(y,\s\up8(^))=1.69x+eq\o(a,\s\up8(^))的拟合效果更好,C错误;因为y随x的增大而增大,所以y与x正相关,D正确.故选ABD.16.(2024·河北唐山统考)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345居民年收入x32.231.132.935.737.1商品销售额y25.030.034.037.039.0第n年678910居民年收入x38.039.043.044.646.0商品销售额y41.042.044.048.051.0依据表格数据,得到下面一些统计量的值.eq\o(∑,\s\up8(10),\s\do8(i=1))xieq\o(∑,\s\up8(10),\s\do8(i=1))yieq\o(∑,\s\up8(10),\s\do8(i=1))(xi-eq\o(x,\s\up8(-)))2eq\o(∑,\s\up8(10),\s\do8(i=1))(yi-eq\o(y,\s\up8(-)))2379.6391247.624568.9(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x的线性相关程度是否很强?(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第一个样本点(32.2,25.0)对应的残差(精确到0.01),并判断若剔除这个样本点再进行回归分析,eq\o(b,\s\up8(^))的值将变大还是变小(不必说明理由,直接判断即可)?附:样本(xi,yi)(i=1,2,…,n)的相关系数r=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\r(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)\r(\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)),eq\r(2.297)≈1.516,eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-)).解(1)根据样本相关系数r≈0.95,可以推断线性相关程度很强.(2)由r=eq\f(\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\r(\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)\r(\o(∑,\s\up8(10),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2))≈0.95及eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2),可得eq\f(\o(b,\s\up8(^)),r)=eq\f(\r(\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)\r(\o(∑,\s\up8(10),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2),\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2)=eq\f(\r(\o(∑,\s\up8(10),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2),\r(\o(∑,\s\up8(10),\s\do8(i=1))(xi-\o(x,\s\up8(-)))2))≈eq\r(2.297),所以eq\o(b,\s\up8(^))≈req\r(2.297)≈0.95×1.516≈1.440,又因为eq\o(x,\s\up8(-))=37.96,eq\o(y,\s\up8(-))=39.1,所以eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))eq\o(x,\s\up8(-))≈-15.56,所以y关于x的经验回归方程为eq\o(y,\s\up8(^))=1.44x-15.56.(3)第一个样本点(32.2,25.0)的残差为25.0-(1.44×32.2-15.56)=-5.808≈-5.81,由于该点在回归直线的左下方,故将其剔除后,eq\o(b,\s\up8(^))的值将变小.17.(2023·广东汕头三模)某药企为评估一款新药的药效和安全性,组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标A的数量y与连续用药天数x具有相关关系.刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓.根据志愿者的临床试验情况,得到了一组数据(xi,yi),i=1,2,3,4,5,…,10,xi表示连续用药i天,yi表示相应的临床疗效评价指标A的数值.该药企为了进一步研究药物的临床效果,建立了y关于x的两个回归模型:模型①:由最小二乘公式可求得y关于x的经验回归方程为eq\o(y,\s\up8(^))=2.50x-2.50;模型②:由图中样本点的分布,可以认为样本点集中在曲线y=blnx+a的附近,令t=lnx,则有eq\o(∑,\s\up8(10),\s\do8(i=1))ti=22.00,eq\o(∑,\s\up8(10),\s\do8(i=1))yi=230,eq\o(∑,\s\up8(10),\s\do8(i=1))tiyi=569.00,eq\o(∑,\s\up8(10),\s\do8(i=1))teq\o\al(2,i)=50.92.(1)根据所给的统计量,求模型②中y关于x的经验回归方程;(2)根据下列表格中的数据,说明哪个模型的预测值精度更高、更可靠;(3)根据(2)中精确度更高的模型,预测用药一个月后,疗效评价指标相对于用药半个月的变化情况(一个月以30天计,结果保留两位小数).回归模型模型①模型②残差平方和eq\o(∑,\s\up8(10),\s\do8(i=1))(yi-eq\o(y,\s\up8(^))i)2102.2836.19附:样本(ti,yi)(i=1,2,…,n)的最小二乘估计公式为eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(ti-t)(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(n),\s\do8(i=1))(ti-t)2),eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))t;相关指数R2=1-eq\f(\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(^)))2,\o(∑,\s\up8(n),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2).参考数据:ln2≈0.6931.解(1)由题意,知eq\o(∑,\s\up8(10),\s\do8(i=1))ti=22.00,eq\o(∑,\s\up8(10),\s\do8(i=1))yi=230,可得t=2.20,eq\o(y,\s\up8(-))=23,又由eq\o(b,\s\up8(^))=eq\f(\o(∑,\s\up8(10),\s\do8(i=1))(ti-t)(yi-\o(y,\s\up8(-))),\o(∑,\s\up8(10),\s\do8(i=1))(ti-t)2)=eq\f(\o(∑,\s\up8(10),\s\do8(i=1))tiyi-10t\o(y,\s\up8(-)),\o(∑,\s\up8(10),\s\do8(i=1))teq\o\al(2,i)-10t2)=eq\f(569.00-10×2.20×23,50.92-10×2.202)=25,则eq\o(a,\s\up8(^))=eq\o(y,\s\up8(-))-eq\o(b,\s\up8(^))t=23-25×2.20=-32,所以模型②中y关于x的经验回归方程为eq\o(y,\s\up8(^))=25lnx-32.(2)由表格中的数据,可得102.28>36.19,即eq\f(102.28,\o(∑,\s\up8(10),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2)>eq\f(36.19,\o(∑,\s\up8(10),\s\do8(i=1))(yi-\o(y,\s\up8(-)))2),所以模型①的R2小于模型②,说明回归模型②的预测值精度更高、更可靠.(3)根据模型②,当连续用药30天后,eq\o(y,\s\up8(^))30

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论