版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题94一元线性回归模型及其应用题型一求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量和正相关,则由如下表所示的观测数据算得的线性回归方程为A. B.C. D.【答案】B【解析】【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案.【详解】由题得,所以样本中心点的坐标为(0,0),代入选项检验得选B.故答案为B【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2)称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法求线性回归方程的一般步骤(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格xi,yi,xeq\o\al(2,i),xiyi.(4)计算eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),eq\o(∑,\s\up10(n),\s\do10(i=1))xeq\o\al(2,i),eq\o(∑,\s\up10(n),\s\do10(i=1))xiyi.(5)代入公式计算eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)),公式为eq\b\lc\{(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up10(n),\s\do10(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up10(n),\s\do10(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),,\o(a,\s\up6(^))=\o(y,\s\up6(-))-\o(b,\s\up6(^))\o(x,\s\up6(-)).))(6)写出线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)).例2.(2019·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限与所支出的总费用(万元)有如表的数据资料:使用年限23456总费用2.23.85.56.57.0(1)
在给出的坐标系中作出散点图;(2)求线性回归方程中的、;(3)估计使用年限为年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式,.)【答案】(1)见解析;(2);(3)估计使用12年时,支出总费用是14.84万元..【解析】【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用.【详解】(1)散点图如图,由图知与间有线性相关关系.(2)∵,,,,∴;.(3)线性回归直线方程是,当(年)时,(万元).即估计使用12年时,支出总费用是14.84万元.【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧重于应用性.例3.(2022·全国·高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下:气温x/℃-504712151923273136热茶销售杯数y/杯15615013212813011610489937654(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗?(3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系;(4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2℃,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4);(5)143【解析】【详解】分析:(1)以x轴表示气温,以y轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系;(4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果.详解:(1)以x轴表示气温,以y轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因335,778.所≈-2.35,所以回归直线方程(5)由(4)的方程,当x=22℃,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算,的公式和准确的计算,是求线性回归方程的关键.(2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.题型二利用回归直线方程对总体进行估计例4.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y辆与年份代码x年的数据如下表:年份20162017201820192020年份代码第x年12345新能源汽车y辆305070100110(1)建立y关于x的线性回归方程;(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车.参考公式:回归方程斜率和截距的最小二乘估计公式分别为,.【答案】(1)(2)27900【解析】【分析】(1)第一步分别算第x,y的平均值,第二步利用,即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果.(1),,,因为,所以,所以(2)预测该地区2022年抽样1000汽车调查中新能源汽车数,当时,,该地区2022年共有30万辆汽车,所以新能源汽车.规律方法本题已知y与x是线性相关关系,所以可求出回归方程进行估计和预测.否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩平均分偏差).在某次考试成绩统计中,某老师为了对学生数学偏差(单位:分)与物理偏差(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:学生序号12345678数学偏差20151332-5-10-18物理偏差6.53.53.51.50.5-0.5-2.5-3.5(1)若与之间具有线性相关关系,求关于的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式),回归直线方程为,其中【答案】(1)(2)【解析】【分析】(1)根据最小二乘法即可求出关于的线性回归方程;(2)设该同学的物理成绩为,则物理偏差为,数学偏差为,根据回归方程可知,,即可解出.(1)由题意可得,,,,所以,故线性回归方程为.(2)由题意,设该同学的物理成绩为,则物理偏差为:.而数学偏差为128-120=8,∴,解得,所以,可以预测这位同学的物理成绩为94.例6.(2022·广东揭阳·高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:
上一年的出险次数次以上(含次)下一年保费倍率连续两年没有出险打折,连续三年没有出险打折有评估机构从以往购买了车险的车辆中随机抽取1000辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):一年中出险次数012345次以上(含5次)频数5003801001541(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价格有较强的线性相关关系,估计其回归直线方程为:.(其中(万元)表示购车价格,(元)表示商业车险保费).李先生2016年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保)【答案】(1)0.8744;(2)3846元,减轻了车主负担.【解析】【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论.【详解】(1)设某车在两年中出险次数为N,则,所以某车在两年中出险次数不超过2次的概率为;(2)设该车辆2017年的保费倍率为X,则X为随机变量,X的取值为0.85,1,1.25,1.5,1.75,2,X的分布列为:X0.8511.251.51.752P0.500.380.100.0150.0040.001下一年保费倍率X的期望为:,该车辆估计2017年应缴保费为:元,因,则车险新政总体上减轻了车主负担.题型三线性回归分析例7.(2022·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①;②分别进行拟合,得到相应的回归方程,,进行残差分析得到如表所示的残差值及一些统计量的值:日期x(天)123456用户y(人)132243455568模型①的残差值-1.1-2.87.5-1.2-1.90.4模型②的残差值0.3-5.44.3-3.2-1.63.8(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:,)【答案】(1)该选模型①,理由见解析(2)【解析】【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可(1)应该选择模型①模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6.∵14.9<18.6,∴模型①的拟合效果较好,应该选模型①.(2)剔除异常数据,即剔除第3天的数据后,得,,,.∴,.∴y关于x的回归方程为.规律方法(1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.②残差平方和法:残差平方和eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.③决定系数法:R2=1-eq\f(\o(∑,\s\up10(n),\s\do10(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up10(n),\s\do10(i=1))(yi-\o(y,\s\up6(-)))2)越接近1,表明回归的效果越好.例8.(2022·河南·南阳中学高三阶段练习(文))2022年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1522274048546068.56867.56665当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定y与x满足的线性回归方程为.(1)根据下列表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;回归模型模型①模型②回归方程79.1320.2(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程的截距:.【答案】(1)对A型材料进行应用改造的投入为17亿元时的直接收益为(亿元);(2)投入17亿元比投入20亿元时收益小.【解析】【分析】(1)根据模型和相关系数公式计算比较即可,然后将x=17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点()求出,再令x=20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可.(1)对于模型①,对应的,故对应的,故对应的相关指数,对于模型②,同理对应的相关指数,故模型②拟合精度更高、更可靠.故对A型材料进行应用改造的投入为17亿元时的直接收益为(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型②拟合精度更高、更可靠.(2)当时,后五组的,,由最小二乘法可得,故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:,故投入17亿元比投入20亿元时收益小.例9.(2022·陕西·高新一中高三阶段练习(理))2022年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将型材料更好地投入商用,拟对型材料进行应用改造.根据市场调研与模拟,得到应用改造投入(亿元)与产品的直接收益(亿元)的数据统计如下:序号123456723468101315222740485460当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定y与x满足的线性回归方程为.回归模型模型①模型②79.1320.2(1)根据表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..用最小二乘法求线性回归方程的截距:.【答案】(1),模型②拟合精度更高、更可靠,收益为;(2)投入17亿元比投入20亿元时收益小.【解析】【分析】(1)根据题意求得,再根据的计算公式,即可分别求得,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值.(1)对于模型①,对应的,故对应的,故对应的相关指数,对于模型②,同理对应的相关指数,故模型②拟合精度更高、更可靠.故对型材料进行应用改造的投入为17亿元时的直接收益为.(2)当时,后五组的,由最小二乘法可得,故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:,故投入17亿元比投入20亿元时收益小.题型四残差分析与相关指数的应用例10.(2022·河北·藁城新冀明中学高二阶段练习)假定产品产量x(千件)与单位成本y(元/件)之间存在相关关系.数据如下:x234345y737271736968(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归直线方程,对于单位成本70元/件时,预报产量为多少;(3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2),千件;(3)各组残差见解析,残差平方和为.【解析】【分析】(1)根据表中数据描点即可求解;(2)根据表中数据,求出,,,,代入公式求出线性回归方程的系数,进而求出即可得回归直线方程;(3)根据残差的定义及残差平方和公式即可求解.(1)解:散点图如下:(2)解:因为,,,,所以,,所以回归直线方程为,令,则,解得,所以单位成本70元/件时,预报产量约为千件.(3)解:各组残差分别为:,,,,,,残差的平方和为.规律方法(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差eq\o(e,\s\up6(^))1,eq\o(e,\s\up6(^))2,…,eq\o(e,\s\up6(^))n来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.例11.(2022·河北·大名县第一中学高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x(亿元)与科技升级直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1322314250565868.56867.56666当时,建立了y与x的两个回归模型:模型①:;模型②:;当时,确定y与x满足的线性回归方程为.(1)根据下列表格中的数据,比较当时模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益.回归模型模型①模型②回归方程182.479.2(附:刻画回归效果的相关指数,,)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程的系数:【答案】(1)回归模型②,72.93(亿元);(2)投入20亿元时,公司的实际收益更大.【解析】【分析】(1)根据表中数据比较和可判断拟合效果,进而求出预测值;(2)求出,进而求出,得出回归方程得求出结果.【详解】解:(1)由表格中的数据,,∴,∴可见模型①的相关指数小于模型②的相关指数.所以回归模型②的拟合效果更好.所以当亿元时,科技升级直接收益的预测值为(亿元).(2)当时,由已知可得,.∴.∴当时,y与x满足的线性回归方程为.当时,科技升级直接收益的预测值为亿元.当亿元时,实际收益的预测值为亿元亿元,∴技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12.(2022·全国·模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:x1234567y611213466101196根据以上数据,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,与(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:62.141.54253550.123.47其中,.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.(3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果:支付方式现金公交卡扫码人次106030已知该线路公交车票价2元,使用现金支付的乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)适宜(2),活动推出第8天使用扫码支付的人次为347(3)199200元【解析】【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出,进而求出,即可得出回归方程,令求解即可;(3)根据题意分别求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可.(1)根据散点图判断,适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型.(2)∵,∴两边同时取常用对数,得.设,,则.∵,,,∴,,∴,∴,把代入上式,得,∴y关于x的回归方程为,活动推出第8天使用扫码支付的人次为347.(3)由题意,可知一个月中使用现金的乘客有1000人次,共收入(元);使用公交卡的乘客有6000人次,共收入(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入(元),享受8折优惠的有1000人次,共收入(元),享受9折优惠的有1500人次,共收入(元),故该车队一辆车一个月的收入为(元).∴估计该车队一辆车一年的收入为(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.例13.(2022·黑龙江·哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表年份20152016201720182019编号x12345企业总数量y(单位:千个)2.1563.7278.30524.27936.224注:参考数据,,,(其中).附:样本的最小二乘法估计公式为,(1)根据表中数据判断,与(其中,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y关于x的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率.【答案】(1)(2)(3)【解析】【分析】(1)根据表中数据判断y关于x的回归方程为非线性方程;(2)令,将y关于x的非线性关系,转化为z关于x的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解;(1)根据表中数据适宜预测未来几年我国区块链企业总数量.(2),,令,则,,由公式计算可知,即,即所以y关于x的回归方程为(3)设甲公司获得“优胜公司”为事件.则所以甲公司获得“优胜公司”的概率为.例14.(2022·湖南·长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:x(天)1234567y(秒)990990450320300240210现用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中)18450.370.55参考公式:对于一组数据(,),(,),…,(,),其回归直线的斜率和截距的最小二乘估计公式分别为:,.【答案】(1);150秒(2)【解析】【分析】(1)首先换元,令,设y关于t的线性回归方程为,利用参考公式,即可求解;(2)首先根据题意写出随机变量,,再利用独立事件概率公式,即可求解.(1)由题意,,令,设y关于t的线性回归方程为,则,则.∴,又,∴y关于x的回归方程为,故时,.∴.经过50天训练后,每天解题的平均速度y约为150秒.(2)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,由题意知,最多再进行4局就有胜负.当时,小明胜,∴当时,小明胜,∴;当时,小明胜,∴.∴小明最终赢得比赛的概率为.【同步练习】一、单选题1.(2022·黑龙江·哈尔滨三中一模(文))某产品的广告费用与销售额的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程中的为9.4,据此模型预报广告费用为7万元时销售额为(
)A.73万元 B.81.4万元 C.77.1万元 D.74.9万元【答案】D【解析】【分析】先求样本中心点为,进而得,回归方程为,再代入计算即可得答案.【详解】解:由题知,,因为回归方程过定点,所以,即所以回归方程为,所以当广告费用为7万元时销售额为万元.故选:D2.(2022·四川·高三阶段练习(文))某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高(单位:)和臂展(单位:)进行了测量,这10名志愿者身高和臂展的折线图如图所示.已知这10名志愿者身高的平均值为,根据这10名志愿者的数据求得臂展关于身高的线性回归方程为,则下列结论不正确的是(
)A.这10名志愿者身高的极差小于臂展的极差B.这10名志愿者的身高和臂展呈正相关关系C.这10名志愿者臂展的平均值为176.2cmD.根据回归方程可估计身高为160cm的人的臂展为158cm【答案】C【解析】【分析】利用平均值、极差、线性回归方程的特征进行逐项判断.【详解】解:对于选项A:因为这10名志愿者臂展的最大值大于身高的最大值,而臂展的最小值小于身高的最小值,所以这10名志愿者身高的极差小于臂展的极差,故A正确.对于选项B:因为,所以这10名志愿者的身高和臂展呈正相关关系,故B正确.对于选项C:因为这10名志愿者身高的平均值为176cm,所以这10名志愿者臂展的平均值为,故C错误.对于选项D:若一个人的身高为160cm,则由回归方程,可得这个人的臂展的估计值为158cm,故D正确.故选:C3.(2022·全国·高二单元测试)某公司为了解某产品的研发费x(单位:万元)对销售量y(单位:百件)的影响,收集了该公司以往的5组数据,发现用函数模型(e为自然对数的底数)拟合比较合适.令,得到,经计算,x,z对应的数据如下表所示:研发费x581215204.55.25.55.86.5则(
).A. B. C. D.【答案】B【解析】【分析】利用回归直线过样本中心点求出的值,从而得到回归方程,再利用得出,的值,从而可得出答案.【详解】解:,,所以,,解得,所以,又因为,所以,所以,所以.故选:B.4.(2022·天津滨海新·高三阶段练习)下列说法不正确的是:(
)A.线性回归直线一定过点B.数据,,…,的平均数为,则,,…,的平均数为C.数据,,,,,的第百分位数为D.随机变量,其正态曲线是单峰的,它关于直线对称【答案】C【解析】【分析】根据线性回归直线的性质,平均值的定义,百分位数的概念,正态曲线的性质判断各选项,【详解】线性回归直线一定过其中心点,A正确;由得,B正确;数据,,,,,应重新排列为,其第百分位数为3,C错;由正态曲线的性质知D正确.故选:C.5.(2022·广西百色·高二期末(理))某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知回归直线方程为=6.3x+6.8,下列说法正确的是(
)x23456y1925★4044A.看不清的数据★的值为33B.回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨C.据此模型预测产量为8吨时,相应的生产能耗为50.9吨D.回归直线=6.3x+6.8恰好经过样本点(4,★)【答案】D【解析】【分析】根据回归直线方程的性质和应用,对每个选项进行逐一分析,即可判断和选择.【详解】对A:因为,将代入,故,∴,故A错误;对,回归系数6.3的含义是产量每增加1吨,相应的生产能耗大约增加6.3吨,故错误;对,当时,,故错误;对,因为,故必经过,故正确.故选:.6.(2022·广西玉林·高二期末(文))如果在一实验中,测得的四组数值分别是,则y与x之间的回归直线方程是(
)A. B.C. D.【答案】B【解析】【分析】根据已知数据求样本中心点,由样本中心点在回归直线上,将其代入各选项的回归方程验证即可.【详解】由题设,,.因为回归直线方程过样本点中心,A:,排除;B:,满足;C:,排除;D:,排除.故选:B.7.(2022·吉林·双辽市第一中学高三期末(文))新能源汽车是指采用非常规的车用燃料作为动力来源(或使用常规的车用燃料、采用新型车载动力装置),综合车辆的动力控制和驱动方面的先进技术,形成的技术原理先进、具有新技术、新结构的汽车.新能源汽车包括混合动力电动汽车(HEV)、纯电动汽车(BEV,包括太阳能汽车)、燃料电池电动汽车(FCEV)、其他新能源(如超级电容器、飞轮等高效储能器)汽车等.非常规的车用燃料指除汽油、柴油之外的燃料.下表是2022年我国某地区新能源汽车的前5个月销售量与月份的统计表:月份代码x12345销售量y(万辆)0.50.611.41.5由上表可知其线性回归方程为,则的值是(
).A.0.28 B.0.32 C.0.56 D.0.64【答案】A【解析】【分析】先计算,,再根据样本中心点适合方程解得的值即可.【详解】由表中数据可得,,将代入,即,解得.故选:A.8.(2022·全国·高二课时练习)中国是茶的故乡,也是茶文化的发源地.为了弘扬中国茶文化,某酒店推出特色茶食品“排骨茶”,为了解每壶“排骨茶”中所放茶叶克数与食客的满意率的关系,调查研究发现,可选择函数模型来拟合与的关系,根据以下统计数据:茶叶克数123454.344.364.444.454.51可求得关于的非线性经验回归方程为(
)A. B.C. D.【答案】A【解析】【分析】令,由线性回归方程经过样本中心点,利用表中数据求得,代入选项即得.【详解】由题表中数据可知,令,则,对于A,化简变形可得,等号两边同取对数,可得,将代入可得,所以A正确;对于B,,∴,将代入可得,,故B错误;对于C,∵,将代入可得,∴,故C错误;对于D,∵,将代入可得,∴,故D错误.故选:A.二、多选题9.(2022·全国·模拟预测)某公司大力推进科技创新发展战略,持续加大研发投入(单位:万元),不断提升公司的创新能力.2016年至2020年该公司的研发投入如下表所示:年份20162017201820192020年份编号x12345研发投入y/万元5193m175211若y与x线性相关,由上表数据求得的线性回归方程为,则(
)A.B.y与x正相关C.该公司平均每年增加研发投入约11.4万元D.预计2022年该公司的研发投入为292.8万元【答案】ABD【解析】【分析】根据直线回归的定义,平均值必须在直线上即可.【详解】因为,点在回归直线上,,所以,故A正确;根据表格中的数据及正相关的定义可知,y与x正相关,选项B正确;回归直线方程的斜率即为该公司平均每年增加研发投入,为40.2万元,故C错误;因为2022年对应的年份编号为7,即x=7,所以预计2022年该公司的研发投入为(万元);故选:D.10.(2022·辽宁大连·高三期末)变量与变量的20对数据记为,其中,根据最小二乘法求得回归直线方程是,变量间的相关系数为,则下列说法中正确的是(
)A.利用回归直线方程计算所得的与实际值必有误差B.回归直线必过点C.若所有的点都在回归直线上,则D.若变量与正相关,则【答案】BCD【解析】【分析】根据已知条件,结合线性回归方程的性质,以及相关性的定义逐一判断即可.【详解】对于A,若所有的样本点都在回归直线上,则与实际值相等,故A错误;对于B,直线必过样本点中心,故B正确;对于C,若所有的点都在回归直线上,则变量间的相关系数为,即,故C正确;对于D,变量与正相关,则,故D正确;故选:BCD11.(2022·湖北江岸·高三期末)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现在统计了该平台从2013年到2022年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2013年作为第一年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是(
)A.销售额y与年份序号x正相关B.销售额y与年份序号x线性关系不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2022年“年货节”期间的销售额约为2680.54亿元【答案】ACD【解析】【分析】根据图象的走势左下到右上可判断A;由相关系数的绝对值越大拟合效果越好可判断B、C;令,代入三次函数求出值即可判断D.【详解】根据图象可知,散点从左下到右上分布,销售额与年份序号呈正相关关系,故A正确;因为相关系数,靠近,销售额与年份序号线性相关显著,B错误.根据三次函数回归曲线的相关指数,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确;由三次多项式函数,当时,亿元,D正确;故选:ACD12.(2022·全国·高三专题练习)有一组样本数据,,…,,由这组样本数据得到的回归直线方程为,则(
)A.若所有样本点都在回归直线上,则样本的相关系数B.若,,则C.若样本数据的残差为,则必有样本数据的残差为D.若越趋近于1,则的预报精度越高【答案】BD【解析】【分析】由回归方程与样本点拟合程度与相关系数的关系判断A;由样本中心在回归方程上判断B;根据残差、相关指数的实际意义判断C、D.【详解】若所有样本点都在回归直线上,当样本数据呈正相关时,相关系数,当样本数据呈负相关时,相关系数,A错误;回归直线必过样本点的中心,其中,,所以,即,B正确;样本数据的残差为,其他样本数据的残差值的大小没必然联系,C错误;越趋近于1,说明回归直线的拟合效果越好,所以的预报精度越高,D正确.故选:BD.三、填空题13.(2022·山东青岛·高三期末)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040506070根据上表可得回归方程,其中,据此估计,当投入10万元广告费时,销售额为_________万元;【答案】85【解析】【分析】根据表中数据求得样本中心,代入回归方程后求得,然后再求当的函数值即可.【详解】由上表可知:.得样本点的中心为,代入回归方程,得.所以回归方程为,将代入可得:.故答案为:8514.(2022·全国·高三专题练习)2022年受疫情影响,国家鼓励员工在工作地过年.某机构统计了某市5个地区的外来务工人员数与他们选择留在当地过年的人数占比,得到如下的表格:A区B区C区D区E区外来务工人员数50004000350030002500留在当地的人数占比80%90%80%80%84%根据这5个地区的数据求得留在当地过年人员数y与外来务工人员数x的线性回归方程为.该市对外来务工人员选择留在当地过年的每人补贴1000元,该市F区有10000名外来务工人员,根据线性回归方程估计F区需要给外来务工人员中留在当地过年的人员的补贴总额为___________万元.(参考数据:取)【答案】【解析】【分析】求出,利用中心点求得,然后令代入可得估计值,求得留在当地过年的人员数可得补贴总额.【详解】由已知,,所以,则,即,时,,估计应补贴(万元).故答案为:.【点睛】关键点点睛:本题考查结尾回归直线方程的应用,线性回归直线的性质:线性回归直线一定过中心点,由此可求得方程中的参数值,得方程,从而用回归方程进行计算估计.15.(2022·全国·高三专题练习)对平面直角坐标系中的两组点,如果存在一条直线使这两组点分别位于该直线的两侧,则称该直线为“分类直线”.对于一条分类直线,记所有的点到的距离的最小值为,约定:越大,分类直线的分类效果越好.某学校高三(2)班的7位同学在2020年期间网购文具的费用(单位:百元)和网购图书的费用(单位:百元)的情况如图所示,现将,,和为第Ⅰ组点.将,和归为第Ⅱ点.在上述约定下,可得这两组点的分类效果最好的分类直线,记为.给出下列四个结论:①直线比直线的分类效果好;②分类直线的斜率为2;③该班另一位同学小明的网购文具与网购图书的费用均为300元,则小明的这两项网购花销的费用所对应的点与第Ⅱ组点位于的同侧;④如果从第Ⅰ组点中去掉点,第Ⅱ组点保持不变,则分类效果最好的分类直线不是.其中所有正确结论的序号是___________.【答案】②③④【解析】【分析】根据分类直线的定义判断.【详解】由图象知:,①当直线为分类直线时,,当直线为分类直线时,所以直线分类效果好,故错误;②由图知定位L的位置由确定,所以直线L过点的外心,设直线方程为则,解得,故正确;③当到L的距离与到L的距离相等时为L的临界值,此时点在L的右侧,故正确;④去掉点后,,解得,故正确;故答案为:②③④【点睛】关键点点睛:本题关键是理解分类直线的定义,如本题L的位置由确定.16.(2022·山东淄博·一模)以模型去拟合一组数据时,设,将其变换后得到线性回归方程,则______.【答案】##【解析】【分析】将回归方程化为,再与模型比较系数,即可得到答案.【详解】由,得,,所以.故答案为:.四、解答题17.(2022·全国·模拟预测)重楼,中药名,具有清热解毒、消肿止痛、凉肝定惊之功效,具有极高的药用价值.近年来,随着重楼的药用潜力被不断开发,野生重楼资源已满足不了市场的需求,巨大的经济价值提升了家种重楼的热度,某机构统计了近几年某地家种重楼年产量y(单位:吨),统计数据如表所示.年份2014201520162017201820192020年份代码x1234567年产量y/吨130180320390460550630(1)根据表中的统计数据,求出y关于x的线性回归方程;(2)根据(1)中所求方程预测2022年该地家种重楼的年产量.附:回归方程,中斜率和截距的最小二乘估计公式分别为,.【答案】(1)(2)805吨【解析】【分析】(1)利用题中的数据及公式可求解;(2)根据(1)中的回归方程代入年份代码即可求解.(1)由表格数据,得,,,,则,所以,所以y关于x的线性回归方程为.(2)由题可知,2022年的年份代码为9,即,将代入回归方程,得,所以预测2022年该地家种重楼的年产量为805吨.18.(2022·全国·高三阶段练习(理))研究显示,越来越多的“996”上班族下班后通过慢跑强身健体,慢跑属于一种有氧运动,可以消耗人体大量热量,坚持慢跑可以促进新陈代谢,增加肺活量以及增强心脏功能,提升人体免疫力,因此深受青年人喜爱.如图统计了小明这100天每天慢跑的时间情况(单位:分钟).(1)求m的值.(2)如表是小明的同事小强本月前7次慢跑的时间情况;由散点图可知,小强的慢跑次数x和慢跑时间y(单位:分钟)之间线性相关,①求y关于x的线性回归方程,其中使用分数形式表示;②根据①中的运算结果预测小强第9次的慢跑时间是否会超过小明这100天慢跑的平均时间.次数x1234567慢胞时间(单位:分钟)15182723202936参考公式:在线性回归方程中,.【答案】(1)m=0.031(2)①,②预测小强第9次的慢跑时间会超过小明这100天慢跑的平均时间【解析】【分析】(1)依据频率之和,即矩形面积之和为1求解m的值;(2)根据公式求解,进而求出线性回归方程,进而求出小强第9次的慢跑时间和这100天慢跑的平均时间,比较出大小.(1)依题意,,解得:m=0.031(2)①依题意,,,,,故所求回归直线方程为;②小明这100天慢跑的平均时间为:;将x=9代入中,得,故可以预测小强第9次的慢跑时间会超过小明这100天慢跑的平均时间.19.(2022·福建福州·高三期末)为让人民享受到更优质的教育服务.我国逐年加大对教育的投入,下图是我国2001年至2019年间每年普通本科招生数y(单位:万人)的条形图.为了预测2022年全国普通本科招生数,建立了y与时间变量t的三个回归模型.其中根据2001年至2019年的数据(时间变量t的值依次为1,2,3,…,19)建立模型①:,相关指数;模型②:,相关系数,相关指数.根据2014年至2019年的数据(时间变量t的值依次为1,2,3,…,6)建立模型③:,相关系数,相关指数.(1)可以根据模型①得到2022年全国普通本科招生数的预测值为671.42万人,请你也分别利用模型②、③,求2022年全国普通本科招生数的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)根据模型②中预测值为511万人;根据模型③中的预测值为万人.(2)模型③得到的预测值更可靠,理由见解析.【解析】【分析】(1)将,分别代入模型中的函数,即可求解;(2)根据已知条件,结合2001年到2019年间全国普通本招生逐年上升,从2001年到2010年间递增幅度较大,从2010年到2019年间递增幅度较小,即可求解.(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论