高三数学一轮复习五层训练(新高考地区)第48练变量间的相关关系(原卷版+解析)_第1页
高三数学一轮复习五层训练(新高考地区)第48练变量间的相关关系(原卷版+解析)_第2页
高三数学一轮复习五层训练(新高考地区)第48练变量间的相关关系(原卷版+解析)_第3页
高三数学一轮复习五层训练(新高考地区)第48练变量间的相关关系(原卷版+解析)_第4页
高三数学一轮复习五层训练(新高考地区)第48练变量间的相关关系(原卷版+解析)_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第48练变量间的相关关系一、课本变式练1.(人A选择性必修三P103习题8.1T1变式)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(

)A. B.C. D.2.(人A选择性必修三P103习题8.1T3变式)若一组观测值,,…,()对应的点位于同一直线上,则x,y的相关系数为______.3.(人A选择性必修三P120练习T2变式)某生物兴趣小组为研究一种红铃虫的产卵数y与温度x(单位:℃)的关系.现收集了7组观测数据得到下面的散点图:由此散点图,在20℃至36℃之间,下面四个回归方程类型中最适宜作为红铃虫产卵数y和温度x的回归方程类型的是(

)A. B. C. D.4.(人A选择性必修三P120习题9.2T4变式)某科技公司研发了一项新产品,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价(千元)和销售量(千件)之间的一组数据如下表所示:月份123456销售单价销售量(1)试根据1至5月份的数据,建立关于的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过千件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程,其中.参考数据:,.二、考点分类练(一)相关性与相关系数5.通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导致了疾病;丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断哪位成员的意见最可能成立(

)A.甲 B.乙 C.丙 D.丁6.某统计部门对四组数据进行统计分析后,获得如图所示的散点图.下面关于相关系数的比较,正确的是()A. B. C. D.7.(多选)(2023届湖湘名校教育联合体高三上学期联考)对两个变量y和x进行回归分析,得到一组样本数据,则下列结论正确的是(

)A.若求得的经验回归方程为,则变量y和x之间具有正的线性相关关系B.若其经验回归方程必过点,则C.若根据这组数据得到样本相关系数,则说明样本数据的线性相关程度较强D.若用相关指数来刻画回归效果,回归模型1的相关指数,回归模型2的相关指数,则模型1的拟合效果更好8.在一组样本数据为,,…,不全相等的散点图中,若所有样本点都在直线上,则这组样本数据的相关系数_______.【答案】【解析】因为,所以这两个变量成负相关,故这组样本数据的相关系数为负值,又所有样本点都在直线上,则,所以.(二)回归直线方程9.2022年6月18日,很多商场都在搞促销活动.重庆市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售价元和销售量件之间的一组数据如下表所示:价格9095100105110销售量1110865用最小二乘法求得关于的经验回归直线是,相关系数,则下列说法不正确的有(

)A.变量与负相关且相关性较强 B.C.当时,的估计值为13 D.相应于点的残差为10.(多选)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个歧义点和后,得到新的回归直线的斜率为3.则下列说法正确的是(

)A.相关变量x,y具有正相关关系B.去除两个歧义点后的回归直线方程为C.去除两个歧义点后,样本(4,8.9)的残差为D.去除两个歧义点后,随x值增加相关变量y值增加速度变小11.若某地的财政收入x与支出y满足线性回归方程(单位:亿元),其中,,.若今年该地区财政收入为10亿元,则年支出预计不会超过________亿元.12.(20-23届河南省湘豫名校联考高三上学期期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,如下图:2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)(1)根据条形统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)参考数据:,.参考公式:相关系数.线性回归方程的斜率,截距.附:相关性弱一般强13.(2023届河南省许昌市高三上学期诊断)随着人民生活水平的日益提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们喜爱.某新能源汽车销售企业在2017年至2021年的销售量(单位:万辆)数据如下表:年份2017年2018年2019年2020年2021年年份代号12345销售量(万辆)75849398100(1)请用相关系数判断关于的线性相关程度(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确到小数点后两位);(2)求出关于的线性回归方程,并预计2022年该新能源汽车企业的销售量为多少万辆?参考数据:,,附:相关系数,回归直线方程的斜率,截距(三)曲线型回归方程14.(2022届河南豫北高中高三毕业班考前定位联合考试)某高科技公司为加强自主研发能力,研发费用逐年增加,统计最近6年的研发费用(单位:元)与年份编号得到样本数据,令,并将绘制成下面的散点图.若用方程对与的关系进行拟合,则(

)A., B.,C., D.,15.以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则______.16.(2022届河北省石家庄市部分学校高三下学期5月模拟)截至2021年12月,中国网民规模达10.32亿人,随之电信网络诈骗犯罪形势也非常严峻.2021年6月,公安部推出国家级反诈防骗“王炸”系统——“国家反诈中心APP”,这是一款能有效预防诈骗、快速举报诈骗内容的软件,用户通过学习里面的防诈骗知识可以有效避免各种网络诈骗的发生,减少不必要的财产损失,某省自“国家反诈中心APP”推出后,持续采取多措并举的推广方式,积极推动全省“国家反诈中心APP”安装注册工作.经统计,省反诈中心发现全省网络诈骗举报件数y(件)与推广时间有关,并记录了经推广x个月后举报件数的数据:推广月数(个)1234567y(件)891888351220200138112(1)现用作为回归方程模型,利用表中数据,求出该回归方程.(2)分析该省一直加大力度推广下去有可能将网络诈骗举报件数降至接近于零吗?参考数据(其中):15860.370.55参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.三、最新模拟练17.(2023届江苏省G4联盟高三上学期12月联考)如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).根据该折线图,下列说法错误的是(

)A.城镇人口与年份呈现正相关 B.乡村人口与年份的相关系数接近C.城镇人口逐年增长率大致相同 D.可预测乡村人口仍呈现下降趋势18.(2023届广东省广州市四校高三上学期第二次模拟)对两个变量和进行回归分析,得到一组样本数据,,…,则下列说法不正确的是(

)A.若变量和之间的相关系数为,则变量和之间具有较强的线性相关关系B.残差平方和越小的模型,拟合的效果越好C.用决定系数来刻画回归效果,越小说明拟合效果越好D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高19.(多选)(2022届湖北省黄冈中学高三下学期二模)已知由样本数据,,2,3,,组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则下列说法正确的是(

)A.相关变量,具有正相关关系B.去除两个样本点和后,回归直线方程为C.去除两个样本点和后,随值增加相关变量值增加速度变小D.去除两个样本点和后,样本的残差为0.120.(2022届山西省怀仁市高三上学期期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:3456234根据表中数据,得出关于的回归直线方程为.据此计算出在样本处的残差为,则表中的值为__________.(注:残差是实际观察值与估计值之间的差,)21.(2022届海南省文昌中学高三4月段考)从某大学中随机选取8名女大学生,其身高x(单位:cm)与体重y(单位:kg)数据如下表:x165165157170175165155170y4857505464614359若已知y与x的线性回归方程为,设残差记为观测值与预测值之间的差(即残差)那么选取的女大学生身高为175cm时,相应的残差为___________.22.(2023届贵州省贵阳市白云区高三上学期质量监测)下面给出了根据我国年—2022年水果人均占有量(单位:kg)和年份代码绘制的散点图和线性回归方程的残差图(2016年—2022年的年份代码分别为1~7).(1)根据散点图分析与之间的相关关系;(2)根据散点图相应数据计算得,,求关于的线性回归方程(数据精确到);(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.附:回归方程中的斜率和截距的最小二乘法估计公式分别为23.(2023届福建省三明市教研联盟校高三上学期期中)中国在第75届联合国大会上承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:性别购买非电动汽车购买电动汽车总计男性39645女性301545总计692190依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关;(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和数学期望.①参考数据:;②参考公式:(i)线性回归方程:,其中;(ii)相关系数:,若,则可判断与线性相关较强.(iii),其中.附表:四、高考真题练24.(2022高考全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i12345678910总和根部横截面积0.040.060.040.080.080.050.050.070.070.060.6材积量0.250.400.220.540.510.340.360.460.420.403.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.25.(2020高考全国乙卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.26.(2016高考全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:,,,.参考公式:相关系数回归方程中斜率和截距最小二乘估计公式分别为:,.五、综合提升练27.已知x与y之间的几组数据如下表:x1234y1mn4参考公式:线性回归方程,其中,;相关系数.上表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为,,,对应的相关系数分别为,,,下列结论中错误的是(

)A.三条回归直线有共同交点 B.相关系数中,最大C. D.28.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年)1234567失效费y(单位:万元)2.903.303.604.404.805.205.90由上表数据可知,y与x的相关系数为______.(精确到0.01,参考公式和数据:,,,)29.(2022届黑龙江省大庆实验中学高三5月模拟)【阅读材料1】我们在研究两个变量之间的相关关系时,往往先选取若干个样本点(),(),……,(),将样本点画在平面直角坐标系内,就得到样本的散点图.观察散点图,如果所有样本点都落在某一条直线附近,变量之间就具有线性相关关系,如果所有的样本点都落在某一非线性函数图象附近,变量之间就有非线性相关关系.在统计学中经常选择线性或非线性(函数)回归模型来刻画相关关系,并且可以用适当的方法求出回归模型的方程,还常用相关指数R2来刻画回归的效果,相关指数R2的计算公式为:当R2越大时,回归方程的拟合效果越好;当R2越小时,回归方程的拟合效果越差,R2是常用的选择模型的指标之一,在实际应用中应该尽量选择R2较大的回归模型.【阅读材料2】2021年6月17日9时22分,我国酒泉卫星发射中心用长征二号F遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪胺3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛,该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造,根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1522274048546068.56867.56665当0<x≤13时,建立了与的两个回归模型:模型①:;模型②:;当x>13时,确定y与x满足的线性回归直线方程为.根据以上阅读材料,解答以下问题:(1)根据下列表格中的数据,比较当0<x≤13时模型①,②的相关指数R2的大小,并选择拟合效果更好的模型.回归模型模型①模型②回归方程79.1320.2(2)当应用改造的投入为20亿元时,以回归直线方程为预测依据,计算公司的收益约为多少.附:①若最小二乘法求得回归直线方程为,则;②③,当时,.30.(2023届河北省沧州市海兴县高三上学期12月调研)某统计部门依据《中国统计年鉴——2017》提供的数据,对我国1997-2016年的国内生产总值(GDP)进行统计研究,作出了两张散点图:图1表示1997-2016年我国的国内生产总值(GDP),图2表示2007-2016年我国的国内生产总值(GDP).(1)用表示第i张图中的年份与GDP的线性相关系数,,依据散点图的特征分别写出的结果;(2)分别用线性回归模型和指数回归模型对两张散点图进行回归拟合,分别计算出统计数据——相关指数的数值,部分结果如下表所示:年份1997-20162007-2016线性回归模型0.9306指数回归模型0.98990.978①将上表中的数据补充完整(结果保留3位小数,直接写在答题卡上);②若估计2017年的GDP,结合数据说明采用哪张图中的哪种回归模型会更精准一些?若按此回归模型来估计,2020年的GDP能否突破100万亿元?事实上,2020年的GDP刚好突破了100万亿元,估计与事实是否吻合?结合散点图解释说明.第48练变量间的相关关系一、课本变式练1.(人A选择性必修三P103习题8.1T1变式)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(

)A. B.C. D.【答案】A【解析】由题中的散点图可以看出,图1和图3是正相关,相关系数大于0,则,,图2和图4是负相关,相关系数小于0,则,,图3和图4的点相对于图1和图2更加集中,所以相关性较强,所以更接近于1,更接近于,由此可得.故选A.2.(人A选择性必修三P103习题8.1T3变式)若一组观测值,,…,()对应的点位于同一直线上,则x,y的相关系数为______.【答案】【解析】由已知条件和相关系数的定义得,x,y的相关系数为.3.(人A选择性必修三P120练习T2变式)某生物兴趣小组为研究一种红铃虫的产卵数y与温度x(单位:℃)的关系.现收集了7组观测数据得到下面的散点图:由此散点图,在20℃至36℃之间,下面四个回归方程类型中最适宜作为红铃虫产卵数y和温度x的回归方程类型的是(

)A. B. C. D.【答案】C【解析】由散点图可以看出红铃虫产卵数y随着温度x的增长速度越来越快,所以最适宜作为红铃虫产卵数y和温度x的回归方程类型.故选C4.(人A选择性必修三P120习题9.2T4变式)某科技公司研发了一项新产品,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价(千元)和销售量(千件)之间的一组数据如下表所示:月份123456销售单价销售量(1)试根据1至5月份的数据,建立关于的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过千件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程,其中.参考数据:,.【解析】(1)因为,,所以,得,于是关于的回归直线方程为;(2)当时,,则,故可以认为所得到的回归直线方程是理想的.二、考点分类练(一)相关性与相关系数5.通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导致了疾病;丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断哪位成员的意见最可能成立(

)A.甲 B.乙 C.丙 D.丁【答案】D【详解】当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,但相关关系是一种非确定性关系,相关关系不等于因果关系,丁的意见最可能成立.故选D.6.某统计部门对四组数据进行统计分析后,获得如图所示的散点图.下面关于相关系数的比较,正确的是()A. B. C. D.【答案】C【解析】由图可知:所对应的图中的散点呈现正相关,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,故选C7.(多选)(2023届湖湘名校教育联合体高三上学期联考)对两个变量y和x进行回归分析,得到一组样本数据,则下列结论正确的是(

)A.若求得的经验回归方程为,则变量y和x之间具有正的线性相关关系B.若其经验回归方程必过点,则C.若根据这组数据得到样本相关系数,则说明样本数据的线性相关程度较强D.若用相关指数来刻画回归效果,回归模型1的相关指数,回归模型2的相关指数,则模型1的拟合效果更好【答案】AC【解析】在经验回归方程中,则y与x之间具有正的线性相关关系.故A正确;在经验回归方程中恒过样本中心,则,故,故B错误;,则样本数据的线性相关程度越强.故C正确;相关系数越大,模型拟合效果越好,故D错误.故选AC.8.在一组样本数据为,,…,不全相等的散点图中,若所有样本点都在直线上,则这组样本数据的相关系数_______.【答案】【解析】因为,所以这两个变量成负相关,故这组样本数据的相关系数为负值,又所有样本点都在直线上,则,所以.(二)回归直线方程9.2022年6月18日,很多商场都在搞促销活动.重庆市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售价元和销售量件之间的一组数据如下表所示:价格9095100105110销售量1110865用最小二乘法求得关于的经验回归直线是,相关系数,则下列说法不正确的有(

)A.变量与负相关且相关性较强 B.C.当时,的估计值为13 D.相应于点的残差为【答案】C【解析】对于A,由回归直线可得变量线性负相关,且由相关系数,可知相关性强,故A正确,对于B,由表中数据可得,﹐,故回归直线恒过点,故,解得,故B正确,对于C,当时,,故C错误,对于D,相应于点的残差为,故D正确.故选C.10.(多选)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个歧义点和后,得到新的回归直线的斜率为3.则下列说法正确的是(

)A.相关变量x,y具有正相关关系B.去除两个歧义点后的回归直线方程为C.去除两个歧义点后,样本(4,8.9)的残差为D.去除两个歧义点后,随x值增加相关变量y值增加速度变小【答案】ABC【解析】对A,因为回归直线的斜率大于0,即相关变量x,y具有正相关关系,故A正确;对B,将代入得,则去掉两个歧义点后,得到新的相关变量的平均值分别为,,此时的回归直线方程为,故B正确;对C,x=4时,,残差为8.9-9=-0.1,故C正确;对D,斜率3>1,此时随x值增加相关变量y值增加速度变大,D错误.故选ABC.11.若某地的财政收入x与支出y满足线性回归方程(单位:亿元),其中,,.若今年该地区财政收入为10亿元,则年支出预计不会超过________亿元.【答案】10【解析】由题意得财政收入x与支出y满足线性回归方程为,其中,当时,,因为,所以,所以今年该地区财政收入为10亿元,则年支出预计不会超过10亿元12.(20-23届河南省湘豫名校联考高三上学期期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,如下图:2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)(1)根据条形统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)参考数据:,.参考公式:相关系数.线性回归方程的斜率,截距.附:相关性弱一般强【解析】(1)由条形统计图,得,,所以,.所以.因为相关系数,所以与具有很强的线性相关关系,且为正相关.(2),所以,所以.由题意知,2023年对应的年份代码,当时,,故预测2023年该公司的研发人数约为613人.13.(2023届河南省许昌市高三上学期诊断)随着人民生活水平的日益提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们喜爱.某新能源汽车销售企业在2017年至2021年的销售量(单位:万辆)数据如下表:年份2017年2018年2019年2020年2021年年份代号12345销售量(万辆)75849398100(1)请用相关系数判断关于的线性相关程度(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确到小数点后两位);(2)求出关于的线性回归方程,并预计2022年该新能源汽车企业的销售量为多少万辆?参考数据:,,附:相关系数,回归直线方程的斜率,截距【解析】(1)解:由表中数据可得,,∴,又,,∴,所以与有很强的线性相关性;(2)解:由表中数据可得,则,∴,又2022年对应的代号为6,故,由此预计2022年该新能源汽车企业的销售量为109.2万辆.(三)曲线型回归方程14.(2022届河南豫北高中高三毕业班考前定位联合考试)某高科技公司为加强自主研发能力,研发费用逐年增加,统计最近6年的研发费用(单位:元)与年份编号得到样本数据,令,并将绘制成下面的散点图.若用方程对与的关系进行拟合,则(

)A., B.,C., D.,【答案】A【解析】因为,令,则与的回归方程为.根据散点图可知与正相关,所以.从回归直线图象,可知回归直线的纵截距大于0,即,所以.故选A15.以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则______.【答案】【解析】,即,∴,.16.(2022届河北省石家庄市部分学校高三下学期5月模拟)截至2021年12月,中国网民规模达10.32亿人,随之电信网络诈骗犯罪形势也非常严峻.2021年6月,公安部推出国家级反诈防骗“王炸”系统——“国家反诈中心APP”,这是一款能有效预防诈骗、快速举报诈骗内容的软件,用户通过学习里面的防诈骗知识可以有效避免各种网络诈骗的发生,减少不必要的财产损失,某省自“国家反诈中心APP”推出后,持续采取多措并举的推广方式,积极推动全省“国家反诈中心APP”安装注册工作.经统计,省反诈中心发现全省网络诈骗举报件数y(件)与推广时间有关,并记录了经推广x个月后举报件数的数据:推广月数(个)1234567y(件)891888351220200138112(1)现用作为回归方程模型,利用表中数据,求出该回归方程.(2)分析该省一直加大力度推广下去有可能将网络诈骗举报件数降至接近于零吗?参考数据(其中):15860.370.55参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.【解析】(1)由题意.

令,设y关于t的线性回归方程为直线则

则,

∴,又,∴y关于x的回归方程为.(2)仅从现有统计数据所得回归方程,可发现当推广时间越来越长时,即x越来越大时,y的值会逐渐降至接近于30,可知该省一直加大力度推广下去,网络诈骗举报件数大概会逐渐降至30件.

但在使用经验回归方程进行预测时,方程只适用于所研究的样本总体,一般具有时效性,不能期望回归方程得到的预报值就是响应变量的精确值,所以若加大力度一直推广下去,并随着国家对网络诈骗的严厉打击和科技发展,再加上相关部门对个人信息防护手段的加强,人们对网络诈骗犯罪的防范意识逐步提高,网络诈骗举报件数是有可能降至接近于零的.三、最新模拟练17.(2023届江苏省G4联盟高三上学期12月联考)如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).根据该折线图,下列说法错误的是(

)A.城镇人口与年份呈现正相关 B.乡村人口与年份的相关系数接近C.城镇人口逐年增长率大致相同 D.可预测乡村人口仍呈现下降趋势【解析】对于A选项,由折线图可知,城镇人口与年份呈现正相关,A对;对于B选项,因为乡村人口与年份呈负线性相关关系,且线性相关性很强,所以接近,B错;对于C选项,城镇人口与年份呈现正相关,且线性相关性很强,相关系数接近,故城镇人口逐年增长率大致相同,C对;对于D选项,由折线图可知,乡村人口与年份呈负线性相关关系,可预测乡村人口仍呈现下降趋势,D对.故选B.18.(2023届广东省广州市四校高三上学期第二次模拟)对两个变量和进行回归分析,得到一组样本数据,,…,则下列说法不正确的是(

)A.若变量和之间的相关系数为,则变量和之间具有较强的线性相关关系B.残差平方和越小的模型,拟合的效果越好C.用决定系数来刻画回归效果,越小说明拟合效果越好D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高【答案】C【解析】变量和之间的相关系数为越大,则变量和之间具有较强的线性相关关系,故A正确;残差平方和越小的模型,拟合的效果越好,故B正确;用决定系数来刻画回归效果,越大说明拟合效果越好,故C错误;在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,故D正确.故选C.19.(多选)(2022届湖北省黄冈中学高三下学期二模)已知由样本数据,,2,3,,组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则下列说法正确的是(

)A.相关变量,具有正相关关系B.去除两个样本点和后,回归直线方程为C.去除两个样本点和后,随值增加相关变量值增加速度变小D.去除两个样本点和后,样本的残差为0.1【答案】AB【解析】对于A,,则相关变量,具有正相关关系,故A正确;对于B,求出,故去除样本点后的回归直线方程为,故B正确;对于C,由于斜率为,随值增加相关变量值增加速度变大,故C错误;对于D,样本的残差为,故D错误.20.(2022届山西省怀仁市高三上学期期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:3456234根据表中数据,得出关于的回归直线方程为.据此计算出在样本处的残差为,则表中的值为__________.(注:残差是实际观察值与估计值之间的差,)【答案】【解析】根据样本处的残差为,即,可得,即回归直线方程为,又由样本数据的平均数为,得,解得.21.(2022届海南省文昌中学高三4月段考)从某大学中随机选取8名女大学生,其身高x(单位:cm)与体重y(单位:kg)数据如下表:x165165157170175165155170y4857505464614359若已知y与x的线性回归方程为,设残差记为观测值与预测值之间的差(即残差)那么选取的女大学生身高为175cm时,相应的残差为___________.【答案】4【解析】已知y与x的线性同归方程为当时:,相应的残差为:22.(2023届贵州省贵阳市白云区高三上学期质量监测)下面给出了根据我国年—2022年水果人均占有量(单位:kg)和年份代码绘制的散点图和线性回归方程的残差图(2016年—2022年的年份代码分别为1~7).(1)根据散点图分析与之间的相关关系;(2)根据散点图相应数据计算得,,求关于的线性回归方程(数据精确到);(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.附:回归方程中的斜率和截距的最小二乘法估计公式分别为【解析】(1)根据散点图可知,散点均匀的分布在一条直线附近,且随着的增大,增大,故与成线性相关,且为正相关;(2)解:依题意,,,,,,所以关于的线性回归方程为:;(3)解:由残差图可以看出,残差对应点分布在水平带状区域内,且宽度较窄,说明拟合效果较好,回归方程的预报精度较高.23.(2023届福建省三明市教研联盟校高三上学期期中)中国在第75届联合国大会上承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:性别购买非电动汽车购买电动汽车总计男性39645女性301545总计692190依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关;(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和数学期望.①参考数据:;②参考公式:(i)线性回归方程:,其中;(ii)相关系数:,若,则可判断与线性相关较强.(iii),其中.附表:【解析】(1)相关系数为故与线性相关较强.(2)零假设为:购买电动汽车与车主性别相互独立,即购买电动汽车与车主性别无关.所以依据小概率值的独立性检验,我们推断不成立,即认为购买电动汽车与车主性别有关,此推断犯错误的概率不大于.(3)抽样比,男性车主选取2人,女性车主选取5人,则的可能取值为故,,故的分布列为:012四、高考真题练24.(2022高考全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i12345678910总和根部横截面积0.040.060.040.080.080.050.050.070.070.060.6材积量0.250.400.220.540.510.340.360.460.420.403.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.【解析】(1)样本中10棵这种树木的根部横截面积的平均值样本中10棵这种树木的材积量的平均值据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为(2)由表中的数据和附注中的参考数据得,,,=0.2474=0.0134,所以相关系数r≈≈0.97.(3)树木的材积量与其根部横截面积近似成正比,比例系数,所以该林区这种树木的总材积量的估计值为().25.(2020高考全国乙卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.【解析】(1)样区野生动物平均数为,地块数为200,该地区这种野生动物的估计值为(2)样本(i=1,2,…,20)的相关系数为(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.26.(2016高考全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:,,,.参考公式:相关系数回归方程中斜率和截距最小二乘估计公式分别为:,.【解析】(Ⅰ)由折线图中数据和附注中参考数据得,,,,.因为与的相关系数近似为0.99,说明与的线性相关程度相当高从而可以用线性回归模型拟合与的关系.(Ⅱ)由及(Ⅰ)得,.所以,关于的回归方程为:.将2016年对应的代入回归方程得:.所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.五、综合提升练27.已知x与y之间的几组数据如下表:x1234y1mn4参考公式:线性回归方程,其中,;相关系数.上表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为,,,对应的相关系数分别为,,,下列结论中错误的是(

)A.三条回归直线有共同交点 B.相关系数中,最大C. D.【答案】D【解析】由题意,,即.若,则,此时,.,,.则,,;若,则,此时,.,,.,,;若,则,此时,.,,,.由样本点的中心相同,故A正确;由以上计算可得,相关系数中,最大,,,故B,C正确,D错误.故选D.28.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年)1234567失效费y(单位:万元)2.903.303.604.404.805.205.90由上表数据可知,y与x的相关系数为______.(精确到0.01

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论