版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第27讲统计案例和回归方程【知识点总结】一、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程SKIPIF1<0的求法为SKIPIF1<0其中,SKIPIF1<0,SKIPIF1<0,(SKIPIF1<0,SKIPIF1<0)称为样本点的中心。步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k>0,称两个变量正相关;k<0,称两个变量负相关。二、独立性独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。步骤为列出22列联表(如表13-8所示),求出SKIPIF1<0,并判断:A1A2合计B1aca+cB2bdb+d合计a+bc+dn=a+b+c+d若K2>10.828,有99.9%把握称“A取A1或A2”对“B取B1,B2”有关系;若10.828K2>6.635,有99%把握称“A取A1或A2”对“B取B1,B2”有关系;若6.635K2>3.841,有95%把握称“A取A1或A2”对“B取B1,B2”有关系;若K23.841,没有把握称A与B相关。【典型例题】例1.(2022·全国·高三专题练习(文))在对两个变量x,y进行回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()A.①②④③ B.③②④① C.②③①④ D.②④③①【答案】D【详解】根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求回归方程,最后对所求的回归方程作出解释.故选:D例2.(2022·全国·高三专题练习)对于数据组SKIPIF1<0,如果由线性回归方程得到的对应于自变量SKIPIF1<0的估计值是SKIPIF1<0,那么将SKIPIF1<0称为相应于点SKIPIF1<0的残差.某工厂为研究某种产品产量SKIPIF1<0(吨)与所需某种原材料SKIPIF1<0吨)的相关性,在生产过程中收集4组对应数据SKIPIF1<0如下表所示:SKIPIF1<03456SKIPIF1<02.534SKIPIF1<0根据表中数据,得出SKIPIF1<0关于SKIPIF1<0的线性回归方程为SKIPIF1<0,据此计算出样本点处的残差为-0.15,则表中SKIPIF1<0的值为()A.3.3 B.4.5 C.5 D.5.5【答案】B【详解】由题意可知,在样本(4,3)处的残差-0.15,则SKIPIF1<0,即SKIPIF1<0,解得SKIPIF1<0,即SKIPIF1<0,又SKIPIF1<0,且线性方程过样本中心点(SKIPIF1<0,SKIPIF1<0),则SKIPIF1<0,则SKIPIF1<0,解得SKIPIF1<0.故答案为:B【点睛】理解残差的定义,实际值减去估计值;线性方程过样本中心(SKIPIF1<0,SKIPIF1<0);要求对基本知识点比较熟练,计算才准确.例3.(2022·全国·高三专题练习)据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm,其余均在50mmm以上,局地超过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为SKIPIF1<0.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数SKIPIF1<0(SKIPIF1<0,且SKIPIF1<0)表示是否下雨:当SKIPIF1<0时表示该地区下雨,当SKIPIF1<0时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下:332714740945593468491272073445992772951431169332435027898719(1)求出k的值,使得该地区每一天下雨的概率均为SKIPIF1<0;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2016年到2020年该地区端午节当天降雨量(单位:mm)如表:时间2016年2017年2018年2019年2020年年份SKIPIF1<012345降雨量SKIPIF1<02827252322经研究表明:从2016年到2020年,该地区端午节有降雨的年份的降雨量SKIPIF1<0与年份SKIPIF1<0具有线性相关关系,求回归直线方程SKIPIF1<0.并预测该地区2022年端午节有降雨的话,降雨量约为多少?参考公式:SKIPIF1<0,SKIPIF1<0.【详解】(1)由题意可知,SKIPIF1<0,解得SKIPIF1<0,即SKIPIF1<0表示下雨,SKIPIF1<0表示不下雨.所给的20组数据中SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,共SKIPIF1<0组表示SKIPIF1<0天中恰好有SKIPIF1<0天下雨,故所求的概率为SKIPIF1<0.(2)由题中所给的数据可得SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,所以回归方程为SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0.所以该地区SKIPIF1<0年端午节有降雨的话,降雨量约为SKIPIF1<0SKIPIF1<0.例4.(2022·全国·高三专题练习(理))某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本SKIPIF1<0(元)与生产该产品的数量SKIPIF1<0(千件)有关,经统计得到如下数据:SKIPIF1<012345678SKIPIF1<011261SKIPIF1<035SKIPIF1<0282524根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型SKIPIF1<0和指数函数模型SKIPIF1<0分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为SKIPIF1<0与SKIPIF1<0的相关系数SKIPIF1<0.(1)用反比例函数模型求SKIPIF1<0关于SKIPIF1<0的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到SKIPIF1<0,并用其估计产量为10千件时每件产品的非原料成本.参考数据:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0360SKIPIF1<0SKIPIF1<0SKIPIF1<0参考公式:对于一组数据SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小一乘估计分别为:SKIPIF1<0,SKIPIF1<0,相关系数SKIPIF1<0【解析】(1)令SKIPIF1<0,则SKIPIF1<0可转化为SKIPIF1<0.因为SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,得SKIPIF1<0,即SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0.(2)由定义知SKIPIF1<0与SKIPIF1<0的相关系数为:SKIPIF1<0,则SKIPIF1<0,所以用反比例函数模型拟合效果更好.当SKIPIF1<0时,SKIPIF1<0(元),则当产量为10千件时,每件产品的非原料成本为21元.例5.(2022·全国·高三专题练习)如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择SKIPIF1<0和SKIPIF1<0两个模型进行拟合,经过数据处理得到两个回归方程分别为SKIPIF1<0和SKIPIF1<0,并得到以下一些统计量的值:SKIPIF1<0SKIPIF1<0残差平方和SKIPIF1<0SKIPIF1<0SKIPIF1<0总偏差平方和SKIPIF1<0SKIPIF1<0(1)请利用相关指数SKIPIF1<0判断哪个模型的拟合效果更好;(2)估计该小区2021年6月份的二手房均价.(精确到SKIPIF1<0万元/平方米)参考数据:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.参考公式:相关指数SKIPIF1<0.【详解】(1)设模型SKIPIF1<0和SKIPIF1<0的相关指数分别为SKIPIF1<0和SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0.因为SKIPIF1<0,所以SKIPIF1<0.所以模型SKIPIF1<0的拟合效果更好.(2)由(1)知,模型SKIPIF1<0的拟合效果更好,利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:SKIPIF1<0SKIPIF1<0SKIPIF1<0(万元/平方米).例6.(2022·全国·高三专题练习)近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:现根据散点图利用SKIPIF1<0或SKIPIF1<0建立y关于x的回归方程,令SKIPIF1<0,SKIPIF1<0得到如下数据:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<010.15109.943.040.16SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<013.94-2.111.670.2121.22且(SKIPIF1<0,SKIPIF1<0)与(SKIPIF1<0,SKIPIF1<0)(i=1,2,3,…,13)的相关系数分别为SKIPIF1<0,SKIPIF1<0,且SKIPIF1<0=﹣0.9953.(1)用相关系数说明哪种模型建立y与x的回归方程更合适;(2)根据(1)的结果及表中数据,建立SKIPIF1<0关于x的回归方程;(3)已知蕲艾的利润z与x、y的关系为SKIPIF1<0,当x为何值时,z的预报值最大.参考数据和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,SKIPIF1<0=15.7365,对于一组数据(SKIPIF1<0,SKIPIF1<0)(i=1,2,3,…,n),其回归直线方程SKIPIF1<0的斜率和截距的最小二乘法估计分别为SKIPIF1<0,SKIPIF1<0,相关系数SKIPIF1<0.【详解】(1)由题意知SKIPIF1<0,SKIPIF1<0,因为SKIPIF1<0,所有用SKIPIF1<0模型建立SKIPIF1<0与SKIPIF1<0的回归方程更合适.(2)因为SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0(3)由题意知SKIPIF1<0SKIPIF1<0SKIPIF1<0,所以SKIPIF1<0,当且仅当SKIPIF1<0时等号成立,所以当温度为20时这种草药的利润最大.例7.(2022·河北张家口·高三期末)已知某区SKIPIF1<0、SKIPIF1<0两所初级中学的初一年级在校学生人数之比为SKIPIF1<0,该区教育局为了解双减政策的落实情况,用分层抽样的方法在SKIPIF1<0、SKIPIF1<0两校初一年级在校学生中共抽取了SKIPIF1<0名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:(1)在抽取的SKIPIF1<0名学生中,SKIPIF1<0、SKIPIF1<0两所学校各抽取的人数是多少?(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做作业时长超过SKIPIF1<0小时的学生比例,请根据频率分布直方图,估计这两个数值;(3)另据调查,这SKIPIF1<0人中做作业时间超过SKIPIF1<0小时的人中的SKIPIF1<0人来自SKIPIF1<0中学,根据已知条件填写下面列联表,并根据列联表判断是否有SKIPIF1<0的把握认为“做作业时间超过SKIPIF1<0小时”与“学校”有关?做作业时间超过SKIPIF1<0小时做作业时间不超过SKIPIF1<0小时合计SKIPIF1<0校SKIPIF1<0校合计附表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0附:SKIPIF1<0.【解析】(1)解:设SKIPIF1<0、SKIPIF1<0两校所抽取人数分别为SKIPIF1<0、SKIPIF1<0,由已知可得SKIPIF1<0,解得SKIPIF1<0.(2)解:由直方图可知,学生做作业的平均时长的估计值为SKIPIF1<0(小时).由SKIPIF1<0,可知有SKIPIF1<0的学生做作业时长超过SKIPIF1<0小时.综上,估计该区学生做作业时间的平均时长为SKIPIF1<0小时,该区有SKIPIF1<0的学生做作业时长超过3小时.(3)解:由(2)可知,有SKIPIF1<0(人)做作业时间超过3小时.故填表如下(单位:人):做作业时间超过SKIPIF1<0小时做作业时间不超过SKIPIF1<0小时合计SKIPIF1<0校SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0校SKIPIF1<0SKIPIF1<0SKIPIF1<0合计SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0,所以有SKIPIF1<0的把握认为“做作业时间超过SKIPIF1<0小时”与“学校”有关.【技能提升训练】一、单选题1.(2022·全国·高三专题练习)某工厂的每月各项开支SKIPIF1<0与毛利润SKIPIF1<0(单位:万元)之间有如下关系,SKIPIF1<0与SKIPIF1<0的线性回归方程SKIPIF1<0,则SKIPIF1<0()SKIPIF1<024568SKIPIF1<03040605070A.17.5 B.17 C.15 D.15.5【答案】A【分析】根据表中的数据,求得样本中心为SKIPIF1<0,代入回归方程为SKIPIF1<0,即可求解.【详解】由题意,根据表中的数据,可得SKIPIF1<0,SKIPIF1<0,即样本中心为SKIPIF1<0,代入SKIPIF1<0与SKIPIF1<0的线性回归方程为SKIPIF1<0,解得SKIPIF1<0.故选:A.【点睛】本题主要考查了回归直线方程的应用,其中解答中熟记回归直线的方程必过样本中心这一基本特征是解答的关键,着重考查了计算能力.2.(2021·重庆南开中学高三阶段练习)对两个变量y和x进行回归分析,得到一组样本数据:SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,则下列说法中不正确的是()A.由样本数据得到的回归方程SKIPIF1<0必过样本中心SKIPIF1<0B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系【答案】C【分析】理解回归分析中样本中心、残差、相关指数R2、相关系数的含义,即可判断各选项的正误.【详解】A:样本中心点在回归直线上,正确;B:残差平方和越小的模型,拟合效果越好,正确,C:R2越大拟合效果越好,不正确,D:当SKIPIF1<0的值大于0.8时,表示两个变量具有高度线性相关关系,正确.故选:C.3.(2021·黑龙江·漠河市高级中学高三阶段练习(文))某单位为了了解办公楼用电量SKIPIF1<0(度)与气温SKIPIF1<0(℃)之间的关系,随机统计了四个工作量与当天平均气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得到线性回归方程SKIPIF1<0,当气温为SKIPIF1<0℃时,预测用电量均为A.68度 B.52度 C.12度 D.28度【答案】A【详解】由表格可知SKIPIF1<0,SKIPIF1<0,根据回归直线方程必过SKIPIF1<0得SKIPIF1<0,因此当SKIPIF1<0时,SKIPIF1<0,故选择A.4.(2022·全国·高三专题练习)关于线性回归的描述,有下列命题:①回归直线一定经过样本中心点;②相关系数SKIPIF1<0的绝对值越大,拟合效果越好;③相关指数SKIPIF1<0越接近1拟合效果越好;④残差平方和越小,拟合效果越好.其中正确的命题个数为()A.1 B.2 C.3 D.4【答案】C【分析】根据回归直线方程的性质,相关系数、相关系数及残差平方和的意义判断各项的正误即可.【详解】对于①,回归直线一定经过样本中心点,故正确;对于②,相关系数SKIPIF1<0的绝对值越接近于1,相关性越强,故错误;对于③,相关指数SKIPIF1<0越接近1拟合效果越好,故正确;对于④,残差平方和越小,拟合效果越好,故正确.故选:C.5.(2022·全国·高三专题练习)下列表述中,正确的个数是()①将一组数据中的每一个数据都加上同一个常数后,方差不变;②设有一个回归方程SKIPIF1<0,变量SKIPIF1<0增加1个单位时,SKIPIF1<0平均增加5个单位;③设具有相关关系的两个变量SKIPIF1<0,SKIPIF1<0的相关系数为SKIPIF1<0,那么SKIPIF1<0越接近于0,SKIPIF1<0,SKIPIF1<0之间的线性相关程度越高;④在一个SKIPIF1<0列联表中,根据表中数据计算得到SKIPIF1<0的观测值SKIPIF1<0,若SKIPIF1<0的值越大,则认为两个变量间有关的把握就越大.A.0 B.1 C.2 D.3【答案】C【分析】①根据方差的性质即可判断,②由回归方程一次项的系数符号可知增减情况,③根据相关系数的含义判断正误,④根据卡方检验的观测值的意义判断正误.【详解】①将一组数据中的每一个数据都加上同一个常数SKIPIF1<0后SKIPIF1<0,方差不变,正确;②设有一个回归方程SKIPIF1<0,变量SKIPIF1<0增加1个单位时,SKIPIF1<0平均减少5个单位,错误;③设具有相关关系的两个变量SKIPIF1<0,SKIPIF1<0的相关系数为SKIPIF1<0,那么SKIPIF1<0越接近于1,SKIPIF1<0,SKIPIF1<0之间的线性相关程度越高,错误;④在一个SKIPIF1<0列联表中,根据表中数据计算得到SKIPIF1<0的观测值SKIPIF1<0,若SKIPIF1<0的值越大,两个变量有关系的出错概率越小,则认为两个变量间有关的把握就越大,正确.故选:C6.(2022·全国·高三专题练习(文))对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是()A.0.2 B.0.8 C.-0.98 D.-0.7【答案】C【分析】由相关系数的绝对值越大,越具有强大相关性,即可求解【详解】∵相关系数的绝对值越大,越具有强大相关性,C相关系数的绝对值最大约接近1,∴C拟合程度越好.故选:C7.(2022·全国·高三专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<0【答案】A【分析】由给出的四组数据的散点图,结合相关系数的概念,逐图判定,即可求解.【详解】由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以SKIPIF1<0接近于1,SKIPIF1<0接近于SKIPIF1<0,由此可得SKIPIF1<0.故选:A.8.(2022·全国·高三专题练习(理))如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线上,则下列说法错误的是()A.解释变量和预报变量是一次函数关系 B.相关系数SKIPIF1<0C.相关指数SKIPIF1<0 D.残差平方和为0【答案】B【分析】根据相关指数和残差的定义逐一判断即可.【详解】散点图中所有的样本点都落在一条斜率为非0实数的直线上,所以解释变量和预报变量是一次函数关系,且残差平方和为0,因此选项AD正确;由题意可知,SKIPIF1<0,若直线的斜率为正,则SKIPIF1<0,若直线的斜率为负,则SKIPIF1<0.故选:B.9.(2022·全国·高三专题练习(理))对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()
A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<0【答案】A【分析】根据题中给出的散点图,先判断是正相关还是负相关,然后根据散点图的集中程度分析相关系数的大小【详解】解:由图可知,图2和图3是正相关,图1和图4是负相关,囷1和图2的点相对更加集中,所以相关性更强,所以SKIPIF1<0接近于SKIPIF1<0,SKIPIF1<0接近1,所以SKIPIF1<0,故选:A10.(2022·全国·高三专题练习(理))变量x,y的线性相关系数为SKIPIF1<0,变量m,n的线性相关系数为SKIPIF1<0,下列说法错误的是()A.若SKIPIF1<0,则说明变量x,y之间线性相关性强B.若SKIPIF1<0,则说明变量x,y之间的线性相关性比变量m,n之间的线性相关性强C.若SKIPIF1<0,则说明变量x,y之间的相关性为正相关D.若SKIPIF1<0,则说明变量x,y之间线性不相关【答案】B【分析】根据相关系数的意义逐项分析判断即可.【详解】A:因为SKIPIF1<0接近于1,所以说明变量x,y之间线性相关性强,故A正确;B:若SKIPIF1<0,满足SKIPIF1<0,但是不能说明变量x,y之间的线性相关性比变量m,n之间的线性相关性强,故B错误;C:若SKIPIF1<0,则说明变量x,y之间的相关性为正相关,故C正确;D:SKIPIF1<0,则说明变量x,y之间线性不相关,故D正确.故选:B.11.(2022·全国·高三专题练习(文))已知相关变量SKIPIF1<0和SKIPIF1<0的散点图如图所示,若用SKIPIF1<0与SKIPIF1<0拟合时的相关系数分别为SKIPIF1<0则比较SKIPIF1<0的大小结果为()A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.不确定【答案】C【分析】由散点图可知,对数形式的拟合程度高,再根据负相关,比较两个相关系数大小.【详解】由散点图可知,SKIPIF1<0拟合比用SKIPIF1<0拟合的程度高,故SKIPIF1<0;又因为此关系为负相关,SKIPIF1<0故选:C12.(2022·全国·高三专题练习(文))在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=SKIPIF1<0x+1上,则这组样本数据的样本相关系数为()A.-1 B.0 C.SKIPIF1<0 D.1【答案】D【分析】所有样本点(xi,yi)(i=1,2,…,n)都在直线SKIPIF1<0上,故这组样本数据完全正相关,故其相关系数为1.【详解】由题设知,所有样本点(xi,yi)(i=1,2,…,n)都在直线SKIPIF1<0上,∴这组样本数据完全正相关,故其相关系数为1,故选D.根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.13.(2022·全国·高三专题练习)如图,5个SKIPIF1<0数据,去掉SKIPIF1<0后,下列说法错误的是()A.相关系数r变大 B.残差平方和变大C.R2变大 D.解释变量x与预报变量y的相关性变强【答案】B【分析】根据图中的点,计算去掉SKIPIF1<0前后的相关系数、残差平方和、SKIPIF1<0,即可判断各选项的正误.【详解】由图,SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,∴相关系数SKIPIF1<0.令回归方程SKIPIF1<0,则SKIPIF1<0,∴SKIPIF1<0,即回归方程为SKIPIF1<0,可得SKIPIF1<0为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,∴残差平方和SKIPIF1<0,故SKIPIF1<0,去掉SKIPIF1<0后,SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,∴相关系数SKIPIF1<0.∴SKIPIF1<0,A、D正确;令回归方程SKIPIF1<0,则SKIPIF1<0,∴SKIPIF1<0,即回归方程为SKIPIF1<0,可得SKIPIF1<0为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,∴残差平方和SKIPIF1<0,故SKIPIF1<0,∴SKIPIF1<0,B错误,C正确;故选:B14.(2022·全国·高三专题练习)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第SKIPIF1<0天12345使用人数(SKIPIF1<0)151734578421333由表中数据可得y关于x的回归方程为SKIPIF1<0,则据此回归模型相应于点(2,173)的残差为()A.SKIPIF1<0 B.SKIPIF1<0 C.3 D.2【答案】B【分析】先计算出SKIPIF1<0的值,然后求得估计值,最后计算出残差.【详解】令SKIPIF1<0,则SKIPIF1<0,SKIPIF1<01491625使用人数(SKIPIF1<0)151734578421333SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,所以SKIPIF1<0,当SKIPIF1<0时,SKIPIF1<0,所以残差为SKIPIF1<0.故选:B【点睛】非线性回归要先转化为线性回归来求解,回归直线方程过样本中心点.15.(2022·全国·高三专题练习)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生452065不愿生132235总计5842100计算得,SKIPIF1<0.参照下表,SKIPIF1<00.0500.0100.001SKIPIF1<03.8416.63510.828下列结论正确的是()A.在犯错误的概率不超过SKIPIF1<0的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过SKIPIF1<0的前提下,认为“生育意愿与城市级别无关”C.有SKIPIF1<0以上的把握认为“生育意愿与城市级别有关”D.有SKIPIF1<0以上的把握认为“生育意愿与城市级别无关”【答案】C【分析】根据SKIPIF1<0的值与临界值比较即可判断进而可得正确选项.【详解】因为SKIPIF1<0,所以有SKIPIF1<0以上的把握认为“生育意愿与城市级别有关”,故选项A、B、D不正确,故选:C.16.(2022·全国·高三专题练习)2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:赞成“自助游”不赞成“自助游”合计男性301545女性451055合计7525100参考公式:SKIPIF1<0,其中SKIPIF1<0.SKIPIF1<00.150.100.050.0250.0100.0050.001x02.0722.7063.8415.0246.6357.87910.828参照公式,得到的正确结论是()A.有SKIPIF1<0以上的把握认为“赞成‘自助游’与性别无关”B.有SKIPIF1<0以上的把握认为“赞成‘自助游’与性别有关”C.在犯错误的概率不超过SKIPIF1<0的前提下,认为“赞成‘自助游’与性别无关”D.在犯错误的概率不超过SKIPIF1<0的前提下,认为“赞成‘自助游’与性别有关”【答案】D【分析】计算SKIPIF1<0的值与临界值比较即可判断四个选项的正确性,进而可得正确选项.【详解】将SKIPIF1<0列联表中的数据代入计算,得SKIPIF1<0,因为SKIPIF1<0,所以在犯错误的概率不超过SKIPIF1<0的前提下,可以认为“赞成‘自助游’与性别有关”.有SKIPIF1<0以上的把握认为“赞成‘自助游’与性别有关”,没有SKIPIF1<0以上的把握认为“赞成‘自助游’与性别有关”,故选项ABC不正确,故选:D.17.(2022·全国·高三专题练习(文))为了了解某高中生对电视台某节目的态度,在某中学随机调查了110名同学,得到如下列联表:男女总计喜欢402060不喜欢203050总计6050110由SKIPIF1<0算得SKIPIF1<0.SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”C.有99%的把握认为“喜欢该节目与性别有关”D.有99%的把握认为“喜欢该节目与性别无关”【答案】C【分析】根据求出的数据,结合临界值表判断即可【详解】解:因为SKIPIF1<0,所以在犯错误的概率不超过1%的前提下,认为“喜欢该节目与性别有关”,或有99%的把握认为“喜欢该节目与性别有关”,故选:C18.(2022·全国·高三专题练习(文))为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:根据图中的信息,下列结论中不正确的是()A.样本中多数男生喜欢手机支付B.样本中的女生数量少于男生数量C.样本中多数女生喜欢现金支付D.样本中喜欢现金支付的数量少于喜欢手机支付的数量【答案】C【分析】根据两等号条形图的信息,逐个分析判断即可.【详解】对于A,由右图可知,样本中多数男生喜欢手机支付,A对;对于B,由左图可知,样本中的男生数量多于女生数量,B对;对于C,由右图可知,样本中多数女生喜欢手机支付,C错;对于D,由右图可知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,D对.故选:C.19.(2021·全国·高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的()A.样本中的女生数量多于男生数量B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C.样本中的男生偏爱两理一文D.样本中的女生偏爱两文一理【答案】D【分析】由等高堆积条形图逐项判断即可.【详解】解:由条形图知女生数量多于男生数量,故A正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B正确;男生偏爱两理一文,故C正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D错误.故选:D.二、多选题20.(2021·山东聊城·三模)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的样本点数据SKIPIF1<0,则下列结论正确的是()A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心SKIPIF1<0C.若以模型SKIPIF1<0拟合该组数据,为了求出回归方程,设SKIPIF1<0,将其变换后得到线性方程SKIPIF1<0,则a,b的估计值分别是3和6.D.用SKIPIF1<0SKIPIF1<0来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零实数的直线上,则SKIPIF1<0的值为1【答案】BCD【分析】分别根据线性相关关系及拟合曲线关系对选项一一分析.【详解】若两变量x,y具有线性相关关系,即满足SKIPIF1<0,则一定满足SKIPIF1<0,样本点不一定在拟合直线上,故A错误,B正确;若以模型SKIPIF1<0拟合该组数据,SKIPIF1<0,故SKIPIF1<0,故C正确;用SKIPIF1<0SKIPIF1<0来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零实数的直线上,则SKIPIF1<0,即SKIPIF1<0SKIPIF1<0,故D正确;故选:BCD21.(2021·辽宁朝阳·一模)关于变量SKIPIF1<0、SKIPIF1<0的SKIPIF1<0个样本点SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0及其线性回归方程:SKIPIF1<0,下列说法正确的有()A.若相关系数SKIPIF1<0越小,则表示SKIPIF1<0、SKIPIF1<0的线性相关程度越弱B.若线性回归方程中的SKIPIF1<0,则表示变量SKIPIF1<0、SKIPIF1<0正相关C.若残差平方和越大,则表示线性回归方程拟合效果越好D.若SKIPIF1<0,SKIPIF1<0,则点SKIPIF1<0一定在回归直线SKIPIF1<0上【答案】BD【分析】本题可根据线性相关系数的意义判断出A错误,然后根据SKIPIF1<0判断出B正确,再然后根据残差平方和越大拟合效果越差判断出C错误,最后根据样本中心点一定在回归直线上判断出D正确.【详解】A项:根据线性相关系数的意义可知,当SKIPIF1<0的绝对值越接近于0时,两个随机变量线性相关越来越弱,A错误;B项:当SKIPIF1<0时,结合SKIPIF1<0易知,变量SKIPIF1<0、SKIPIF1<0正相关,B正确;C项:残差平方和越大,拟合效果越差,C错误;D项:样本中心点一定在回归直线上,D正确,故选:BD.22.(2022·江苏·高三专题练习)则下列说法正确的是()A.在回归分析中,残差的平方和越小,模型的拟合效果越好;B.在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;C.若数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的平均数为1,则SKIPIF1<0,SKIPIF1<0,…SKIPIF1<0的平均数为2;D.对分类变量SKIPIF1<0与SKIPIF1<0的随机变量SKIPIF1<0的观测值SKIPIF1<0来说,SKIPIF1<0越小,判断“SKIPIF1<0与SKIPIF1<0有关系”的把握越大.【答案】ABC【分析】根据残差的意义,可判定AB真命题;根据数据的平均值的计算公式,可得C真命题;根据独立性检验中观测值SKIPIF1<0的几何意义,可判定D为假命题.【详解】根据残差的意义知,残差的平方和越小,模型的拟合效果越好,所以A正确;由残差的意义知,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,所以B正确;若数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的平均数为1,则SKIPIF1<0,SKIPIF1<0,…SKIPIF1<0的平均数为也扩大为原来的2倍,即平均数为2,所以C正确;对分类变量SKIPIF1<0与SKIPIF1<0的随机变量SKIPIF1<0的观测值SKIPIF1<0来说,应该是SKIPIF1<0越大,判断“SKIPIF1<0与SKIPIF1<0有关系”的把握越大,所以D不正确.故选:ABC.23.(2022·全国·高三专题练习)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的SKIPIF1<0,女生喜欢抖音的人数占女生人数SKIPIF1<0,若有SKIPIF1<0的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有()人附表:SKIPIF1<00.0500.010SKIPIF1<03.8416.635附:SKIPIF1<0A.25 B.45 C.60 D.75【答案】BC【分析】设男生的人数为SKIPIF1<0,列出SKIPIF1<0列联表,计算出SKIPIF1<0的观测值,结合题中条件可得出关于SKIPIF1<0的不等式,解出SKIPIF1<0的取值范围,即可得出男生人数的可能值.【详解】解:设男生的人数为SKIPIF1<0,根据题意列出SKIPIF1<0列联表如下表所示:男生女生合计喜欢抖音SKIPIF1<0SKIPIF1<0SKIPIF1<0不喜欢抖音SKIPIF1<0SKIPIF1<0SKIPIF1<0合计SKIPIF1<0SKIPIF1<0SKIPIF1<0则SKIPIF1<0,由于有SKIPIF1<0的把握认为是否喜欢抖音和性别有关,则SKIPIF1<0,即SKIPIF1<0,得SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0的可能取值有SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0,因此,调查人数中男生人数的可能值为SKIPIF1<0、50、55或SKIPIF1<0.故选:BC.三、填空题24.(2022·全国·高三专题练习)有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据:近视不近视总计少看手机SKIPIF1<0SKIPIF1<0SKIPIF1<0多看手机SKIPIF1<0SKIPIF1<0SKIPIF1<0总计SKIPIF1<0SKIPIF1<0SKIPIF1<0则在犯错误的概率不超过__________的前提下认为近视与多看手机有关系.附表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0参考公式:SKIPIF1<0,其中SKIPIF1<0.【答案】SKIPIF1<0【分析】根据列联表计算得SKIPIF1<0,进而得答案.【详解】解:根据列联表计算SKIPIF1<0,所以在犯错误的概率不超过SKIPIF1<0的前提下认为近视与多看手机有关系.故答案为:SKIPIF1<0四、解答题25.(2022·全国·高三专题练习(文))近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表:月份5月6月7月8月9月月份代码SKIPIF1<012345产值SKIPIF1<0亿元1620273037(1)根据上表数据,计算SKIPIF1<0与SKIPIF1<0的线性相关系数SKIPIF1<0,并说明SKIPIF1<0与SKIPIF1<0的线性相关性强弱;(SKIPIF1<0,则认为SKIPIF1<0与SKIPIF1<0线性相关性很强;SKIPIF1<0,则认为SKIPIF1<0与SKIPIF1<0线性相关性不强)(2)求出SKIPIF1<0关于SKIPIF1<0的线性回归方程,并预测10月该企业的产值.参考公式:SKIPIF1<0;参考数据:SKIPIF1<0.【答案】(1)SKIPIF1<0;相关系数较强;(2)SKIPIF1<0;10月该企业的产值约为SKIPIF1<0亿元【分析】(1)利用表中数据求出SKIPIF1<0,再由相关系数的求解公式即可求解.(2)利用最小二乘法即可求解.(1)SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,因为SKIPIF1<0,所以SKIPIF1<0与SKIPIF1<0线性相关性较强.(2)设线性回归方程为:SKIPIF1<0;SKIPIF1<0,SKIPIF1<0,即SKIPIF1<0,10月份对应的代码为SKIPIF1<0,SKIPIF1<0,10月该企业的产值约为SKIPIF1<0亿元.26.(2021·江西·模拟预测(文))某科技公司研发了一项新产品SKIPIF1<0,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价SKIPIF1<0(千元)和销售量SKIPIF1<0(千件)之间的一组数据如下表所示:月份SKIPIF1<0123456销售单价SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0销售量SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0(1)试根据1至5月份的数据,建立SKIPIF1<0关于SKIPIF1<0的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过SKIPIF1<0千元,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程SKIPIF1<0,其中SKIPIF1<0.参考数据:SKIPIF1<0,SKIPIF1<0.【答案】(1)SKIPIF1<0;(2)是.【分析】(1)先由表中的数据求出SKIPIF1<0,再利用已知的数据和公式求出SKIPIF1<0,从而可求出SKIPIF1<0关于SKIPIF1<0的回归直线方程;(2)当SKIPIF1<0时,求出SKIPIF1<0的值,再与15比较即可得结论【详解】(1)因为SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,得SKIPIF1<0,于是SKIPIF1<0关于SKIPIF1<0的回归直线方程为SKIPIF1<0;(2)当SKIPIF1<0时,SKIPIF1<0,则SKIPIF1<0,故可以认为所得到的回归直线方程是理想的.27.(2022·河南·温县第一高级中学高三阶段练习(理))身高体重指数(BMI)的大小直接关系到人的健康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量其身高、体重(数据如下表)并进行线性回归分析,得到线性回归方程为SKIPIF1<0,因为某些原因,3号学生的体重数据丢失.学生编号12345身高SKIPIF
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年山东省第三届中小学生海洋知识竞赛题库及答案(小学组第201-400题)
- 前后壁脱垂护理课件
- 《命题演算》课件
- 冠心病中医治疗方法
- 企业与高校合作国际法律合作协议
- 高压电力工程监理电工聘用合同
- 畜牧业房产交易合同模板
- 音乐厅照明工程承包合同
- 珠海市二手房中介合同签订技巧
- 建筑劳务分包合同协议书范本
- 学校购买乐器合同范例
- 2024-2030年中国汽车精细化学品行业竞争格局及发展风险研究报告
- 养老机构心理危机应急救援预案
- 《老年人生活照护》试卷A卷及答案
- 2024年上海公务员考试申论试题(A卷)
- 怎样做好接待工作培训课件
- 2024-2025苏教版一年级数学上册 第三单元《图形的初步认识(一)》检测卷(含答案)
- 电子信息产业园建设项目可行性研究报告
- 消防安全知识培训课件
- (一模)宁波市2024学年第一学期高考模拟考试 物理试卷(含答案)
- 2024年资格考试-WSET二级认证考试近5年真题附答案
评论
0/150
提交评论