2025年新高考艺术生数学突破讲义专题28统计案例和回归方程_第1页
2025年新高考艺术生数学突破讲义专题28统计案例和回归方程_第2页
2025年新高考艺术生数学突破讲义专题28统计案例和回归方程_第3页
2025年新高考艺术生数学突破讲义专题28统计案例和回归方程_第4页
2025年新高考艺术生数学突破讲义专题28统计案例和回归方程_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题28统计案例和回归方程【考点预测】知识点一、变量间的相关关系1、变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.2、散点图将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示.3、相关系数若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为.(1)当时,表示两个变量正相关;当时,表示两个变量负相关.(2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上.(3)通常当时,认为两个变量具有很强的线性相关关系.知识点二、线性回归1、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为其中,,,(,)称为样本点的中心.2、残差分析对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(1)残差图通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.(3)相关指数用相关指数来刻画回归的效果,其计算公式是:.越接近于,说明残差的平方和越小,也表示回归的效果越好.知识点三、独立性检验1、分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为总计总计从列表中,依据与的值可直观得出结论:两个变量是否有关系.2、等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征.(2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系.3、独立性检验(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(2)公式:,其中为样本容量.(3)独立性检验的具体步骤如下:①计算随机变量的观测值,查下表确定临界值:0.50.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”.(2)两个分类变量和是否有关系的判断标准:统计学研究表明:当时,认为与无关;当时,有的把握说与有关;当时,有的把握说与有关;当时,有的把握说与有关.【典型例题】例1.(山东省枣庄市2024届高三学期3月模拟考试数学试题)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:疗法疗效合计未治愈治愈甲155267乙66369合计21115136经计算得到,根据小概率值的独立性检验(已知独立性检验中),则可以认为(

)A.两种疗法的效果存在差异B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005C.两种疗法的效果没有差异D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005【答案】C【解析】零假设为:疗法与疗效独立,即两种疗法效果没有差异.根据列联表中的数据,,根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即认为两种疗法效果没有差异.故选:C.例2.(四川省成都市2024届高三学期第二次诊断性检测文科数学试题)对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是(

)A.变量与呈现正相关,且 B.变量与呈现负相关,且C.变量与呈现正相关,且 D.变量与呈现负相关,且【答案】C【解析】由题意可知,变量的散点图中,随的增大而增大,所以变量与呈现正相关;再分别观察两个散点图,图比图点更加集中,相关性更好,所以线性相关系数.故选:C.例3.(FHsx1225yl136)如图,去掉点D(3,10)后,下列说法错误的是(

)A.相关系数r变大B.残差平方和变大C.决定系数R2变大D.解释变量x与预报变量y的相关性变强【答案】B【解析】去掉D(3,10)后,其他数据都在一条直线附近,变量x与变量y的相关性变强,模型拟合效果变好,故残差平方和变小.例4.(湖南省2024年普通高等学校招生全国统一考试考前演练二数学试题)某骑行爱好者在专业人士指导下对近段时间骑行锻炼情况进行统计分析,统计每次骑行期间的身体综合指标评分与骑行用时(单位:小时)如下表:身体综合指标评分12345用时小时)9.58.87.876.1由上表数据得到的正确结论是(

)参考数据:参考公式:相关系数.A.身体综合指标评分与骑行用时正相关B.身体综合指标评分与骑行用时的相关程度较弱C.身体综合指标评分与骑行用时的相关程度较强D.身体综合指标评分与骑行用时的关系不适合用线性回归模型拟合【答案】C【解析】因为相关系数.即相关系数近似为与负相关,且相关程度相当高,从而可用线性回归模型拟合与的关系.所以选项ABD错误,C正确.故选:C.例5.(四川省成都市第七中学2024届高三学期期末数学试题)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计301000.10.050.010.0050.0012.7063.8416.6357.87910.828计算可知,根据小概率值______的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”(

)附:,.A.0.001 B.0.05 C.0.01 D.0.005【答案】B【解析】完善列联表如下:被某病毒感染未被某病毒感染合计注射疫苗104050未注射疫苗203050合计3070100假设:“给基因编辑小鼠注射该疫苗不能起到预防该病毒感染的效果”.因为:,而,所以根据小概率值的独立性检验,推断不成立.即认为“给基因编辑小鼠注射该疫苗能起到预防该病毒感染的效果”.故选:B例6.(云南省曲靖市2024届高三学期第一次质量监测数学试题)已知变量关于的回归方程为,若对两边取自然对数,可以发现与线性相关.现有一组数据如下表所示:12345则当时,预测的值为(

)A. B. C. D.【答案】C【解析】令,由可得,如下表所示:由表格中的数据可得,,则有,解得,故,当时,.故选:C.例7.(山东省滨州市2024届高三学期期末数学试题)某学校一同学研究温差(单位:℃)与本校当天新增感冒人数(单位:人)的关系,该同学记录了5天的数据:5689121620252836由上表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是(

)A.与有正相关关系 B.经验回归直线经过点C. D.时,残差为0.2【答案】C【解析】由表格可知,越大,越大,所以与有正相关关系,故A正确;,,样本点中心为,经验回归直线经过点,故B正确;将样本点中心代入直线方程,得,所以,故C错误;,当时,,,故D正确.故选:C例8.(云南省大理白族自治州2024届高三第二次复习统一检测数学试题)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下表对应数据:134571520304045根据表中数据得到关于的经验回归方程为,则当时,残差为.(残差观测值-预测值)【答案】【解析】,因为回归直线过点,代入,可得,当时,,所以残差为.故答案为:例9.(天津市八校联考2023-2024学年高三学期期末质量调查数学试卷)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:天数x1234567一次最多答对题数y12151618212427参考数据:,,,,,相关系数由表中数据可知该老师每天一次最多答对题数y与天数x之间是相关(填“正”或“负”),其相关系数(结果保留两位小数)【答案】正0.99【解析】由表中数据得随的增大而增大,所以该老师每天一次最多答对题数y与天数x之间是正相关,.故答案为:正;.例10.(2024年普通高等学校招生全国统一考试数学文科猜题卷(七))近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:年份20192020202120222023充电桩数量x/万台13579新能源汽车年销量y/万辆2537485872(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.参考数据:,,,.【解析】(1)由题知,,又,,,所以,因为y与x的相关系数近似为0.999,非常接近1,所以y与x的线性相关程度很高,可以用线性回归模型拟合y与x的关系.(2),,所以y关于x的线性回归方程为.当时,,故当充电桩数量为24万台时,该地区新能源汽车的年销量为157.25万辆.例11.(湖北省七市州2024届高三学期3月联合统一调研测试数学试题)某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表:一周参加体育锻炼次数01234567合计男生人数1245654330女生人数4556432130合计579111086460(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下列联表,并依据小概率值的独立性检验,能否认为性别因素与学生体育锻炼的经常性有关系;性别锻炼合计不经常经常男生女生合计(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题.以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为,求和;(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.附:0.10.050.012.7063.8416.635【解析】(1)根据统计表格数据可得列联表如下:性别锻炼合计不经常经常男生72330女生141630合计213960零假设为:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关;根据列联表的数据计算可得根据小概率值的独立性检验,推断不成立,即性别因素与学生体育锻炼的经常性有关系,此推断犯错误的概率不超过0.1(2)因学校总学生数远大于所抽取的学生数,故近似服从二项分布,易知随机抽取一人为“极度缺乏锻炼”者的概率即可得,故,.(3)易知10名“运动爱好者”有7名男生,3名女生,所以的所有可能取值为;且服从超几何分布:故所求分布列为0123可得例12.(陕西省汉中市汉台区2024届高三学期第四次校际联考数学试题)大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:样本号12345678910总和零件的横截面积0.030.050.040.070.070.040.050.060.060.050.52耗材量0.240.400.230.550.500.340.350.450.430.413.9并计算得.(1)估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;(2)求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);(3)刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为,若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.附:相关系数.【解析】(1)样本中10个这种零件的横截面积的平均值,样本中10个这种零件的耗材量的平均值,由此可估算刘铭同学制作的这种零件平均每个零件的横截面积为,平均一个零件的耗材量为.(2),这种零件的横截面积和耗材量的样本相关系数为.(3)设这种零件的总耗材量的估计值为,又已知这种零件的耗材量和其横截面积近似成正比,,解得,故这种零件的总耗材量的估计值为.例13.在一次抽样调查中测得个样本点,得到下表及散点图.

(1)根据散点图判断与哪一个适宜作为关于的回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果试建立与的回归方程;(计算结果保留整数)参考公式:【解析】(1)由题中散点图可以判断,适宜作为关于的回归方程;(2)令,则,原数据变为由表可知与近似具有线性相关关系,计算得,,,所以,,则.所以关于的回归方程是.【过关测试】一、单选题1.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,下列结论正确的是(

A. B.C. D.【答案】B【解析】由给出的四组数据的散点图可以看出,左侧两图是正相关,样本相关系数大于0,则,,右侧两图是负相关,样本相关系数小于0,则,,下方两图的点相对更加集中,所以相关性较强,所以接近于1,接近于-1,上方两图的点相对分散一些,所以相关性较弱,所以和比较接近0,由此可得.故选:B.2.(上海市普陀区桃浦中学2024届高三学期期末数学试题)下列命题中,真命题的是(

)A.若回归方程,则变量与负相关B.线性回归分析中决定系数用来刻画回归的效果,若该值越小,则模型的拟合效果越好C.若样本数据的方差为2,则数据的方差9D.若与独立,则【答案】A【解析】对于A,回归方程为,又,所以变量与负相关,故A正确,对于B,线性回归分析中决定系数用来刻画回归的效果,若值越大,说明模型的拟合效果越好,故B错误.对于C,若样本数据的方差为2,则数据的方差,故C错误,对于D,掷一枚骰子,设事件A:点数小于3,则;事件B:点数为偶数,则,所以,即与独立,又,,故D错误.故选:A.3.(内蒙古呼和浩特市2024届高三学期学业质量监测数学试题)用模型拟合一组数据组,其中,设,得变换后的线性回归方程为,则(

)A. B. C.35 D.21【答案】B【解析】由题意得,故,即,故,解得.故选:B4.(上海市浦东新区2024届高三学期期中教学质量检测数学试卷)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是(

)A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小【答案】D【解析】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误;对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误.故选:D.二、多选题5.(2024届广东省湛江市高三一模数学试题)某养老院有110名老人,经过一年的跟踪调查,过去的一年中他们是否患过某流行疾病和性别的相关数据如下表所示:性别是否患过某流行疾病合计患过该疾病未患过该疾病男b女c合计80110下列说法正确的有(

)参考公式:,其中.附表:0.10.050.0250.010.0012.7063.8415.0246.63510.828A.B.C.根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联D.根据小概率值的独立性检验,没有充分的证据推断是否患过该流行疾病与性别有关联【答案】ABC【解析】根据列联表中的数据可求得;对于A,代入计算可得,正确;对于B,经计算可得,可得B正确;对于CD,结合附表数值以及独立性检验的实际意义,可认为根据小概率值的独立性检验,认为是否患过该流行疾病与性别有关联,即C正确,D错误;故选:ABC6.(河北省沧州市泊头市联考2024届高三学期高考模拟考试数学试题)下表是某地从2019年至2023年能源消费总量近似值(单位:千万吨标准煤)的数据表:年份20192020202120222023年份代号12345能源消费总量近似值(单位:千万吨标准煤)44.244.646.247.850.8以为解释变量,为响应变量,若以为回归方程,则决定系数0.9298,若以为回归方程,则,则下面结论中正确的有(

)A.变量和变量的样本相关系数为正数B.比的拟合效果好C.由回归方程可准确预测2024年的能源消费总量D.【答案】ABD【解析】对于A选项:随着变量的增加,变量也在增加,故变量和变量成正相关,即样本相关系数为正数,正确;对于B选项:因为,故比的拟合效果好,正确;对于C选项:回归方程可预测2024年的能源消费总量,不可准确预测,错误;对于D选项:由回归方程必过样本中心点,可知,正确.故选:ABD.7.(FHsx1225yl136)(多选)某学校为了调查学生对“只要学习够努力,成绩一定有奇迹”这句话的认可程度,随机调查了90名本校高一、高二的学生,得到如下列联表.用样本估计总体,则下列说法正确的是(参考数据:χ2=,n=a+b+c+d,P(χ2≥6.635)=0.010,P(χ2≥10.828)=0.001)(

)认可不认可总计高一202040高二401050总计603090A.高一高二大约有66.7%的学生认可这句话B.高一高二大约有99%的学生认可这句话C.依据α=0.01的独立性检验,认为学生对这句话认可与否与年级有关D.在犯错误的概率不超过0.01的前提下,认为学生对这句话认可与否与年级无关【答案】AC【解析】随机调查了90名学生,其中一共有60名学生认可,所以认可率大约为66.7%,χ2===9.因为6.635<9<10.828,故C正确,D错误.故选AC.8.(安徽省芜湖市安徽师范大学附属中学2024届高三第二次模拟考试数学试题)已知由样本数据(i=1,2,3,…,10)组成的一个样本,得到回归直线方程为,且.剔除一个偏离直线较大的异常点后,得到新的回归直线经过点.则下列说法正确的是A.相关变量x,y具有正相关关系B.剔除该异常点后,样本相关系数的绝对值变大C.剔除该异常点后的回归直线方程经过点D.剔除该异常点后,随x值增加相关变量y值减小速度变小【答案】BC【解析】依题意,原样本中,,剔除一个偏离直线较大的异常点后,新样本中,,因此剔除该异常点后的回归直线方程经过点,C正确;由新的回归直线经过点,得新的回归直线斜率为,因此相关变量x,y具有负相关关系,A错误;又,则剔除该异常点后,随x值增加相关变量y值减小速度变大,D错误;由剔除的是偏离直线较大的异常点,得剔除该点后,新样本数据的线性相关程度变强,即样本相关系数的绝对值变大,B正确.故选:BC9.(湘豫名校联考2024年2月高三第一次模拟考试数学试题)下列说法中,正确的是(

)A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位B.已知随机变量,若,则C.两组样本数据和的方差分别为.若已知且,则D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则【答案】BC【解析】若有一个经验回归方程,随着的增大,会减小,错误;曲线关于对称,因为,所以,所以,B正确;因为,所以,所以,同理可得:,故,C正确;经验回归方程为,且样本点与的残差相等,则,D错误.故选:.10.(河南省部分重点中学2024届高三学期2月质量检测数学试题)已知变量之间的经验回归方程为,且变量的数据如下表所示:5681214108651则下列说法正确的是(

)A.变量之间负相关 B.C.当时,可估计的值为11 D.当时,残差为【答案】AC【解析】对于A选项,由,可得变量之间负相关,故A选项正确;对于B选项,,将代入经验回归方程,有,可得,故B选项错误;对于C选项,由上知,当时,,故C选项正确;对于D选项,当时,,残差为,故D选项错误.故选:AC.11.(吉林省部分学校2024届高三学期高考模拟(三)数学试题)为了解高二学生是否喜爱物理学科与性别的关联性,某学校随机抽取了200名学生进行统计.得到如图所示的列联表,则下列说法正确的是(

)性别物理学科喜爱不喜爱男6040女2080A.喜爱物理学科的学生中,男生的频率为B.女生中喜爱物理学科的频率为C.依据小概率值的独立性检验,可以推断学生是否喜爱物理学科与性别有关D.在犯错误的概率不超过的前提下,认为学生是否喜爱物理学科与性别无关参考公式:,其中.附表:0.100.050.010.0050.0012.7063.8416.6357.87910.828【答案】AC【解析】对于A,喜爱物理学科的学生共有(名),故喜爱物理学科的学生中,男生的频率为,A正确;对于B,女生共有100名,喜爱物理的女生有20名,故女生中喜爱物理学科的频率为,B错误;对于C,D,,故依据小概率值的独立性检验,可以推断学生是否喜爱物理学科与性别有关,即在犯错误的概率不超过的前提下,认为学生是否喜爱物理学科与性别有关,C正确,D错误,故选:AC12.(云南省三校2024届高三高考备考实用性联考卷(五)数学试题)下列命题正确的是(

)A.若样本数据的方差为3,则数据的方差为12B.以模型去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则C.若某校高三(1)班8位同学身高(单位)分别为:,,,,,,,,则这组数据的下四分位数(即第25百分位数)为170D.根据变量与的样本数据计算得到,根据的独立性检验,可判断与有关,且犯错误的概率不超过0.05【答案】AB【解析】对于A,根据,可得数据的方差为,故A正确;对于B,对两边同时取对数可得,因为,,所以,所以,故B正确;对于C,从小到大可得这组数据为,,则这组数据的下四分位数(即第25百分位数)为,故C错误;对于D,因为,在犯错误的概率不超过0.05的情况下,不能判断与有关,故D错误,故选:AB.13.(浙江省宁波市慈溪市2024届高三学期期末测试数学试题)某电商平台为了对某一产品进行合理定价,采用不同的单价在平台试销,得到的数据如下表所示:单价x/元88.599.510销量y/万件8985807868根据以上数据得到与具有较强的线性关系,若用最小二乘估计得到经验回归方程为,则(

)A.相关系数 B.点一定在经验回归直线上C. D.时,对应销量的残差为【答案】BC【解析】由表中数据可得,所以样本中心为,故在经验回归直线上,B正确,由可得与具负相关,故A错误,将代入可得,解得,C正确,当时,,所以残差为,D错误,故选:BC14.(广东省揭阳市2024届高三学期期末教学质量测试数学试题)2023年入冬以来,流感高发,某医院统计了一周中连续5天的流感就诊人数y与第天的数据如表所示.x12345y2110a15a90109根据表中数据可知x,y具有较强的线性相关关系,其经验回归方程为,则(

)A.样本相关系数在内 B.当时,残差为-2C.点一定在经验回归直线上 D.第6天到该医院就诊人数的预测值为130【答案】AD【解析】由题意可知x,y具有较强的正相关关系,故样本相关系数在内,A正确;根据题意得,故,解得,故当时,,残差为,B错误;点即点,当时,,即点不在经验回归直线上,C错误;当时,,即第6天到该医院就诊人数的预测值为130,D正确,故选:AD15.(辽宁省沈阳市辽中区第一私立高级中学2023-2024学年高二学期期末考试数学试题)对两个变量和进行回归分析,则下列结论正确的为()A.回归直线至少会经过其中一个样本点B.残差平方和越小的模型,拟合的效果越好C.建立两个回归模型,模型的相关系数,模型的相关系数,则模型的拟合度更好D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别为【答案】BD【解析】A选项,回归直线不一定经过样本点,A选项错误.B选项,残差平方和越小的模型,拟合的效果越好,B选项正确.C选项,,所以模型的拟合度更好,C选项错误.D选项,由,得,D选项正确.故选:BD16.(重庆市黔江中学校2024届高三学期8月考试数学试题)下列说法中正确的是(

)A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变B.回归直线恒过样本点的中心,且至少过一个样本点C.用相关指数来刻画回归效果时,越接近1,说明模型的拟合效果越好D.在列联表中,的值越大,说明两个分类变量之间的关系越弱【答案】AC【解析】对A:将一组数据中的每一个数据都加上或减去同一个常数后,数据的波动性不变,故方差不变,故A正确;对B:回归直线恒过样本点的中心正确,但不一定会过样本点,故B错误;对C:用相关指数来刻画回归效果时,越接近1,说明模型的拟合效果越好,故C正确;对D:在列联表中,的值越大,说明两个分类变量之间的关系越强,故D错误.故选:AC.三、填空题17.(广东省广州市2024届普通高中毕业班综合测试(一)数学试卷)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数.(参考公式:决定系数)【答案】【解析】因为,两边取对数可得,又,,依题意回归直线方程必过样本中心点,所以,解得,所以,又.故答案为:;18.(专题04回归分析与独立性检验的应用(四大类型))学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:天数x1234567一次最多答对题数y12151618212427参考数据:,,,,,相关系数由表中数据可知该老师每天一次最多答对题数y与天数x之间是正相关,其相关系数(结果保留两位小数).【答案】0.99【解析】由题意.故答案为:.四、解答题19.(四川省成都市郫都区2024届高三学期阶段检测(三))数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,某线下家电商场为提升人气和提高营业额也开通了在线直播,下表统计了该商场开通在线直播的第x天的线下顾客人数y(单位:百人)的数据:x12345y1012151820(1)根据第1至第5天的数据分析,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后三位);(2)根据第1至第5天的数据分析,可用线性回归模型拟合y与x的关系,试求出该线性回归方程并估计该商场开通在线直播的第10天的线下顾客人数.(参考公式:相关系数,参考数据:回归方程:,其中,)【解析】(1)依题意可得,,

,,∴两个变量与相关关系很强.(2)因为,,,,所以时(百人),故预估该商场开通在线直播的第天的线下顾客人数为百人.20.(河南省TOP二十名校2024届高三学期质检一数学试题)近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的APP,得到如下数据:青年人中年人老年人对短视频剪接成长视频的APP有需求200对短视频剪接成长视频的APP无需求150其中的数据为统计的人数,已知被调研的青年人数为400.(1)求的值;(2)根据小概率值的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人是否有差异?参考公式:,其中.临界值表:0.10.050.010.0050.0012.7063.8416.6357.87910.828【解析】(1)由题意可得:,解得.(2)零假设为:对短视频剪接成长视频APP的需求,青年人与中老年人没有差异.由已知得,如下列联表:青年人中老年人合计对短视频剪接成长视频的APP有需求300250550对短视频剪接成长视频的APP无需求100350450合计4006001000可得,根据小概率值的独立性检验,我们推断不成立,所以对短视频剪接成长视频的APP有需求,青年人与中老年人有差异.21.(山西省晋城市第一中学校2024届高三学期第十四次调研考试数学试题)成都第31届世界大学生夏季运动会于7月28日开幕,蓬勃向上的青春活力在“大运之城”绽放,多所学校掀起了运动的热潮,为了解决学生对运动的喜爱程度,某学校从全校学生中随机抽取200名学生进行问卷调查,得到以下信息:①抽取的学生中,男生占的比例为60%;②抽取的学生中,不喜欢运动的学生占的比例为40%;③抽取的学生中,喜欢运动的男生比喜欢运动的女生多40人.(1)完成列联表,依据小概率值的独立性检验,能否认为是否喜欢运动与性别有关联?喜欢运动不喜欢运动合计男生女生合计(2)从随机抽取的这200名学生中随机抽取20人,其中喜欢运动的有11人,不喜欢运动的有9人,现从这20人中随机选出2人,设2人中喜欢运动的学生人数为,求随机变量的分布列.参考公式及数据0.1000.0500.0100.0012.7063.8416.63510.828【解析】(1)列联表如下:喜欢运动不喜欢运动合计男生8040120女生404080合计12080200假设:是否喜欢运动与性别无关联,由题知:,依据小概率值的独立性检验,我们推断不成立,即认为是否喜欢运动与性别有关联.(2)由题知的所有取值为,此时.则的分布列为:01222.(河北省张家口市尚义县第一中学等校2024届高三学期开学收心联考数学试题)为了研究体育锻炼对某年龄段的人患某种慢性病的影响,某人随机走访了个该年龄段的人,得到的数据如下:慢性病体育锻炼合计经常不经常未患病患病合计(1)定义分类变量、如下:,,以频率估计概率,求条件概率与的值;(2)根据小概率值的独立性检验,分析经常进行体育锻炼是否对患该种慢性病有影响.附:【解析】(1)由表格中的数据可得,.(2)将列联表中的数据代入公式计算得,根据小概率值的独立性检验,我们推断经常锻炼对患有某种慢性病有影响,此推断犯错误的概率不大于.23.(江苏省南京市金陵中学2023-2024学年高三学期2月模拟测试数学试题)某高中为了了解高中学生暑假期间阅读古典名著的时间(小时/每周)和他们的语文成绩(分)的关系,某实验小组做了调查,得到一些数据(表一).表一编号12345学习时间247710语文成绩829395108122(1)请根据所给数据求出语文成绩的平均数和方差;(2)基于上述调查,学校为了确认学生喜欢阅读古典名著与语文成绩的关系,抽样调查了200位学生.按照是否喜欢阅读古典名著与语文成绩是否优秀统计,得到下列数据,请依据表中数据及小概率值的独立性检验,分析“喜欢阅读古典名著与语文成绩优秀”是否有关.表二语文成绩优秀语文成绩不优秀合计喜欢阅读7525100不喜欢阅读5545100合计130702000.100.050.0102.7063.8416.635【解析】(1)由题意得,,所以语文成绩的平均数为100,方差为189.2.(2)零假设为:喜欢阅读古典名著与语文成绩优秀无关.根据表中数据,可得,所以依据的独立性检验,不成立,故可以认为“喜欢阅读古典名著与语文成绩优秀”有关.24.(陕西省2024届高三教学质量检测(一)文科数学试题)我国老龄化时代已经到来,老龄人口比例越来越大,出现很多社会问题.2015年10月,中国共产党第十八届中央委员会第五次全体会议公报指出:坚持计划生育基本国策,积极开展应对人口老龄化行动,实施全面二孩政策.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线总计愿生40y60不愿生x2240总计5842100(1)求x和y的值.(2)分析调查数据,是否有以上的把握认为“生育意愿与城市级别有关”?(3)在以上二孩生育意愿中按分层抽样的方法,抽取6名育龄妇女,再选取两名参加育儿知识讲座,求至少有一名来自一线城市的概率.参考公式:,0.0500.0100.001k3.8416.63510.828【解析】(1)由题意得,;(2)由,得,∴有以上的把握认为“生育意愿与城市级别有关”.(3)抽取6名育龄妇女,来自一线城市的人数为,记为1,2,来自非一线城市的人数为,记为a,b,c,d,选设事件A为“取两名参加育儿知识讲座,求至少有一名来自一线城市”,基本事件为:,,事件共有9个,或25.(广东省深圳外国语学校、执信中学2023-2024学年高三学期期末校际联考数学试卷)杭州第19届亚运会,中国代表团共获得201金111银71铜,共383枚奖牌,金牌数超越2010年广州亚运会的199枚,标志着我国体育运动又有了新的突破.某大学从全校学生中随机抽取了130名学生,对其日常参加体育运动情况做了调查,其中是否经常参加体育运动的数据统计如下:经常参加不经常参加男生6020女生4010(1)利用频率估计概率,现从全校女生中随机抽取5人,求其中恰有2人不经常参加体育运动的概率;(2)依据小概率值的独立性检验,能否认为是否经常参加体育运动与性别有关联.参考公式:.0.10.050.010.0050.0012.7063.8416.6357.87910.828【解析】(1)由表格知:经常参加与不经常参加体育运动的女生比例为,所以,抽取到不经常参加体育运动的女生人数服从,故恰有2人不经常参加体育运动的概率.(2)由题设得列联表如下:经常参加不经常参加男生602080女生40105010030130故,所以,依据小概率值的独立性检验认为经常参加体育运动与性别没有关联.26.(河北省张家口市2023-2024学年高三学期1月期末考试数学试题)某公司男女职工人数相等,该公司为了解职工是否接受去外地长时间出差,进行了如下调查:在男女职工中各随机抽取了100人,经调查,男职工和女职工接受去外地长时间出差的人数分别为40和20.(1)根据所给数据,完成下面列联表,并依据小概率值的独立性检验,能否认为是否接受去外地长时间出差与性别有关联?单位:人性别接受不接受合计男女合计(2)若将频率视为概率,用样本估计总体,从该公司中随机抽取5人,记其中接受去外地长时间出差的人数为X,求X的数学期望,附表:0.10.050.010.0050.0012.7063.8416.6357.87910.828附:,其中.【解析】(1)依题意,列出列联表如下:单位:人性别接受不接受合计男4060100女2080100合计60140200零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,所以.根据小概率值的独立性检验,我们推断不成立,即认为是否接受去外地长时间出差与性别有关联,此推断犯错误的概率不大于0.005.(2)由题意,接受去外地长时间出差的频率为,所以接受去外地长时间出差的概率为.随机变量的可能取值为0,1,2,3,4,5,由题意,得,所以的数学期望.27.(艺体生一轮复习第九章计数原理、概率与统计第50讲独立性检验【练】)第五代移动通信技术(简称)是最新一代蜂窝移动通信技术,是实现人机物互联的网络基础设施.某市工信部门为了解本市手机用户对网络的满意情况,随机抽取了本市200名手机用户进行了调查,所得情况统计如下:满意情况年龄合计50岁以下50岁或50岁以上满意95不满意25合计120200附:0.10.050.0250.010.0012.7063.8415.0246.63510.828,其中.(1)完成上述列联表,并估计本市手机用户对网络满意的概率;(2)依据小概率值的独立性检验,分析本市手机用户对网络满意与年龄在50岁以下是否有关.【解析】(1)完成列联表如下:满意情况年龄合计50岁以下50岁或50岁以上满意9555150不满意252550合计12080200所以本市手机用户对网络满意的概率约为.(2)零假设为:本市手机用户对网络满意与年龄在50岁以下无关.根据列联表中的数据,计算可得,根据小概率值的独立性检验原则,没有充分证据推断不成立,因此可以认为成立,即认为本市手机用户对网络满意与年龄在50岁以下无关.28.(青海省西宁市大通县2024届高三学期期末数学试题)家居消费是指居民在日常生活中购买和使用的家具、家电、建材、装修等产品和服务所形成的消费行为.长期以来,家居消费一直是居民消费的重要组成部分,对于带动居民消费增长和经济恢复具有重要意义.某家居店为了迎接周年庆举办促销活动,统计了半个月以来天数x与销售额y(万元)的一组数据:.通过分析发现x与y呈线性相关.(1)求x与y的样本相关系数r(结果保留三位小数);(2)求x与y的线性回归方程(,的结果用分数表示).参考公式:相关系数,,.参考数据:,,,.【解析】(1)依题意,,,所以.(2)因为,则,所以y关于x的线性回归方程为.29.(江苏省镇江市第一中学2024届高三学期1月学情检测调研数学试题)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各人进行分析,从而得到表(单位:人):经常网购偶尔或不用网购合计男性45100女性65100合计(1)完成上表;对于以上数据,采用小概率值的独立性检验,能否认为我市市民网购与性别有关联?(2)①现从所抽取的女市民中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;②将频率视为概率,从我市所有参与调查的市民中随机抽取20人赠送礼品,记其中经常网购的人数为,求随机变量的数学期望和方差.参考公式:.常用的小概率值和对应的临界值如下表:a0.1500.1000.0500.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828【解析】(1)完善列联表如下表所示(单位:人):经常网购偶尔或不用网购合计男性女性合计零假设性别与网购之间无关联,由列联表得,,根据小概率值的独立性检验,推断不成立,即认为我市市民网购与性别有关联.(2)①由题意可知,所抽取的名女市民中,经常网购的有人,偶尔或不用网购的有人,所以,选取的人中至少有人经常网购的概率为;②由列联表可知,抽到经常网购的市民的频率为,将频率视为概率,所以,从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为,由题意可知,,所以,,.30.(河北省邢台市宁晋县河北宁晋中学2024届高三学期模拟预测数学试题)“世界卫生组织”通过总结“世界预防医学”的最新成果,指出:的疾病都与不良水质有关,50多种疾病与饮用不良水质有关.下表是某省A市的慢性病研究中心调查得到的甲慢性病与饮用水水质的调查表:单位:人饮用水水质甲慢性病合计患病不患病优良水质100400500不良水质100200300合计200600800(1)依据小概率值的独立性检验,能否认为A市患慢性病与饮用不良水质有关?(2)已知某省A市、B市和其他县市人口占比分别是,,,以调查表数据的频率估计A市患甲慢性病的概率,经过深入调查发现B市和其他县市患甲慢性病的概率分别为,,从该省任意抽取一人,试估计此人患甲慢性病的概率.附表及公式:,其中.临界值表:0.10.050.010.0050.0012.7063.8416.6357.87910.828【解析】(1)由题设,,所以依据小概率值的独立性检验,能认为A市患慢性病与饮用不良水质有关.(2)由题设,A市患甲慢性病的概率为,B市和其他县市患甲慢性病的概率分别为,,所以从该省任意抽取一人,此人患甲慢性病的概率为.31.(黑龙江省鸡西市第一中学校2024届高三学期期末数学试题)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额:月份12345带货金额万元350440580700880(1)计算变量的相关系数(结果精确到0.01).(2)求变量之间的线性回归方程,并据此预测2023年6月份该公司的直播带货金额.参考数据:,参考公式:相关系数,线性回归方程的斜率,截距.【解析】(1)(2)因为,所以,所以变量之间的线性回归方程为,当时,(万元).所以预测2023年6月份该公司的直播带货金额为986万元.32.(江西省赣州市兴国县联考2024届高三学期5月月考文科数学试题)随着人们生活水平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论