专题14 统计案例 -《2022年高考数学解答题预测》全国通用_第1页
专题14 统计案例 -《2022年高考数学解答题预测》全国通用_第2页
专题14 统计案例 -《2022年高考数学解答题预测》全国通用_第3页
专题14 统计案例 -《2022年高考数学解答题预测》全国通用_第4页
专题14 统计案例 -《2022年高考数学解答题预测》全国通用_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文档来源网络侵权联系删除仅供参考【猜想与对策】《2022【猜想与对策】《2022年高考数学解答题预测》(全国通用)专题14统计案例【真题体验】1.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).2.(2020·海南·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:

3218468123710(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表:

(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,0.050

0.010

0.0013.841

6.63510.8283.(2020·全国·高考真题(理))某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.4.(2020·全国·高考真题(文))某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:,P(K2≥k)0.050

0.0100.001k3.8416.63510.8285.(2019·全国·高考真题(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.的分组企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:.【命题规律】1.命题的考查重点有:(1)统计图表;(2)频率分布图、表及其应用;(3)回归分析;(4)独立性检验的应用2.从命题类型看,小题多独立考查统计图表的辨识,考查平均数、方差等数字特征的概念或简单计算;大题有以下类型,一是独立考查回归分析的应用、独立性检验的应用,二是将二者综合考查,三是将回归分析的应用、独立性检验的应用之一与随机变量的分布列综合考查.【知识技能方法】一.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.eq\x(体现的不一定是因果关系.)(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.二.两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中,3.通过求eq\a\vs4\al(Q=\i\su(i=1,n,)yi-bxi-a2)的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.4.相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.5.技能方法(1)求线性回归方程=1\*GB3①利用公式,求出回归系数eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^)).=2\*GB3②待定系数法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数eq\o(b,\s\up6(^)).(2)模型拟合效果的判断=1\*GB3①残差平方和越小,模型的拟合效果越好.=2\*GB3②相关指数R2越大,模型的拟合效果越好.=3\*GB3③回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.三.独立性检验1.2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2.独立性检验利用随机变量K2(也可表示为χ2)的观测值(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.3.技能方法(1)比较几个分类变量有关联的可能性大小的方法=1\*GB3①通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.=2\*GB3②通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.(2)独立性检验的一般步骤=1\*GB3①根据样本数据制成2×2列联表.=2\*GB3②根据公式K2=eq\f(nad-bc2,a+ba+cb+dc+d),计算K2的观测值k.=3\*GB3③比较观测值k与临界值的大小关系,作统计推断.【常用结论】1.求解回归方程的关键是确定回归系数eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),应充分利用回归直线过样本中心点(eq\x\to(x),eq\x\to(y)).2.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.3.根据回归方程计算的eq\o(y,\s\up6(^))值,仅是一个预报值,不是真实发生的值.【预测演练】1.(2022·陕西西安·高三阶段练习(文))为了解“朗读记忆”和“默读记忆”两种记忆方法的效率(记忆的平均时间)是否有差异,将40名学生平均分成两组分别采用两种记忆方法记忆同一篇文章.由于事先没有约定用什么图表记录记忆所用时间(单位:min),其结果是“朗读记忆”用茎叶图表示(如图①),“默读记忆”用频率分布直方图表示(分组区间为,,…,)(如图②).(1)分别计算“朗读记忆”和估算“默读记忆”(估算时,用各组的中点值代替该组的平均值)记忆这篇文的平均时间(单位:min);(2)依据(1),用m表示40位学生记忆的平均时间,完成下列2×2列联表,判断“朗读记忆”和“默读记忆”两种记忆方法与其效率记忆的平均时间m是否有关联,并说明理由.参考公式和数据:小于m不小于m合计朗读记忆(人数)默读记忆(人数)合计0.1000.0500.0100.001k2.7063.8416.63510.8282.(2022·河南洛阳·模拟预测(文))关于棉花质量,主要有以下几个指标:品级、长度、马克隆值、回潮率、含杂率、短纤维率、危害性杂物、棉结等.为研究棉花质量,提高棉花品质,某研究机构在一批棉花中随机抽查了200份棉花样品中的马克隆值、回潮率,得下表:马克隆值y回潮率x12610835313424541120(1)估计事件“该批棉花马克隆值不超过4.2,回潮率不超过99.9%”的概率;(2)根据所给数据,完成下面的列联表:

马克隆值y回潮率x(3)根据(2)中的列联表,判断是否有99.9%的把握认为该批棉花马克隆值与回潮率有关?附:0.0500.0100.001k3.8416.63510.8283.(2022·河北·石家庄二中高三阶段练习)中央政府为了对应因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”,为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研,人社部从网上年龄在15~65的人群中随机调查50人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:年龄支持"延迟退休"人数5101021(1)由以上统计数据填下面2×2列联表,并问是否有90%的把握认为以45岁为分界点对“延迟退休年龄政策”的支持度有差异:45岁以下45岁以上合计支持不支持合计(2)若从年龄在的被调查人中各随机选取两人进行调查,记选中的4人中支持“延迟退休”人数为,求随机变量的分布列及数学期望.参考数据:4.(2022·全国·高三专题练习)第十九届林芝桃花旅游文化节年月日正式拉开帷幕,以“桃花依旧——相约中国‘醉’美春天”为宣传推广语,组织开展了丰富多彩、特色鲜明的系列活动.某研究小组为了了解开幕式文艺演出时林芝市民的观看情况,从全市随机调查了名市民(男女各名),统计到全程观看、部分观看和没有观看的人数如表:观看情况全程观看部分观看没有观看男生人数女生人数(1)求出表中,的值;根据表中统计的数据,完成下面的列联表,并判断能否在犯错误的概率不超过的前提下,认为全程观看与性别有关?(2)从没有观看的人中随机抽取人进一步了解情况,计抽取的人中男性人数为,求的分布列与数学期望;男性女性总计全程观看非全程观看总计附:.5.(2022·全国·模拟预测(文))“冰雪为媒,共赴冬奥之约”!第24届冬季奥林匹克运动会于2022年2月4日于20日在北京举行,共有91个国家的代表团参加.各国运动员在赛场上全力以赴、奋勇争先,为我们带来了一场冰与雪的视觉盛宴.本届奥运会前,为了分析各参赛国实力与国家所在地区(欧洲/其它)之间的关系,某体育爱好者统计了近年相关冰雪运动赛事(奥运会、世锦寒等)中一些国家斩获金牌的次数,得到如下茎叶图.(1)计算并比较茎叶图中“欧洲地区”国家和“其它地区”国家获金牌的平均次数(记为)和方差(记为,保留一位小数),判断是否能由此充分地得出结论“欧洲国家的冰雪运动实力强于其它国家”,说明你的理由.(2)记图中斩获金牌次数大于70的国家为“冰雪运动强国”,请按照图中数据补全2×2列联表,并判断是否有97.5%的把握认为一个国家是否为“冰雪运动强国”与该国家所在地区(欧洲/其它)有关(假设该样本可以反映总体情况).附:,其中.0.100.050.0250.0102.7063.8415.0246.635“冰雪运动强国”非“冰雪运动强国”合计欧洲国家其它国家合计6.(2022·河南新乡·二模(文))新能源汽车是指除汽油、柴油发动机之外的所有其他能源汽车,被认为能减少空气污染和缓解能源短缺的压力.在当今提倡全球环保的前提下,新能源汽车越来越受到消费者的青睐,新能源汽车产业也必将成为未来汽车产业发展的导向与目标.某车企调查了近期购车的200位车主的性别与购车种类的情况,得到如下数据:购置新能源汽车购置传统燃油汽车总计男性8020100女性6535100总计14555200(1)根据表中数据,判断能否有95%的把握认为是否购置新能源汽车与性别有关;(2)已知该车企有3种款式不同的汽车,每款汽车均有新能源和传统燃油两种类型各1辆,假设某单位从这6辆汽车中随机购买2辆汽车,求这2辆车款式不相同的概率.附:,.0.100.050.0250.0102.7063.8415.0246.6357.(2022·河南新乡·二模(理))新能源汽车是指除汽油、柴油发动机之外的所有其他能源汽车,被认为能减少空气污染和缓解能源短缺的压力.在当今提倡全球环保的前提下,新能源汽车越来越受到消费者的青睐,新能源汽车产业也必将成为未来汽车产业发展的导向与目标.某车企调查了近期购车的200位车主的性别与购车种类的情况,得到如下数据:购置新能源汽车购置传统燃油汽车总计男性8020100女性6535100总计14555200(1)根据表中数据,判断能否有95%的把握认为是否购置新能源汽车与性别有关;(2)已知该车企有5种款式不同的汽车,每种款式的汽车均有新能源和传统燃油两种类型各1辆.假设某单位从这10辆汽车中随机购买4辆汽车,设其中款式相同的汽车的对数为,求的分布列与数学期望.附:,.0.100.050.0250.0102.7063.8415.0246.6358.(2022·内蒙古包头·高三期末(文))某沙漠地区经过治理,生态系统得到很大改普,人工栽培和野生植物数量不断增加.为调查该地区某种植物的数量,将其分成面积相近的150个地块,从这些地块中用简单随机抽样的方法抽取15个作为样区,调查得到样本数据(,2,…,15),其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种植物的数量,并计算得,,,,.(1)求该地区这种植物数量的估计值(这种植物数量的估计值等于样区这种植物数量的平均数乘以地块数);(2)求样本(,2,…,15)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种植物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数,.9.(2022·四川师范大学附属中学二模(理))数独是源自18世纪瑞士的一种数学游戏,玩家需要根据盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫()内的数字均含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:x(天)1234567y(秒)990990450320300240210现用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中):18450.370.555参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.10.(2022·湖南益阳·一模)从2019年的11月份开始,新冠肺炎疫情逐渐在全球开始蔓延,目前,国内外疫情防控形势仍严峻复杂.(1)为有效控制疫情传播,需对特殊人群进行核酸检测,为提高检测效率,多采用混合检测模式.“k合1”“混采核酸检测是指:先将k个人的样本混合在一起进行1次检测,如果这k个人都没有感染新冠病毒,则每人的检测结果均为阴性,检测结束;如果这k个人中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的检测结果,检测结束.现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并假设每次检测结果准确,若将这100人随平均分成20组,每组5人,且对每组都采用“5合1”混采核酸检测试.求两名感染者不在同一组的概率.(2)2021年12月来,西安市爆发了新冠局部疫情,受疫情影响,餐饮和旅游都受到了影响.某网站统计了西安“面”在2022年1月7至11日的网络售量y(单位:百件),得到以下数据:日期x7891011销售量y(百件)1012111220根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?若可以,求出y关于x之间的线性回归方程;若不可以,请说明理由.参考数据:,参考公式:相关系数.回归直线的方程是:,其中,.11.(2022·陕西西安·二模(文))某学校共有1000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样随机抽取了100名学生进行调查,月消费金额分布在950元之间.根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示,将月消费金额不低于750元的学生称为“高消费群”.(1)求的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的中点值作代表);(2)若样本中属于“高消费群”的女生有20人,完成下列列联表,并判断是否有的把握认为该校学生属于“高消费群”与“性别”有关?属于“高消费群”不属于“高消费群”合计男女合计(参考公式:,其中12.(2022·重庆巴蜀中学高三阶段练习)美国职业篮球联赛(NBA联赛)分为常规赛和季后赛,常规赛共82场比赛,以全明星假期为界,分为前半赛季和后半赛季,东、西部排名前8的球队进入季后赛,季后赛共四轮,最后一轮总决赛采用七场四胜制(“七场四胜制”是指在七场比赛中先胜四场者获得比赛胜利,胜者成为本赛季的总冠军).下表是A队在常规赛的前80场比赛中的比赛结果记录表阶段比赛场数主场场数获胜场数主场获胜场数前半赛季52254323后半赛季28151712(1)根据表中信息完成列联表,并判断是否有95%的把握认为比赛的“主客场”与“胜负”之间有关?胜场数负场数总计主场比赛客场比赛总计(2)已知A队与B队在季后赛的总决赛中相遇,假设每场比赛结果相互独立,A队每场比赛获胜的概率等于A队常规赛前80场比赛获胜的频率,求总决赛五场结束的概率.附∶P(K2≥k0)0.1000.0500.025k02.7063.8415.02413.(2022·河南省直辖县级单位·二模(文))近年来,随着社会对教育的重视,家庭的平均教育支出增长较快,随机抽样调查某市2015~2021年的家庭平均教育支出,得到如下折线图.(附:年份代码1~7分别对应的年份是2015~2021).经计算得,,,,.(1)用线性回归模型拟合y与t的关系,求出相关系数r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论