第09讲 统计与统计案例(学生版)-2025版高中数学一轮复习考点帮_第1页
第09讲 统计与统计案例(学生版)-2025版高中数学一轮复习考点帮_第2页
第09讲 统计与统计案例(学生版)-2025版高中数学一轮复习考点帮_第3页
第09讲 统计与统计案例(学生版)-2025版高中数学一轮复习考点帮_第4页
第09讲 统计与统计案例(学生版)-2025版高中数学一轮复习考点帮_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Page第09讲统计与统计案例(13类核心考点精讲精练)1.5年真题考点分布5年考情考题示例考点分析关联考点2024年新Ⅱ卷,第4题,5分计算几个数的中位数计算几个数的平均数计算几个数据的极差/2023年新I卷,第9题,5分计算几个数的中位数计算几个数的平均数计算几个数据的极差、方差标准差/2023年新Ⅱ卷,第19题,12分频率分布直方图的实际应用总体百分位数的估计/2023年全国甲卷(理),第19题,12分独立性检验解决实际问题计算几个数的中位数超几何分布的均值超几何分布的分布列2023年全国乙卷(理),第17题,12分计算几个数的平均数计算几个数据的极差、方差、标准差统计新定义2022年新I卷,第20题,12分独立性检验解决实际问题计算条件概率2022年新Ⅱ卷,第19题,12分频率分布直方图的实际应用由频率分布直方图估计平均数利用对立事件的概率公式求概率计算条件概率2022年全国甲卷(理),第2题,5分众数、平均数、中位数的比较计算几个数据的极差、方差、标准差/2022年全国乙卷(理),第19题,12分相关系数的计算根据样本中心点求参数计算几个数的平均数2021年新I卷,第9题,5分众数、平均数、中位数的比较计算几个数据的极差、方差、标准差/2021年新Ⅱ卷,第9题,5分计算几个数的众数计算几个数的中位数计算几个数的平均数计算几个数据的极差、方差、标准差/2021年全国乙卷(理),第17题,10分独立性检验解决实际问题/2021年全国甲卷(理),第2题,5分由频率分布直方图计算频率、频数、样本容量、总体容量由频率分布直方图估计平均数/2021年全国甲卷(理),第17题,10分计算几个数的平均数计算几个数据的极差、方差、标准差/2020年新I卷,第19题,12分完善列联表独立性检验/2020年新Ⅱ卷,第19题,12分完善列联表独立性检验/2020年全国甲卷(理),第5题,5分由散点图画求近似回归直线/2020年全国乙卷(理),第18题,12分相关系数的计算/2020年全国丙卷(理),第18题,12分独立性检验解决实际问题/2020年新Ⅱ卷,第9题,5分根据折线统计图解决实际问题/2.命题规律及备考策略【命题规律】本节内容是新高考卷的常考内容,设题不定,难度中等或偏难,分值为5-15分【备考策略】1.理解、掌握简单随机抽样、分层抽样定义及计算2.理解、掌握总体样本估计的定义及计算3.理解、掌握线性回归的定义及计算4.理解、掌握独立性检验的定义及计算【命题预测】本节内容是新高考卷的常考内容,一般给在大题中结合前面的的概率及分布列一起考查,需重点强化复习知识讲解1.简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.频率分布直方图(1)纵轴表示eq\f(频率,组距),即小长方形的高=eq\f(频率,组距);(2)小长方形的面积=组距×eq\f(频率,组距)=频率;(3)各个小方形的面积总和等于1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.4.频率分布表的画法第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.5.条形图、折线图及扇形图(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.6.百分位数、众数、平均数的定义(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.(3)众数一组数据中出现次数最多的数据叫做这组数据的众数.(4)平均数一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).7.样本的数字特征之方差如果有n个数据x1,x2,…,xn,那么这n个数的(1)标准差s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).(2)方差s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2].8.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为eq\x\to(x),则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\x\to(x)+a.(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)回归方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定参数.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2)=\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(eq\x\to(x),eq\x\to(y))称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.当χ2≤2.706时,没有充分的证据判定变量A,B有关联;当χ2>2.706时,有90%的把握判定变量A,B有关联;当χ>3.841时,有95%的把握判定变量A,B有关联;当χ>6.635时,有99%的把握判定变量A,B有关联.考点一、简单随机抽样1.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是(

)A. B. C. D.2.(2024高一下·全国·专题练习)某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.2,则n等于()A.80 B.160 C.200 D.2803.(2024·陕西西安·一模)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,…,649,650.从中抽取50个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(

)3221183429

7864540732

5242064438

1223435677

35789056428442125331

3457860736

2530073286

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.328 C.072 D.4571.(2024·四川成都·模拟预测)用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是(

)A., B.,C., D.,2.(2024·云南贵州·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按01、02、、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为(

)062743132432532709412512631763232616804560111410957774246762428114572042533237322707360701400523261737263890512451793014231021182191A.51 B.25 C.32 D.12考点二、分层随机抽样1.(2024·江西南昌·模拟预测)已知三种不同型号的产品数量之比依次为,现用分层抽样的方法抽取容量为的样本,若样本中型号产品有件,则为(

)A.60 B.70 C.80 D.902.(2023·全国·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有(

).A.种 B.种C.种 D.种3.(2024·上海·高考真题)水果分为一级果和二级果,共136箱,其中一级果102箱,二级果34箱.(1)随机挑选两箱水果,求恰好一级果和二级果各一箱的概率;(2)进行分层抽样,共抽8箱水果,求一级果和二级果各几箱;(3)抽取若干箱水果,其中一级果共120个,单果质量平均数为303.45克,方差为603.46;二级果48个,单果质量平均数为240.41克,方差为648.21;求168个水果的方差和平均数,并预估果园中单果的质量.1.(2024·河南·三模)国内某优秀新能源电池制造企业在锂电池单位能量密度技术上取得了重大突破,该制造企业内的某车间有两条生产线,分别生产高能量密度锂电池和低能量密度锂电池,总产量为400个锂电池.质检人员采用分层随机抽样的方法随机抽取了一个容量为80的样本进行质量检测,已知样本中高能量密度锂电池有35个,则估计低能量密度锂电池的总产量为(

).A.325个 B.300个 C.225个 D.175个2.(2024·黑龙江双鸭山·模拟预测)为了解某校初中学生的近视情况,按年级用分层抽样的方法随机抽取100名学生进行视力检测,已知初一、初二、初三年级分别有800名,600名,600名学生,则不同的抽样结果共有(

)A. B. C. D.考点三、条形统计图1.(2024·江西·二模)下图是我国年纯电动汽车销量统计情况,则下列说法错误的是(

A.我国纯电动汽车销量呈现逐年增长趋势B.这六年销量的第60百分位数为536.5万辆C.2020年销量高于这六年销量的平均值D.这六年增长率最大的为2019年至2020年2.(2024·全国·模拟预测)如图为某中型综合超市年的年总营业额(单位:万元)的统计图,则下列说法错误的是(

A.年的年总营业额的极差为2200万元B.年的年总营业额波动性比年的年总营业额波动性小C.年的年总营业额逐年上升,2021年跌落低谷,之后每年又呈上升趋势D.年的年总营业额的中位数是2019年和2020年的年总营业额的平均数1.(2024·四川达州·二模)下图是某地区2016-2023年旅游收入(单位:亿元)的条形图,则下列说法错误的是(

A.该地区2016-2019年旅游收入逐年递增B.该地区2016-2023年旅游收入的中位数是4.30C.经历了疫情之后,该地区2023年旅游收入恢复到接近2018年水平D.该地区2016-2023年旅游收入的极差是3.692.(2024·陕西西安·模拟预测)国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)(

A.2018年至2022年我国居民消费水平逐年提高B.2018年至2022年我国城镇居民消费水平逐年提高C.2018年至2022年我国居民消费水平数据的极差为6463元D.2022年我国城镇人口数比农村人口数的1.5倍还要多考点四、折线统计图1.(2024·辽宁抚顺·三模)(多选)年月日国家统计局发布了制造业采购经理指数(),如下图所示:下列说法正确的是(

)A.从年月到年月,这个月的制造业采购经理指数()的第百分位数为B.从年月到年月,这个月的制造业采购经理指数()的极差为C.从年月到年月制造业采购经理指数()呈下降趋势D.大于表示经济处于扩张活跃的状态;小于表示经济处于低迷萎缩的状态,则年月到年月,经济处于扩张活跃的状态2.(2024·全国·二模)(多选)人均可支配收入和人均消费支出是两个非常重要的经济和民生指标,常被用于衡量一个地区经济发展水平和群众生活水平.下图为2018~2023年前三季度全国城镇居民人均可支配收入及人均消费支出统计图,据此进行分析,则(

)A.2018~2023年前三季度全国城镇居民人均消费支出逐年递增B.2018~2023年前三季度全国城镇居民人均可支配收入逐年递增C.2018~2023年前三季度全国城镇居民人均可支配收入的极差比人均消费支出的极差小D.2018~2023年前三季度全国城镇居民人均消费支出的中位数为21180元1.(2024·黑龙江·三模)(多选)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是(

A.成绩在[70,80)的考生中,甲班人数多于乙班人数B.甲班成绩在[80,90)内人数最多C.乙班成绩在[70,80)内人数最多D.甲班成绩的极差比乙班成绩的极差小2.(23-24高三下·山东·开学考试)(多选)进入冬季哈尔滨旅游火爆全网,下图是2024年1月1.日到1月7日哈尔滨冰雪大世界和中央大街日旅游人数的折线图,则(

)A.中央大街日旅游人数的极差是1.2 B.冰雪大世界日旅游人数的中位数是2.3C.冰雪大世界日旅游人数的平均数比中央大街大 D.冰雪大世界日旅游人数的方差比中央大街大考点五、扇形统计图1.(2024·山东菏泽·模拟预测)南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年某国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是(

)A.2016年至2023年,知识付费用户数量逐年增加B.2016年至2023年,知识付费用户数量逐年增加量2019年最多C.2016年至2023年,知识付费用户数量的逐年增加量逐年递增D.2023年知识付费用户数量超过2016年知识付费用户数量的10倍2.(2024·湖南邵阳·模拟预测)(多选)有关数据显示,年轻一代的父母更加重视亲子陪伴,以往“以孩子为中心”的观念正逐步向与孩子玩在一起、学在一起的方向转变.如图为2023年中国父母参与过的各类亲子活动人数在参与调查总人数中的占比,根据该图,下列说法正确的是(

)A.在参与调查的总人数中父母参与过的亲子活动最多的是亲子阅读B.在参与调查的总人数中同时参与过亲子阅读与亲子运动会的父母不少于C.图中各类亲子活动占比的中位数为D.图中10类亲子活动占比的极差为1.(2024·辽宁·模拟预测)某高中2023年的高考考生人数是2022年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2022年和2023年高考分数达线情况,得到如图所示扇形统计图:

下列结论正确的是(

)A.该校2023年与2022年的本科达线人数比为6:5B.该校2023年与2022年的专科达线人数比为6:7C.2023年该校本科达线人数比2022年该校本科达线人数增加了80%D.2023年该校不上线的人数有所减少2.(2024·辽宁·二模)(多选)下图为某市2023年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7924元,与上一年同比增长4.4%;农村居民人均消费支出4388元,与上一年同比增长7.8%,则关于2023年第一季度该市居民人均消费支出,下列说法正确的是(

)A.2023年第一季度该市居民人均消费支出6393元B.居住及食品烟酒两项的人均消费支出总和超过了总人均消费支出的50%C.城乡居民人均消费支出的差额与上一年同比在缩小D.医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%考点六、频率分布表1.现有一个容量为50的样本,其数据的频数分布表如下表所示:组号12345频数811109则第4组的频数和频率分别是(

)A.12,0.06 B.12,0.24 C.18,0.09 D.18,0.361.某单位招聘员工,有名应聘者参加笔试,随机抽查了其中名应聘者笔试试卷,统计他们的成绩如下表:分数段人数1366211若按笔试成绩择优录取名参加面试,由此可预测参加面试的分数线为A.分 B.分 C.分 D.分考点七、频率分布直方图1.(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有(

)A.22年 B.23年 C.25年 D.35年2.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是(

)A. B. C. D.3.(2021·全国·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是(

)A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间4.(2022·全国·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间的概率;(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).1.(2024·湖北黄冈·模拟预测)为了解高中学生每天的体育活动时间,某市教育部门随机抽取高中学生进行调查,把每天进行体育活动的时间按照时长(单位:分钟)分成组:,40,50,50,60,60,70,,.然后对统计数据整理得到如图所示的频率分布直方图,则可估计这名学生每天体育活动时间的第百分位数为(

)A. B. C. D.2.(2024·广西桂林·模拟预测)(多选)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于80,90内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则(

)A.B.估计该年级学生成绩的中位数约为77.14C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50D.估计该年级成绩在80分及以上的学生成绩的方差为323.(2024·福建泉州·模拟预测)(多选)某校在开展“弘扬中华传统文化,深植文化自信之根”主题教育的系列活动中,举办了“诵读国学经典,传承中华文明”知识竞赛.赛前为了解学生的备赛情况,组织对高一年和高二年学生的抽样测试,测试成绩数据处理后,得到如下频率分布直方图,则下面说法正确的是(

)A.高一年抽测成绩的众数为75B.高二年抽测成绩低于60分的比率为C.估计高一年学生成绩的平均分低于高二年学生成绩的平均分D.估计高一年学生成绩的中位数低于高二年学生成绩的中位数4.(2024·江苏南京·二模)(多选)2023年10月31日,神舟十六号载人飞船返回舱在东风着陆场成功着陆,激发了学生对航天的热爱.某校组织高中学生参加航天知识竞赛,现从中随机抽取100名学生成绩分为四组,分别为,得到频率分布直方图如图所示,则(

A.B.这组样本数据的分位数为88C.若从这100名学生成绩不低于80分的学生中,随机抽取3人,则此3人的分数都不低于90分的概率为D.若用样本的频率估计总体,从该校高中学生中随机抽199人,记“抽取199人中成绩不低于90的人数为”的事件为,则最大时,.考点八、总体百分位数的估计1.(2024·江西·一模)从1984年第23届洛杉矶夏季奥运会到2024年第33届巴黎夏季奥运会,我国获得的夏季奥运会金牌数依次为15、5、16、16、28、32、51、38、26、38、40,这11个数据的分位数是(

)A.16 B.30 C.32 D.512.(2024·安徽·模拟预测)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是.3.(2024·广东广州·模拟预测)(多选)已知,,,,,为依次增大的一组数据,则去掉和后,这组数据的(

)一定减小.A.极差 B.下四分位数 C.上四分位数 D.中位数1.(2024·安徽六安·模拟预测)样本数据16,20,24,21,22,18,14,28的分位数为(

)A.16 B.17 C.23 D.242.(2024·河南周口·模拟预测)已知一组从小到大排列的数据:a,2,2,4,4,5,6,b,8,8,若其第70百分位数等于其极差,则.考点九、总体集中趋势的估计1.(2023·全国·高考真题)(多选)有一组样本数据,其中是最小值,是最大值,则(

)A.的平均数等于的平均数B.的中位数等于的中位数C.的标准差不小于的标准差D.的极差不大于的极差2.(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是(

)A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数3.(2024·重庆九龙坡·三模)(多选)已知样本数据的平均数为2,方差为1,则下列说法正确的是(

)A.数据,的平均数为6B.数据,的方差为9C.数据的方差为1D.数据的平均数为51.(23-24高三下·北京·开学考试)设一组数据,则数据的平均值为,30%分位数为.2.(2024·广东广州·模拟预测)已知数据,且满足,若去掉,后组成一组新数据,则新数据与原数据相比,有可能变大的是(

)A.平均数 B.中位数 C.极差 D.方差3.(2024·浙江·三模)(多选)已知a,,有一组样本数据为,3,,,8,10,,12,13,若在这组数据中再插入一个数8,则(

)A.平均数不变 B.中位数不变 C.方差不变 D.极差不变考点十、总体离散程度的估计1.(2024·陕西商洛·模拟预测)设一组样本数据的平均值是1,且的平均值是3,则数据的方差是(

)A.1 B.2 C.3 D.42.(2024·黑龙江哈尔滨·模拟预测)已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6个数据的新方差为(

)A. B. C.6 D.103.(2021·全国·高考真题)(多选)下列统计量中,能度量样本的离散程度的是(

)A.样本的标准差 B.样本的中位数C.样本的极差 D.样本的平均数4.(2021·全国·高考真题)(多选)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则(

)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同5.(2023·全国·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:试验序号12345678910伸缩率545533551522575544541568596548伸缩率536527543530560533522550576536记,记的样本平均数为,样本方差为.(1)求,;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)6.(2021·全国·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).1.(2024·新疆·二模)若数据的平均数为,方差为,则数据的方差为(

)A. B. C. D.2.(2024·江苏泰州·模拟预测)(多选)已知,有一组数据为,3,,,8,10,,12,13,若在这组数据中去除第5个数8,则(

)A.平均数不变 B.中位数不变 C.方差不变 D.极差不变3.(2024·云南·模拟预测)某学校高三年级男生共有个,女生共有个,为调查该年级学生的年龄情况,通过分层抽样,得到男生和女生样本数据的平均数和方差分别为和,已知,则该校高三年级全体学生年龄的方差为(

)A. B.C. D.14.(2024·辽宁·模拟预测)某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,对其生产的第一批零件的内径进行测量,统计绘制了如下图所示的频率分布直方图.

(1)求a的值以及这批零件内径的平均值和方差(同一组中的数据用该组区间的中点值作代表);(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间内的零件个数为,求的分布列以及数学期望;(3)已知这批零件的内径(单位:mm)服从正态分布,现以频率分布直方图中的平均数作为的估计值,频率分布直方图中的标准差作为的估计值,则在这批零件中随机抽取200个,记内径在区间上的零件个数为,求的方差.参考数据:,若,则,,.5.(2024·湖北武汉·模拟预测)四月的武汉被百万株蔷薇花覆盖,形成了全城的花海景观。蔷薇花一般扦插繁殖,园林局为了更好的了解扦插枝条的长度对繁殖状况的影响,选择甲乙两区按比例分层抽样来抽取样本.已知甲区的样本容量,样本平均数,样本方差;乙区的样本容量,样本平均数,样本方差.(1)求由两区样本组成的总样本的平均数及其方差;(结果保留一位小数)(2)为了营造“花在风中笑,人在画中游”的美景,甲乙两区决定在各自最大的蔷薇花海公园进行一次书画比赛,两区各派一支代表队参加,经抽签确定第一场在甲区举行.比赛规则如下:每场比赛分出胜负,没有平局,胜方得1分,负方得0分,下一场在负方举行,先得2分的代表队获胜,比赛结束.当比赛在甲区举行时,甲区代表队获胜的概率为,当比赛在乙区举行时,甲区代表队获胜的概率为.假设每场比赛结果相互独立.甲区代表队的最终得分记为X,求X的分布列及的值.参考数据:.考点十一、成对数据的统计相关性1.(2024·上海·高考真题)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是(

)A.气候温度高,海水表层温度就高B.气候温度高,海水表层温度就低C.随着气候温度由低到高,海水表层温度呈上升趋势D.随着气候温度由低到高,海水表层温度呈下降趋势2.(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”.鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为(

)A.花瓣长度和花萼长度不存在相关关系B.花瓣长度和花萼长度负相关C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为D.若从样本中抽取一部分,则这部分的相关系数一定是3.(2022·全国·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i12345678910总和根部横截面积0.040.060.040.080.080.050.050.070.070.060.6材积量0.250.400.220.540.510.340.360.460.420.403.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.4.(2020·全国·高考真题)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.1.(23-24高三下·云南昆明·阶段练习)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的决定系数如下,其中拟合效果最好的模型是(

)A.模型1(决定系数为0.97) B.模型2(决定系数为0.85)C.模型3(决定系数为0.40) D.模型4(决定系数为0.25)2.(2024·贵州贵阳·模拟预测)(多选)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57根据表中的数据可得到经验回归方程为.,则(

)A.y与x的样本相关系数B.C.表中维修费用的第60百分位数为6D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元3.(2024·江苏宿迁·三模)(多选)为了研究y关于x的线性相关关系,收集了5对样本数据(见表格),若已求得一元线性回归方程为,则下列选项中正确的是(

)123451A.B.当时的残差为C.样本数据y的40百分位数为1D.去掉样本点后,y与x的相关系数不会改变4.(2024·河南新乡·模拟预测)氮氧化物是一种常见的大气污染物,下图为我国2015年至2023年氮氧化物排放量(单位:万吨)的折线图,其中年份代码1~9分别对应年份2015~2023.已知,,,.(1)可否用线性回归模型拟合与的关系?请分别根据折线图和相关系数加以说明.(2)若根据所给数据建立回归模型,可否用此模型来预测2024年和2034年我国的氮氧化物排放量?请说明理由.附:相关系数.考点十二、一元线性回归模型及其应用1.(2024·上海·三模)设一组成对数据的相关系数为r,线性回归方程为,则下列说法正确的为(

).A.越大,则r越大 B.越大,则r越小C.若r大于零,则一定大于零 D.若r大于零,则一定小于零2.(2024·天津·二模)有人通过调查统计发现,儿子成年时的身高与父亲的身高呈线性相关,且儿子成年时的身高(单位:)与父亲的身高(单位:)的经验回归方程为,根据以上信息,下列判断正确的为(

).A.儿子成年时的身高与父亲的身高的样本相关系数B.父亲的身高为,儿子成年时的身高一定在到之间C.父亲的身高每增加,儿子成年时的身高平均增加D.儿子在成年时的身高一般会比父亲高3.(2024·山东枣庄·模拟预测)(多选)已知两个变量y与x对应关系如下表:x12345y5m8910.5若y与x满足一元线性回归模型,且经验回归方程为,则(

)A.y与x正相关 B.C.样本数据y的第60百分位数为8 D.各组数据的残差和为04.(2024·陕西西安·二模)近年来我国新能源汽车行业蓬勃发展,新能源汽车不仅对环境保护具有重大的意义,而且还能够减少对不可再生资源的开发,是全球汽车发展的重要方向.“保护环境,人人有责”,在政府和有关企业的努力下,某地区近几年新能源汽车的购买情况如下表所示:年份x20192020202120222023新能源汽车购买数量>(万辆)0.400.701.101.501.80(1)计算与的相关系数(保留三位小数);(2)求关于的线性回归方程,并预测该地区2025年新能源汽车购买数量.参考公式,,.参考数值:,.5.(2024·河北沧州·模拟预测)“南澳牡蛎”是我国地理标志产品,产量高、肉质肥、营养好,素有“海洋牛奶精品”的美誉.2024年该基地考虑增加人工投入,现有以往的人工投入增量x(人)与年收益增量y(万元)的数据如下:人工投入增量x(人)234681013年收益增量y(万元)13223142505658该基地为了预测人工投入增量为16人时的年收益增量,建立了y与x的两个回归模型:模型①:由最小二乘公式可求得y与x的线性回归方程:;模型②:由散点图的样本点分布,可以认为样本点集中在曲线:的附近,对人工投入增量x做变换,令,则,且有,,,.(1)(i)根据所给的统计量,求模型②中y关于x的回归方程(精确到0.1);(ii)根据下列表格中的数据,比较两种模型的决定系数,并选择拟合精度更高、更可靠的模型,预测人工投入增量为16人时的年收益增量.回归模型模型①模型②回归方程182.479.2(2)根据养殖规模与以往的养殖经验,产自某南澳牡蛎养殖基地的单个“南澳牡蛎”质量(克)在正常环境下服从正态分布.购买10只该基地的“南澳牡蛎”,会买到质量小于20g的牡蛎的可能性有多大?附:若随机变量,则,;样本的最小二乘估计公式为:,,.1.(2024·上海徐汇·二模)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):x12345y0.50.911.11.5若已求得一元线性回归方程为,则下列选项中正确的是(

)A.B.当时,y的预测值为2.2C.样本数据y的第40百分位数为1D.去掉样本点后,x与y的样本相关系数r不会改变2.(2024·河北·一模)某校为了解本校高一男生身高和体重的相关关系,在该校高一年级随机抽取了7名男生,测量了他们的身高和体重得下表:身高(单位:167173175177178180181体重(单位:90545964677276由表格制作成如图所示的散点图:

由最小二乘法计算得到经验回归直线的方程为,其相关系数为;经过残差分析,点对应残差过大,把它去掉后,再用剩下的6组数据计算得到经验回归直线的方程为,相关系数为.则下列选项正确的是(

)A.B.C.D.3.(2024·甘肃陇南·一模)(多选)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:x23456y2.23.85.56.57根据表中的数据可得到经验回归方程为.则(

)A.B.y与x的样本相关系数C.表中维修费用的第60百分位数为6D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元4.(2024·全国·模拟预测)脑机接口,即指在人或动物大脑与外部设备之间创建的直接连接,实现脑与设备的信息交换.近日埃隆.马斯克宣布,脑机接口公司Neuralink正在接收第二位植入者申请,该试验可以实现意念控制手机和电脑.未来10到20年,我国脑机接口产业将产生数百亿元的经济价值.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量(单位:亿元)与研发人员增量(人)的10组数据.现用模型①,②分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.根据收集到的数据,计算得到下表数据,其中.7.52.2582.504.5012.142.88(1)根据残差图,判断应选择哪个模型;(无需说明理由)(2)根据(1)中所选模型,求出关于的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少多少人?(精确到1)附:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计分别为5.(2024·江西九江·三模)车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过实验测得轿车行驶里程与某品牌轮胎凹槽深度的数据,如下表所示:行驶里程万0.00.41.01.62.42.83.44.4轮胎凹槽深度8.07.87.26.25.64.84.44.0(1)求该品牌轮胎凹槽深度与行驶里程的相关系数,并判断二者之间是否具有很强的线性相关性;(结果保留两位有效数字)(2)根据我国国家标准规定:轿车轮胎凹槽安全深度为(当凹槽深度低于时刹车距离增大,驾驶风险增加,必须更换新轮胎).某人在保养汽车时将小轿车的轮胎全部更换成了该品牌的新轮胎,请问在正常行驶情况下,更换新轮胎后继续行驶约多少公里需对轮胎再次更换?附:变量与的样本相关系数;对于一组数据,,其线性回归方程的斜率和截距的最小二乘估计分别为:.考点十三、列联表与独立性检验1.(2024·江苏盐城·模拟预测)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到,则(

)0.10.050.010.0050.0012.7063.8416.6357.87910.828A.变量Ⅰ与Ⅱ相关B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1C.变量Ⅰ与Ⅱ不相关D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.12.(2024·广东江门·模拟预测)(多选)某中学为更好的开展素质教育,现对外出研学课程是否和性别有关做了一项调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.若依据的独立性检验,可以认为“选修外出研学课程与性别有关”.则调查人数中男生可能有(

)男生女生合计选修外出研学课程未选修外出研学课程合计附:,其中A.150人 B.225人 C.300人 D.375人3.(2024·湖南益阳·一模)某公园为了提升公园形象,提高游客旅游的体验感,他们更新了部分设施,调整了部分旅游线路.为了解游客对新措施是否满意,随机抽取了100名游客进行调查,男游客与女游客的人数之比为2:3,其中男游客有35名满意,女游客有15名不满意.满意不满意总计男游客35女游客15合计100(1)完成列联表,依据表中数据,以及小概率值的独立性检验,能否认为游客对公园新措施满意与否与性别有关?(2)从被调查的游客中按男、女分层抽样抽取5名游客.再随机从这5名游客中抽取3名游客征求他们对公园进一步提高服务质量的建议,其中抽取男游客的人数为.求出的分布列及数学期望.参考公式:,其中.参考数据:0.100.050.0100.0052.7063.8416.6357.8791.(2024·四川成都·三模)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀甲班10乙班30附:(),0.050.0250.0100.0053.8415.0246.6357.879已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是(

)A.甲班人数少于乙班人数B.甲班的优秀率高于乙班的优秀率C.表中的值为15,的值为50D.根据表中的数据,若按的可靠性要求,能认为“成绩与班级有关系”2.(2024·福建南平·模拟预测)(多选)2023年10月全国多地医院出现较多的支原体肺炎感染患者,患者多以儿童为主.某研究所在某小学随机抽取了46名儿童,得到他们是否接种流感疫苗和是否感染支原体肺炎的情况的相关数据,如下表所示,则(

)感染情况接种情况感染支原体肺炎未感染支原体肺炎合计接种流感疫苗未接种流感疫苗合计46附:.0.10.050.010.0050.0012.7063.8416.6357.87910.828A.B.C.认为是否接种流感疫苗与是否感染支原体肺炎有关联,此推断犯错的概率不大于0.1D.没有充分的证据推断是否接种流感疫苗与是否感染支原体肺炎有关联3.(2024·广东佛山·模拟预测)某区中考体育科目有必选项目和选考项目,其中篮球为一个选考项目.该区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:性别是否喜欢篮球合计喜欢不喜欢男生450150600女生150250400合计6004001000(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;(2)用按性别比例分配的分层随机抽样的方法从参与调查的喜欢篮球的600名初中学生中抽取8名学生做进一步调查,将这8名学生作为一个样本,从中随机抽取3人,用X表示随机抽取的3人中女生的人数,求X的分布列和数学期望.附:参考数据,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828一、单选题1.(2024·四川南充·一模)甲同学近10次数学考试成绩情况如下:103,106,113,119,123,118,134,118,125,121,则甲同学数学考试成绩的第75百分位数是(

)A.118 B.121 C.122 D.1232.(2024·广东珠海·模拟预测)下列说法正确的是(

)A.一组数据的标准差为0,则这组数据中的数均相等B.两组数据的标准差相等,则这两组数据的平均数相等C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强D.已知变量,由它们的样本数据计算得到的观测值的部分临界值如下表:0.10.050.0250.012.7063.8415.0246.635则在犯错误的概率不超过0.025的前提下认为变量没有关系3.(2024·江苏苏州·模拟预测)设研究某两个属性变量时,作出零假设并得到2×2列联表,计算得,则下列说法正确的是(

)A.有99.5%的把握认为不成立 B.有5%的把握认为的反面正确C.有95%的把握判断正确 D.有95%的把握能反驳4.(2024·安徽芜湖·模拟预测)下列说法正确的是(

)A.若随机变量,则当较小时,对应的正态曲线“矮胖”,随机变量X的分布比较分散B.在做回归分析时,可以用决定系数刻画模型回归效果,越小,说明模型拟合的效果越好C.一元线性回归模型中,如果相关系数,表明两个变量的相关程度很强D.在列联表中,若所有数据均变成原来的2倍,则不变(,其中)二、多选题5.(2024·海南海口·模拟预测)某校为了解学生的身体状况,随机抽取了50名学生测量体重,经统计,这些学生的体重数据(单位:千克)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则(

)A.频率分布直方图中的值为0.04B.这50名学生体重的众数约为52.5C.该校学生体重的上四分位数约为61.25D.这50名学生中体重不低于65千克的人数约为106.(2024·湖北武汉·模拟预测)某科技公司统计了一款App最近5个月的下载量如表所示,若与线性相关,且线性回归方程为,则(

)月份编号12345下载量(万次)54.543.52.5A.与负相关 B.C.预测第6个月的下载量是2.1万次 D.残差绝对值的最大值为0.27.(2024·江西新余·模拟预测)已知对个数据做如下变换:当为奇数时,对应的变为;当为偶数时,对应的变为,则对于该组数据的变化,下列情况中可能发生的是:(

).A.平均数增大 B.方差不变C.分位数减小 D.众数减小三、填空题8.(2024·四川成都·模拟预测)已知关于x的一组数据:x1m345y0.50.6n1.31.4根据表中数据得到的线性回归直线方程为,则的值.四、解答题9.(2024·浙江嘉兴·二模)为了有效预防流感,很多民众注射了流感疫苗.市防疫部门随机抽取了1000人进行调查,发现其中注射疫苗的800人中有220人感染流感,另外没注射疫苗的200人中有80人感染流感.医学研究表明,流感的检测结果有检错的可能,已知患流感的人其检测结果有呈阳性(流感),而没有患流感的人其检测结果有呈阴性(未感染)(1)估计该市流感感染率是多少?(2)根据所给的数据,判断是否有99%的把握认为注射流感疫苗与预防流感有关;(3)已知某人的流感检查结果呈阳性,求此人真的患有流感的概率.(精确到0.001)附:.0.0500.0100.001k3.8416.63510.82810.(2024·陕西安康·模拟预测)某乒乓球训练机构以训练青少年为主,其中有一项打定点训练,就是把乒乓球打到对方球台的指定位置(称为“准点球”),在每周末,记录每个接受训练的学员在训练时打的所有球中“准点球”的百分比(),A学员已经训练了1年,下表记录了学员最近七周“准点球”的百分比:周次(x)12345675252.853.55454.554.955.3若.(1)根据上表数据,计算与的相关系数,并说明与的线性相关性的强弱;(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱)(精确到)(2)求关于的回归方程,并预测第周“准点球”的百分比.(精确到)参考公式和数据:,,.一、单选题1.(2024·江苏镇江·三模)命题P:的平均数与中位数相等;命题Q:是等差数列,则P是Q的(

)A.充分不必要条件 B.必要不充分条件C.充要条件 D.既不充分也不必要条件2.(2024·江西新余·模拟预测)已知一组数据大致呈线性分布,其回归直线方程为,则的最小值为(

).A. B. C. D.无法确定3.(2024·吉林·模拟预测)设样本数据,,…,的平均数为,标准差为,若样本数据,,…,的平均数比标准差少3,则的最大值为(

)A.1 B. C.4 D.二、多选题4.(2024·湖南邵阳·三模)为了解一片经济林的生长情况,随机抽取了其中60株树木,测量底部周长(单位:cm),所得数据均在区间内,其频率分布直方图如图所示,则(

)A.图中的值为0.025B.样本中底部周长不小于110cm的树木有12株C.估计该片经济林中树木的底部周长的分位数为115D.估计该片经济林中树木的底部周长的平均数为104(每组数据用该组所在区间的中点值作代表)5.(2024·辽宁·模拟预测)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个歧义点和后,得到新的回归直线的回归系数为2.5,则下列说法正确的是(

)A.相关变量具有正相关关系B.去除两个歧义点后,随值增加相关变量值增加速度变小C.去除两个歧义点后,重新求得回归方程对应的直线一定过点D.去除两个歧义点后,重新求得的回归直线方程为6.(2024·吉林长春·模拟预测)已知变量x和变量y的一组成对样本数据()的散点落在一条直线附近,,,相关系数为,线性回归方程为,则(

)A.当越大时,成对样本数据的线性相关程度越强B.当时,C.,时,成对样本数据()的相关系数满足D.时,成对样本数据()的线性回归方程满足参考公式:7.(2024·福建·模拟预测)已知一组数据的平均数、中位数、众数依次成等差数列,现在丢失了其中一个数据,另外六个数据分别是7,9,10,7,15,7.将丢失数据的所有可能值从小到大排列成数列an,记,则(

)A. B.C.an是等差数列 D.a8.(2024·湖北·模拟预测)已知互不相同的20个样本数据,若去掉其中最大和最小的数据,设剩下的18个样本数据的方差为,平均数;去掉的两个数据的方差为,平均数;原样本数据的方差为,平均数,若,则(

)A.B.C.剩下18个数据的中位数大于原样本数据的中位数D.剩下18个数据的分位数不等于原样本数据的分位数三、解答题9.(2024·海南海口·模拟预测)制定适合自己的学习计划并在学习过程中根据自己的实际情况有效地安排和调整学习方法是一种有效的学习策略.某教师为研究学生制定学习计划并坚持实施和数学成绩之间的关系,得到如下数据:成绩分成绩分合计制定学习计划并坚持实施没有制定学习计划合计50(1)依据小概率值的独立性检验,能否认为“制定学习计划并坚持实施”和“数学成绩高于分”有关联?(2)若该校高三年级每月进行一次月考,该校学生小明在高三开学初认真制定了学习计划,其中一项要求自己每天要把错题至少重做一遍,做对为止.以下为小明坚持实施计划的月份和他在学校数学月考成绩的校内名次数据:月考时间月初月初次年月初次年月初次年月初时间代码月考校内名次参考数据:,.(ⅰ)求月考校内名次与时间代码的线性回归方程;(ⅱ)该校老师给出了上一年该校学生高考(月初考试)数学成绩在校内的名次和在全省名次的部分数据:校内名次全省名次利用数据分析软件,根据以上数据得出了两个回归模型和决定系数:模型①模型②在以上两个模型中选择“较好”模型(说明理由),并结合问题(ⅰ)的回归方程,依据“较好”模型预测小明如果能坚持实施学习计划,他在次年高考中数学成绩的全省名次(名次均保留整数).(参考数据:,,)附:(ii),其中.(i)对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.10.(2024·江苏无锡·模拟预测)由于人们对工业高度发达的负面影响预料不够,预防不利,导致了全球性的三大危机:资源短缺、环境污染、生态破坏环境污染指自然的或人为的破坏,向环境中添加某种物质而超过环境的自净能力而产生危害的行为或由于人为的因素,环境受到有害物质的污染,使生物的生长繁殖和人类的正常生活受到有害影响由于人为因素使环境的构成或状态发生变化,环境质量下降,从而扰乱和破坏了生态系统和人类的正常生产和生活条件的现象据研究,某种污染物具有极强的污染力,现在对这种污染物的污染力进行调查研究,通过实验调查,可以得到某地区该污染物到来后的污染时间小时与该污染物的污染面积平方米的一些数据如下:通过分析可知,数据与之间存在很强的线性回归关系.(1)求出与之间的关系式;(2)根据中的关系式,该污染物到来后的污染时间是多少时,该污染物的污染面积的平均增长最慢?参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别,..1.(2024·天津·高考真题)下列图中,线性相关性系数最大的是(

)A. B.C. D.2.(2024·全国·高考真题)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:优级品合格品不合格品总计甲车间2624050乙车间70282100总计96522150(1)填写如下列联表:优级品非优级品甲车间乙车间能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()附:0.0500.0100.001k3.8416.63510.8283.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:时间范围学业成绩优秀5444231不优秀1341471374027(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?(附:其中,.)4.(2023·全国·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2

18.8

20.2

21.3

22.5

23.2

25.8

26.5

27.5

30.132.6

34.3

34.8

35.6

35.6

35.8

36.2

37.3

40.5

43.2试验组的小白鼠体重的增加量从小到大排序为7.8

9.2

11.4

12.4

13.2

15.5

16.5

18.0

18.8

19.219.8

20.2

21.6

22.8

23.6

23.9

25.1

28.2

32.3

36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.8416.6355.(2023·全国·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;(2)实验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2

18.8

20.2

21.3

22.5

23.2

25.8

26.5

27.5

30.132.6

34.3

34.8

35.6

35.6

35.8

36.2

37.3

40.5

43.2实验组的小白鼠体重的增加量从小到大排序为:7.8

9.2

11.4

12.4

13.2

15.5

16.5

18.0

18.8

19.219.8

20.2

21.6

22.8

23.6

23.9

25.1

28.2

32.3

36.5(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:对照组实验组(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.附:0.1000.0500.0102.7063.8416.6356.(2023·全国·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:试验序号12345678910伸缩率545533551522575544541568596548伸缩率536527543530560533522550576536记,记的样本平均数为,样本方差为.(1)求,;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)7.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论