2025高考帮备考教案数学第九章 统计与成对数据的统计分析第1讲 随机抽样、统计图表含答案_第1页
2025高考帮备考教案数学第九章 统计与成对数据的统计分析第1讲 随机抽样、统计图表含答案_第2页
2025高考帮备考教案数学第九章 统计与成对数据的统计分析第1讲 随机抽样、统计图表含答案_第3页
2025高考帮备考教案数学第九章 统计与成对数据的统计分析第1讲 随机抽样、统计图表含答案_第4页
2025高考帮备考教案数学第九章 统计与成对数据的统计分析第1讲 随机抽样、统计图表含答案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025高考帮备考教案数学第九章统计与成对数据的统计分析第九章统计与成对数据的统计分析第1讲随机抽样、统计图表课标要求命题点五年考情命题分析预测1.了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法与随机数法.会计算样本均值和样本方差,了解样本与总体的关系.2.了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.掌握分层随机抽样的样本均值和样本方差.3.能根据实际问题的特点,设计恰当的抽样方法解决问题.4.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.随机抽样2023新高考卷ⅡT3;2020全国卷ⅡT18本讲为高考的命题热点,主要考查:(1)分层随机抽样,题型以选择题和填空题为主,属于中低档题;(2)统计图表的应用,着重考查频率分布表、频率分布直方图、条形图、折线图等,单独命题时以小题形式出现,与其他知识综合命题时常作为问题情境出现在解答题中.预计2025年高考命题趋势变化不大,重点在情境的创新.统计图表2023新高考卷ⅡT19;2022新高考卷ⅡT19;2020新高考卷ⅡT9;2019全国卷ⅢT17学生用书P2081.简单随机抽样(1)分类:放回简单随机抽样和不放回简单随机抽样.除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样.(2)常用方法:①抽签法和②随机数法.辨析比较1.抽签法和随机数法的异同:(1)都是逐个、不放回抽样;(2)总体中个体数不多时选择抽签法,总体量较大,样本量较小时选择随机数法.2.能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为③分层随机抽样,每一个子总体称为④层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为⑤比例分配.辨析比较简单随机抽样与分层随机抽样的辨析抽样方法共同点各自特点相互联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的机会均等;(2)都是不放回抽样.从总体中逐个抽取.分层随机抽样在各层抽样时可采用简单随机抽样.样本容量较小.分层随机抽样将总体分成互不交叉的层,分层进行抽取.总体可以分层,层与层之间有明显区别,而层内个体间差异较小.3.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布表、频率分布直方图等.(2)频率分布直方图的制作步骤a.求极差.极差为一组数据中最大值与最小值的⑥差.b.决定组距与组数.当样本量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.c.将数据分组.使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.d.列频率分布表.计算各小组的频率,作出频率分布表.e.画频率分布直方图.在频率分布直方图中,纵轴表示⑦频率组距1.下列说法正确的是(D)A.从无限多个个体中抽取100个个体作为样本是简单随机抽样B.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛是简单随机抽样C.从某厂生产的5000件产品中抽取600件进行质量检验,可用抽签法D.某校有2000名学生,其中高一年级700人,高二年级600人,高三年级700人,现从中抽取20人了解学生在校学习压力的情况,可用分层随机抽样的方法抽取解析A选项,不是简单随机抽样,因为题中被抽取的总体中的个体数是无限的,而不是有限的;B选项,不是简单随机抽样,个子最高的5名同学是确定的,不是等可能抽样;C选项是简单随机抽样,但总体中的个体数太多,不宜采用抽签法;D选项,三个年级的学生个体差异比较明显,所以适用分层随机抽样.2.某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆.为检验该公司这三种型号轿车的质量,公司质检部要抽取57辆进行检验,则下列说法错误的是(B)A.应采用分层随机抽样的方法抽取B.应采用简单随机抽样抽取C.三种型号的轿车依次应抽取9辆,36辆,12辆D.这三种型号的轿车,每一辆被抽到的可能性相等解析由题知,该公司质检部要对三种型号的轿车抽取57辆进行检验,所以该检验应采用分层随机抽样的方法,故选项A正确,选项B错误.对于选项C,1500+6000+2000=9500(辆),所以三种型号的轿车依次应抽取57×15009500=9(辆),57×60009500=36(辆),57×200093.中国古代科举制度始于隋而成于唐,兴盛于明、清两朝.明代会试分南卷、北卷、中卷,按11∶7∶2的比例录取,若某年会试录取人数为100,则中卷录取人数为(A)A.10 B.35 C.55 D.75解析由题意知,会试录取人数为100,则中卷录取人数为100×211+7+2=4.[教材改编]某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=0.030.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为3.解析因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(求频率之和时,切勿忘记乘以组距)由频率分布直方图可知,身高在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10.所以从身高在[140,150]内的学生中选取的人数应为1060×18=3.(抽样比=身高在[学生用书P209命题点1随机抽样角度1简单随机抽样例1(1)下列抽取样本的方式属于简单随机抽样的是(B)A.从平面直角坐标系中抽取5个点作为样本B.盒子里共有80个零件,从中抽取5个零件进行质量检验.在抽样时,从中任意拿出一个零件进行质量检验后不再把它放回盒子里C.从20件玩具中一次性抽取3件进行质量检验D.某班有50名学生,指定数学成绩排名前三的3名学生参加学校组织的数学竞赛解析A不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的.B是简单随机抽样.C不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取.D不是简单随机抽样,因为不是等可能抽样.(2)设某总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从下面随机数表第1行第5列的数字开始,从左到右依次选取两个数字,则选出来的第5个个体编号为03.18180792454417165807798386196216765003105523640505266238解析由题意得,选出来的这5个个体的编号依次是07,17,16,19,03,所以选出来的第5个个体编号为03.方法技巧(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③等可能抽取.(2)用随机数法选取样本时,要剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要个数.角度2分层随机抽样例2(1)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层随机抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于(D)A.12 B.18 C.24 D.36解析根据分层随机抽样方法知n960+480=24960,解得n(2)某口罩厂的三个车间在一个小时内共生产3600个口罩,在出厂前要检查这批口罩的质量,现决定采用分层随机抽样的方法进行抽取,若从第一、二、三车间抽取的口罩个数分别为a,b,c,且a,b,c成等差数列,则第二车间生产的口罩个数为(C)A.800 B.1000 C.1200 D.1500解析因为a,b,c成等差数列,所以a+c=2b,则第二车间生产的口罩个数为3600×ba+b+c=3600×方法技巧(1)在比例分配的分层随机抽样中,抽样比=样本容量总体容量=各层样本容量(2)总体中各层的个体数之比等于样本中相应的各层抽取的样本量之比.训练1(1)“夸父一号”的成功发射,实现了我国天基太阳探测卫星跨越式突破,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学按01,02,…,30进行编号,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第3列的数字开始,由左到右依次选取两个数字,则选取的第5位同学的编号为(C)4567321212310701085213200112512932049234493582003623486969387481A.23 B.20 C.13 D.12解析依次从随机数表中选取的有效编号为12,07,01,08,13,故选取的第5位同学的编号为13.故选C.(2)[多选]已知某地区有小学生120000人,初中生75000人,高中生55000人,当地教育部门为了解本地区中小学生的近视率,按小学生、初中生、高中生进行分层随机抽样,抽取一个容量为2000的样本,得到小学生、初中生、高中生的近视率分别为30%,70%,80%.下列说法中正确的有(ABD)A.从高中生中抽取了440人B.每名学生被抽到的概率为1C.估计该地区中小学生总体的平均近视率为60%D.估计高中生的近视人数为44000解析由题意,得每名学生被抽到的概率为2000120000+75000+55000=1125,故B正确;从高中生中抽取了55000×1125=440(人),故A正确;估计高中生的近视人数为55000×80%=44000,故D正确;学生总人数为250000人,小学生占比为120000250000=48%,同理,初中生、高中生占比分别为30%,22%,在容量为2000的样本中,小学生、初中生和高中生分别有960人、600人和440人,则近视人数为960×30%+600×70%命题点2统计图表角度1条形图、扇形(饼)图、折线图例3(1)[2023四川南充模拟]下图是甲、乙两人高考前10次数学模拟成绩的折线图,则下列说法错误的是(C)A.甲的数学成绩最后3次逐渐升高B.甲的数学成绩在130分及以上的次数多于乙的数学成绩在130分及以上的次数C.甲有5次考试成绩比乙高D.甲数学成绩的极差小于乙数学成绩的极差解析对于A,由题图可知甲的最后三次数学成绩逐渐升高,故A说法正确.对于B,甲的数学成绩在130分及以上的次数为6,乙的数学成绩在130分及以上的次数为5,故B说法正确.对于C,甲有7次考试成绩比乙高,故C说法错误.对于D,由题图可知,甲、乙两人的数学成绩的最高成绩相同,甲的最低成绩为120分,乙的最低成绩为110分,因此甲的数学成绩的极差小于乙的数学成绩的极差,D说法正确.故选C.(2)[多选/2023济南市模拟]某学校组建了辩论、英文剧场、民族舞、无人机和数学建模五个社团,高一学生全员参加,且每位学生只能参加一个社团.学校根据学生参加情况绘制如下统计图,已知参加无人机社团和参加数学建模社团的学生人数相等,下列说法正确的是(AC)A.高一年级学生人数为120B.参加无人机社团的学生人数为17C.若按比例分层随机抽样从各社团抽取20人,则从无人机社团抽取的学生人数为3D.若甲、乙、丙三人报名参加社团,则共有60种不同的报名方法解析由题中统计图可知,参加民族舞社团的学生人数为12,占高一年级学生人数的10%,所以高一年级学生人数为12÷10%=120,所以参加英文剧场社团的学生人数为120×35%=42,又参加辩论社团的学生人数为30,所以参加无人机社团的学生人数等于参加数学建模社团的学生人数等于(120-42-30-12)÷2=18,故A正确,B不正确.若按分层随机抽样从各社团抽取20人,则从无人机社团抽取的学生人数为20×18120=3,C正确.若甲、乙、丙三人报名参加社团,则每人有5种选法,共有53=125(种)不同的报名方法,故D不正确.综上所述,选方法技巧统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例.(2)折线图:描述数据随时间的变化趋势.(3)条形图和频率分布直方图:直观描述不同类别或分组数据的频数和频率.角度2频率分布直方图例4[2023长沙雅礼中学模拟]某学校为了调查学生一周在生活方面的支出(单位:元)情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法不正确的是(A)A.样本中支出在[50,60]内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则约有600人支出在[50,60]内解析设[50,60]对应小长方形的高为x,则(0.01+0.024+0.036+x)×10=1,解得x=0.03,所以样本中支出在[50,60]内的频率为0.03×10=0.3,A选项错误.n=600.3=200,样本中支出不少于40元的人数为200×(0.036+0.03)×10=132,B选项正确.该校有2000名学生,则约有2000×0.3=600(人)支出在[50,60]内,D选项正确.故选A.方法技巧与频率分布直方图相关的结论(1)频率分布直方图中各小长方形的面积之和为1.(2)频率分布直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距(3)频率分布直方图中每组样本的频数为频率×总数.训练2(1)[2023陕西省宝鸡市质检]某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的身高都在A,B,C,D,E五个层次内,分男、女生统计得到如下图所示的样本分布统计图,则(B)A.样本中A层次的女生比相应层次的男生人数多B.估计样本中男生身高的中位数比女生身高的中位数大C.D层次的女生和E层次的男生在整个样本中的频率相等D.样本中B层次的学生人数和C层次的学生人数一样多解析设样本中女生有y人,则男生有(1000-y)人,设女生身高频率分布直方图中的组距为t,由(a+1.5a+2a+2.5a+3a)t=1,所以at=0.1,所以女生身高频率分布直方图中A层次频率为0.2,B层次频率为0.3,C层次频率为0.25,D层次频率为0.15,E层次频率为0.1,所以样本中A层次的女生人数为0.2y,男生人数为0.1(1000-y),由于y的取值未知,所以无法比较A层次中男、女生人数,A错误;D层次女生在女生样本中频率为0.15,所以在整个样本中频率为0.15y1000,E层次男生在男生样本中频率为0.15,所以在整个样本中频率为0.15(样本中B层次的学生数为0.3y+0.25(1000-y)=250+0.05y,样本中C层次的学生数为0.25y+0.3(1000-y)=300-0.05y,由于y的取值未知,所以250+0.05y与300-0.05y可能不相等,D错误;女生中A,B两个层次的频率之和为0.5,所以女生的样本身高中位数为B,C层次的分界点,而男生A,B两个层次的频率之和为0.35,A,B,C三个层次的频率之和为0.65,显然中位数落在C层次内,所以样本中男生身高的中位数比女生身高的中位数大,B正确.故选B.(2)[多选/2023南京市、盐城市二模]新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于21世纪初,近年来发展迅速,连续8年产销量位居世界第一.图1,图2分别是2017年至2022年我国新能源汽车年产量和占比(占我国汽车年总产量的比例)情况,则(BCD)图1图2A.2017—2022年我国新能源汽车年产量逐年增加B.2017—2022年我国新能源汽车年产量的极差为626.4万辆C.2022年我国汽车年总产量超过2700万辆D.2019年我国汽车年总产量低于2018年我国汽车年总产量解析对于选项A,题图1中2019年新能源汽车年产量低于2018年新能源汽车年产量,A错误;对于选项B,极差为705.8-79.4=626.4(万辆),B正确;对于选项C,2022年我国汽车年总产量为705.8÷25.6%≈2757(万辆),C正确;对于选项D,2019年我国汽车年总产量为124.2÷4.8%≈2588(万辆),2018年我国汽车年总产量为127÷4.5%≈2822(万辆),D正确.故选BCD.1.[命题点1角度2/2023新高考卷Ⅱ]某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有(D)A.C40045·C20015种 B.C.C40030·C20030种 D.解析由题意,初中部和高中部学生人数之比为400200=21,所以抽取的60名学生中初中部应有60×23=40(人),高中部应有60×13=20(人),所以不同的抽样结果共有C2.[命题点2角度1/全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是(A)A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析解法一设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以只有A是错误的.解法二设新农村建设前经济收入为x,则新农村建设后经济收入为2x.因为0.6x<0.37×2x,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.3.[命题点2角度2/2021全国卷甲]为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是(C)A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为0.02+0.04×1×100%=6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于10.5万元的农户比率约为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×1004.[命题点2角度2/全国卷Ⅰ]某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7]频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6]频数151310165(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)频率分布直方图如图所示.(2)根据(1)中的频率分布直方图,知该家庭使用节水龙头50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=该家庭使用了节水龙头后50天日用水量的平均数为x2=估计该家庭使用节水龙头后,一年能节省水(0.48-0.35)×365=47.45(m3).学生用书·练习帮P3731.[2024宝鸡段考]下列4个抽样中,简单随机抽样的个数是(B)①从无数个个体中抽取50个个体作为样本;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某连队从200名党员官兵中,挑选出50名最优秀的赶赴某市参加抗洪救灾工作;④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.A.0 B.1 C.2 D.3解析①不是简单随机抽样,因为简单随机抽样要求被抽取的样本总体的个数是有限的.②不是简单随机抽样,虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样,因为50名党员官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.④是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是等可能抽样.故选B.2.[2024四川遂宁月考]从遂宁市中小学生中抽取部分学生,进行肺活量调查.经了解,该市小学、初中、高中三个学段学生的肺活量有较大差异,而同一学段男女生的肺活量差异不大.在下面的抽样方法中,最合理的抽样方法是(C)A.简单随机抽样 B.按性别分层随机抽样C.按学段分层随机抽样 D.按学校分层随机抽样解析已经了解到该市小学、初中、高中三个学段学生的肺活量有较大差异,而同一学段男女生的肺活量差异不大,因此按学段分层随机抽样,这种方式具有代表性,比较合理.故选C.3.[2024河南郑州模拟]为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师开展了植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐树苗(C)A.30棵 B.50棵 C.72棵 D.80棵解析由题意,中年教师应分得树苗的数量为600×35+3+2=180,所以中年教师应分得梧桐树苗的数量为180×40%=72.故选4.[2024四川乐山月考]为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有8人,则第三组中有疗效的人数为(B)A.8 B.10 C.12 D.18解析由题可知样本总数为200.16+0.24=50,设第三组有疗效的人数为x,则x+850=5.[2023上海春季高考]如图为2017—2021年中国货物进出口总额的统计图,则下列说法错误的是(C)A.从2018年开始,每年与上一年相比,2021年的进出口总额增长率最大B.从2018年开始,进出口总额逐年增大C.从2018年开始,进口总额逐年增大D.从2018年开始,每年与上一年相比,2020年的进出口总额增长率最小解析由题图可知,2020年的进口总额小于2019年的进口总额,故C不正确;由题图可知,2017—2021年的进出口总额依次为27.81,30.50,31.57,32.22,39.10,与上一年相比,2018年的增长率为30.50-27.8127.81≈9.7%,同理可得2019年,2020年,2021年的增长率分别约为3.5%,2.1%,21.4%,故6.[多选]某商户收集并整理了其在2023年1月到8月线上和线下收入的数据,并绘制如图所示的折线图,则下列结论正确的是(ACD)A.该商户这8个月中,月收入最高的是7月B.该商户这8个月的线上总收入低于线下总收入C.该商户这8个月中,线上、线下收入相差最小的是7月D.该商户这8个月中,月收入不少于17万元的频率是0.5解析对于A:该商户这8个月中,月收入分别为16万元,13.5万元,16万元,17万元,17万元,16万元,20万元,17.5万元,月收入最高的是7月,A正确;(提醒:月收入包含线上收入和线下收入)对于B:该商户这8个月的线上总收入为72万元,线下总收入为61万元,B错误;对于C:根据折线图可看出该商户这8个月中,线上、线下收入相差最小的是7月,C正确;对于D:该商户这8个月中,月收入不少于17万元的有4个月,故所求频率为0.5,D正确.7.[2024山西模拟]总体由编号为1,2,…,99,100的100个个体组成.现用随机数法选取60个个体,利用电子表格软件产生的若干个1~100范围内的整数随机数的开始部分数据如下,则选出来的第5个个体的编号为31.8442178315745568877744772176335063解析简单随机抽样中,随机数法获取的个体编号要在指定编号范围内,遇到大于最大编号或者重复号码舍去不要,由给定的数据,从8数起至第5个仍是8,重复,舍去,所以选中的第5个个体的编号为31.8.一工厂生产了16800件某种产品,它们分别来自甲、乙、丙3条生产线.为检查这批产品的质量,决定采用分层随机抽样的方法进行抽样.已知从甲、乙、丙3条生产线抽取的产品个数分别是a,b,c,且2b=a+c,则乙生产线生产了5600件产品.解析设甲、乙、丙3条生产线分别生产了T甲,T乙,T丙件产品,则a∶b∶c=T甲∶T乙∶T丙,即aT甲=bT乙=cT丙.9.[2024海南校考]某网站推出了关于生态文明建设进展情况的调查,调查数据表明,环境治理和保护问题仍是百姓关心的热点,参与调查者中关注此问题的约占80%.现从参与关注生态文明建设的人群中随机选出200人,并将这200人按年龄分组:第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.(1)求a的值;(2)现从年龄较小的第1,2,3组中用分层随机抽样的方法抽取24人,则每组抽到的人数分别是多少?解析(1)由频率分布直方图可得10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035.(2)由题意从年龄较小的第1,2,3组中用分层随机抽样的方法抽取的比例为0.01∶0.015∶0.035=2∶3∶7,故第1组抽取24×22+3+7=4第2组抽取24×32+3+7=6第3组抽取24×72+3+7=14(人)10.[多选/2024江西名校联考]2023年夏天,国产动画电影《长安三万里》热映,点燃“唐诗热”,为此某市电视台准备在该电视台举办的“我爱背唐诗”节目前三届参加总决赛的120名选手(假设每位选手只参加其中一届总决赛)中,随机抽取24名参加一个唐诗交流会,若按前三届参加总决赛的人数比例分层随机抽样,则第一届抽取6人,若按性别比例分层随机抽样,则女选手抽取15人,则下列结论正确的是(ABD)A.样本容量是24B.第二届与第三届参加总决赛的选手共有90人C.120名选手中男选手有50人D.第一届参加总决赛的女选手最多有30人解析对于A,由样本容量定义知,样本容量为24,A正确;对于B,∵第一届参加总决赛的选手有624×120=30(人),∴第二届与第三届参加总决赛的选手共有120-30=90(人),B对于C,∵女选手共有1524×120=75(人),∴男选手有120-75=45(人),C错误;对于D,由B知,第一届参加总决赛的选手共30人,∴第一届参加总决赛的女选手最多有30人,D正确.故选11.[教育强国/多选/2023广东调研]近年来国家教育系统全面加快推进教育现代化,建设教育强国,各级各类教育事业发展取得了新进展.根据国家统计局发布的《中华人民共和国2021年国民经济和社会发展统计公报》中的数据,作出如图所示的柱状图,则下列叙述正确的是(AD)A.2017—2021年,普通、职业本专科招生人数逐年增加B.普通、职业本专科在2017—2018年招生人数增长最多C.2017—2021年,普通高中招生人数在普通、职业本专科,中等职业教育及普通高中招生总人数中的占比逐年下降D.2017—2021年,中等职业教育平均招生人数为608万解析由柱状图可知,2017—2021年,普通、职业本专科招生人数依次为761万、791万、915万、967万、1001万,人数逐年增加,所以A选项正确.2018—2021年,普通、职业本专科招生人数每年比上年增长的人数分别为30万、124万、52万、34万,即2018—2019年增长人数最多,所以B选项不正确.2017—2021年,普通高中招生人数在普通、职业本专科,中等职业教育及普通高中招生总人数中的占比分别为800761+582+800≈0.373,793791+557+793≈0.370,839915+600+839≈0.356,876967+645+876≈0.352,9051001+656+905≈0.353,所以C选项不正确.2017—2021年,中等职业教育平均招生人数为12.[设问创新/多选]设某组数据均落在区间[10,60]内,共分为[10,20),[20,30),[30,40),[40,50),[50,60]五组,对应频率分别为p1,p2,p3,p4,p5.已知依据该组数据所绘制的频率分布直方图为轴对称图形,给出下列四个条件,其中能确定该组数据频率分布的条件是(AD)A.p1=0.1,p3=0.4 B.p2=2p5C.p1+p4=p2+p5=0.3 D.p1≤2p2≤4p3≤2p4≤p5解析因为频率分布直方图为轴对称图形,所以p1=p5,p2=p4.对A,p1=0.1,p3=0.4,则p5=0.1,p2+p4=1-p1-p3-p5=1-0.1-0.4-0.1=0.4,又p2=p4,所以p2=p4=0.2,则p1,p2,p3,p4,p5的值都可以确定,所以由A中条件能确定该组数据的频率分布;对B,p2=2p5,则p1=p5,p4=2p5,有p1+p2+p4+p5=6p5,因为p5,p3的值都未知,所以得不到p1,p2,p3,p4,p5的值,所以由B中条件不能确定该组数据的频率分布;对C,p1+p4=p2+p5=0.3,则p1+p2+p4+p5=0.6,所以p3=0.4,但确定不了p1,p2,p4,p5的值,所以由C中条件不能确定该组数据的频率分布;对D,p1≤2p2≤4p3≤2p4≤p5,因为p1=p5,p2=p4,所以p1=2p2=4p3=2p4=p5,则p1=p5=4p3,p2=p4=2p3,又p1+p2+p3+p4+p5=1,所以13p3=1,即p3=113,所以p1=p5=413课标要求命题点五年考情命题分析预测1.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.能用样本估计总体的取值规律.4.能用样本估计百分位数,理解百分位数的统计含义.百分位数的估计本讲是高考命题的热点,主要考查百分位数,样本数据的数字特征,统计图中的数字特征,总体趋势估计等.预计2025年高考主要以生产生活实践情境为载体考查样本的数字特征及对总体的估计.样本的数字特征2023新高考卷ⅠT9;2022全国卷乙T19;2022全国卷甲T2;2021新高考卷ⅠT9;2021新高考卷ⅡT9;2021全国卷甲T2;2021全国卷乙T17;2020全国卷ⅢT3;2019全国卷ⅡT5;2019全国卷ⅡT13;2019全国ⅢT17总体数字特征的估计2023全国卷乙T17;2022新高考卷ⅡT19;2022全国卷乙T19;2021全国卷乙T17;2020全国卷ⅡT18;2020全国卷ⅢT18;2019全国卷ⅡT19;2019全国卷ⅢT17分层随机抽样的均值与方差学生用书P2121.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有①p%的数据小于或等于这个值,且至少有②(100-p)%的数据大于或等于这个值.(2)四分位数:第25百分位数、中位数(第50百分位数)、第75百分位数把一组由小到大排列后的数据分成四等份,这三个分位数统称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.2.平均数、中位数、众数数字特征概念特征平均数x=③1nx与每一个样本数据有关,样本中任何一个数据的改变都会引起平均数的改变,对样本中的极端值更加敏感.中位数将一组数据按从小到大或从大到小的顺序排列后,处在最④中间的一个数据(当数据个数是奇数时)或最中间两个数据的⑤平均数(当数据的个数是偶数时).只利用了样本数据中间位置的一个或两个值,有的样本数据的改变不一定引起中位数的改变.众数一组数据中出现次数⑥最多的数据(即频数最大值所对应的样本数据).体现了样本数据的最大集中点,对极端值不敏感,一组数据可能有n个众数,也可能没有众数.3.方差和标准差名称定义样本的方差和标准差假设一组数据是x1,x2,…,xn,用x表示这组数据的平均数,那么这n个数的方差s2=⑦1n[标准差s=⑧1n[(总体的方差和标准差一般式如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=⑨1N∑加权式如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=⑩1N∑i=1总体标准差:S=S24.分层随机抽样的样本均值与方差以两层随机抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为x,方差为s2,第二层有n个数,分别为y1,y2,…,yn,平均数为y,方差为t2,则x=1m∑i=1mxi,s2=1m∑i=1m(xi-x)2,y=1n∑j=1nyj,t2=1n∑j=1n(yj-y)2.若记样本均值为a,样本方差为b2常用结论1.平均数的性质(1)若给定一组数据x1,x2,…,xn的平均数为x,则ax1+b,ax2+b,…,axn+b的平均数为ax+b.(2)若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别为x和y,则x1+y1,x2+y2,…,xn+yn的平均数为x+y.2.方差的性质若给定一组数据x1,x2,…,xn,其方差为s2,则ax1,ax2,…,axn的方差为a2s2,ax1+b,ax2+b,…,axn+b的方差为a2s2.特别地,当a=1时,有x1+b,x2+b,…,xn+b的方差为s2,这说明将一组数据中的每一个数据都加上一个相同的常数,方差是不变的,即数据经过平移后方差不变.1.下列说法正确的是(D)A.对一组数据来说,平均数和中位数总是非常接近B.一组数据的第p百分位数唯一C.方差与标准差具有相同的单位D.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变解析平均数指的是这组数据的平均水平,中位数指的是这组数据的中间水平,它们之间没有必然联系,故A错误;一组数据的第p百分位数可以不唯一,故B错误;方差是标准差的平方,故它们的单位不一样,故C错误.2.[全国卷Ⅲ]设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(C)A.0.01 B.0.1 C.1 D.10解析因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.3.[多选/2021新高考卷Ⅱ]下列统计量中可用于度量样本x1,x2,…,xn离散程度的有(AC)A.x1,x2,…,xn的标准差 B.x1,x2,…,xn的中位数C.x1,x2,…,xn的极差 D.x1,x2,…,xn的平均数解析平均数、众数和中位数均刻画了样本数据的集中趋势,一般地,对数值型数据集中趋势的描述,可以用平均数和中位数,对分类型数据集中趋势的描述,可以用众数.方差、标准差和极差均是度量样本数据离散程度的数字特征.故选AC.4.[江苏高考]已知一组数据6,7,8,8,9,10,则该组数据的方差是53解析数据6,7,8,8,9,10的平均数是6+7+8+8+9+106=8,则方差是4+1+0+0+1+46=5.[2023湖南省六校联考]数据:1,2,2,3,4,5,6,6,7,8,其中位数为m,第60百分位数为a,则m+a=10.解析共有10个数据,且为从小到大排列,所以中位数为第5个数和第6个数的平均数,所以m=4+52=4.5,因为10×60%=6,所以第60百分位数为第6个数和第7个数的平均数,所以a=5+62=5.5,所以m+a学生用书P213命题点1百分位数的估计例1(1)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18.则该组数据的第75百分位数为14.5,第86百分位数为17.解析∵75%×20=15,∴第75百分位数为14+152=14.5.∵86%×20=17.2,∴第86百分位数为第18个数据,即(2)[2023重庆二调]如图是根据某班学生在一次体能素质测试中的成绩画出的频率分布直方图,则由直方图得到的80%分位数为78.5.解析∵(0.016+0.030)×10=0.46<0.8,(0.016+0.030+0.040)×10=0.86>0.8,∴80%分位数位于[70,80)中,令其为x,则x-7010解得x=78.5.方法技巧1.计算一组n个数据的第p百分位数的步骤(1)按从小到大排列原始数据;(2)计算i=n×p%;(3)若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第i+12.频率分布直方图中第p百分位数的求解步骤(1)确定第p百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+p%-fa%fb%-训练1(1)已知100个数据的第75百分位数是9.3,则下列说法正确的是(C)A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数解析因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其他选项均不正确,故选C.(2)[2023河北名校联考]为科普航天知识,某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是7(8,9,10也可).(写出一个满足条件的m的值即可)解析原数据去掉m后,剩余数据从小到大依次为6,7,7,8,8,9,10,因为7×0.25=1.75,所以这7个数的第25百分位数为7,所以数据7,6,8,9,8,7,10,m的第25百分位数为7,又8×0.25=2,所以7为这8个数据从小到大排序后的第2个数与第3个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.命题点2样本的数字特征角度1离散型数据的数字特征例2(1)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则(A)A.x=4,s2<2 B.x=4,s2=2C.x>4,s2<2 D.x>4,s2>2解析设7个数为x1,x2,x3,x4,x5,x6,x7,则x1+x2+x3+x4+x5+x6+x77=4,17x1-42+x2-42+x3-42+x4-42+x5-42+x6-42+x7-42=2,所以x1+x2+x3+x4+x5+x6+x7(2)[多选/2023新高考卷Ⅰ]有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(BD)A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差解析取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为223=663,故A,C均不正确;根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D综上,选BD.角度2统计图中的数字特征例3[多选/2023重庆市三检]某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是(ABD)A.样本的众数为6712B.样本的中位数为662C.样本的平均值为66D.该校男生体重超过70kg的学生大约为600人解析对于A,由频率分布直方图知样本的众数为65+702=6712,故A正确;对于B,设样本的中位数为x,因为前两个矩形面积和为5×0.03+5×0.05=0.4,前三个矩形面积和为5×0.03+5×0.05+5×0.06=0.7,所以中位数位于(65,70]之间,则有5×0.03+5×0.05+x-65×0.06=0.5,解得x=6623,故B正确;对于C,样本的平均值为57.5×0.15+62.5×0.25+67.5×0.3+72.5×0.2+77.5×0.1=66.75,故C不正确;对于D,2000名男生中体重超过70kg方法技巧频率分布直方图中的数字特征(1)众数:在频率分布直方图中,一般用最高小长方形的底边中点的横坐标近似代替;(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3)平均数:平均数在频率分布直方图中近似等于各组区间的中点值与对应频率之积的和.训练2(1)[2022全国卷甲]某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(B)A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差解析对于A,讲座前问卷答题的正确率的中位数是70%+75%2=72.5%,所以A错误;对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D(2)[多选/2021新高考卷Ⅰ]有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(CD)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同解析设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x-,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x-+c,m+c,σ命题点3总体数字特征的估计角度1总体集中趋势的估计例4统计局就某地居民的月收入(单位:元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2500,3000)内.(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层随机抽样的方法抽出100人进行下一步分析,则月收入在[4000,4500)内的应抽取多少人?(2)估计该地居民的月收入的中位数.(3)假设同组中的数据用该组区间的中点值代替,估计该地居民月收入的平均数.解析(1)因为(0.0002+0.0004+0.0003+0.0001)×500=0.5,所以a=又0.0005×500=0.25,所以月收入在[4000,4500)内的频率为0.25,所以月收入在4000,4500内的应抽取的人数为0.25×100(2)因为0.0002×500=0.1,0.0004×500=0.2,0.0005×500=0.25,0.1+0.2+0.25=0.55>0.5,所以样本数据的中位数是3500+0.5因此估计该地居民月收入的中位数是3900元.(3)样本平均数为2750×0.0002+3250方法技巧平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.角度2总体离散程度的估计例5[2023全国卷乙]某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为z,样本方差为s2.(1)求z,s2.(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z≥2s210解析(1)由题意,求出zi的值如表所示,试验序号i12345678910zi968-8151119182012则z=110×(9+6+8-8+15+11+19+18+20+12)=11s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=(2)因为2s210=26.1=24.4,z=所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.方法技巧总体离散程度的估计标准差(方差)刻画了数据的离散程度或波动幅度,标准差(方差)越大,数据的离散程度越大,越不稳定;标准差(方差)越小,数据的离散程度越小,越稳定.训练3[全国卷Ⅱ]某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.解析(1)由题意可知,随机调查的100个企业中增长率不低于40%的企业有14+7=21(个),产值负增长的企业有2个,所以这类企业中产值增长率不低于40%的企业比例约为21100,产值负增长的企业比例约为2100=(2)由题意可知,这类企业产值增长率的平均数约为y=1100×[2×(-0.1)+24×0.1+53×0.3+14×0.5+7×0.7]=0.3方差约为s2=1100×[2×(-0.1-0.3)2+24×(0.1-0.3)2+53×(0.3-0.3)2+14×(0.5-0.3)2+7×(0.7-0.3)2]=0.0296所以标准差s=0.0296=0.000命题点4分层随机抽样的均值与方差例6某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为5.4,方差为12.4.(精确到0.1)解析把甲同学抽取的样本的平均数记为x,方差记为sx2;把乙同学抽取的样本的平均数记为y,方差记为sy2;把合在一起后的样本的平均数记为a则a=10×5+8×610+8s2=10=10≈12.4.即合在一起后样本的平均数为5.4,方差为12.4.方法技巧计算分层随机抽样的方差的步骤(1)确定x1,x2,s1(2)确定x;(3)应用公式s2=n1n1+n2[s12+(x1-x)2]+n2n1+n2训练4[2023安徽省示范高中联考]为了调查公司员工的健康状况,某公司男、女员工比例是2∶3,用分层随机抽样的方法抽取样本,统计样本数据如下:男员工的平均体重为70kg,标准差为5kg;女员工的平均体重为50kg,标准差为6kg.则由此估计该公司员工的平均体重是58kg,方差是127.6kg2.解析设该公司员工的平均体重为xkg,方差为s2kg2,由题意得x=70×25+50×35=58,所以方差s2=[52+(70-58)2]×25+[62+(50-58)2]×1.[命题点1/2023重庆名校联考]从2,3,4,5,6,7,8,9中随机取两个数,这两个数一个比m大,一个比m小的概率为514,已知m为上述数据的第x百分位数,则x的取值可能为(CA.50 B.60 C.70 D.80解析因为514=1028=C21C51C82,所以m=4或m=7.当m=4时,数据的第x百分位数是第3个数据,则2<x%×8<3,解得25<x<37.5,所有选项都不符合;当m=7时,数据的第x百分位数是第6个数据,则5<x%×8<62.[命题点2/多选/2023济南市统考]有一组样本数据x1,x2,…,xn,其平均数为x.现加入一个新数据xn+1,且xn+1<x,组成新的样本数据x1,x2,…,xn,xn+1,与原样本数据相比,新的样本数据可能(BD)A.平均数不变 B.众数不变C.极差变小 D.第20百分位数变大解析x=1n(x1+x2+…+xn),新的样本数据的平均数x新=1n+1x1+x2+…+xn+xn+1=1n+1(nx+xn+1)<1n+1(nx+x)=x,故A错误.新增的数据xn+1可能等于原样本数据的众数,故B正确.当xn+1比原样本数据中最小的数据还小时,会改变极差,且极差变大;当3.[命题点2,4/2023潍坊市高三统考]若一组样本数据x1,x2,…,xn的平均数为10,另一组样本数据2x1+4,2x2+4,…,2xn+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为(A)A.17,54 B.17,48 C.15,54 D.15,48解析设样本数据x1,x2,…,xn的平均数为x,则x=10,所以样本数据2x1+4,2x2+4,…,2xn+4的平均数为2x1+4+2x2+4+…+2xn+4n=2(x1+x2+…+xn)+4nn=2×n×x+4nn=2x+4=24,所以将两组样本数据合并为一组样本数据后的平均数为10n+24n2n=17.又样本数据2x1+4,2x2+4,…,2xn+4的方差为1n{[2x1+4-(2x+4)]2+[2x2+4-(2x+4)]2+…+[2xn+4-(2x+4)]2}=4n[(x1-x)2+(x2-x)2+…+(xn-x)2]=8,所以1n[(x14.[命题点3/2021全国卷乙]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和(1)求x,y,s12,(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s12解析(1)由表格中的数据易得:x=-0.2+0.3+0+0y=0.1+0.4+0.s12=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2(2)由(1)中数据可得y-x=10.3-10.0=0.3,而2s12+s2210=25(s所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.5.[命题点4/2023广州市调研]为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为(B)A.0.96 B.0.94 C.0.79 D.0.75解析由题知,样本数据中,初中生人数m=800,每天睡眠时间的平均数x=9,方差s12=1;高中生人数n=1200,每天睡眠时间的平均数y=8,方差s估计该地区中学生每天睡眠时间的平均数w=mx+nym+n=800×9+1200×8800+1学生用书·练习帮P3751.[2024福州市一检]某市抽查一周空气质量指数变化情况,得到一组数据:80,76,73,82,86,75,81.以下关于这组数据判断正确的有(C)A.极差为11 B.中位数为82C.平均数为79 D.方差为124解析对A,B,将这组数据按从小到大的顺序排列为73,75,76,80,81,82,86,则这组数据的极差为86-73=13,这组数据的中位数为80,A错误,B错误;对C,(80+76+73+82+86+75+81)÷7=79,C正确;对D,[(80-79)2+(76-79)2+(73-79)2+(82-79)2+(86-79)2+(75-79)2+(81-79)2]÷7≈17.7,D错误.故选C.2.[2024湖北部分学校联考]为了弘扬体育精神,某学校组织秋季运动会,在一项比赛中,学生甲进行了8组投篮,得分分别为10,8,a,8,7,9,6,8,如果学生甲的平均得分为8分,那么这组数据的第75百分位数为(C)A.8 B.9 C.8.5 D.9.5解析由题意可得10+8+a+8+7+9+6+88=8,解得a将这组数据按从小到大的顺序排列,即6,7,8,8,8,8,9,10.因为8×75%=6,为整数,所以这组数据的第75百分位数为8+92=8.5,(求得整数6时,第6个数据并不是第75百分位数,第6个数据和第7个数据的算术平均数才是第75百分位数)故选3.[全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(A)A.中位数 B.平均数C.方差 D.极差解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.4.[2024河南名校联考]在某次考试中,某班学生的最高分为100分,最低分为50分,且最高分只有1个,现将全班每个学生的分数按照yi=axi+b(a>0)进行调整,其中xi是第i个学生的原始分数,yi是第i个学生调整后的分数,若调整后,全班的最高分为100分,最低分为60分,则(B)A.调整后分数的平均数和原始分数的平均数相同B.调整后分数的中位数高于原始分数的中位数C.调整后分数的标准差和原始分数的标准差相同D.调整后分数的众数个数多于原始分数的众数个数解析对于A,B:根据题意知100=100a+b,60=50a+b,所以a=0.8,b=20,于是yi=0.8xi+20,则yi-xi=0.8xi+20-xi=20-0.2xi=0.2(100-xi)对于C:根据yi=0.8xi+20,可得调整后分数的标准差等于原始分数的标准差的0.8倍,显然调整后分数的标准差变小了,故C错误.对于D:如果原始分数相同,则调整后的分数也相同,故调整后分数的众数个数和原始分数的众数个数相同,故D错误.5.[多选/2024云南昆明模拟]甲、乙两个旅游景区某月初连续7天的日均气温(单位:℃)数据如图所示(气温均取整数),则关于这7天的日均气温,下列判断正确的是(ABC)A.甲旅游景区日均气温的平均数与乙旅游景区日均气温的平均数相等B.甲旅游景区日均气温的中位数与乙旅游景区日均气温的中位数相等C.甲旅游景区的日均气温波动比乙旅游景区的日均气温波动大D.乙旅游景区日均气温的极差为1℃解析对于A,B项,甲旅游景区的日均气温分别为5℃,3℃,6℃,3℃,7℃,5℃,6℃;乙旅游景区的日均气温分别为5℃,4℃,6℃,5℃,5℃,4℃,6℃.甲旅游景区日均气温的中位数为5℃,平均数为5+3+6+3+7+5+67=5(℃);乙旅游景区日均气温的中位数为5℃,平均数为5+4+6+5+5+4+67=5(℃).故A,B正确.对于C项,根据折线图知甲旅游景区的日均气温波动比乙旅游景区的日均气温波动大,故C正确.对于D项,乙旅游景区日均气温的极差为6-4=2(℃),故D错误.6.[多选/2023合肥市二检]如图是某汽车公司100家销售商2022年新能源汽车销售量(单位:辆)的频率分布直方图,则(ACD)A.a的值为0.004B.估计这100家销售商新能源汽车销售量的平均数为135C.估计这100家销售商新能源汽车销售量的80%分位数为212.5D.若按分层随机抽样原则从这100家销售商中抽取20家,则从销售量在[200,300]内的销售商中抽取5家解析对于A,由频率分布直方图可得,50×0.002+50×0.003+50a+50×0.006+50a+50×0.001=1,得a=0.004,故A正确;对于B,(25×0.002+75×0.003+125×0.004+175×0.006+225×0.004+275×0.001)×50=150,故B错误;对于C,设80%分位数为x,易得x∈[200,250),则50×0.002+50×0.003+50×0.004+50×0.006+x-200×0.004=0.8,解得x=212.5,故C正确;对于D,销售量在[200,300]内的频率为50×0.004+50×7.[多选/2024马鞍山市段考]某学校共有学生2000人,其中高一学生800人,高二、高三学生各600人,学校为了了解学生在暑假期间每天的读书时间(单位:时),按照分层随机抽样的方法从全校学生中抽取100人,其中高一学生、高二学生、高三学生每天读书时间的平均数分别为x1=2.7,x2=3.1,x3=3.3,每天读书时间的方差分别为s12=1,s22=2,sA.从高一学生中抽取了40人B.抽取的高二学生每天的总读书时间是1860小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计该校全体学生每天的读书时间的方差为s2=1.966解析对于A,根据分层随机抽样,分别从高一学生、高二学生、高三学生中抽取40人、30人、30人,故A正确;对于B,抽取的高二学生每天的总读书时间是x2×30=93(时),故B错误;对于C,被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(时),故C正确;对于D,被抽取的学生每天的读书时间的方差为40100×[1+(2.7-3)2]+30100×[2+(3.1-3)2]+30100×[3+(8.[2024新疆喀什模拟]样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为2.解析由样本a,0,1,2,3的平均值为1,可得a+0+1+2+35=1,解得a=-1,所以样本的方差为15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)29.[2024陕西商洛联考]某品牌汽车2019—2022年这四年的销量逐年增长,2019年销量为5万辆,2022年销量为22万辆,且这四年销量的中位数与平均数相等,则这四年的总销量为54万辆.解析设2020年的销量为a万辆,2021年的销量为b万辆,5<a<b<22,由题意可知,中位数为a+b2,平均数为5+a+b+224,由a+b2=5+a+b+224,得a10.[2024长沙市雅礼中学月考]某工厂生产内径为28.50mm的一种零件,为了了解零件的生产质量,在某次抽检中,从该厂的1000个零件中抽出60个,测得其内径尺寸(单位:mm)如下:28.51×1328.52×628.50×428.48×1128.49×p28.54×128.53×728.47×q这里用x×n表示有n个尺寸为xmm的零件,p,q均为正整数.若从这60个零件中随机抽取1个,则这个零件的内径尺寸小于28.49mm的概率为415(1)求p,q的值.(2)已知这60个零件内径尺寸的平均数为xmm,标准差为smm,且s=0.02,在某次抽检中,若抽取的零件中至少有80%的零件内径尺寸在[x-s,x+s]内,则称本次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论