2025-高考科学复习解决方案-数学-基础版第二章第1节 随机抽样、常用统计图表含答案_第1页
2025-高考科学复习解决方案-数学-基础版第二章第1节 随机抽样、常用统计图表含答案_第2页
2025-高考科学复习解决方案-数学-基础版第二章第1节 随机抽样、常用统计图表含答案_第3页
2025-高考科学复习解决方案-数学-基础版第二章第1节 随机抽样、常用统计图表含答案_第4页
2025-高考科学复习解决方案-数学-基础版第二章第1节 随机抽样、常用统计图表含答案_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025-高考科学复习解决方案-数学-基础版第二章第一节随机抽样、常用统计图表课标解读考向预测1.了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法.2.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.3.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.4.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.在近几年的高考中,抽样方法、频率分布直方图考查的较多,常结合样本的数字特征出题,这部分出题比较灵活,多结合实际问题出题,考查分析问题的能力,以及处理数据的能力.预计2025年的高考仍以此形式呈现,可以是选择题、填空题,也可以是解答题,在解答题中常与概率等联合出题.必备知识——强基础1.简单随机抽样(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中eq\x(\s\up1(01))逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都eq\x(\s\up1(02))相等,我们把这样的抽样方法叫做eq\x(\s\up1(03))放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都eq\x(\s\up1(04))相等,我们把这样的抽样方法叫做eq\x(\s\up1(05))不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.(2)简单随机样本通过简单随机抽样获得的样本称为简单随机样本.(3)简单随机抽样的常用方法实现简单随机抽样的方法有很多,eq\x(\s\up1(06))抽签法和eq\x(\s\up1(07))随机数法是比较常用的两种方法.2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行eq\x(\s\up1(08))简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为eq\x(\s\up1(09))分层随机抽样,每一个子总体称为eq\x(\s\up1(10))层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.3.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.(2)作频率分布直方图的步骤①求eq\x(\s\up1(11))极差;②决定eq\x(\s\up1(12))组距与eq\x(\s\up1(13))组数;③将eq\x(\s\up1(14))数据分组;④列频率分布表;⑤画频率分布直方图.1.在比例分配的分层随机抽样中,每一层入样的个体数为该层的个体数乘以抽样比.2.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.1.概念辨析(正确的打“√”,错误的打“×”)(1)简单随机抽样是一种不放回抽样.()(2)简单随机抽样的每个个体被抽到的机会不一样,与先后有关.()(3)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.()答案(1)×(2)×(3)×(4)√2.小题热身(1)从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是()A.总体指的是该市参加升学考试的全体学生B.样本是指1000名学生的数学成绩C.样本量指的是1000名学生D.个体指的是1000名学生中的每一名学生答案B解析对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指1000名学生的数学成绩,故B正确;对于C,样本量是1000,故C错误;对于D,个体指的是每名学生的数学成绩,故D错误.(2)(人教A必修第二册习题9.1T5改编)为了了解高一、高二、高三学生的身体状况,现用比例分配的分层随机抽样的方法抽出一个容量为1200的样本,三个年级学生数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为()A.240 B.300C.360 D.400答案C解析依题意可得eq\f(k,k+5+3)=eq\f(240,1200),解得k=2,所以高三年级抽取的人数为eq\f(3,2+5+3)×1200=360.(3)(人教B必修第二册5.1.1练习AT2改编)从某班50名同学中选出5人参加户外活动,利用随机数法抽取样本时,先将50名同学按01,02,…,50进行编号,然后从随机数表的第1行第5列和第6列数字开始从左往右依次选取两个数字,则选出的第5个个体的编号为()注:表为随机数表的第1行与第2行0347437386369647366146986371629774246792428114572042533237321676A.24 B.36C.46 D.47答案A解析由题意知,从随机数表的第1行第5列和第6列数字开始,由表可知依次选取43,36,47,46,24.(4)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图.①直方图中x的值为________;②在这些用户中,月用电量落在区间[100,250)内的户数为________.答案①0.0044②70解析①由频率分布直方图知数据落在[200,250)内的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x=eq\f(0.22,50)=0.0044.②因为数据落在[100,250)内的频率为(0.0036+0.0060+0.0044)×50=0.7,所以所求户数为0.7×100=70.考点探究——提素养考点一简单随机抽样例1(2024·河南部分中学高三联考)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课外书籍的时长情况,决定利用随机数表法从全班学生中抽取10人进行调查.将46名学生按01,02,…,46进行编号.现提供随机数表的第7行至第9行:844217533157245506887704744767217633502583921206766301637859169556571998105071751286735807443952387933211234297864560782524207443815510013429966027954若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然向右读数,则得到的第8个样本编号是()A.07 B.12C.39 D.44答案D解析由题意可知,得到的样本编号依次为12,06,01,16,19,10,07,44,39,38,则得到的第8个样本编号是44.【通性通法】(1)简单随机抽样需满足:总体的个体数有限;逐个抽取;等可能抽取.(2)简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于总体中个体数较多的情况).【巩固迁移】1.用不放回简单随机抽样的方法从含有10个个体的总体中,抽取一个样本量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.eq\f(1,10),eq\f(1,10) B.eq\f(3,10),eq\f(1,5)C.eq\f(1,5),eq\f(3,10) D.eq\f(3,10),eq\f(3,10)答案A解析第一次被抽到,显然为eq\f(1,10);第二次被抽到,首先第一次不能被抽到,第二次才被抽到,可能性为eq\f(9,10)×eq\f(1,9)=eq\f(1,10).考点二比例分配的分层随机抽样例2(1)(2024·河南襄城三模)现有300名老年人、500名中年人、400名青年人,从中按比例用分层随机抽样的方法抽取n人,若抽取的老年人与青年人共21名,则n的值为()A.15 B.30 C.32 D.36答案D解析由题意可知eq\f(n,1200)=eq\f(21,700),解得n=36.(2)(2023·新课标Ⅱ卷)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有()A.Ceq\o\al(45,400)·Ceq\o\al(15,200)种 B.Ceq\o\al(20,400)·Ceq\o\al(40,200)种C.Ceq\o\al(30,400)·Ceq\o\al(30,200)种 D.Ceq\o\al(40,400)·Ceq\o\al(20,200)种答案D解析根据比例分配的分层随机抽样的定义知,初中部共抽取60×eq\f(400,600)=40名,高中部共抽取60×eq\f(200,600)=20名,根据组合数概念和分步乘法计数原理,不同的抽样结果共有Ceq\o\al(40,400)·Ceq\o\al(20,200)种.故选D.【通性通法】(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体数量或反之求解:根据比例分配的分层随机抽样,列比例式进行计算.【巩固迁移】2.某区域大型城市、中型城市、小型城市的数量之比为2∶m∶1,为了解该区域城市的空气质量情况,现用比例分配的分层随机抽样方法抽取一个容量为n的样本.在样本中,中型城市比大型城市多4个,比小型城市多8个,则n=()A.24 B.28C.32 D.36答案A解析根据比例分配的分层随机抽样可设抽取的大、中、小型城市的数量分别为2x,mx,x,则eq\b\lc\{(\a\vs4\al\co1(mx-2x=4,,mx-x=8,))解得eq\b\lc\{(\a\vs4\al\co1(x=4,,m=3,))所以n=2x+mx+x=24.考点三统计图表(多考向探究)考向1扇形图、条形图例3(多选)某中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列说法正确的是()A.成绩前200名的200人中,高一学生人数比高二学生人数多30B.成绩第1~100名的100人中,高一学生人数不超过一半C.成绩第1~50名的50人中,高三最多有32人D.成绩第51~100名的50人中,高二学生人数比高一的多答案ABC解析由饼状图知,成绩前200名的200人中,高一学生人数比高二学生人数多200×(45%-30%)=30,A正确;由条形图知高一学生在前200名中,前100名的和后100名的人数相等,因此成绩第1~100名的100人中,高一学生人数为200×45%×0.5=45<50,B正确;成绩第1~50名的50人中,高一学生人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51~100名的50人中,高一学生人数为200×45%×0.3=27,高二最多有23人,因此高二学生人数比高一的少,D错误.【通性通法】(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.(2)条形图直观描述不同类别或分组数据的频数.【巩固迁移】3.(多选)(2024·广东梅州三模)某公司经营五种产业,为应对市场变化,在五年前进行了产业结构调整,优化后的产业结构使公司总利润不断增长,今年总利润比五年前增加了一倍,调整前后各产业利润占总利润的比例如图所示,则下列结论错误的是()A.调整后传媒的利润增量小于杂志B.调整后房地产的利润有所下降C.调整后试卷的利润增加不到一倍D.调整后图书的利润增长了一倍以上答案ABC解析设调整前的各产业利润的总和为a,则调整后的各产业利润的总和为2a.对于A,调整前传媒的利润为0.1a,杂志的利润为0.05a,调整后传媒的利润为0.24a,杂志的利润为0.16a,则调整后传媒的利润增量为0.14a,杂志的利润增量为0.11a,故A错误;对于B,调整前房地产的利润为0.45a,调整后房地产的利润为0.5a,故B错误;对于C,调整前试卷的利润为0.15a,调整后试卷的利润为0.46a,且eq\f(0.46a,0.15a)>3,故C错误;对于D,调整前图书的利润为0.25a,调整后图书的利润为0.64a,且eq\f(0.64a,0.25a)>2,故D正确.考向2折线图例4(多选)(2024·河北唐山二模)2023年的夏季,全国多地迎来罕见极端高温天气.某课外小组通过当地气象部门统计了当地七月份前20天每天的最高气温与最低气温,得到如下图表,根据图表,下列判断正确的是()A.七月份前20天最低气温的中位数低于25℃B.七月份前20天中最高气温的极差大于最低气温的极差C.七月份前20天最高气温的平均数高于40℃D.七月份前10天(1~10日)最高气温的方差大于最低气温的方差答案BD解析七月份前20天中,最低气温低于25℃的天数不超过9天,故中位数不可能低于25℃,故A错误;最高气温的最大值大于40℃,最小值低于35℃,而最低气温的最大值小于30℃,最小值接近25℃,故最高气温的极差大于最低气温的极差,故B正确;最高气温超过40℃的天数不超过5天,且最大值不超过45℃,故平均数不可能高于40℃,故C错误;前10天中,最低气温的分布更集中,故最高气温的方差大于最低气温的方差,故D正确.【通性通法】折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.【巩固迁移】4.(2024·安徽滁州教学质量检测)某品牌为了研究旗下某产品在甲、乙两个平台的销售状况,统计了2023年7月到12月甲、乙官方平台的月营业额(单位:万元),得到如图所示的折线图.下列说法错误的是()A.乙平台的月营业额的平均值在[31,32]内B.甲平台的月营业额总体呈上升趋势C.乙平台的月营业额极差比甲平台的月营业额极差小D.10、11、12月份的总营业额甲平台比乙平台少答案D解析对于A,乙平台的月营业额的平均值=eq\f(14+21+26+30+52+47,6)≈31.7∈[31,32],A正确;对于B,由题图可知正确;对于C,乙平台的月营业额极差为52-14=38,甲平台的月营业额极差为53-7=46,C正确;对于D,甲平台10、11、12月份的总营业额为33+44+53=130,乙平台10、11、12月份的总营业额为30+52+47=129,D错误.考向3频率分布直方图例5某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,则分数在[70,80)内的频率为________;根据评奖规则,排名在前10%的学生可以获奖,则估计获奖的学生至少需要________分.答案0.2588解析设分数在[70,80)内的频率为x,根据频率分布直方图,可得(0.010+0.015+0.020+0.025+0.005)×10+x=1,解得x=0.25,所以分数在[70,80)内的频率为0.25,因为分数在[80,90)内的频率为0.25,在[90,100]内的频率为0.05,而0.05<10%<0.25+0.05,所以设排名前10%的分界点为90-a,则0.025a+0.005×10=10%,解得a=2,所以排名前10%的分界点为88分,即获奖的学生至少需要88分.【通性通法】频率分布直方图的相关结论(1)频率分布直方图中各小长方形的面积之和为1.(2)频率分布直方图中纵轴表示eq\f(频率,组距),故每组样本的频率为组距×eq\f(频率,组距),即矩形的面积.(3)频率分布直方图中每组样本的频数为频率×总数.【巩固迁移】5.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.考向4雷达图例6(多选)为比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分).绘制了如图所示的六维能力雷达图.例如,图中甲的数学抽象能力指标值为4,乙的数学抽象能力指标值为5,则下列说法正确的是()A.甲的逻辑推理能力指标值高于乙的逻辑推理能力指标值B.甲的数学建模能力指标值高于乙的直观想象能力指标值C.甲的数学运算能力指标值高于甲的直观想象能力指标值D.甲的六维能力整体水平低于乙的六维能力整体水平答案AD解析对于A,甲的逻辑推理能力指标值为4,乙的逻辑推理能力指标值为3,所以甲的逻辑推理能力指标值高于乙的逻辑推理能力指标值,故A正确;对于B,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,所以甲的数学建模能力指标值低于乙的直观想象能力指标值,故B错误;对于C,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值低于甲的直观想象能力指标值,所以C错误;对于D,甲的六维能力指标值的平均值为eq\f(4+3+4+5+3+4,6)=eq\f(23,6),乙的六维能力指标值的平均值为eq\f(5+4+3+5+4+3,6)=4>eq\f(23,6),所以甲的六维能力整体水平低于乙的六维能力整体水平,所以D正确.【通性通法】雷达图可以在同一坐标系内展示多指标的分析比较情况,它是由一组坐标和多个同心圆组成的图表.雷达图分析法是综合评价中常用的一种方法,尤其适用于对多属性体系结构描述的对象作出全局性、整体性评价,在数据可视化中经常会用到.【巩固迁移】6.(多选)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃,下面叙述正确的是()A.各月的平均最低气温都在0℃以上B.八月的平均温差比十一月的平均温差大C.平均最高气温高于20℃的月份有4个D.四月和十一月的平均最低气温基本相同答案ABD解析对于A,由题图可知,各月的平均最低气温都在0℃以上,故A正确;对于B,由题图可知,八月的平均最高气温点与平均最低气温点之间的距离大于十一月的平均最高气温点与平均最低气温点之间的距离,故B正确;对于C,由题图可知,平均最高气温高于20℃的月份有七月和八月,只有两个月份,故C错误;对于D,由题图可知,四月和十一月的平均最低气温均为5℃,D正确.课时作业一、单项选择题1.下列抽样方法是简单随机抽样的是()A.质检员从50个零件中一次性抽取5个做质量检验B.课堂上,李老师对全班45名学生中点名表扬了3名发言积极的C.老师要求学生从实数集中逐个抽取10个分析奇偶性D.某运动员从8条跑道中随机抽取一条跑道试跑答案D解析对于A,错在“一次性”抽取;对于B,老师表扬的是发言积极的,对每一个个体而言,不具备“等可能性”;对于C,错在总体个数是无限的.2.某企业生产甲、乙、丙三种不同型号的产品,产品数量之比依次为2∶3∶5,现用比例分配的分层随机抽样方法抽取一个容量为n的样本,样本中甲型号产品有12件,则此样本的容量为()A.40 B.60C.80 D.120答案B解析由题意得,总体中甲型号产品所占的比例是eq\f(2,2+3+5)=eq\f(1,5).因为样本中甲型号产品有12件,样本量为n,所以eq\f(1,5)×n=12,解得n=60.3.某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号001,002,…,599,600.从中抽取60个样本,根据提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是()332118342978645607325242064438122343567735789056428442125331345786073625300732862345788907236896080432567808436789535577348994837522535578324577892345A.457 B.328C.253 D.072答案D解析由题设,从第5行第6列开始向右读取数据,依次为253,313,457,860,736,253,007,328,623,457,889,072,…,∵将600个零件进行编号001,002,…,599,600,∴前6个编号分别为253,313,457,007,328,072,∴第6个样本编号是072.4.(2022·天津高考)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.8 B.12C.16 D.18答案B解析志愿者的总人数为eq\f(20,(0.24+0.16)×1)=50,所以第三组的人数为50×0.36=18,有疗效的人数为18-6=12.故选B.5.如图为2018~2021年中国货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是()A.从2018年开始,2021年的进出口总额增长率最大B.从2018年开始,进出口总额逐年增大C.从2018年开始,进口总额逐年增大D.从2018年开始,2020年的进出口总额增长率最小答案C解析显然2021年相对于2020年进出口额增量增加特别明显,故最后一年的增长率最大,A正确;统计图中的每一年条形图的高度逐年增加,故B正确;2020年相对于2019年的进口总额是减少的,故C错误;显然进出口总额2021年的增长率最大,而2020年相对于2019年的增量比2019年相对于2018年的增量小,且计算增长率时前者的分母还大,故2020年的增长率一定最小,D正确.故选C.6.(2023·铁岭模拟)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到扇形统计图如图所示,则下列结论中不正确的是()A.新农村建设后,种植收入增加B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入不变D.新农村建设后,种植收入在经济收入中所占比重下降答案C解析因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,不妨设建设前的经济收入为m,则建设后的经济收入为2m.对于A,从扇形统计图中可以看到,新农村建设后,种植收入比建设前增加2m×37%-m×60%=m×14%,故A正确;对于B,新农村建设后,其他收入比建设前增加2m×5%-m×4%=m×6%>m×4%,即增加了一倍以上,故B正确;对于C,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为之前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;对于D,新农村建设后,种植收入在经济收入中所占比重由建设前的60%降为37%,故D正确.7.(2023·宁夏石嘴山模拟)某企业不断自主创新提升技术水平,积极调整企业旗下的甲、乙、丙、丁、戊5种系列产品的结构比例,近年来取得了显著效果.据悉该企业2023年5种系列产品年总收入是2020年的2倍,其中5种系列产品的年收入构成比例如图所示.则下列说法错误的是()A.2023年甲系列产品收入比2020年的多B.2023年乙和丙系列产品收入之和比2020年的企业年总收入还多C.2023年丁系列产品收入是2020年丁系列产品收入的eq\f(1,3)D.2023年戊系列产品收入是2020年戊系列产品收入的2倍答案C解析对于A,2023年甲系列产品收入占了总收入的20%,2020年甲系列产品收入占了总收入的30%,而该企业2023年5种系列产品年总收入是2020年的2倍,故2023年甲系列产品收入比2020年的多,故A正确;对于B,2023年乙和丙系列产品收入之和占了总收入的55%,该企业2023年5种系列产品年总收入是2020年的2倍,故2023年乙和丙系列产品收入之和比2020年的企业年总收入还多,故B正确;对于C,2023年丁系列产品收入占了总收入的5%,2020年丁系列产品收入占了总收入的20%,而该企业2023年5种系列产品年总收入是2020年的2倍,故2023年丁系列产品收入是2020年丁系列产品收入的eq\f(1,2),故C错误;对于D,2023年戊系列产品收入占了总收入的20%,2020年戊系列产品收入占了总收入的20%,而该企业2023年5种系列产品年总收入是2020年的2倍,故2023年戊系列产品收入是2020年戊系列产品收入的2倍,故D正确.故选C.8.(2024·河南洛阳摸底)世界人口变化情况的三幅统计图如图所示.下列四个结论中错误的是()A.从折线图能看出世界人口的总量随着年份的增加而增加B.1957年到2050年各洲中北美洲人口增长速度最慢C.2050年亚洲人口比其他各洲人口的总和还要多D.2050年欧洲人口与南美洲及大洋洲人口之和基本持平答案B解析由折线图可以看出世界人口的总量随着年份的增加而增加,故A正确;三幅统计图并不能得到各个洲人口增长速度的快慢,故B错误;由扇形统计图可知2050年亚洲人口比其他各洲人口的总和还要多,故C正确;由条形统计图可知2050年欧洲人口与南美洲及大洋洲人口之和基本持平,故D正确.二、多项选择题9.某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)内的学生有60人,则下列说法正确的是()A.样本中支出在[50,60)内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2000名学生,则一定有600人的支出在[50,60)内答案BC解析对于A,样本中支出在[50,60)内的频率为1-(0.010+0.024+0.036)×10=0.3,故A错误;对于C,n=eq\f(60,0.3)=200,故n的值为200,故C正确;对于B,样本中支出不少于40元的人数为200×(0.036×10+0.3)=132,故B正确;对于D,若该校有2000名学生,则可能有600人的支出在[50,60)内,故D错误.10.(2024·湖北九师联盟模拟)某企业2023年12个月的收入与支出数据的折线图如图.已知:利润=收入-支出,根据该折线图,下列说法正确的是()A.该企业2023年1月至6月的总利润低于2023年7月至12月的总利润B.该企业2023年1月至6月的平均收入低于2023年7月至12月的平均收入C.该企业2023年8月至12月的支出持续增长D.该企业2023年11月的月利润最大答案ABC解析因为图中的实线与虚线的相对高度表示当月利润.由折线图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;由折线图可知2023年8月至12月的虚线是上升的,所以支出持续增长,故C正确;由折线图可知11月的相对高度比7月、8月都要小,故D错误.三、填空题11.某学校有高中学生1000人,其中高一年级、高二年级、高三年级的人数分别为320,300,380,为了调查学生参加“社区志愿服务”的意向,现采用比例分配的分层随机抽样的方法从该校学生中抽取一个样本量为200的样本,那么应抽取高二年级学生的人数为________.答案60解析因为学校有高中学生1000人,抽取一个样本量为200的样本,所以应抽取高二年级学生的人数为eq\f(200,1000)×300=60.12.某单位招聘员工,有250名应聘者参加笔试,随机抽查了其中20名应聘者的笔试试卷,统计他们的成绩(单位:分)如下表:分数段[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)[90,95]人数1345322若按笔试成绩择优录取50名参加面试,可预测参加面试的分数线为________.答案85分解析因为有250名应聘者参加笔试,按笔试成绩择优录取50名参加面试,所以录取的比例为1∶5.随机抽查的20名应聘者被录取的人数为20×eq\f(1,5)=4.由20名应聘者的成绩表可知,被录取的4人成绩不低于85分,故可预测参加面试的分数线为85分.13.将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用比例分配的分层随机抽样的方法抽取容量为100的样本,则应从C中抽取________个个体;若A,B,C三层的样本的平均数分别为15,30,20,则样本的平均数为________.答案2020.5解析∵A,B,C三层个体数之比为5∶3∶2,又有总体中每个个体被抽到的概率相等,∴应从C中抽取100×eq\f(2,5+3+2)=20个个体.样本的平均数为eq\o(w,\s\up6(-))=eq\f(5,5+3+2)×15+eq\f(3,5+3+2)×30+eq\f(2,5+3+2)×20=20.5.14.(2023·吉林长春监测)我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a(单位:t),用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果当地政府希望使80%以上的居民每月的用水量不超出该标准,为了科学合理确定出a的数值,政府采用抽样调查的方式,绘制出100位居民全年的月均用水量(单位:t)频率分布直方图如图,通过分析样本数据来估计全市居民用水量的分布情况,可推断标准a大约为________.答案2.6解析前5组的频率之和为(0.12+0.20+0.30+0.44+0.50)×0.5=0.78<0.8.前6组的频率之和为0.78+0.20×0.5=0.88>0.8.所以2.5≤a<3,由0.2×(a-2.5)=0.8-0.78,解得a=2.6.15.(多选)EDG电子竞技俱乐部夺得英雄联盟全球总决赛冠军的消息在网络上轰动一时,这是对电子竞技体育主流价值的一种认可,也是一场集体的自我证明,电竞并不等同于打游戏,其需要很强的责任心和自律精神,我国体育总局已经将电子竞技项目列为正式体育竞赛项目,某公司推出一款全新电子竞技游戏,下面雷达图给出该游戏中3个人物的5种特征分析,则下列说法错误的是()A.小班的生命值比小轲大,所以在游戏中一定比小轲活得久B.如果进行一对一对抗赛,小班比小娜的胜率大C.小娜的各项特征均衡,组队进攻时,可以弥补小轲的弱点D.小轲的生命值低,但是法力、防御力、移动速度都很出色,适合快速进攻答案AB解析虽然小班的生命值比小轲大,但回血值、移动速度、防御力、法力均低于小轲,所以在游戏中不一定比小轲活得久,A错误;由于小娜的生命值、回血值、移动速度、防御力都高于小班,而两者的法力几乎一样,所以小娜比小班的胜率大,B错误;小娜的生命值高,回血值高,组队进攻时,可以弥补小轲的弱点,C正确;小轲的生命值低,但回血值、法力、防御力、移动速度都高,故小轲适合快速进攻,D正确.故选AB.16.(多选)高中阶段教育(含普通高中、中等职业学校及其他适龄教育机构)近六年的在校生规模与毛入学率情况图表及2023年高中阶段教育在校生结构饼状图如图,根据图中信息,下列说法正确的是(高中阶段毛入学率=在校生规模÷适龄青少年总人数×100%)()A.近六年,高中阶段在校生规模与毛入学率均持续增长B.近六年,高中阶段在校生规模的平均值超过4000万人C.2022年,未接受高中阶段教育的适龄青少年不足420万人D.2023年,普通高中的在校生超过2470万人答案BD解析对于A,高中在校生人数在前四年有下降的过程,故A错误;对于B,近六年的高中在校生总数为24037万人,平均值在4000万人以上,故B正确;对于C,eq\f(3995,0.895)×(1-0.895)≈469(万人),大于420万人,故C错误;对于D,4128×0.601≈2481(万人),故D正确.17.某网络研发公司为解决各种技术问题成立了一个专业技术研发团队,该团队中数学专业毕业与物理专业毕业的人数之比为2∶1,用比例分配的分层随机抽样的方法从团队中随机抽取了60人进行问卷调查.进行统计后将这60人按数学专业、物理专业分为两组,再将每组人员每天使用某设备进行测试的时间(单位:分钟)分为[0,10),[10,20),[20,30),[30,40),[40,50]5组,得到如图所示的频率分布直方图(假设所抽取的人员每天使用某设备进行测试的时间均不超过50分钟).(1)求出数学专业频率分布直方图中a的值;(2)求抽取的60人中每天使用某设备进行测试的时间不少于30分钟的人数.解(1)由题意得,数学专业频率分布直方图中所有组的频率和为1,则有(0.010+0.015+0.030+0.010+a)×10=1,解得a=0.035.(2)60人中数学专业的人数为60×eq\f(2,2+1)=40,物理专业的人数为60×eq\f(1,2+1)=20,则抽取的60人中每天使用某设备进行测试的时间不少于30分钟的人数为(0.035+0.010)×10×40+(0.020+0.015)×10×20=25.第二节用样本估计总体课标解读考向预测1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用样本的数字特征估计总体集中趋势和总体离散程度.用样本估计总体在高考中出题频率较高,常结合频率分布直方图、样本的数字特征出题.预计2025年高考将会以与统计图表的识读、成对数据的统计分析相综合的形式呈现.必备知识——强基础1.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有eq\x(\s\up1(01))p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)四分位数常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第eq\x(\s\up1(02))25百分位数也称为第一四分位数或下四分位数,第eq\x(\s\up1(03))75百分位数也称为第三四分位数或上四分位数.2.样本的数字特征(1)众数:一组数据中eq\x(\s\up1(04))出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于eq\x(\s\up1(05))最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把eq\x(\s\up1(06))eq\f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq\o(x,\s\up6(-)),则这组数据的标准差和方差分别是s=eq\r(\f(1,n)[(x1-\o(x,\s\up6(-)))2+(x2-\o(x,\s\up6(-)))2+…+(xn-\o(x,\s\up6(-)))2]),s2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(xn-eq\o(x,\s\up6(-)))2].3.总体平均数、方差、标准差与样本平均数、方差、标准差名称定义总体均值(总体平均数)、方差、标准差一般式:如果总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq\o(Y,\s\up6(-))=eq\f(Y1+Y2+…+YN,N)=eq\f(1,N)eq\o(∑,\s\up8(N),\s\do8(i=1))Yi为eq\x(\s\up1(07))总体均值,又称总体平均数,称S2=eq\f(1,N)eq\o(∑,\s\up8(N),\s\do8(i=1))(Yi-eq\o(Y,\s\up6(-)))2为eq\x(\s\up1(08))总体方差,S=eq\r(S2)为eq\x(\s\up1(09))总体标准差加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值为eq\o(Y,\s\up6(-))=eq\x(\s\up1(10))eq\f(1,N)eq\o(∑,\s\up8(k),\s\do8(i=1))fiYi,总体方差为S2=eq\x(\s\up1(11))eq\f(1,N)eq\o(∑,\s\up8(k),\s\do8(i=1))fi(Yi-eq\o(Y,\s\up6(-)))2样本均值(样本平均数)、方差、标准差如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq\o(y,\s\up6(-))=eq\f(y1+y2+…+yn,n)=eq\f(1,n)eq\o(∑,\s\up8(n),\s\do8(i=1))yi为eq\x(\s\up1(12))样本均值,又称样本平均数,称s2=eq\f(1,n)eq\o(∑,\s\up8(n),\s\do8(i=1))(yi-eq\o(y,\s\up6(-)))2为eq\x(\s\up1(13))样本方差,s=eq\r(s2)为eq\x(\s\up1(14))样本标准差说明:(1)在简单随机抽样中,我们常用样本平均数、方差、标准差去估计总体平均数、方差、标准差.(2)总体平均数、方差、标准差是一个确定的数,样本平均数、方差、标准差具有随机性(因为样本具有随机性).(3)一般情况下,样本量越大,估计越准确1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广若数据x1,x2,…,xn的平均数为eq\o(x,\s\up6(-)),方差为s2,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\o(x,\s\up6(-))+a,方差为m2s2.1.概念辨析(正确的打“√”,错误的打“×”)(1)对一组数据来说,平均数和中位数总是非常接近.()(2)一组数据的方差越大,说明这组数据越集中.()(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()答案(1)×(2)×(3)√2.小题热身(1)(人教A必修第二册习题9.2T1改编)下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2 B.3.0C.4.4 D.2.5答案A解析把该组数据按照由小到大的顺序排列,可得2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,得第3个数据3.2是第25百分位数.(2)(多选)(人教B必修第二册习题5-1BT3改编)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A.这组数据的极差为4B.这组数据的平均数为3C.这组数据的中位数为4D.这组数据的众数为3和5答案AC解析这组数据的极差为5-1=4,A正确;这组数据的平均数为eq\f(1+3×2+5×3,6)=eq\f(11,3),B错误;这组数据的中位数为eq\f(3+5,2)=4,C正确;这组数据的众数为5,D错误.(3)(人教B必修第二册练习BT4改编)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用比例分配的分层随机抽样的方法从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的平均使用寿命分别为980h,1020h,1032h,则抽取的100件产品的平均使用寿命为________h.答案1013解析由比例分配的分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品件数分别为25,50,25,则抽取的100件产品的平均使用寿命为eq\f(1,100)×(980×25+1020×50+1032×25)=1013(h).(4)已知一组数据的频率分布直方图如图,则众数是________,平均数是________.答案6567解析因为最高小长方形底边中点的横坐标为65,所以众数为65;平均数eq\o(x,\s\up6(-))=(55×0.030+65×0.040+75×0.015+85×0.010+95×0.005)×10=67.考点探究——提素养考点一百分位数的计算例1(1)(2023·江苏南通海安质量监测)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:借书数量/本5678910频数/人58131194则这50名学生的借书数量的上四分位数是()A.8 B.8.5C.9 D.10答案C解析由50×75%=37.5,故第75百分位数为借书数量从小到大排序后的第38个,又5+8+13+11=37<38<5+8+13+11+9=46,故上四分位数(第75百分位数)是9.(2)某校为了了解高三年级学生的身体素质状况,在开学初举行了一场身体素质体能测试,以便对体能不达标的学生进行有针对性的训练,促进他们体能的提升,现从整个年级测试成绩中抽取100名学生的测试成绩,并把测试成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,绘制成频率分布直方图(如图所示).其中分数在[90,100]这一组内的纵坐标为a,则该次体能测试成绩的80%分位数约为________分.答案92解析由频率分布直方图知,10×(0.002+0.004+0.014+0.020+a+0.035)=1,得a=0.025.因为0.02+0.04+0.14+0.20+0.35=0.75,所以该次体能测试成绩的80%分位数落在[90,100]内,设其为x,则由(x-90)×0.025=0.05,解得x=92.【通性通法】计算一组n个数据第p百分位数的步骤【巩固迁移】1.为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则x=()A.58或64 B.59或64C.58 D.59答案A解析将已知的6个数从小到大排序为45,49,53,57,61,79.若x≤57,则这组数据的第80百分位数与第60百分位数分别为61和57,它们的差为4,不符合条件;若x≥79,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件;若57<x<79,则这组数据的第80百分位数与第60百分位数分别为x和61(或61和x),则|x-61|=3,解得x=58或x=64.故选A.2.(2024·安徽十校联考)学校组织班级知识竞赛,某班的8名学生的成绩(单位:分)分别是68,63,77,76,82,88,92,93,则这8名学生成绩的75%分位数是()A.88分 B.89分C.90分 D.92分答案C解析8名学生的成绩从小到大排列为63,68,76,77,82,88,92,93,因为8×75%=6,所以75%分位数为第6个数和第7个数的平均数,即eq\f(1,2)×(88+92)=90(分).考点二总体集中趋势的估计例2(1)(2024·山东临沂模拟)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则()A.a>b>c B.c>b>aC.c>a>b D.b>c>a答案B解析将生产的件数由小到大排列为10,12,14,14,15,15,16,17,17,17,a=eq\f(1,10)×(15+17+14+10+15+17+17+16+14+12)=14.7,b=15,c=17.因此c>b>a.故选B.(2)(多选)(2023·湖北荆州中学模拟)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是()A.该公司职工的测试成绩不低于60分的人数约占总人数的80%B.该公司职工测试成绩的中位数约为70分C.该公司职工测试成绩的平均值约为68分D.该公司职工测试成绩的众数约为60分答案BC解析对于A,该公司职工的测试成绩不低于60分的频率为(0.02+0.015)×20=0.70,∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,测试成绩在[60,80)的频率为0.02×20=0.4,∴该公司职工测试成绩的中位数约为60+eq\f(0.5-0.3,0.4)×20=70分,故B正确;对于C,该公司职工测试成绩的平均值约为eq\o(x,\s\up6(-))=30×0.005×20+50×0.01×20+70×0.02×20+90×0.015×20=68分,故C正确;对于D,该公司职工测试成绩的众数约为eq\f(60+80,2)=70分,故D错误.故选BC.【通性通法】频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:各组区间的中点值与对应频率之积的和.【巩固迁移】3.某市市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=10.5(元).即当w=3时,该市居民该月的人均水费估计为10.5元.考点三总体离散程度的估计例3甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.解(1)eq\o(x,\s\up6(-))甲=eq\f(1,8)×(82+81+79+78+95+88+93+84)=85,eq\o(x,\s\up6(-))乙=eq\f(1,8)×(92+95+80+75+83+80+90+85)=85,seq\o\al(2,甲)=eq\f(1,8)×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,seq\o\al(2,乙)=eq\f(1,8)×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知eq\o(x,\s\up6(-))甲=eq\o(x,\s\up6(-))乙,seq\o\al(2,甲)<seq\o\al(2,乙),甲的成绩较稳定,所以派甲参赛比较合适.【通性通法】标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.【巩固迁移】4.(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为eq\o(z,\s\up6(-)),样本方差为s2.(1)求eq\o(z,\s\up6(-)),s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果eq\o(z,\s\up6(-))≥2eq\r(\f(s2,10)),则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解(1)eq\o(x,\s\up6(-))=eq\f(1,10)×(545+533+551+522+575+544+541+568+596+548)=552.3,eq\o(y,\s\up6(-))=eq\f(1,10)×(536+527+543+530+560+533+522+550+576+536)=541.3,eq\o(z,\s\up6(-))=eq\o(x,\s\up6(-))-eq\o(y,\s\up6(-))=552.3-541.3=11,zi=xi-yi的值分别为9,6,8,-8,15,11,19,18,20,12,故s2=eq\f(1,10)×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,eq\o(z,\s\up6(-))=11,2eq\r(\f(s2,10))=2eq\r(6.1)=eq\r(24.4),故有eq\o(z,\s\up6(-))≥2eq\r(\f(s2,10)),所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.考点四分层随机抽样的均值与方差例4为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间的均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间的均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为________.答案1.04解析该地区中学生每天睡眠时间的平均数为eq\f(800,1200+800)×9+eq\f(1200,1200+800)×8=8.4(小时),该地区中学生每天睡眠时间的方差为eq\f(800,1200+800)×[0.5+(9-8.4)2]+eq\f(1200,1200+800)×[1+(8-8.4)2]=1.04.【通性通法】在分层随机抽样中,如果第一层的样本量为m,平均值为eq\o(x,\s\up6(-)),方差为seq\o\al(2,1);第二层的样本量为n,平均值为eq\o(y,\s\up6(-)),方差为seq\o\al(2,2),则样本的平均值为eq\o(w,\s\up6(-))=eq\f(m\o(x,\s\up6(-))+n\o(y,\s\up6(-)),m+n),样本的方差为s2=eq\f(1,m+n){m[seq\o\al(2,1)+(eq\o(x,\s\up6(-))-eq\o(w,\s\up6(-)))2]+n[seq\o\al(2,2)+(eq\o(y,\s\up6(-))-eq\o(w,\s\up6(-)))2]}.特别地,在比例分配的分层随机抽样中,我们可以直接用样本平均数eq\o(w,\s\up6(-))估计总体平均数eq\o(W,\s\up6(-)),用样本方差s2估计总体方差S2.【巩固迁移】5.(2023·安徽宣城模拟)某学校有男生400人,女生600人,为调查该校全体学生每天运动时间的情况,按照男女比例通过分层随机抽样的方法取到一个样本,样本中男生每天运动时间的平均值为80分钟,方差为10,女生每天运动时间的平均值为60分钟,方差为20.结合数据,估计该校全体学生每天运动时间的方差为()A.15 B.16C.96 D.112答案D解析由题意,用比例分配的分层随机抽样的方式抽取样本,且该样本中男、女生的比为eq\f(400,600)=eq\f(2,3),不妨设抽取的男、女生人数分别为2n,3n,那么样本的总数为5n.则所有样本的平均值为eq\f(1,5n)×(80×2n+60×3n)=68,方差为eq\f(2n,5n)×[10+(80-68)2]+eq\f(3n,5n)×[20+(60-68)2]=112.故选D.6.为了了解全区科级干部“党风廉政知识”的学习情况,采用比例分配的分层随机抽样方法,从全区320名正科级干部和1280名副科级干部中抽取40名科级干部预测全区科级干部“党风廉政知识”的学习情况.现将这40名科级干部分为正科级干部组和副科级干部组,利用同一份试卷分别进行测试.经过测试后,两组各自将测试成绩统计分析如下表:分组人数平均成绩正科级干部组a80副科级干部组b70则40名科级干部测试成绩的平均分eq\o(x,\s\up6(-))=________.答案72解析样本量与总体中的个体数的比为eq\f(40,320+1280)=eq\f(1,40),则抽取的正科级干部人数a=320×eq\f(1,40)=8,副科级干部人数b=1280×eq\f(1,40)=32.所以这40名科级干部测试成绩的平均分eq\o(x,\s\up6(-))=eq\f(80×8+70×32,40)=72.课时作业一、单项选择题1.(2023·天津河西区三模)学校组织班级知识竞赛,某班的12名学生的成绩(单位:分)分别是58,67,73,74,76,82,82,87,90,92,93,98,则这12名学生成绩的第三四分位数是()A.88分 B.89分C.90分 D.91分答案D解析12名学生的成绩(单位:分)由小到大排列为58,67,73,74,76,82,82,87,90,92,93,98,∵12×75%=9,∴这12名学生成绩的第三四分位数是eq\f(90+92,2)=91(分).2.(2024·重庆南开中学月考)为了解某高中学生的身高情况,按年级采用比例分配的分层随机抽样的方法抽取样本,抽到高一、高二、高三年级的学生人数分别为100,200,300,样本中高一、高二、高三这三个年级学生的平均身高分别为eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),eq\o(z,\s\up6(-)),则估计该高中学生的平均身高为()A.eq\f(1,6)eq\o(x,\s\up6(-))+eq\f(1,3)eq\o(y,\s\up6(-))+eq\f(1,2)eq\o(z,\s\up6(-)) B.eq\f(\o(x,\s\up6(-))+\o(y,\s\up6(-))+\o(z,\s\up6(-)),2)C.eq\f(1,2)eq\o(x,\s\up6(-))+eq\f(1,3)eq\o(y,\s\up6(-))+eq\f(1,6)eq\o(z,\s\up6(-)) D.eq\f(\o(x,\s\up6(-))+\o(y,\s\up6(-))+\o(z,\s\up6(-)),3)答案A解析样本量为100+200+300=600,样本平均数为eq\f(100,600)eq\o(x,\s\up6(-))+eq\f(200,600)eq\o(y,\s\up6(-))+eq\f(300,600)eq\o(z,\s\up6(-))=eq\f(1,6)eq\o(x,\s\up6(-))+eq\f(1,3)eq\o(y,\s\up6(-))+eq\f(1,2)eq\o(z,\s\up6(-)),所以估计该高中学生的平均身高为eq\f(1,6)eq\o(x,\s\up6(-))+eq\f(1,3)eq\o(y,\s\up6(-))+eq\f(1,2)eq\o(z,\s\up6(-)).3.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B解析讲座前问卷答题的正确率的中位数为eq\f(70%+75%,2)=72.5%>70%,故A错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D错误.故选B.4.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据()A.众数为2 B.平均数为2.5C.方差为1.6 D.标准差为4答案C解析由题中数据可得,众数为2和3,故A错误;平均数eq\o(x,\s\up6(-))=eq\f(5+5+…+2+1,10)=3,故B错误;方差s2=eq\f((5-3)2+(5-3)2+…+(2-3)2+(1-3)2,10)=1.6,标准差为eq\r(1.6)≠4,故C正确,D错误.5.(2023·河北唐山一中模拟)对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件使用寿命的85%分位数为()A.500h B.450h C.350h D.550h答案A解析电子元件寿命小于500h的百分比为100×eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2000)+\f(3,2000)+\f(1,400)+\f(1,250)))=85%,则这批电子元件使用寿命的85%分位数为500h.故选A.6.某市教育部门组织高中教师在暑假期间进行培训,培训后统一举行测试.随机抽取100名教师的测试成绩(单位:分,满分100分)进行统计,得到如图所示的频率分布折线图,则下列说法正确的是()A.这100名教师的测试成绩的极差是20分B.这100名教师的测试成绩的众数是90分C.这100名教师的测试成绩的中位数是87.5分D.这100名教师中测试成绩不低于90分的人数占比超过50%答案C解析对于A,由题意知,这100名教师的测试成绩的最高分与最低分无法确定,故极差无法确定,故A错误;对于B,由题图易知这100名教师的测试成绩的众数为87.5分,故B错误;对于C,设这100名教师的测试成绩的中位数为x分,则(0.02+0.04)×5+(x-85)×0.08=0.5,解得x=87.5,故C正确;对于D,这100名教师中测试成绩不低于90分的人数占比为(0.03+0.03)×5×100%=30%,30%<50%,故D错误.故选C.7.已知两组数据x1,x2,x3,x4,x5和y1,y2,y3,y4,y5的中位数、方差均相同,则两组数据合并为一组数据后,()A.中位数一定不变,方差可能变大B.中位数一定不变,方差可能变小C.中位数可能改变,方差可能变大D.中位数可能改变,方差可能变小答案A解析不妨设x1≤x2≤x3≤x4≤x5,y1≤y2≤y3≤y4≤y5,则两组数据x1,x2,x3,x4,x5和y1,y2,y3,y4,y5的中位数分别为x3,y3,则x3=y3,两组数据合并为一组数据后,中位数为eq\f(x3+y3,2)=x3=y3,故中位数一定不变,设x1,x2,x3,x4,x5的平均数为eq\o(x,\s\up6(-)),方差为seq\o\al(2,1),y1,y2,y3,y4,y5的平均数为eq\o(y,\s\up6(-)),方差为seq\o\al(2,1),则eq\o(∑,\s\up8(5),\s\do8(i=1))xi=5eq\o(x,\s\up6(-)),eq\o(∑,\s\up8(5),\s\do8(i=1))xeq\o\al(2,i)=5(seq\o\al(2,1)+eq\o(x,\s\up6(-))2),eq\o(∑,\s\up8(5),\s\do8(i=1))yi=5eq\o(y,\s\up6(-)),eq\o(∑,\s\up8(5),\s\do8(i=1))yeq\o\al(2,i)=5(seq\o\al(2,1)+eq\o(y,\s\up6(-))2),则两组数据合并为一组数据后的平均数eq\o(z,\s\up6(-))=eq\f(1,10)(eq\o(∑,\s\up8(5),\s\do8(i=1))xi+eq\o(∑,\s\up8(5),\s\do8(i=1))yi)=eq\f(1,10)(5eq\o(x,\s\up6(-))+5eq\o(y,\s\up6(-)))=eq\f(\o(x,\s\up6(-))+\o(y,\s\up6(-)),2),方差s2=eq\f(1,10)[eq\o(∑,\s\up8(5),\s\do8(i=1))(xi-eq

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论