专题51 统计(解析版)_第1页
专题51 统计(解析版)_第2页
专题51 统计(解析版)_第3页
专题51 统计(解析版)_第4页
专题51 统计(解析版)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题51统计【考点预测】知识点一、抽样1、抽样调查(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.(2)个体:构成总体的每一个元素叫做个体.(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.2、简单随机抽样(1)定义一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)两种常用的简单随机抽样方法①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.(3)抽签法与随机数法的适用情况抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.(4)简单随机抽样的特征①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.只有四个特点都满足的抽样才是简单随机抽样.3、分层抽样(1)定义一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的.(2)分层抽样问题类型及解题思路①求某层应抽个体数量:按该层所占总体的比例计算.②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq\f(样本容量,总体容量)=eq\f(各层样本数量,各层个体数量)”注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).知识点二、用样本估计总体1、频率分布直方图(1)频率、频数、样本容量的计算方法①eq\f(频率,组距)×组距=频率.②eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于.2、频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.3、百分位数(1)定义一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.(2)计算一组个数据的的第百分位数的步骤①按从小到大排列原始数据.②计算.③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.(3)四分位数我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.4、样本的数字特征(1)众数、中位数、平均数①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.5、标准差和方差(1)定义①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.(2)数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.(3)平均数、方差的性质如果数据的平均数为,方差为,那么①一组新数据的平均数为,方差是.②一组新数据的平均数为,方差是.③一组新数据的平均数为,方差是.【题型归纳目录】题型一:随机抽样、分层抽样题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图题型三:百分位数题型四:样本的数字特征【典例例题】题型一:随机抽样、分层抽样例1.(2022·全国·高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(

)3221183429

7864540732

5242064438

1223435677

35789056428442125331

3457860736

2530073286

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.328 C.253 D.007【答案】A【解析】从第5行第6列开始向又读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,第四个是007,第五个是328,第六个是623.故选:A.例2.(2022·全国·高三专题练习)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是(

)A.总体是36个篮球 B.样本是4个篮球C.样本容量是4 D.每个篮球被抽到的可能性不同【答案】D【解析】依题意,总体是36个篮球,样本是4个篮球,样本容量是4,选项A,B,C都正确;甲箱抽3个,每个球被抽到的概率为,乙箱抽1个,每个球被抽到的概率为,则每个篮球被抽到的可能性相同,D不正确.故选:D例3.(2022·上海宝山·高三阶段练习)某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体学生中抽取一个容量为68的样本,则此样本中女生人数为(

)A.40 B.36 C.34 D.32【答案】D【解析】由题意得:样本中女生人数为.故选:D变式1.(2022·江西·赣源中学高三阶段练习(文))年月日,搭载问天实验舱的长征五号遥三运载火箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生人,高二学生人,高三学生人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分层抽样的方式抽取人填写问卷调查,则高三年级有多少人被抽中(

)A.16 B.18 C.20 D.24【答案】D【解析】由分层抽样原则可知:高三年级应抽取人.故选:D.变式2.(2022·四川省内江市第六中学模拟预测(理))某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是(

)A.若按专业类型进行分层抽样,则张三被抽到的可能性比李四大B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人C.采用分层抽样比简单随机抽样更合理D.该问题中的样本容量为100【答案】A【解析】对于选项A,张三与李四被抽到的可能性一样大,故A错误;对于选项B,理学专业应抽取的人数为,工学专业应抽取的人数为,故B正确;对于选项C,因为各专业差异比较大,所以采用分层随机抽样更合理,故C正确;对于选项D,该问题中的样本容量为100,故D正确.故选:A.变式3.(2022·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为人,延庆冬奥村的容量约人,张家口冬奥村的容量约人.为了解各冬奥村服务质量,现共准备了份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是(

)A.58份 B.50份 C.32份 D.19份【答案】C【解析】在延庆冬奥村投放的问卷数量是份.故选:C.变式4.(2022·全国·高三专题练习)利用简单随机抽样的方法,从个个体中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为___________.【答案】【解析】第二次抽取时,余下的每个个体被抽取到的概率为,则,即,则在整个抽样过程中,每个个体被抽取到的概率为.故答案为:.变式5.(2022·重庆南开中学高三阶段练习)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该校部门、部门、部门分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则部门抽检人数为______.【答案】20【解析】由题意得从部门抽检人数为(人),故答案为:20变式6.(2022·全国·高三专题练习)某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数如下表:甲校乙校丙校男生9790x女生153160y(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,将800人按001,002,…,800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取的4个人的编号.(下面摘取了随机数表第7行至第9行)8442

1753

3157

2455

0688

7704

7447

6721

7633

5026

83926301

5316

5916

9275

3816

5821

7071

7512

8673

5807

44391326

3321

1342

7864

1607

8252

0744

3815

0324

4299

7931【解析】(1)根据题意可得丙校共有人,根据分层抽样规则可得,应从丙校抽取人.(2)第8行第7列的数为1,从数1开始向右读,则最先抽取的4个人的编号为165,538,707,175.【方法技巧与总结】不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图例4.(2022·辽宁朝阳·高三阶段练习)某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样调查,随机抽取了名学生,他们的身高都在,,,,五个层次内,分男、女生统计得到以下样本分布统计图,则(

)A.样本中层次的女生比相应层次的男生人数多B.估计样本中男生身高的中位数比女生身高的中位数大C.层次的女生和层次的男生在整个样本中频率相等D.样本中层次的学生数和层次的学生数一样多【答案】B【解析】设样本中女生有人,则男生有人,设女生身高频率分布直方图中的组距为由频率分布直方图的性质可得,所以,所以女生身高频率分布直方图中层次频率为20%,层次频率为30%,层次频率为25%,层次频率为15%,层次频率为10%所以样本中层次的女生人数为,男生人数为,由于的取值未知,所以无法比较层次中男,女生人数,A错误;层次女生在女生样本数中频率为15%,所以在整个样本中频率为,层次男生在男生样本数中频率为15%,所以在整个样本中频率为,由于的取值未知,所以无法比较层次的女生和层次的男生在整个样本中频率,C错误;样本中层次的学生数为,样本中层次的学生数为,由于的取值未知,所以无法比较样本中层次的学生数和层次的学生数的大小,D错,女生中,两个层次的频率之和为50%,所以女生的样本身高中位数为,层次的分界点,而男生,两个层次的频率之和为35%,,,两个层次的频率之和为65%,显然中位数落在C层次内,所以样本中男生身高的中位数比女生身高的中位数大,B正确;故选:B.例5.(2022·黑龙江·佳木斯一中三模(理))如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是(

)A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关【答案】B【解析】从图(1)的柱形图可得2019年1~4月份快递业务量3月份最高,2月份最低,3月份比2月份高4397-2411=1986,差值接近2000万件,故A正确.从1~4月份来看,业务量与业务收入有波动,结合图(1)(2)中的柱形图可得业务量与业务收入在2月份和4月份均下降,故B错误.从两图中柱状图可得业务量与业务收入变化高度一致,但业务量2月份同比增长,而业务收入2月份同比增长,因此增量与增长速度并不完全一致,故C正确.从图(1)中可得2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,这的确和春节后网购迎来喷涨有关,故D正确.故选:B.例6.(2022·湖北孝感·高三阶段练习)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则(

)备注:同比增长率=,环比增长率=,A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%【答案】D【解析】对A,从图中可以看出2022年1月全国居民消费价格的同比增长率为,所以2022年1月全国居民消费价格有所上升,故A错误;对B,由图2022年5月全国居民消费价格环比增长率为,所以2022年5月全国居民消费价格有所下降,故B错误;对C,将C选项中的数据由小到大排列得,,因为,则同比增长率的40%分位数为第6个数,故C错误;对D,环比增长率的平均数为,故D正确.故选:D变式7.(2022·山西大附中高三阶段练习(文))小王于2015年底贷款购置了一套房子,根据家庭收入情况,小王选择了10年期每月还款数额相同的还货方式,且截止2019年底,他没有再购买第二套房子.下图是2016年和2019年家庭收入用于各项支出的比例分配图,根据以上信息,判断下列结论中正确的是(

)A.小王一家2019年用于饮食支出费用与2016年相同B.小王一家2019年用于其他方面的支出费用是2016年的3倍C.小王一家2019年的家庭收入比2016年增加了一倍D.小王一家2019年的房贷支出比2016年减少了【答案】B【解析】对于A,小王一家2019年用于饮食的支出比例与跟2016年相同,但是由于2019年比2016年家庭收入多,小王一家2019年用于饮食的支出费用比2016年多,故A错误;对于B,设2016年收入为,相同的还款数额在2016年占各项支出的,在2019年占各项支出的,年收入为:,小王一家2019年用于其他方面的支出费用为,小王一家2016年用于其他方面的支出费用为,小王一家2019年用于其他方面的支出费用是2016年的3倍,故B正确;对于C,设2016年收入为,则2019年收入为:,故C错误;对于D,小王一家2019年用于房贷的支出费用与2016年相同,故D错误.故选:B.变式8.(2022·全国·高三专题练习)某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)(1)求频率分布直方图中a的值;(2)试估计该市居民月均用水量的众数、平均数;(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?【解析】(1)由频率分布直方图中所有矩形的面积之和为1,可得,解得.(2)由频率分布直方图可知,该市居民月均用水量的众数约为(吨),由频率分布直方图可知,平均数约为(吨).(3)由频率分布直方图可知,月均用水量低于2.5吨的居民人数所占的百分比为,月均用水量低于3吨的居民人数所占的百分比为,所以,由题意可得,解得.所以如果希望85%的居民月均用水量不超过标准x,那么x定为2.9吨比较合理.变式9.(2022·全国·高三专题练习)法国著名的数学家笛卡尔曾经说过:“阅读优秀的书籍,就是和过去时代中最杰出的人们(书籍的作者)一一进行交谈,也就是和他们传播的优秀思想进行交流,阅读会让精神世界闪光”.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图,如图所示:(1)求a;(2)根据频率分布直方图,估计该地年轻人每天阅读时间的中位数(精确到0.1)(单位:分钟);(3)为了进一步了解年轻人的阅读方式,研究机构采用分层抽样的方法从每天阅读时间位于分组,和的年轻人中抽取5人,再从中任选3人进行调查,求其中恰好有2人每天阅读时间位于的概率.【解析】(1)因为频率分布直方图的所有矩形面积之和为1,所以,解得.(2)因为,.则中位数位于区间内,设中位数为x,则,解得,所以估计该地年轻人阅读时间的中位数约为74.4分钟.(3)由题意,阅读时间位于的人数为,阅读时间位于的人数为,阅读时间位于的人数为,所以在这三组中按照分层抽样抽取5人的抽样比例为,则抽取的5人中位于区间有1人,设为a,位于区间有2人,设为,,位于区间有2人,设为,.则从5人中任取3人,样本空间.含有10个样本点.设事件A为“恰有2人每天阅读时间在”,,含有3个样本点.所以,所以恰好有2人每天阅读时间位于的概率为.变式10.(2022·贵州遵义·三模(理))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.(1)请根据频率分布折线图,画出频率分布直方图,并根据频率分布直方图估计该班级的平均分;(2)经相关部门统计,高考分数以上的考生获得高校T“强基计划”入围资格,并制作高校T录取政策和考生录取预测统计表(如表所示).第一轮笔试有2科,学生通过考试获得相应等级的事件相互独立且概率相同.高考分数第一轮笔试学科测试等级ABCABC学生通过考试获得相应等级概率第二轮面试入围条件至少有1科,且2科均不低于B录取条件全在第一轮笔试中2科均获得通过第二轮面试考生通过概率为考生通过概率为若该班级考分前10名都已经报考了高校T的“强基计划”,且恰有2人成绩高于690分.求:①总分高于690分的某位同学没有进入第二轮的概率;②该班恰有两名同学通过“强基计划”被高校T录取的概率.【解析】(1)画出频率分布直方图如下图所示:平均分为:.(2)总分大于等于分的同学有人,其中有人小于等于分,人大于分.①.②设高于分的同学被高校录取为事件,不超过分的同学被高校录取为事件,则,.变式11.(2022·全国·高三专题练习(理))山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:采购数x(单位:箱)客户数51015155(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.【解析】(1)对应的频率分别为,则对应的频率/组距为,故这些数据的频率分布直方图如下图所示:由直方图可知,采购数在168箱以上(含168箱)的客户数为(人)(2)由题意可知,去年年底客户采购酥梨在内的数量为(箱)则小李去年年底总销售量为(箱)(3)由题意可得当时,(元)变式12.(2022·河南·温县第一高级中学高三阶段练习(文))随着新冠肺炎疫情的稳定,各地的经济均呈现缓慢的恢复趋势,为了更进一步做好疫情的防控工作,避免疫情的再度爆发,A地区规定居民出行或者出席公共场合均需佩戴口罩,现将A地区20000个居民一周的口罩使用个数统计如下表所示,其中每周的口罩使用个数在6以上(含6)的有14000人.口罩使用数量频率0.2m0.3n0.1(1)求m,n的值;(2)根据表中数据,完善上面的频率分布直方图;(3)计算A地区居民一周口罩使用个数的平均数以及方差.【解析】(1)由已知,;(2)频率分布直方图如下:(3)由频率分布直方图得一周内使用口罩的平均数为,方差为.变式13.(2022·全国·高三专题练习)已知A,B两家公司的员工月均工资(单位:万元)情况分别如图1,图2所示:(1)以每组数据的区间中点值为代表,根据图1估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平?请说明理由.(2)小明拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,他应该选哪个公司?【解析】(1)A公司员工月均工资的平均数为(万元).由题图1可知A公司员工月均工资在0.6万元以下的比例为,所以A公司员工月均工资的中位数约为0.6万元.用中位数更能反映该公司普通员工的工资水平,理由如下:因为平均数受每一个数据的影响,越离群的数据对平均数的影响越大,该公司少数员工的月收入很高,在这种情况下平均数并不能较好的反映普通员工的收入水平,而中位数不受少数极端数据的影响,可以较好的反映普通员工的收入水平.(2)B公司员工月均工资的平均数为(万元)由题图2知,B公司员工月均工资在0.6万元以下的频率为,在0.8万元以下的频率为.设B公司员工月均工资的中位数为x万元,则,得.小明应选择B公司应聘,理由如下:B公司员工工资数据较为集中,月均工资的平均数和中位数均能反映该公司普通员工的平均收入水平,B公司员工月均工资平均数为0.69,中位数为0.7,均大于A公司员工月均工资的中位数0.62,所以以公司普通员工的工资水平作为决策依据,小明应该选B公司应聘.【方法技巧与总结】(1)利用频率分布直方图求频率、频数;(2)利用频率分布直方图估计总体.(3)频率分布直方图的纵坐标是,而不是频率.题型三:百分位数例7.(2022·广东·高三阶段练习)为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则(

)A.58或64 B.59或64 C.58 D.59【答案】A【解析】将已知的6个数从小到大排序为45,49,53,57,61,79.若,则这组数据的第80百分位数与第60百分位数分别为61和57,他们的差为4,不符合条件;若,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件;若,则这组数据的第80百分位数与第60百分位数分别为x和61(或61和x),则,解得或故选:A例8.(2022·湖南·长沙一中高三阶段练习)一学习小组10名学生的某次数学测试成绩的名次由小到大分别是2,4,5,,11,14,15,39,41,50,已知该小组数学测试成绩名次的40%分位数是9.5,则的值是(

)A.6 B.7 C.8 D.9【答案】C【解析】依题意是整数,那么40%分位数9.5就是第,第位数的平均值,于是,解得.故选:C例9.(2022·湖南岳阳·高三阶段练习)中国青年志愿者协会成立于1994年12月5日,此后广大志愿者、志愿服务组织不断蓬勃发展,目前高校青年志愿者组织就有132个.为了解某大学学生参加志愿者工作的情况,随机抽取某高校志愿者协会的40名成员,就他们2022年第2季度参加志愿服务的次数进行了统计,数据如表所示.则这40名学生本季度参加志愿活动的第40百分数位为(

)次数7891011人数610987A.9 B.8 C.8.5 D.9.5【答案】C【解析】∵为整数∴第40百分数位为第16位和第17位的平均数,即为故选:C.变式14.(2022·江苏南通·高三开学考试)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:借书数量(单位:本)5678910频数(单位:人)58131194则这50名学生的借书数量的上四分位数(第75百分位数)是(

)A.8 B.8.5 C.9 D.10【答案】C【解析】由,故第75百分位数在借书数量从小到大排序后的第38人,又,故四分位数(第75百分位数)是9.故选:C变式15.(2022·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:党史学习时间(小时)7891011党员人数610978则该单位党员一周学习党史时间的众数及第50百分位数分别是(

)A.8,8.5 B.8,8 C.9,8 D.8,9【答案】D【解析】党员人数一共有,学习党史事件为8小时的人数最多,故学习党史时间的众数为8,,那么第50百分位数是第20和21个数的平均数,第20,21个数分别为9,9,所以第50百分位数是,故选:D变式16.(2022·福建省漳州第一中学模拟预测)树人中学举办以“喜迎二十大、永远跟党走、奋进新征程”为主题的演讲比赛,其中9人比赛的成绩为:85,86,88,88,89,90,92,94,98(单位:分),则这9人成绩的第80百分位数是___________.【答案】94【解析】,所以从小到大选取第8个数作为80百分位数,即94.故答案为:94变式17.(2022·全国·高三专题练习)已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)【答案】【解析】因为,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是.故答案为:【方法技巧与总结】计算一组个数据的的第百分位数的步骤①按从小到大排列原始数据.②计算.③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.题型四:样本的数字特征例10.(2022·全国·高三专题练习)上海入夏的标准为:立夏之后,连续五天日平均气温不低于.立夏之后,测得连续五天的平均气温数据满足如下条件,其中能断定上海入夏的是(

)A.总体均值为,中位数为B.总体均值为,总体方差大于C.总体中位数为,众数为D.总体均值为,总体方差为【答案】D【解析】对于A,总体均值为,中位数为,可能出现低于的情况,故A不正确;对于B,当总体方差大于,不知道总体方差的具体数值,因此不能确定数据的波动大小,故B不正确;对于C,中位数和众数也不能确定,故C不正确:对于D,当总体均值为,总体方差为,根据方差公式,因为方差为1,,若存在有一天气温低于,则方差定大于1,或者通过假设,则,(另一值舍去),此时即为五天最低温度为度,大于,故D正确.故选:D.例11.(2022·全国·高三专题练习)若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是(

)A.甲同学:平均数为2,众数为1B.乙同学:平均数为2,方差小于1C.丙同学:中位数为2,众数为2D.丁同学:众数为2,方差大于1【答案】B【解析】对于A,甲同学:若平均数为2,众数为1,则有1次名次应为4,不符合题意;对于B,乙同学:平均数为2,设乙同学3次考试的名次分别为,,,则方差,则,所以,,均不大于3,符合题意;对于C,丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;对于D,丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.故选:B例12.(2022·重庆南开中学高三阶段练习)橙子辅导中学的高一、二、三这三个年级学生的平均身高分别为,若按年级采用分层抽样的方法抽取了一个600人的样本,抽到高一、高二、高三的学生人数分别为100、200、300,则估计该高中学生的平均身高为(

)A. B. C. D.【答案】A【解析】设橙子辅导中学的总人数为,由题意知,高一、高二、高三的学生总人数分别为:,所以估计该高中学生的平均身高为:.故选:A.变式18.(2022·广东佛山·高三阶段练习)已知一组数据的平均数是3,方差是2,则由这5个数据组成的新的一组数据的方差是(

)A.4 B.6 C. D.【答案】C【解析】因为一组数据的平均数是3,方差是2,所以,,所以,,所以的平均数为,所以的方差为,故选:C变式19.(2022·全国·高三阶段练习(理))某组样本数据的平方和,平均数,则该组数据的方差(

)A.1 B. C.2 D.【答案】D【解析】,故选:D变式20.(多选题)(2022·福建·高三阶段练习)某环保局对辖区内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若连续10天,每天空气质量指数(单位:)不超过100,则认为该地区环境治理达标,否则认为该地区环境治理不达标.根据连续10天检查所得数据的数字特征推断,环境治理一定达标的地区是(

)A.甲地区:平均数为80,方差为40 B.乙地区:平均数为50,众数为40C.丙地区:中位数为50,极差为60 D.丁地区:极差为10,80%分位数为90【答案】AD【解析】设每天的空气质量指数为,则方差.对于A选项,由,得,如果这10天中有1天的空气质量指数超过100,则必有矛盾,所以这10天每天的空气质量指数都不超过100,A正确.对于B选项,有天为40,有天为,有天为,此时:平均数为50,众数为40,但该地区环境治理不达标,所以B选项错误.对于C选项,第天为,后面天为,此时中位数为50,极差为60,但该地区环境治理不达标,所以C选项错误.对于D选项,如果最大值超过100,根据极差为10,则最小值超过90,这与80%分位数为90矛盾,故最大值不超过100,D正确.故选:AD变式21.(多选题)(2022·广东·仲元中学高三阶段练习)已知一组样本数据,其中,由这组数据得到另一组新的样本数据,,…,,其中,则(

).A.两组样本数据的样本平均数相同B.两组样本数据的样本方差相同C.,,…,样本数据的第30百分位数为D.将两组数据合成一个样本容量为30的新的样本数据,该样本数据的平均数为5【答案】BC【解析】由题意可得:∵,则,,故A错误,B正确.第30百分位数:,故为第5个数.的排列为:,,,,,……因此,第30百分位数为,C正确;新样本的平均数为,D错误.故选:BC.变式22.(2022·陕西·安康市教学研究室三模(理))从1,2,3,4,5,6中任取4个不同的数,则这4个数的中位数是3的概率为____________.【答案】【解析】中位数为3,则中间两个数为2,4,∴符合条件的有1,2,4,5和1,2,4,6,故概率为.故答案为:变式23.(2022·上海市进才中学高三阶段练习)已知等差数列的公差为3,则、、、…、这11个数据的方差______.【答案】90【解析】∵数列为等差数列,则这11个数据的平均数:∴这11个数据的方差故答案为:90.变式24.(2022·江苏·南京师大附中高三阶段练习)有一组样本数据,该样本的平均数和方差均为.在该组数据中加入一个数,得到新的样本数据,则新样本数据的方差为__________.【答案】【解析】样本数据,该样本的平均数和方差均为,在该组数据中加入1个数,则新样本数据的平均数,方差为.故答案为:.变式25.(2022·全国·高三专题练习)已知一组数的方差是4,则的标准差是__.【答案】4【解析】数据的方差为4,所以数据的方差为,所以数据的标准差为,故答案为:4.【方法技巧与总结】(1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方.【过关测试】一、单选题1.(2022·福建省福州延安中学高三开学考试)为检查某校学生心理健康情况,市教委从该校名学生中随机抽查名学生,检查他们心理健康程度,则下列说法正确的是(

)A.名学生的心理健康情况是总体 B.每个学生是个体C.名学生是总体的一个样本 D.名学生为样本容量【答案】A【解析】对选项A:名学生的心理健康情况是总体,故A正确;对选项B,每个学生的心理健康情况是个体,故B错误;对选项C,名学生的心理健康情况是总体的一个样本,故C错误;对选项D,名学生的心理健康情况为样本容量,故D错.故选:2.(2022·山东·汶上县第一中学高三开学考试)某市为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为(

)A.8.25 B.8.45 C.8.65 D.8.85【答案】B【解析】由频率分布直方图,得月均用水量在5.2吨以下的居民用户所占的比例为,月均用水量在9.2吨以下的居民用户所占的比例为,故中位数落在区间内.设样本的中位数为,则,所以,即样本的中位数为,由样本估计总体的思想,估计该市居民月均用水量的中位数为,故选:B.3.(2022·黑龙江·佳木斯一中三模(文))新冠肺炎疫情防控中,测量体温是最简便、最快捷,也是筛查成本比较低、性价比很高的筛查方式,是更适用于大众的普通筛查手段.某班级体温检测员对某一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列结论不正确的是(

)A.甲同学的体温的极差为0.5℃B.甲同学的体温的众数为36.3℃C.乙同学的体温的中位数与平均数不相等D.乙同学的体温比甲同学的体温稳定【答案】C【解析】对于A:甲同学的体温的极差为℃,故A选项正确;对于B:甲同学的体温从低到高依次为36.1℃,36.1℃,36.3℃,36.3℃,36.3℃,36.5℃,36.6℃,故众数为36.3℃,故B选项正确;对于C:乙同学的体温从低到高依次为36.2℃,36.3℃,36.3℃,36.4℃,36.5℃,36.5℃,36.6℃,故中位数为36.4℃,而平均数也是36.4℃,故C选项错误;对于D:从折线图上可以看出,乙同学的体温比甲同学的体温稳定,故D选项正确.故选:C4.(2022·河北邯郸·高三开学考试)某高中2022年的高考考生人数是2021年高考考生人数的倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:下列结论正确的是(

)A.该校2022年与2021年的本科达线人数比为6:5B.该校2022年与2021年的专科达线人数比为6:7C.2022年该校本科达线人数增加了80%D.2022年该校不上线的人数有所减少【答案】C【解析】不妨设2021年的高考人数为100,则2022年的高考人数为年本科达线人数为50,2022年本科达线人数为90,得2022年与2021年的本科达线人数比为,本科达线人数增加了,故选项不正确,选项C正确;2021年专科达线人数为35,2022年专科达线人数为45,所以2022年与2021年的专科达线人数比为,选项B错误;2021年不上线人数为15,2022年不上线人数也是15,不上线的人数无变化,选项错误.故选:C5.(2022·安徽·高三开学考试)某滑冰馆统计了2021年11月1日到30日某小区居民在该滑冰馆的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是(

)A.该小区居民在该滑冰馆的锻炼天数在区间内的最少B.估计该小区居民在该滑冰馆的锻炼天数的中位数为16C.估计该小区居民在该滑冰馆的锻炼天数的平均值大于14D.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.456【答案】C【解析】频率分布直方图中,面积最小的矩形条所在的区间为,即样本中区间内的数据频率最小,频数也最小,故选项错误,由频率分布直方图可得,前三个小矩形的面积之和为,所以估计该小区居民在该滑冰馆的锻炼天数的中位数小于15,故选项错误;由频率分布直方图可得,,故选项C正确;由频率分布直方图可得,该小区居民在该滑冰馆的锻炼天数超过15天的频率为,故锻炼天数超过15天的概率为,故选项错误.故选:C.6.(2022·广西·模拟预测(文))2022年6月6日是第27个“全国爱眼日”,为普及科学用眼知识,提高群众健康水平,预防眼疾,某区残联在残疾人综合服务中心开展“全国爱眼日”有奖答题竞赛活动.已知5位评委老师按百分制(只打整数分)分别给出某参赛小队评分,可以判断出一定有评委打满分的是(

)A.平均数为98,中位数为98 B.中位数为96,众数为99C.中位数为97,极差为9 D.平均数为98,极差为6【答案】D【解析】选项A:当打分结果为时,满足平均数为98,中位数为98,所以A错误;选项B:当打分结果为时,满足中位数为96,众数为99,所以B错误;选项C:当打分结果为时,满足中位数为97,极差为9,所以C错误;选项D:假设没有评委打满分,结合极差为6可得总成绩,则平均数,与选项不符,故假设不成立,所以平均数为98,极差为6时,一定有评委打满分,故选:D.7.(2022·四川·树德中学高三阶段练习(理))比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述错误的是(

)A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值B.乙的直观想象能力指标值优于甲的数学建模能力指标值C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平D.甲的数学运算能力指标值优于甲的直观想象能力指标值【答案】D【解析】对于A选项,甲的逻辑推理能力指标值为4,乙的逻辑推理能力指标值为3,所以甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值,故选项A正确;对于B选项,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,所以乙的直观想象能力指标值优于甲的数学建模能力指标值,故选项B正确;对于C选项,甲的六维能力指标值的平均值为,乙的六维能力指标值的平均值为,所以乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平,所以选项C正确;对于D选项,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值不优于甲的直观想象能力指标值,所以选项D错误.故选:D8.(2022·河南·高三阶段练习(理))已知甲、乙两班各50人,下表为某次数学考试的成绩情况:分数段甲班人数139161074乙班人数325141187各分数段成绩视为均匀分布,有以下结论:①甲班平均成绩低于乙班;②甲班成绩的中位数与乙班相同;③甲班成绩的方差比乙班成绩的方差小.其中正确的序号是(

)A.① B.①③ C.②③ D.①②③【答案】B【解析】由题可知,,,所以甲班的平均成绩低于乙班的平均成绩,故①正确;因为甲班的中位数位于分数段,乙班的中位数位于分数段,所以甲班的中位数低于乙班的中位数,故②错误;因为,,所以甲班成绩的方差比乙班成绩的方差小,故③正确.综上,正确的序号是①③.故选:B.二、多选题9.(2022·广东广州·高三阶段练习)某校为了解高中学生的身高情况,根据男、女学生所占的比例,采用样本量按比例分配的分层随机抽样分别抽取了男生50名和女生30名,测量他们的身高所得数据(单位:)如下:性别人数平均数方差男生5017218女生3016430根据以上数据,可计算出该校高中学生身高的总样本平均数与总样本方差分别是(

)A. B.C. D.【答案】BD【解析】设总样本量为,由题意得男生样本量为,女生样本量为,假设男生的样本数据为,女生的样本数据为,则总样本平均数,总样本方差,∵,同理,∴总样本方差,故选:BD10.(2022·全国·模拟预测)最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是(

)A.甲同学体温的极差为0.4℃B.乙同学体温的众数为36.4℃,中位数与平均数相等C.乙同学的体温比甲同学的体温稳定D.甲同学体温的第60百分位数为36.4℃【答案】ABC【解析】观察折线图知,甲同学体温的极差为0.4℃,A正确;乙同学体温从小到大排成一列:36.3℃,36.3℃,36.4℃,36.4℃,36.4℃,36.5℃,36.5℃,乙同学体温的众数为36.4℃,中位数为36.4℃,平均数℃,B正确;乙同学的体温波动较甲同学的小,极差为0.2℃,也比甲同学的小,因此乙同学的体温比甲同学的体温稳定,C正确;将甲同学的体温从小到大排成一列:36.2℃,36.2℃,36.4℃,36.4℃,36.5℃,36.5℃,36.6℃,因,则甲同学体温的第60百分位数为36.5℃,D不正确.故选:ABC11.(2022·广东·开平市忠源纪念中学高三阶段练习)某中学组织三个年级的学生进行禁毒知识竞赛.经统计,得到成绩排在前200名学生分布的饼状图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是(

)A.成绩排在前200名的200人中,高二人数比高三人数多10B.成绩排在第名的50人中,高一人数比高二的多C.成绩排在第名的100人中,高三人数占比可能超过D.成绩排在第名的50人中,高二人数肯定多于23【答案】AC【解析】由前200名学生分布的饼状图和高一学生排名分布的频率条形图知:对于,成绩排在前200名的200人中,高二人数比高三人数多,故A正确;对于,成绩排在第名的50人中,高一人数为,高二和高三在前200名中共有,高二的具体人数不知道,故B错误;对于C,成绩排在第名的100人中,高一人数为,高二和高三人数总和为100,所以高三人数占比有可能超过,故C正确;对于D,成绩排在第名的50人中,高一学生有人,高二最多有人,故D不正确;故选:AC.12.(2022·广东茂名·高三阶段练习)下面是某省2016年至2021年乒乓球训练馆新增数量图和乒乓球训练馆类型统计表,则下列说法正确的是(

)2020—2021年乒乓球训练馆类型统计表类型2020年2021年A类型24%21%B类型36%38%C类型40%41%A.2021年该省乒乓球训练馆产业中C类型乒乓球训练馆占比量最高B.2016年至2021年该省乒乓球训练馆数量逐年上升C.2016年至2021年该省乒乓球训练馆新增数量逐年增加D.2021年B类型乒乓球训练馆比2020年B类型乒乓球训练馆数量多【答案】ABD【解析】由统计表可知,2021年该省乒乓球训练馆产业中C类型乒乒球训练馆占比最高,故A正确;由图可知,2016年至2021年该省乒乒球训练馆数量逐年上升,故B正确;由图可知,2020年比2019年下降了,故C错误;由图和统计表可知,2021年B类型乒乒球训练馆比2020年B类型乒乒球训练馆数量多,故D正确.故选:ABD.三、填空题13.(2022·全国·高三专题练习)已知四个数1,2,4,a的平均数为4,则这四个数的中位数是__.【答案】3【解析】由题意可得:,解得:a=9,则中位数为.故答案为:3.14.(2022·广东广州·高三阶段练习)请写出一组由6个不同的自然数从小到大排列的数据,这组数据要满足以下两个条件:①第70百分位数为6,②极差为6.______.【答案】(答案不唯一)【解析】因为,所以第70百分位数为第个数,因为第70百分位数为6,所以第个数为,由于极差为6,所以这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论