




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年高中数学一本通必修二第9第4节总体百分位数的估计、总体集中趋势的估计、总体离散程度的估计(1)9.2.2总体百分位数的估计9.2.3总体集中趋势的估计9.2.4总体离散程度的估计习题:P1-----------------------▌知识梳理▌-----------------------知识点1:总体百分位数的估计1.概念:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.加底色加底色2.计算第p百分位数的一般步骤(设数据有n个)第1步,按从小到大排列原始数据;第2步,计算;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.3.常用百分位数及其别称①第25百分位数:第一四分位数、下四分位数;②第50百分位数:中位数;③第75百分位数:第三四分位数、上四分位数.知识点2:总体集中趋势的估计1.刻画集中趋势的数字特征数字特征特点平均数①平均数是最常用来反映数据集中趋势的统计量;②平均数对样本中的极端值比较敏感,因此在评分类比赛或游戏中,常去掉最高分和最低分后计算新的平均值,并以此平均值作为选手的得分,这是规避极端数据对平均值造成较大影响的一种方法.中位数①在一组数据中,有一半数据不大于中位数,另一半数据则不小于中位数;②与平均数不同,中位数不受极端值影响.众数众数反映的是数据中出现频率最高的数据,很多时候不能反映一组数据的中心值.注:①当一组数据中的任意一个样本数据改变时,平均数都会改变,而中位数和众数可能变化,也可能不变.②一组数据的平均数和中位数都是唯一的,但众数不一定唯一,可能有一个,可能有多个,也可能没有.③一组数据中,平均数和中位数都可能不是样本数据中的数,而众数一定是样本数据中的数.2.适用情况①对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数.②对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.知识点3:总体离散程度的估计1.极差一组数据的最大值与最小值之差叫做极差.极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小的两个值的信息,对其它数据的取值情况没有涉及,所以极差所含的信息量很少.加底色加底色2.方差和标准差假设一组数据是,,…,,用表示这组数据的平均数,则这组数据的方差为.有时为了计算方便,也可按求方差,推导过程如下:.由于方差的单位是原始数据单位的平方,与原始数据不一致,为了使二者单位一致,我们对方差开平方,取它的算术平方根,称为这组数据的标准差.加底色加底色3.总体(样本)方差和总体(样本)标准差如果总体中所有个体的变量值分别为,,…,,总体平均数为,则称为总体方差,为总体标准差.与总体均值类似,总体方差也能写成加权的形式.若总体的N个变量值中,不同的值共有个,不妨记为,,…,,其中出现的频数为,则总体方差为.如果一个样本中个体的变量值分别为,,…,,样本平均数为,则称为样本方差,为样本标准差.加底色加底色注:在随机抽样中,样本标准差依赖于样本的选取,具有随机性.4.方差和标准差的统计意义①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.若标准差(方差)为0,则所有数据的值都相同,相反,若所有数据的值都相同,则这组数据的标准差(方差)为0.②在刻画数据的分散程度上,方差和标准差的作用是一样的,但在解决实际问题中,一般多采用标准差.5.具有线性关系的数据的方差若一组数据,,…,的方差为,则数据,,…,的方差为,标准差为,其中a,b为常数.知识点1【例1】数据3,5,6,7,8,9,10,12,14的第60百分位数是()A.14B.9.5C.8D.9解析:求百分位数,先求i,再结合i是否为整数来取所求百分位数,由题意,数据共9个,所求为第60百分位数,所以,因为i不是整数,且比i大的比邻整数是6,所以取第6个数据9为这组数据的第60百分位数.答案:D【例2】数据3,1,4,5,1,6,7,5的第25百分位数是()A.1B.2C.3D.6解析:数据没有按从小到大排列,先排序,将原数据按从小到大的顺序排列依次为:1,1,3,4,5,5,6,7,共8个数据,且所求为第25百分位数,所以,因为i是整数,所以取第i个和第个数据的平均数作为这组数据的第25百分位数,这里第2个和第3个数据分别为1,3,所以这组数据的第25百分位数为.答案:B知识点2【例3】(多选)某科技攻关青年团队共有10人,其年龄(单位:岁)分布如下表,则这10人年龄的()年龄454036322928人数121321A.中位数是34B.众数是32C.第25百分位数是29D.平均数是34.3解析:将10个数据按从小到大排列为:28,29,29,32,32,32,36,40,40,45,A项,第5个和第6个数据都是32,所以这组数据的中位数为,故A项错误;B项,这组数据中,32出现3次,比其余数据出现次数都多,所以众数为32,故B项正确;C项,,所以第3个数据29是这组数据的第25百分位数,故C项正确;D项,平均数为,故D项正确.答案:BCD【例4】某校举行演讲比赛,邀请7位评委分别给选手打分,得到7个原始评分,在评定选手成绩时,从这7个原始评分中去掉1个最高分,1个最低分,得到5个有效评分,这5个有效评分与7个原始评分相比,数字特征一定保持不变的是()A.众数B.中位数C.平均数D.以上都不对解析:可以想象,将分数按从低到高的顺序排列,去掉一个最高分和一个最低分后,原来在中间的数据仍在中间,所以中位数不变,故选B,下面我们举个例子,假设7位评委打出的分数依次为1,1,2,2,3,4,5,其中位数为2,去掉最高分5分和最低分1分后,数据变成1,2,2,3,4,中位数仍为2,但平均数和众数都发生了变化.答案:B知识点3【例5】某中学举行了一次英语知识竞赛,高三2班有5人参赛,他们的成绩分别为:99,85,93,98,80,则这些成绩的极差是_____,方差是_____.解析:这组数据的最大值为99,最小值为80,所以极差为,平均数为,方差.答案:19,【例6】若数据,,…,的方差是,新数据,,…,的方差是,证明:.证明:设原数据的平均数为,由题意,原数据的方差①,则新数据的平均数为,方差为,结合式①可得新数据的方差.---------------------▌本节核心题型▌---------------------本节的核心内容是百分位数、集中趋势参数(众数、平均数、中位数)、离散程度参数(极差、方差、标准差)的计算及其统计意义的分析.对于百分位数,常考的是其计算,所以我们设计了类型Ⅰ来归纳各种情况下该如何计算百分位数;对于众数、平均数、中位数,在类型Ⅱ中会详细分析其计算方法,以及它们在统计问题中的应用;类型Ⅲ则针对极差、方差、标准差的计算与统计分析.除此之外,本节有时还会遇到数据变换后的有关统计量的计算问题,所以我们还设计了一个类型Ⅳ来归纳这类题.类型Ⅰ:百分位数的计算【例7】2020年11月1日零时广西14个地区人口的男、女性别比如下表所示:地区南宁市柳州市桂林市梧州市玉林市防城港市钦州市男、女性别比/%106.71107.74103.33106.77107.81119.01110.66地区贵港市北海市百色市贺州市河池市来宾市崇左市男、女性别比/%108.29108.48104.69105.66104.18107.52108.90根据表中数据可知,这14个数据的第60百分位数对应的地区是()A.柳州市 B.玉林市 C.北海市 D.南宁市解析:要求第60百分位数,先求i,共14个数据,所以,因为i不是整数,所以取第9个数据作为这组数据的第60百分位数,将数据按从小到大排列依次为:103.33,104.18,104.69,105.66,106.71,106.77,107.52,107.74,107.81,108.29,108.48,108.90,110.66,119.01,其中的第9个数据为107.81,对应玉林市,故选B.答案:B【反思】给出一组从小到大排列的数据(共n个),让求第p百分位数,先按求i,若i不是整数,则取j为比i大的临近整数,第j个数据即为原数据的第p百分位数;若i是整数,则取第i个和第个数据的平均数作为原数据的第p百分位数.本题的i不是整数,有时也会遇到i是整数的情况,比如下面的变式1.【变式1】幸福指数是衡量人们对自身生存和发展状况的感受和体验,即人们的幸福感的一种指数.某机构从某社区随机调查了12人,得到他们的幸福指数分别是7.6,8.5,7.8,9.2,8.1,9,7.9,9.5,8.3,8.8,6.9,9.4,则这组数据的下四分位数是_____.解析:下四分位数即第25百分位数,求百分位数,先算i,由题意,,由于i为整数,所以取第i和个数据的平均值作为第25百分位数,先将数据按从小到大排列,原始数据从小到大排列为:6.9,7.6,7.8,7.9,8.1,8.3,8.5,8.8,9,9.2,9.4,9.5,所以这组数据的下四分位数为.答案:7.85【变式2】某学校举办了一场党史知识竞赛活动,共有500名学生参加了此次活动,为了解本次竞赛活动的得分情况,从中抽取了50名学生的得分(得分均为整数,满分为100分)进行统计,所有学生的得分都不低于60分,将这50名学生的得分进行分组,第一组,第二组,第三组,第四组,得到如下的频率分布直方图,则_____,估计此次竞赛活动中学生得分的第75百分位数为_____分.解析:由图可知,,解得:,给的是数据整理后的频率分布直方图,没有原始数据,如何求第75百分位数?可以想象,在图中从左至右,频率和为0.75的位置,应该就是第75百分位数了,于是按此寻找,由图可知,从左至右前两组的频率和为,前三组的频率和为,所以第75百分位数在上,设为x,如图,应有,解得:,所以此次竞赛活动学生得分的第75百分位数为88.75分.答案:0.03,88.75【反思】由频率分布直方图估计第p百分位数,就是寻找从左至右频率和为p%的位置,具体计算时,可通过估算确定第p百分位数所在的区间,再按从左至右频率和为p%列方程求解第p百分位数.类型Ⅱ:众数、中位数、平均数的计算及统计分析【例8】某高校两个班级在一门选修课程的某次考试中的成绩(总分:100分)如下:甲班8475789567498677668873785345749184995384675768559073726757乙班745892100743783976684617594707384814882668310090669344分别计算两个班级成绩的平均数(结果保留整数)、中位数和众数,并说明在这次考试中哪个班的成绩更好.解:由所给数据,甲班成绩的平均数,乙班成绩的平均数,将甲、乙两班的成绩数据按从小到大排列分别为:甲班:45,49,53,53,55,57,57,66,67,67,67,68,72,73,73,74,75,77,78,78,84,84,84,86,88,90,91,95,99,共29个数据,第15个数据是73,所以甲班成绩的中位数,乙班:37,44,48,58,61,66,66,66,70,73,74,74,75,81,82,83,83,84,84,90,92,93,94,97,100,100,共26个数据,第13个和第14个数据分别为75,81,所以乙班成绩的中位数,甲班的成绩中,67和84这两个分数各有3个,比其余分数个数都多,所以甲班成绩的众数是67和84,乙班的成绩中,66这个分数有3个,比其余分数个数都多,所以乙班成绩的众数是66,因为,,所以乙班成绩更好.【反思】平均数、中位数、众数都能一定程度反映数据的集中趋势,为什么比较甲、乙两班成绩时只用平均数和中位数,不用众数?这是因为众数只利用了出现次数最多的那个数据,它能传递的数据信息较少,对极端值也不敏感,往往用在描述一些分类型的数据(如校服规格、产品等级等)的集中趋势,所以对数值型数据(本题就是如此)集中趋势的描述,一般用平均数和中位数,那平均数和中位数又有何差异?我们来看一个变式.【变式】某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:销售量(件)1800510250210150120人数113532(1)求这15位销售人员该月销售量的平均数、中位数及众数;(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如不合理,请你制定一个较为合理的销售定额.解:(1)15位销售人员该月销售量的平均数为件,将销售量数据从小到大排列,第8个数据是210,所以15位销售人员该月销售量的中位数为210件,由表中数据可知,销售量为210件的人数最多,为5人,所以15位销售人员该月销售量的众数是210件.(2)不合理,因为15人中有13人的销售量低于320件,所以320虽然是平均数,但有一个1800明显高于其余数据,该数据对平均数的影响较大,所以平均数不能很好地反映销售人员的平均销售水平,可以将月销售定额定为210件,因为210件是中位数,也是众数,是大部分销售人员能达到的销售量.【反思】平均数容易受个别极端数据(例如本题的1800这个数据)的影响,有时不能很好地体现一组数据的集中趋势,而中位数不受个别极端值的影响,故此时中位数能更好的反映数据的集中趋势.【例9】为激发户外运动爱好者健身热情,增进群众健身获得感、幸福感,某市体育部门随机抽取200名群众进行每天体育运动时间的调查,按照时长(单位:分钟)分成6组:,,,,,,处理后绘制了如下图的频率分布直方图:(1)求图中a的值;(2)求运动时长在的样本群众人数;(3)估计该市群众每天体育运动时间的众数、平均数、中位数.(保留1位小数)解:(1)由图可知,,解得:.(2)由图知的频率为,所以运动时长在的样本群众人数为.(3)(怎样由频率分布直方图估计众数?由于图中最高的矩形内数据个数最多,所以常用最高矩形的区间中点估计样本数据的众数)由图可估计该市群众每天体育运动时间的众数为分钟,(怎样由频率分布直方图估计平均数?由于只知道每组数据的个数,不知道数据的具体值,故只能估计,常用该组区间的中点值来代表该组的各个值(例如第1组有20个数据,那么我们认为这20个数据都是35),由此可估计样本平均数)图中从左至右各组的频数分别为,,,,,,所以该市群众每天体育运动时间的平均数分钟,(怎样由频率分布直方图估计中位数?此时可看成估计第50百分位数,故处理方法和前面例7的变式2这里有引用一样,根据从左至右频率和为0.5列方程求中位数即可)这里有引用由图可知,从左至右前2组的频率和,前3组的频率和,所以中位数在上,设为x,如图,应有,解得:,即该市群众每天体育运动时间的中位数约为56.7分钟.【反思】在频率分布直方图中:①众数的估计值是最高小矩形的区间中点;②设各组的区间中点值分别为,,…,,频率分别为,,…,,则平均数的估计值为;③中位数即为将频率分布直方图分成左、右两边频率各占0.5的位置.类型Ⅲ:极差、方差、标准差的计算及统计分析【例10】(多选)为了弘扬奥运会中我国射击队员顽强拼搏的奋斗精神,某校射击兴趣小组组织了校内射击比赛,得到8名同学的射击环数如下:9,8,6,10,9,7,6,9(单位:环),则这组样本数据的()A.极差为4 B.平均数是8C.下四分位数是9 D.方差为16解析:A项,8个数据中,最大的是10,最小的是6,所以极差为,故A项正确;B项,这组数据的平均数为,故B项正确;C项,,i为整数,所以取第i个和第个数据的平均值作为下四分位数,将数据按从小到大排列依次为6,6,7,8,9,9,9,10,所以第2个和第3个数据的平均值为,即这组数据的下四分位数为6.5,故C项错误;D项,这组数据的方差为,故D项错误.答案:AB【反思】方差的计算公式是或,这两个公式如何选择?要看用哪个更好算.一般情况下,给出一组具体数据时,常选择前者计算方差,而后者多用于数据组是字母表示的未知量时的情况,我们来看下面的变式1这里有引用.这里有引用【变式1】将某班50人随机分成两个小组,这两组同学在期中考试中的数学成绩如下表:则该班同学在期中考试中的标准差为_______分.组别人数平均分方差第1组20909第2组308014解析:要算标准差,可先求方差,这里没有原始数据,只有分组后各组的平均数和方差,怎么求总方差?若无思路,不妨先把有关数据设出来,翻译已知和所求,再观察二者联系,设第1组的20个数据分别为,,…,,第2组数据分别为,,…,,则第1组的平均数,第2组的平均数,所以该班的平均数①,再看方差,用还是?可以想象,后者更容易看出各组方差与总方差之间的关系,故选择后者,第1组的方差,所以②,第2组的方差,所以③,该班的总方差④,观察发现将①②③代入④,就能求出,将①②③代入④得,所以该班成绩的标准差为6.答案:6【反思】由上面式④可知,,故也可代此分层方差公式直接计算.一般地,设各层的平均数分别为,,…,,总体平均数为,各层的方差分别为,,…,,各层个体数占总个体数的比例分别为,,…,,则总方差.【变式2】某学校高一年级的学生有1200人,其中男生800人,女生400人,为了了解高一年级学生的身高信息,采用分层抽样的方法抽取样本,测量身高所得的统计数据如下频率分布直方图和频率分布表:男生样本的频率分布直方图女生样本的频率分布表组别频数频率40.108nmp120.3020.05(1)求a和p的值;(2)计算男生样本的平均数和方差;(3)根据上述数据,估计总样本方差.解:(1)由图可知,,解得:,在女生样本的频率分布表中,的频数为4,频率为0.1,的频数为8,所以其频率,又因为,所以.(2)男生样本的平均数,(怎样由频率分布直方图估计方差?我们把每组数据用中点值代表,按此计算方差即可)由所给女生样本的频率分布表可知,女生的样本量为,所以,因为是按比例分层抽取的样本,且男生、女生的人数之比为2:1,所以男生的样本量为80,从而男生样本中,,,的频数分别为,,,,故男生样本的方差.(3)由女生样本的频率分布表可得女生的样本平均数为,方差,所以总样本平均数为,总样本方差为.【反思】由频率分布直方图估计样本平均数,常用各区间中点值代表该区间的所有值,一般来说,设各区间中点值分别为,,…,,对应的频率分别为,,…,,样本平均数为,则样本方差.类型Ⅳ:数据变换、增删后各统计量的分析【例11】已知,,,的平均数为m,方差为n,则,,,的平均数为_____,方差为_____.解析:由新数据的结构特征联想到知识点3第5点这里有引用的结论,由此可直接求新数据的平均数和方差,这里有引用由平均数、方差的性质可知新数据的平均数为,方差为.答案:,4n【反思】对一组数据做统一的线性变换时,新数据的平均数、方差可直接代结论计算.例如,将数据变换成后,其平均数由原来的变成,方差由原来的变成.若不是做统一线性变换(例如有数据的增删),就只能代平均数、方差公式来分析了,我们来看下面的变式1.这里有引用这里有引用【变式1】已知样本数据,,,的平均数是4,方差为2,现样本加入新数据3,4,5,则加入数据后新样本的方差是_____.解析:无法直接看出加入3,4,5后新数据的方差,只能代公式计算,我们先翻译已知条件,由题意,原数据的平均数,所以①,原数据的方差,所以②,故新数据的平均数,将式①代入得③,新数据的方差,将②③代入得.答案:【变式2】若样本数据的平均数为4,的平均数为22,则样本数据,,…,,9的方差为_____.解析:无结论可用,仍然考虑代公式翻译已知和所求,再观察二者联系,由题意,,所以①,,所以②,样本数据,,…,,9的平均数,结合式①可得,故所求方差,结合①②可得.答案:20【反思】从上面两道题可以看到,求新数据的平均数、方差时,若没有结论可用,那就直接代公式翻译已知和所求,再观察所求式与已知式的共同结构,整体代入计算得出结果.【变式3】(多选)有一组样本数据,,…,,其样本平均数为,现加入一个新数据,组成新的样本数据,,…,,,与原样本数据相比,新的样本数据可能()A.平均数不变 B.众数不变 C.极差变小 D.第20百分位数变大解析:A项,直观感觉可知加入小于平均值的数据,会拉低平均数,下面给出严格论证,因为,所以新样本数据的平均数,故A项错误;B项,无论新加入一个什么数据,出现次数最多的数都可能不变,所以众数可能不变,故B项正确;C项,由于,所以加入后,样本中最大的数据必定不变,当不小于原来的最小数据时,极差不变,当小于原最小数据时,极差会变大,从而极差不可能变小,故C项错误;D项,直观感觉可知只要加入的比原来的第20百分位数大,那么加入后由于数据个数变多了,第20百分位数可能后移,从而变大,下面举个例子,假设原样本数据是1,2,3,…,100,共100个,因为,所以该组数据的第20百分位数为,现在新加入数据,则此时,从而新样本数据的第20百分位数为第21个数据,也即21,比原来大,故D项正确.答案:BD强化训练A组夯实基础1.(2025·江西景德镇期末)若一组数,,,的平均数是,方差,则数据,,,的平均数和方差分别为()A.11,4 B.8,8 C.11,8 D.4,22.(2024·福建福州一模)(多选)某市抽查一周空气质量指数变化情况,得到一组数据:80,76,73,82,86,75,81,以下关于这组数据判断正确的有()A.极差为13 B.中位数为82C.平均数为79 D.方差为1243.(2025·北京西城期末)甲、乙两地10月1日至7日每天最低气温(单位:℃)如下:1日2日3日4日5日6日7日甲地191784649乙地201711109911记这7天甲地每天最低气温的平均数为,标准差为;记这7天乙地每天最低气温的平均数,标准差为,根据上述信息,下列结论中正确的是()A.,B.,C.,D.,4.(2024·广东南粤名校联考)(多选)某学校随机抽取200名学生数学周测成绩的频率分布直方图如图所示,据此估计该校本次数学周测的总体情况(同一组中的数据用该组区间的中点值为代表),下列说法正确的是()A.众数为60或70B.25%分位数为65C.平均数为73D.中位数为75B组强化能力5.(2024·广东七校联合体第一次联考)(多选)下列说法正确的是()A.数据1,2,3,3,4,5的平均数和中位数相同B.数据6,5,4,3,3,3,2,2,1的众数为3C.有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30D.甲组数据的方差为4,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙组6.(2022·全国甲卷)某社区通过公益讲座来普及社区居民的垃圾分类知识,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差7.(2023·新课标Ⅰ卷)(多选)有一组样本数据,其中是最小值,是最大值,则()A.的平均数等于的平均数B.的中位数等于的中位数C.的标准差不小于的标准差D.的极差不大于的极差8.(2023·江苏苏锡常镇四市一模)(多选)某校1000名学生在高三一模测试中数学成绩的频率分布直方图如图所示(同一组中的数据用该组区间的中点值作代表),分数不低于X即为优秀,已知优秀学生有80人,则()A.B.C.70分以下的人数约为6人D.本次考试的平均分约为93.69.(2023·江苏苏北七市二调)(多选)已知甲种杂交水稻近五年的产量(单位:)数据为:9.8,10.0,10.0,10.0,10.2,乙种杂交水稻近五年的产量(单位:)数据为:9.6,9.7,10.0,10.2,10.5,则()A.甲种的样本极差小于乙种的样本极差B.甲种的样本平均数等于乙种的样本平均数C.甲种的样本方差大于乙种的样本方差D.甲种的样本第60百分位数小于乙种的样本第60百分位数10.(2023·山东济南二模)某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为()A.7.6 B.7.8 C.8 D.8.211.(2024·湖北模拟)(多选)若甲组样本数据,,…,(数据各不相同)的平均数为3,乙组样本数据,,…,的平均数为5,下列说法错误的是()A.a的值不确定B.乙组样本数据的方差为甲组样本数据方差的2倍C.两组样本数据的极差可能相同D.两组样本数据的中位数可能相同12.(2025·山西运城期末)在对某校全体学生每天运动时间的调查中,采用按比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其每天运动时间的平均值为80分钟,方差为10;抽取了女生20人,其每天运动时间的平均值为60分钟,方差为20,结合上述数据,估计全校学生每天运动时间的方差为()A.78 B.112C.110 D.9613.(2024·江苏模拟)某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资(百元)22025222010297人数16510123合计22015011020010690(1)指出该工厂人员月工资数据的众数、中位数、平均数;(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?14.(2024·河南模拟)已知第10~19届亚运会中国队获得的金牌数如下图所示.(1)求第10~19届亚运会中国队获得的金牌数的极差;(2)剔除第12届亚运会中国队获得的金牌数数据,求剩余9届亚运会中国队获得的金牌数的平均数;(3)设第10~12届亚运会中国队获得的金牌数的方差为,第13~15届亚运会中国队获得的金牌数的方差为,不通过计算,试比较与的大小,并说明理由.15.(2025·江西景德镇期末)课外阅读有很多好处,可以帮助提高阅读能力、拓展知识面、提高思维能力、提高情感素养和提高人际交往能力.某校为了解学生课外阅读的情况,随机统计了n名学生的一个学期课外阅读时间(单位:小时),所得数据都在内,将所得的数据分成4组:,,,,得到如图所示的频率分布直方图,现知道课外阅读时间在[125,150]内的有80人.(1)求n和a的值;(2)估计该校学生一个学期课外阅读时间的平均数(同一组中的数据用该组区间的中点值代表);(3)求所得数据的中位数.16.(2025·贵州期末)王老师从所教两个班的100名学生中随机抽取40名学生,记录他们期中考试的数学成绩(满分100分),根据所得数据,按,,,,分成五组,得到如图所示的频率分布直方图.(1)估计这40名学生期中考试数学成绩的平均分和方差(各组数据用该组区间的中点值作代表);(2)已知剩余60名学生期中考试数学成绩的平均分为82,方差为101,结合(1)中求得的结果,估计王老师所教两个班的学生期中考试数学成绩的平均分和方差.C组拓展提升17.(2025·四川成都期末)在某次活动中,登记的8个数据,,…,的平均数为8,方差为16,其中,后来发现应该为10,并且漏登记了一个数据14,则修正后的9个数据的平均数为_____,方差为_____.18.(2025·四川绵阳期末)哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为3时,键值为13的数据因余1,应存放于位置1中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值10和13均映射到同一位置),现有一个容量为7个位置(编号0~6)的哈希表,以除留余数法(除数为7)进行映射,需要存储22个数据,设这7个位置存放的数据个数分别为,,,,,,,则下列说法中正确的是()A.至少有1个位置存放了不少于5个数据B.若这22个数据的键值恰好是0~44间的所有奇数,则的中位数为2C.若的方差为,则的最小值为0,最大值为D.若的极差为5,则最多有2个位置没有存放数据强化训练A组夯实基础1.(2025·江西景德镇期末)若一组数,,,的平均数是,方差,则数据,,,的平均数和方差分别为()A.11,4 B.8,8 C.11,8 D.4,21.C解析:新数据的平均数为,方差为.2.(2024·福建福州一模)(多选)某市抽查一周空气质量指数变化情况,得到一组数据:80,76,73,82,86,75,81,以下关于这组数据判断正确的有()A.极差为13 B.中位数为82C.平均数为79 D.方差为1242.AC解析:A项,这组数据中最大的为86,最小的为73,所以极差为,故A项正确;B项,将数据按从小到大的顺序排列为73,75,76,80,81,82,86,最中间的数据为80,所以中位数为80,故B项错误;C项,平均数,故C项正确;D项,方差,故D项错误.3.(2025·北京西城期末)甲、乙两地10月1日至7日每天最低气温(单位:℃)如下:1日2日3日4日5日6日7日甲地191784649乙地201711109911记这7天甲地每天最低气温的平均数为,标准差为;记这7天乙地每天最低气温的平均数,标准差为,根据上述信息,下列结论中正确的是()A.,B.,C.,D.,3.B解析:由表中数据可知,1日到7日,甲地每天的最低气温都低于乙地(或相等),且甲地的最低气温数据波动程度高于乙地,所以,.4.(2024·广东南粤名校联考)(多选)某学校随机抽取200名学生数学周测成绩的频率分布直方图如图所示,据此估计该校本次数学周测的总体情况(同一组中的数据用该组区间的中点值为代表),下列说法正确的是()A.众数为60或70B.25%分位数为65C.平均数为73D.中位数为754.BC解析:A项,用频率分布直方图估计众数,取最高矩形的区间中点即可,由图可知,众数的估计值为65,故A项错误;B项,频率分布直方图中的25%分位数为从左至右,频率和为0.25的位置,先确定25%分位数在哪个区间,从左到右,第一组的频率为,前两组的频率和为,所以25%分位数在上,设为x,则,解得:,故B项正确;C项,平均数,故C项正确;D项,前两组的频率和为,前三组的频率和为,所以中位数在上,设为,则,解得:,故D项错误.B组强化能力5.(2024·广东七校联合体第一次联考)(多选)下列说法正确的是()A.数据1,2,3,3,4,5的平均数和中位数相同B.数据6,5,4,3,3,3,2,2,1的众数为3C.有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30D.甲组数据的方差为4,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙组5.AB解析:A项,平均数,中位数,故A项正确;B项,这组数据中,3出现3次,比其余数据出现次数多,所以众数为3,故B项正确;C项,由题意,可设甲、乙、丙三层抽取的个体数分别为3m,m,2m,则,所以,从而样本容量为,故C项错误;D项,方差能刻画数据的稳定程度,故计算乙组的方差,乙组数据的平均数,方差,所以甲组数据的方差较小,甲组数据更稳定,故D项错误.6.(2022·全国甲卷)某社区通过公益讲座来普及社区居民的垃圾分类知识,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图,则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差6.B解析:A项,由图可知讲座前10位居民问卷答题的正确率按从小到大排列,第5,6位分别70%,75%,所以中位数为72.5%,故A项错误;B项,由图可知讲座后问卷答题正确率的平均数为,故B项正确;C项,计算标准差较复杂,故考虑直接看图,观察波动情况,结合标准差的统计意义来分析,由图知讲座前问卷答题正确率的数据比讲座后更分散,波动更大,所以讲座前标准差更大,故C项错误;D项,由图可知讲座后问卷答题的正确率的极差为,讲座前为,所以讲座前问卷答题的正确率的极差更大,故D项错误.7.(2023·新课标Ⅰ卷)(多选)有一组样本数据,其中是最小值,是最大值,则()A.的平均数等于的平均数B.的中位数等于的中位数C.的标准差不小于的标准差D.的极差不大于的极差7.BD解析:A项,可以想象,和偏离平均数的程度不一定相同,去掉它们后,平均数可能发生变化,下面举个例子,不妨设这组数据为0,2,3,4,5,6,则原平均数,去掉0和6之后的平均数,故A项错误;B项,不妨假设,则和的中位数都是,故B项正确;C项,和偏离平均数较大,去掉它们后,标准差可能减小,故通过直观想象能得出C项错误,下面举个例子,不妨设这组数据为0,1,1,1,1,2,则原数据的标准差不为0(大于0),去掉最小的0和最大的2后,数据为1,1,1,1,标准差为0,所以,从而,故C项错误;D项,沿用B项的假设,则的极差为,的极差为,要比较两个极差的大小,可再将它们作差判断正负,因为,所以,故D项正确.8.(2023·江苏苏锡常镇四市一模)(多选)某校1000名学生在高三一模测试中数学成绩的频率分布直方图如图所示(同一组中的数据用该组区间的中点值作代表),分数不低于X即为优秀,已知优秀学生有80人,则()A.B.C.70分以下的人数约为6人D.本次考试的平均分约为93.68.AD解析:A项,由题意,,解得:,故A项正确;B项,优秀的学生有80人优秀的频率为,于是要求X,只需找到从右至左频率和为0.08的位置,由图可知,这组的频率为,这组的频率为,所以X在内,且,解得:,故B项错误;C项,由图可知70分以下的频率为,所以频数为,故C项错误;D项,本次考试的平均分的估计值为,故D项正确.9.(2023·江苏苏北七市二调)(多选)已知甲种杂交水稻近五年的产量(单位:)数据为:9.8,10.0,10.0,10.0,10.2,乙种杂交水稻近五年的产量(单位:)数据为:9.6,9.7,10.0,10.2,10.5,则()A.甲种的样本极差小于乙种的样本极差B.甲种的样本平均数等于乙种的样本平均数C.甲种的样本方差大于乙种的样本方差D.甲种的样本第60百分位数小于乙种的样本第60百分位数9.ABD解析:A项,甲种的样本极差为,乙种的样本极差为,,故A项正确;B项,由所给数据,,,所以,故B项正确;C项,显然甲组数据更集中,故结论正确,下面我们也严格地求一下方差,,,所以,故C项错误;D项,求样本的第p百分位数,先按求i,并观察i是否为整数,因为,所以i是整数,故取第i个和第个数据的平均值作为第60百分位数,所以甲种样本的第60百分位数为,乙种样本的第60百分位数为,故D项正确.10.(2023·山东济南二模)某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为()A.7.6 B.7.8 C.8 D.8.210.B解析:设5次射击的环数按从小到大排列依次为,,,,,因为中位数为8,所以,又唯一的众数为9,所以,且,因为极差为3,所以,故,还差,条件已经用完了,怎么求?可以把的范围写出来再看,因为,所以,结合为整数可得,所以这组数据的平均数.11.(2024·湖北模拟)(多选)若甲组样本数据,,…,(数据各不相同)的平均数为3,乙组样本数据,,…,的平均数为5,下列说法错误的是()A.a的值不确定B.乙组样本数据的方差为甲组样本数据方差的2倍C.两组样本数据的极差可能相同D.两组样本数据的中位数可能相同11.ABC解析:A项,由平均数性质,,所以,从而,故A项错误;B项,由方差性质,,故B项错误;C项,不妨设,则,所以甲组数据的极差为,乙组数据的极差为,因为甲组数据各不相同,所以,从而,故C项错误;D项,直观想象可发现,乙组数据是将甲组数据先全部2倍后,再减1得到的结果,这一操作有可能不改变数值,即,由此得,若这个1恰为两组数据各自的中位数,则它们的中位数相同,下面我们举个具体的例子,设甲组数据为,0,1,2,13,则其中位数为1,相应的乙组数据为,,1,3,25,中位数也为1,所以甲、乙两组数据的中位数可能相同,故D项正确.12.(2025·山西运城期末)在对某校全体学生每天运动时间的调查中,采用按比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其每天运动时间的平均值为80分钟,方差为10;抽取了女生20人,其每天运动时间的平均值为60分钟,方差为20,结合上述数据,估计全校学生每天运动时间的方差为()A.78 B.112C.110 D.9612.C解析:因为是按比例分配的分层抽取,所以可用总样本方差估计总体方差,如何求总样本方差?已有各层均值和方差,可直接代本节例10变式1反思这里有引用中总结的公式计算,这里有引用由题意,男生层的平均数,方差,女生层的平均数,方差,所以总样本平均数,从而总样本方差,故可估计全校学生每天运动时间的方差为110.13.(2024·江苏模拟)某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资(百元)22025222010297人数16510123合计22015011020010690(1)指出该工厂人员月工资数据的众数、中位数、平均数;(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?13.解:(1)该工厂人员月工资数据中,20出现次数最多,所以众数为20;数据共23个,按从小到大排列,第12个数据是22,所以中位数为22;平均数为.(2)不能.因为虽然月工资的平均数为3000元,但只有经理的月工资在平均数以上,其余人员的月工资都在平均数以下,说明平均数受到了经理的月工资这一极端数据的影响,不能客观地反映该工厂的月工资水平.14.(2024·河南模拟)已知第10~19届亚运会中国队获得的金牌数如下图所示.(1)求第10~19届亚运会中国队获得的金牌数的极差;(2)剔除第12届亚运会中国队获得的金牌数数据,求剩余9届亚运会中国队获得的金牌数的平均数;(3)设第10~12届亚运会中国队获得的金牌数的方差为,第13~15届亚运会中国队获得的金牌数的方差为,不通过计算,试比较与的大小,并说明理由.14.解:(1)由所给图形可知金牌数最多为201枚,最少为94枚,所以极差为.(2)剔除第12届亚运会中国队获得的金牌数数据,剩余9届亚运会中国队获得的金牌数的平均数为.(3)由所给图形可知,第10~12届亚运会中国队获得的金牌数的波动性明显比第13~15届亚运会中国队获得的金牌数的波动性大,所以.15.(2025·江西景德镇期末)课外阅读有很多好处,可以帮助提高阅读能力、拓展知识面、提高思维能力、提高情感素养和提高人际交往能力.某校为了解学生课外阅读的情况,随机统计了n名学生的一个学期课外阅读时间(单位:小时),所得数据都在内,将所得的数据分成4组:,,,,得到如图所示的频率分布直方图,现知道课外阅读时间在[125,150]内的有80人.(1)求n和a的值;(2)估计该校学生一个学期课外阅读时间的平均数(同一组中的数据用该组区间的中点值代表)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度旅游景区专业保安服务合同
- 2025年度科技园区物业用房移交及创新企业孵化服务合同
- 二零二五年度海洋资源开发合作经营分成协议
- 二零二五年度专业洗衣保姆雇佣服务协议
- 二零二五年度腾讯游戏与体育组织合作举办电竞赛事合同
- 2025年度火锅加盟店员工培训及服务标准合同
- 二零二五年度建筑公司劳务人员工资发放及调整协议
- 2025年度高端制造业个人厂房租赁协议
- 乌鲁木齐首期场地处理工程施工组织设计
- 二零二五年度事业单位员工绩效评估合同
- 做最勇敢的自己
- 2025年大庆职业学院单招职业技能测试题库(名师系列)
- 小学数学中巧用信息技术创造情境教学
- 安徽省历年中考语文现代文阅读之非连续性文本阅读6篇(截至2024年)
- 2025年芜湖职业技术学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 创办民办学校项目可行性论证报告
- 公司员工生日会活动复盘
- 《中国象棋基础教程》课件
- 2025年北京青年政治学院高职单招高职单招英语2016-2024年参考题库含答案解析
- 永辉超市存货管理问题及优化建议9700字
- 大模型落地应用实践方案
评论
0/150
提交评论