用频率直方图估计体分布百分位数_第1页
用频率直方图估计体分布百分位数_第2页
用频率直方图估计体分布百分位数_第3页
用频率直方图估计体分布百分位数_第4页
用频率直方图估计体分布百分位数_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

14.4.3用频率直方图估计总体分布14.4.4百分位数结合实例,能用频率直方图估计总体分布,理解百分位数的统计含义,能用样本估计百分位数.课标要求素养要求在本节的学习过程中,要把实际问题转化为数学问题,并进行计算,对数据进行分析,发展学生的数学建模、数学运算素养和数据分析素养.课前预习课堂互动分层训练内容索引课前预习知识探究11.用频率直方图估计总体分布(1)利用频率直方图求数字特征:①众数是最高的矩形的底边的________.②中位数左右两侧直方图的面积______.③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.中点值相等点睛频率直方图的组数对数据分析的影响:①当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;②当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.

2.p百分位数的定义一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有______的数据小于或等于pk,且至少有__________________的数据大于或等于pk.如果将样本数据从小到大排列成一行,那么k百分位数pk所处位置如图所示.k%(100-k)%3.计算一组n个数据的大样本的k百分位数的步骤第1步将所有数值按从小到大的顺序排列;第2步计算______;平均数4.四分位数中位数即为______百分位数,我们也把中位数、______百分位数和75百分位数称为四分位数.50251.思考辨析,判断正误 (1)若一组样本数据各不相等,则其75百分位数大于25百分位数.() (2)若一组样本数据的10百分位数是23,则在这组数据中有10百的数据大于23.()

提示若一组样本数据的10百分位数是23,则在这组数据中至少有10%的数据小于或等于23. (3)若一组样本数据的24百分位数是24,则在这组数据中至少有76%的数据大于或等于24.(

)√×√2.下列一组数据的25百分位数是(

)2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2 B.3.0C.4.4 D.2.5解析把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2是25百分位数.A3.已知100个数据的75百分位数是9.3,则下列说法正确的是(

) A.这100个数据中一定有75个数小于或等于9.3 B.把这100个数据从小到大排列后,9.3是第75个数据 C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数 D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数

解析因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75百分位数,是9.3,选C.C4.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位某市居民,他们的幸福感指数从小到大分别为3,4,5,5,6,7,7,8,9,10,则这组数据的70百分位数为________.解析

因为70%×10=7为整数,所以这组数据的70百分位数为第7个与第8个数据的平均数,即7.5.7.5课堂互动题型剖析2题型一用频率直方图估计总体分布【例1】

某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数;解由题图知,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,设为x,得0.1=0.03·(x-70),所以x≈73.3,即这80名学生的数学成绩的中位数约为73.3分.(3)求这次测试数学成绩的平均数.在频率直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.思维升华【训练1】

从高一抽出50名学生参加数学竞赛,由成绩得到如图的频率直方图.由于一些数据丢失,试利用频率直方图求: (1)这50名学生成绩的众数与中位数;解

由众数的概念可知,众数是出现次数最多的数,在频率直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75分.由于中位数是所有数据中的中间值,故在频率直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就使中位数左右两边的小矩形的面积和相等.因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,所以中位数应约位于第四个小矩形内.设其底边为x,高为0.03,所以令0.03x=0.2,得x≈6.7,故中位数应约为70+6.7=76.7(分).(2)这50名学生的平均成绩.解

样本平均值应是频率直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.所以平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65(分).题型二百分位数的计算【例2】

从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的25,50,95百分位数;解将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,95百分位数是第12个数据9.9.(2)请你找出珍珠质量较小的前15%的珍珠质量;解因为共有12个数据,所以12×15%=1.8,则15百分位数是第2个数据7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8g,7.9g.(3)若用25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解由(1)可知样本数据的25百分位数是8.15g,50百分位数为8.5g,95百分位数是9.9g,所以质量小于或等于8.15g的珍珠为次品,质量大于8.15g且小于或等于8.5g的珍珠为合格品,质量大于8.5g且小于或等于9.9g的珍珠为优等品,质量大于9.9g的珍珠为特优品.计算一组n个数据的p百分位数的一般步骤:(1)排列:按照从小到大排列原始数据;(2)算i:计算i=n×p%;(3)定数:若i不是整数,大于i的最小整数为j,则p百分位数为第j项数据;若i是整数,则p百分位数为第i项与第(i+1)项数据的平均数.思维升华【训练2】

如图所示是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的80百分位数是(

)DA.-2 B.0C.1 D.2解析由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,题型三由频率直方图求百分位数【例3】

某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;解当0≤x≤200时,y=0.5x;当200<x≤400时,y=0.5×200+0.8·(x-200)=0.8x-60;当x>400时,y=0.5×200+0.8×200+1.0·(x-400)=x-140.所以y与x之间的函数解析式为(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;解由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率直方图可知解得a=0.0015,b=0.0020.(3)根据(2)中求得的数据计算用电量的75百分位数.解设75百分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量低于400千瓦时的占80%,所以75百分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375(千瓦时),即用电量的75百分位数为375千瓦时.由频率直方图求百分位数的方法(1)要注意频率直方图中小矩形的面积,就是数据落在该组的频率.(2)一般采用方程的思想,设出p百分位数,根据其意义列出方程并求解即可.思维升华【训练3】

某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率直方图,已知第一组有5人.(1)求x;解第一组频率为0.01×5=0.05,(2)求抽取的x人的年龄的50百分位数(结果保留整数);解由图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50百分位数在[30,35)内,(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20百分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.解把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,这10人成绩的平均数为评价:从20百分位数和平均数来看,参赛人员的认知程度很高.感想:结合本题和实际,符合社会主义核心价值观即可.分层训练素养提升3

一、选择题1.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的80百分位数是(

)A.90 B.90.5 C.91 D.91.5解析把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,B2.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示.估计棉花纤维的长度的样本数据的80百分位数是(

)AA.29mm B.29.5mmC.30mm D.30.5mm解析棉花纤维的长度在30mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,可以估计棉花纤维的长度的样本数据的80百分位数是29mm.3.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有(

)A.a=13.7,b=15.5 B.a=14,b=15C.a=12,b=15.5 D.a=14.7,b=15D4.已知甲、乙两组数据(已按从小到大的顺序排列):甲组:27,28,39,40,m,50;乙组:24,n,34,43,48,52.A5.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(

)BCDA.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的80百分位数等于乙的成绩的80百分位数D.甲的成绩的极差等于乙的成绩的极差所以二者相等,所以C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.二、填空题6.某学校组织学生参加数学测试,成绩的频率直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的________百分位数.30解析因为分数位于[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的30百分位数.7.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为________秒.16.5解析设成绩的70百分位数为x.所以x∈[16,17),解得x=16.5(秒).8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可估计志愿者年龄的85百分位数为______岁.39解析设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85百分位数在[35,40)内,三、解答题9.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线统计图,求这7天的日最高气温的10百分位数和日最低气温的80百分位数.解由折线图可知,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10%=0.7,不是整数,所以这7天日最高气温的10百分位数是第1个数据,为24℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80%=5.6,不是整数,所以这7天日最低气温的80百分位数是第6个数据,为16℃.10.某网络营销部门随机抽查了某市200名网友在2020年11月11日的网购金额,所得数据如下表:网购金额(单位:千元)人数频率(0,1]160.08(1,2]240.12(2,3]xp(3,4]yq(4,5]160.08(5,6]140.07合计2001.00已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.(1)试确定x,y,p,q的值,并补全频率直方图(如图);所以p=0.4,q=0.25.补全频率直方图如图所示:(2)估计网购金额的25百分位数.解由(1)可知,网购金额不高于2千元的频率为0.08+0.12=0.2,网购金额不高于3千元的频率为0.2+0.4=0.6,所以网购金额的25百分位数在(2,3]内,11.按从小到大顺序排列的数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的65百分位数是4.5,则实数x的取值范围是(

) A.[4.5,+∞) B.[4.5,6.6] C.(4.5,+∞) D.(4.5,6.6]

解析因为8×65%=5.2,所以这组数据的65百分位数是第6项数据4.5,则x≥4.5,又x≤6.6,故选B.B12.某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率直方图,据此估计这批产品的中位数为(

)CA.20 B.25C.22.5 D.22.75解析设中位数为x,则0.1+0.2+0.08·(x-20)=0.5,得x=22.5.13.某大学艺术专业400名学生参加某次测评,根据男、女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率直方图:(1)估计总体400名学生中分数小于70的人数;解根据频率直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以估计总体400名学生中分数小于70的人数为400×0.4=160.(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;解根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论