版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计9.2.2总体百分位数的估计教学目标
结合实例,能用样本估计百分位(重点)01
理解百分位数的统计含义(重点、难点)02能
03
04学科素养
百分位数的概念数学抽象
直观想象
逻辑推理
计算样本的百分位数数学运算
通过频率分布表,频率分布直方图计算样本的百分位数数据分析
数学建模01知识回顾RetrospectiveKnowledge对一组给定的样本数据,画频率分布直方图的步骤:第一步,求极差;第二步,确定组距与组数;第三步,将数据分组;第四步,列频率分布表;第五步,画频率分布直方图;总体取值规律的估计分组频数累计频数频率[1.2,4.2)正正正正23[4.2,7.2)正正正正正正32[7.2,10.2)正正
13[10.2,13.2)正
9[13.2,16.2)正9[16.2,19.2)正5[19.2,22.2)3[22.2,25.2)4[25.2,28.2]2合计1000.320.130.090.090.050.030.040.021.000.23列频率分布表频率=频数样本量总体取值规律的估计频率分布直方图分组频率
频率/组距[1.2,4.2)0.230.077[4.2,7.2)0.320.107[7.2,10.2)0.130.043[10.2,13.2)0.090.030[13.2,16.2)0.090.030[16.2,19.2)0.050.017[19.2,22.2)0.030.010[22.2,25.2)0.040.013[25.2,28.2]0.020.007总体取值规律的估计月平均用水量/t0.120.10.080.060.040.0201.24.27.2
10.213.216.219.222.225.228.20.1070.0430.0300.0300.0170.0100.0130.0070.077频率/组距其它统计图表统计图表主要应用条形图和直方图直观描述不同类别或分组数据的频数和频率扇形图直观描述各类数据占总数的比例折线图描述数据的变化趋势总体取值规律的估计条形图扇形图总体取值规律的估计折线图总体取值规律的估计02知识精讲
ExquisiteKnowledge【思考】给出以下10个数据:49,64,50,48,65,52,56,46,54,51,(1)请将上述10个数据按从小到大排序;
【解析】46,48,49,50,51,52,54,56,64,65.(2)上述数据的中位数是多少?
【解析】51.5(3)在上述数据中,有多少个数据不超过51.5,所占的百分比是多少?
【解析】5个,所占的百分比是50%.
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该市全体居民用户月均用水量的分布情况,得出了"大部分居民用户的月均用水量集中在一个较低值区域"等推断.
接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.问题2
如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?
根据市政府的要求确定居民用水量标准,就是寻找一个数a,使全市居民用户月均用水量不超过a的占80%,大于a的占20%,可以用以下方法对a进行估计.
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,
13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数13.7,并称此数为这组数据的第80百分位数,或80%分位数.
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可.
因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
不一定,尽管这组数据中80%的居民用户用水不超过14t,但因为它来自样本观测数据,只是总体80%分位数的一个估计值,抽样方法和样本的随机性都可能导致样本百分位数估计总体百分位数的误差.
你认为14t这个标准一定能够保证80%的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别??
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数的步骤第一步:按从小到大排列原始数据;第二步:计算i=n×p%;第三步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.直观来说,一组数的第p位百分位数指的是讲这组数按照从小到大的顺序排列后,处于p%位置的数.
中位数相当于是第50百分位数,常用的分位数还有第25百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
另外,像第1百分位数,第5百分位数,第95百分位数,第99百分位数也常用.百分位数的特点:(1)第0百分位数为数据组中的最小数,第100百分位数为数据组中的最大数;(2)一组数据的百分位数既可能是这组数据中的数,也可能不是这组数据中的数;(3)一组数据的某些百分位数可能是同一个数.【例2】根据9.1.2节问题3中,女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.
163.0
164.0
161.0
157.0
162.0
165.0
158.0
155.0
164.0
162.5
154.0
154.0
164.0
149.0
159.0
161.0
170.0
171.0
155.0
148.0
172.0
162.5
158.0
155.5
157.0
163.0
172.0【例2】根据9.1.2节问题3中,女生的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.【解析】把27名女生的样本数据按从小到大排序,可得
148.0149.0154.0154.0155.0155.0155.5157.0157.0
158.0158.0159.0161.0161.0
162.0162.5162.5163.0
163.0164.0164.0164.0165.0170.0171.0172.0172.0由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.
据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.【例3】根据表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%
分位数.分组频率频率累计[1.2,4.2)0.23[4.2,7.2)0.32[7.2,10.2)0.13[10.2,13.2)0.09[13.2,16.2)0.09[16.2,19.2)0.05[19.2,22.2)0.03[22.2,25.2)0.04[25.2,28.2]0.02【解析】由表9.2-1可知,月均用水量在13.2t以下的居民用户所占比例为
23%+32%+13%+9%=77%,在16.2t以下的居民用户所占的比例为
77%+9%=86%.因此,80%分位数一定位于[13.2,16.2)内.可以估计月均用水量的样本数据的80%分位数约为14.2.0.230.550.680.770.860.910.940.981【例3】根据表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%
分位数.分组频率频率累计[1.2,4.2)0.23[4.2,7.2)0.32[7.2,10.2)0.13[10.2,13.2)0.09[13.2,16.2)0.09[16.2,19.2)0.05[19.2,22.2)0.03[22.2,25.2)0.04[25.2,28.2]0.02【解析】由表9.2-1可知,月均用水量在22.2t以下的居民用户所占比例为
23%+32%+13%+9%+5%+3%=94%,在25.2t以下的居民用户所占的比例为
94%+4%=98%.因此,95%分位数一定位于[22.2,25.2)内.可以估计月均用水量的样本数据的95%分位数约为22.95.0.230.550.680.770.860.910.940.981月平均用水量/t0.120.10.080.060.040.0201.24.27.2
10.213.216.219.222.225.228.20.1070.0430.0300.0300.0170.0100.0130.0070.077频率/组距【例3】根据表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%
分位数.0.320.130.090.090.050.030.040.020.23【练习】某中学从高一年级中抽取了30名男生,测量其体重(单位:kg),数据如下:
62605959595858575757
56565656565655555554
54545353525251504948(1)求这30名男生体重的25%,75%分位数;(2)估计本校高一男生体重的第80百分位数.【解析】将所给数据按从小到大排序,可得484950515252535354545455555556565656565657575758585959596062(1)由25%×30=7.5,75%×30=22.5,
可知它们的25%,75%分位数分别是第8,23项数据,分别为53,57.(2)由80%×30=24,可知第80百分位数为第24项与第25项数据的平均数
即(58+58)÷2=58.
据此可以估计本校高一男生体重的第80百分位数为58.【练习】某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成的频率分布直方图如图所示,估计参赛学生的成绩的25%,90%分位数.0.300.400.150.100.0503拓展提升ExpansionAndPromotion04归纳总结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信用体系建设与监管要求考核试卷
- 餐饮外卖平台快速配送与顾客体验优化方案
- 幼儿园奥运爱国课程设计
- 零售连锁行业统一采购与配送管理方案
- 石油化工行业油气储运设施安全防护方案
- 四年级数学(上)计算题专项练习及答案汇编
- 农业机械化在农业机械化管理中的作用考核试卷
- 塑料人造革生产过程中的余热回收利用技术考核试卷
- 塑料模课程设计7
- 医疗设备在老年病防治中的重要性考核试卷
- 部编版语文五年级下册第二单元走进中国古典名著 大单元整体教学设计
- 开诊所可行性分析报告
- 项目复盘工作报告(模版)课件
- 设备操作手册编写与更新方法和技巧讲解与实操演示
- 心力衰竭治疗中的体外机械循环辅助
- 《无线局域网》课件
- 益丰大药房入职测评题库
- 排水沟修复方案
- 人教版五年级数学上册专项计算题12套(每日一练)
- RB-T 131-2022 绿色钢材产品评价要求
- 护理质量管理实践课件
评论
0/150
提交评论