版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE1-9.2用样本估计总体9.2.1总体取值规律的估计[目标]1.学会用频率分布直方图表示样本数据;2.能通过频率分布直方图对数据做出总体统计.[重点]频率分布直方图的画法.[难点]频率分布直方图对数据总体的估计.要点整合夯基础学问点频率分布直方图[填一填]1.频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)确定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.(3)将数据分组.(4)列频率分布表,计算各小组的频率,作出频率分布表.(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.2.频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.[答一答]1.如何确定组距?提示:组距的选择应力求“取整”,假如极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).2.频率分布直方图中长方形的面积有什么含义?提示:在频率分布直方图中,由于长方形的面积S=组距×eq\f(频率,组距)=频率,所以各个小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组上的频率的大小.典例讲练破题型类型一频率分布概念的理解[例1]一个容量为100的样本,其数据的分组与各组的频数如下:组别[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数1213241516137则样本数据落在[10,40)上的频率为()A.0.13 B.0.39C.0.52 D.0.64[分析]依据落在各组的频数即可计算相应的频率.[解析]由题意可知频数在[10,40)的有13+24+15=52(个),所以频率为eq\f(52,100)=0.52.[答案]C[变式训练1]容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率从小到大依次相差0.05,则剩下的三组中频率最大的一组频率为0.12.解析:设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率和为1得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.类型二频率分布直方图的绘制[例2]为了解中学生的身高状况,对某中学同龄的50名男生的身高进行了测量,结果如下(单位:cm):175168170176167181162173171177171171174173174175177166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177169181(1)列出频率分布表;(2)绘制频率分布直方图.[解]极差为181-157=24,将样本数据分成7组,组距为4.(1)列频率分布表如下.分组频数频率[156.5,160.5)30.06[160.5,164.5)40.08[164.5,168.5)120.24[168.5,172.5)130.26[172.5,176.5)130.26[176.5,180.5)30.06[180.5,184.5)20.04合计501(2)绘制频率分布直方图如图.绘制频率分布直方图应留意的问题(1)在列出频率分布表后,画频率分布直方图的关键就是确定小长方形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一样的,合理的定高方法是“找一个恰当的单位长度”(没有统一规定),然后以各组的“eq\f(频率,组距)”来定高.假如我们预先定以“”为1个单位长度,代表“0.1”,则若一个组的eq\f(频率,组距)为0.2,则该小矩形的高就是“”(占两个单位长度),依此类推.(2)在频率分布直方图中,各个小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本量,频率之和为1.[变式训练2]一个农技站为了考察某种大麦穗生长的分布状况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.56.46.75.85.95.95.24.05.44.65.85.56.06.55.16.55.35.95.55.86.25.45.05.06.86.05.05.76.05.56.86.06.35.55.06.35.26.07.06.46.45.85.95.76.86.66.06.45.77.46.05.46.56.06.85.86.36.06.35.65.36.45.76.76.25.66.06.76.76.05.66.26.15.36.26.86.64.75.75.75.85.37.06.06.05.95.46.05.26.06.35.76.86.14.55.66.36.05.86.3依据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.解:(1)计算极差:7.4-4.0=3.4.(2)确定组距与组数:若取组距为0.3,因为eq\f(3.4,0.3)≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)确定分点:使分点比数据多一位小数,并且把第1小组的起点略微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表如下:分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15)50.05[5.15,5.45)110.11[5.45,5.75)150.15[5.75,6.05)280.28[6.05,6.35)130.13[6.35,6.65)110.11[6.65,6.95)100.10[6.95,7.25)20.02[7.25,7.55]10.01合计1001.00(5)绘制频率分布直方图如图:从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35cm之间的麦穗约占41%.类型三频率分布直方图的应用[例3]从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图如下:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18]2合计100(1)求频率分布直方图中的a,b的值;(2)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).[分析]由频率分布直方图进行相关计算时,需驾驭下列关系式:(1)eq\f(频率,组距)×组距=频率.(2)eq\f(频数,样本量)=频率,此关系式的变形为eq\f(频数,频率)=样本量,样本量×频率=频数.[解](1)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a=eq\f(频率,组距)=eq\f(0.17,2)=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b=eq\f(频率,组距)=eq\f(0.25,2)=0.125.(2)样本中的100名学生该周课外阅读时间的平均数在第4组.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本量,频率之和等于1.[变式训练3]为了了解高一年级学生的体能状况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,其次小组的频数为12.(1)其次小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?解:(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此其次小组的频率为eq\f(4,2+4+17+15+9+3)=0.08.因为其次小组的频率=eq\f(其次小组的频数,样本量),所以样本量=eq\f(其次小组的频数,其次小组的频率)=eq\f(12,0.08)=150.(2)由题中直方图可估计该校全体高一年级学生的达标率约为eq\f(17+15+9+3,2+4+17+15+9+3)×100%=88%.课堂达标练经典1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为(C)A.0.2 B.0.3C.0.4 D.0.5解析:在125,120,122,105,130,114,116,95,120,134这10个数字中,落在[114.5,124.5)内的有116,120,120,122,共4个,∴样本数据在[114.5,124.5)内的频率为0.4.故选C.2.从一群学生中抽取一个肯定容量的样本对他们的学习成果进行分析,已知不超过70分的人数为8,其累计频率为0.4,则这个样本量是(A)A.20 B.40C.70 D.80解析:由已知不超过70分的人数为8,累计频率为0.4,则这个样本量n=eq\f(8,0.4)=20.故选A.3.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为(B)A.20 B.30C.40 D.50解析:样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.4.一个频数分布表(样本量为50)不当心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是21.解析:依据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本量为50,∴eq\f(4+5+x+y,50)=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.如图所示是总体的一个样本频率分布直方图,且在[15,18)内的频数为8.(1)求样本在[15,18)内的频率;(2)求样本量;(3)若在[12,15)内的小矩形面积为0.06,求在[18,33)内的频数.解:由题中样本频率分布直方图可知组距为3.(1)由题中样本频率分布直方图得样本在[15,18)内的频率等于eq\f(4,75)×3=eq\f(4,25).(2)∵样本在[15,18)内频数为8,由(1)可知,样本量为eq\f(8,\f(4,25))=8×eq\f(25,4)=50.(3)∵在[12,15)内的小矩形面积为0.06,故样本在[12,15)内的频率为0.06,故样本在[15,33)内的频数为50×(1-0.06)=47,又在[15,18)内频数为8,故在[18,33)内的频数为47-8=39.——本课须驾驭的三大问
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大学军训活动心得体会十篇
- 小学捐资助学活动方案
- 服装供货配送方案
- 建筑机械实习报告
- 动物医学牛场实习报告
- 保险员工工作总结
- 2024年PP-R再生料项目立项申请报告模板
- 四年级语文上学期教学总结
- 客服试用期转正工作总结
- 行政管理专业实习报告汇编15篇
- 科幻小说赏析与创意写作智慧树知到期末考试答案2024年
- 冲上云霄-飞机鉴赏智慧树知到期末考试答案2024年
- 中药奶茶创业计划书
- Windows-Server-2012网络服务架构课件(完整版)
- GB∕T 9286-2021 色漆和清漆 划格试验
- 环境监测所需各类原始记录填写格式模板参考模板范本
- 01土地复垦适宜性评价案例
- 天津城建桩基础课程设计
- 备件的ABC分类管理规定法
- 2019年11月浙江省高中化学学考选考试题与答案
- 英文期刊投稿流程详解(课堂PPT)
评论
0/150
提交评论