用样本频率分布估计总体分布_第1页
用样本频率分布估计总体分布_第2页
用样本频率分布估计总体分布_第3页
用样本频率分布估计总体分布_第4页
用样本频率分布估计总体分布_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

怀天下,求真知,学做人2.2.1用样本的频率分布估计总体分布当前第1页\共有34页\编于星期五\6点频率分布样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率。频率分布的表示形式有:①样本频率分布表②样本频率分布图样本频率分布条形图样本频率分布直方图③样本频率分布折线图所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。当前第2页\共有34页\编于星期五\6点1、抛掷硬币的大量重复试验的结果:35964反面向上36124正面向上频率频数实验结果0.50110.4989频率分布条形图0.10.20.30.40.50.60.701试验结果频率“正面向上”记为0“反面向上”记为1频率分布表:

注意:①各长方形长条的宽度要相同。②相邻长条的间距要适当。

结论:当试验次数无限增大时,两种试验结果的频率大致相等。③长方形长条的高度表示取各值的频率。当前第3页\共有34页\编于星期五\6点例1.

为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少.

解:(1)样本的频率分布表为:

0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品解:(2)样本频率分布的条形图为:

0.10.20.30.40.50.60.7一级品二级品产品频率三级品次品(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.

当前第4页\共有34页\编于星期五\6点知识探究(一):频率分布表【问题】

我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2013年的月均用水量如下表(单位:t):当前第5页\共有34页\编于星期五\6点3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:

频率分布表和频率分布直方图当前第6页\共有34页\编于星期五\6点1.极差:样本数据中的最大值和最小值的差称为极差2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?0.2~4.3()÷0.5=8.2画频率分布直方图的步骤当前第7页\共有34页\编于星期五\6点

3将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?4画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].当前第8页\共有34页\编于星期五\6点

分组频数累计频数频率

[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02

合计1001.00当前第9页\共有34页\编于星期五\6点知识探究(二):频率分布直方图5画频率分布直方图为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O当前第10页\共有34页\编于星期五\6点上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距2图形的意义当前第11页\共有34页\编于星期五\6点图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距当前第12页\共有34页\编于星期五\6点频率分布的条形图和频率分布直方图的区别两者是不同的概念;横轴:两者表示内容相同思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?纵轴:两者表示的内容不相同频率分布条形图的纵轴(长方形的高)表示频率频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。当前第13页\共有34页\编于星期五\6点3分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O当前第14页\共有34页\编于星期五\6点(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O当前第15页\共有34页\编于星期五\6点频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图当前第16页\共有34页\编于星期五\6点利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?当前第17页\共有34页\编于星期五\6点总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线当前第18页\共有34页\编于星期五\6点

用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。

总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线当前第19页\共有34页\编于星期五\6点1、求极差(即一组数据中最大值与最小值的差)

知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。

小结当前第20页\共有34页\编于星期五\6点1、一个容量为20的样本数据.分组后.组距与频数如下:(0,20]2;(20,30]3,(30,40]4;(40,50]5;(50,60]4;(60,70]2。则样本在(-∞,50]上的频率为:

,7/10当前第21页\共有34页\编于星期五\6点2.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:C0.030.050.07体重(kg)频率/组距54.558.562.566.570.574.5根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是()A.20B.30C.40D.50当前第22页\共有34页\编于星期五\6点240027003000330036003900X体重y0.0013、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:

;0.3当前第23页\共有34页\编于星期五\6点4.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?当前第24页\共有34页\编于星期五\6点【解】

(1)第四小组的频率=1-(0.1+0.3+0.4)=0.2.(2)n=第一小组的频数÷第一小组的频率=5÷0.1=50.(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10.即第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内.解本题的关键是准确掌握频率、频数、样本容量(数据总数)之间的关系及中位数的概念.当前第25页\共有34页\编于星期五\6点

变式训练为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,绘制出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶10∶2,第二小组频数为12.1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?解:(1)第二小组的频率是10×0.008=0.08,样本容量是12÷0.08=150.(2)达标率为(0.034+0.030+0.020+0.004)×10=0.088×10=88%.当前第26页\共有34页\编于星期五\6点茎叶图当前第27页\共有34页\编于星期五\6点当前第28页\共有34页\编于星期五\6点012348050571153茎叶当前第29页\共有34页\编于星期五\6点

甲运动员得分:13,51,23,8,26,38,16,

33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲

8463368389

10123454616

7990

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论