用样本的频率分布估计总体分布 完整版课件_第1页
用样本的频率分布估计总体分布 完整版课件_第2页
用样本的频率分布估计总体分布 完整版课件_第3页
用样本的频率分布估计总体分布 完整版课件_第4页
用样本的频率分布估计总体分布 完整版课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用样本的频率分布估计总体分布2.2.1统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断. 用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。 整体介绍:问题:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主

2、要城市中缺水情况排在前10位的城市 思考:由上表,大家可以得到什么信息? 通过抽样,我们获得了100位居民某年的月平均用 水量(单位:t) ,如下表: 如何用样本的频率分布估计总体分布?(一)频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。频数:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率。1.求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12.决定组距与组数(将数据分组)3.将数据分组(8.2取整,分为9组)组距:指每个小

3、组的两个端点的距离.组数:组数的多少根据需要而定.0,0.5),0.5,1),4,4.5 (二)步骤1.求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12.决定组距与组数(将数据分组)4.列频率分布表100位居民月平均用水量的频率分布表频率/组距月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.画频率分布直方图(纵轴表示频率组距)频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?频率分布直方图如下:月

4、均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积总和=?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5月均用水量最多的在那个区间?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5直方图有那些优点和缺点?频率分布直方图的特征:1:从频率分布直方图可以清楚的看出数据分布的总体趋势。2:从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。探究: 同样一组数

5、据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。 【例题精析】例1 有一个容量为50的样本数据的分组的频数如下:12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在15.5, 24.5)的百分比是多少? 解:组距为3 分组 频数 频率 频率

6、/ 组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070例2下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位) (1)列出样本频率分布表(2)一画出频率分布直方图;(3)估计身高小于134的人数占总人

7、数的百分比.。分析:根据样本频率分布表、频率分布直方图的一般步骤解题。解:()样本频率分布表如下:)样本频率分布表如下: 122126130134138142146150158154身高(cm)o0.010.020.030.040.050.060.07频率/组距)其频率分布直方图如下: 3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的

8、中点,得到频率分布折线图二频率分布折线图、总体密度曲线1频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?

9、假如增至10000呢?频率组距产品尺寸(mm)ab 当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线总体在区间 内取值的概率总体密度曲线总体密度曲线 用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线思考:对于任何一个总体,它的密度曲线是不是一定存在?为什么?对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?

10、为什么?实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确(三)茎叶图茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本P6例子)某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分: 49,24,12,31,50,31,

11、44,36,15,37,25,36,39茎叶图甲乙0123452 55 41 6 1 6 7 94 9 084 6 36 83 8 9 1 叶就是从茎的旁边生长出来的数,表示得分的个位数。 茎是指中间的一列数,表示得分的十位数 茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要

12、在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。2茎叶图的特征:()用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。课堂练习: 1、为检测某种产品的质量,抽取了一个容量为30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件 (1) 列出样本的频率分布表; (2)根据上述结果,估计此种产品为二级品或三级品的概率约是多少 解:(1)样

13、本的频率分布表为: 0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品(2)此种产品为二级品或三级品的概率约为0.270.430.7 2.有一个容量为50的样本,数据的分组及其频数如下所示,请将其制成频率直方图频率分布表如下:分组 频率 25,30) 30,35) 35,40) 40,45) 45,50)38 9111050,55)55,6054合计500.060.160.180.220.200.100.081.00频数3.已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11, 那么频率为0.2范围的是

14、 ( )A. 5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5 分组 频数 频率 频数累计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9.511.5 8 0.4 1611.513.5 4 0.2 20 合计 20 1.0D4.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15) 615,18) 0.0818,21) 0.3021,24) 2124,27) 0.6927,30) 1630,33) 0.1033,36 1.00合计 100 1.00课堂小结编制频率分布直方图的步骤:找最大值与最小值。决定组距与组数决定分点登记频数,计算频率,列表,画直方图说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点稍微再小一点.例:已知一个样本,填写下面的频率分布表7.0 6.6 6.8 7.0 7.2 7.4 7.0 7.3 7.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论