《用样本的频率分布估计总体的分布1》-完整版课件_第1页
《用样本的频率分布估计总体的分布1》-完整版课件_第2页
《用样本的频率分布估计总体的分布1》-完整版课件_第3页
《用样本的频率分布估计总体的分布1》-完整版课件_第4页
《用样本的频率分布估计总体的分布1》-完整版课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1用样本的频率分布估计总体的分布用样本估计总体用样本估计总体(两种):一种是:用样本的频率分布估计总体的分布。另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。一频率分布图和频率分布直方图频率分布折线图和总体密度曲线三茎叶图一、频率分布表与频率分布直方图:1.频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。每组的频数除以样本容量的商叫做该组的频率;频率反映每组数据在样本中所占比例的大小。2.样本的频率分布表为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本的频率分布表。3.列频率分布表的步骤

下面我们通过一个具体的实例来阐述这一方法。

某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中的100件钢管的内径尺寸:列频率分布表的方法步骤:①求极差(也称全距,即一组数据中最大值与最小值的差):计算极差时,需要找出这组数据的最大值和最小值最大值最小值

运用上面的算法得出这组样本数据的最大值是25.56,用类似的算法可以得出最小值是25.24它们的差为25.56-25.24=0.32,所以极差等于0.32mm.②决定组距与组数

那么组数=———=10.67,于是分成11组。极差组距

样本数据有100个,由上面算得极差为0.32,取组距为0.03,③决定分点,将数据分组

将第1组的起点定为25.235,以组距为0.03将数据分组时,可以分成以下11组:[25.235,25.265),[25.265,26.295),……,[25.535,25.565].④登记频数,计算频率,列出频率分布表

频率=—————,如第1小组的频率为———=0.01.频数样本容量1100频率分布表:⑤绘制频率分布直方图(1)频率分布直方图的绘制方法与步骤S1先制作频率分布表,然后作直角坐标系,以横轴表示产品内径尺寸,纵轴表示频率/组距.S2把横轴分成若干段,每一段对应一个组的组距,即在横轴上标上25.235,25.265,……,25.565表示的点;S3在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组的频率。这些矩形就构成了频率分布直方图。(2)有关问题的理解①因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小。②在频率分布直方图中,各小矩形的面积之和等于1.③同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同。不同的形状给人的印象也不同,这种印象有时会影响我们对总体的判断。④同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。⑤上例中,如果规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们可依据抽样分析统计出产品中优等品的比例,也就是它的频率。从上表或上图容易看出,这个频率值等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。工厂可以根据质量规范,看看是否达到优等品率的要求,如果没有达到,就需要进一步分析原因,解决问题。频率分布直方图的特点

从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm)。试作出该样本的频率分布表。168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169

151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166解:最大值=180,最小值=151,极差=29,决定分为10组;则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数。可取区间[150.5,180.5]

分组

频数

频率[150.5,153.5)40.04[153.5,156.5)80.08[156.5,159.5)80.08[159.5,162.5)110.11[162.5165.5)220.22[165.5,168.5)190.19[168.5,171.5)140.14[171.5,174.5)70.07[174.5,177.5)40.04[177.5,180.5)30.03

合计1001频率分布直方图为:二、总体密度曲线1.频率分布折线图

把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图。频率分布折线图2.总体密度曲线

总体密度曲线与x轴,直线x=a,x=b围成的面积等于x在[a,b]取值时的概率.2.茎叶图

茎叶图也是用来表示数据的一种图,茎是中间的一列数,叶是从茎上生长出来的数.例.甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平.甲:12,15,24,25,31,31,36,36,37,39,44,49,50.乙:8,13,14,16,23,26,28,33,38,39,51解:画出两人得分的茎叶图甲运动员的得分中位数是众数是几种表示样本分布的方法比较:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便;(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到频率分布表中看不清楚的数据模式,但是从频率分布直方图本身不能得出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。(3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线。(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。练习题:1.在频率分布直方图中,小矩形的高表示()

A.频率/样本容量

B.组距×频率

C.频率

D.频率/组距D2.在用样本频率估计总体分布的过程中,下列说法中正确的是()

A.总体容量越大,估计越精确

B.总体容量越小,估计越精确

C.样本容量越大,估计越精确

D.样本容量越小,估计越精确C3.一个容量为20的样本数据,分组后组距与频数如下表.组距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数234542

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论