高中数学 2.2.1《用样本的频率分布估计总体的分布1》 新人教B必修3_第1页
高中数学 2.2.1《用样本的频率分布估计总体的分布1》 新人教B必修3_第2页
高中数学 2.2.1《用样本的频率分布估计总体的分布1》 新人教B必修3_第3页
高中数学 2.2.1《用样本的频率分布估计总体的分布1》 新人教B必修3_第4页
高中数学 2.2.1《用样本的频率分布估计总体的分布1》 新人教B必修3_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1用样本的频率分布估计总体的分布(一).从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息。如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。.一、频率分布表与频率分布直方图:1.频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。每组的频数除以样本容量的商叫做该组的频率;频率反映每组数据在样本中所占比例的大小。.2.样本的频率分布根据随机所抽样本容量的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本的频率分布表。.3.用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息,如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体的分布,我们总是用样本的频率分布对它进行估计。.4.列频率分布表的步骤下面我们通过一个具体的实例来阐述这一方法。某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中的100件钢管的内径尺寸:.最大值最小值.列频率分布表的方法步骤:①求极差(也称全距,即一组数据中最大值与最小值的差):计算极差时,需要找出这组数据的最大值和最小值,当数据很多时,可借助如下算法(最大值):S1把这100个数据命名为A(1)、A(2)、A(3)、……、A(100);S2设变量x=A(1);S3把A(i)(i=2,3,……,100)逐个与x比较,如果A(i)>x,则x=A(i);.运用上面的算法得出这组样本数据的最大值是25.56,用类似的算法可以得出最小值是25.24它们的差为25.56-25.24=0.32,所以极差等于0.32mm.②决定组距与组数那么组数=———=10.67,于是分成11组。极差组距样本数据有100个,由上面算得极差为0.32,取组距为0.03,.注意:为方便起见,组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除)要适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).③决定分点,将数据分组将第1组的起点定为25.235,以组距为0.03将数据分组时,可以分成以下11组:[25.235,25.265),[25.265,26.295),……,[25.535,25.565]..分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,当然也可以采用其他分组方法。④登记频数,计算频率,列出频率分布表频率=—————,如第1小组的频率为———=0.01.频数样本容量1100.频率分布表:.⑤绘制频率分布直方图利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图。下面仍以上例中的数据加以说明。(1)频率分布直方图的绘制方法与步骤S1先制作频率分布表,然后作直角坐标系,以横轴表示产品内径尺寸,纵轴表示频率/组距..S2把横轴分成若干段,每一段对应一个组的组距,即在横轴上标上25.235,25.265,……,25.565表示的点;S3在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组的频率。这些矩形就构成了频率分布直方图。..(2)有关问题的理解①因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小。②在频率分布直方图中,各小矩形的面积之和等于1..③同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同。不同的形状给人的印象也不同,这种印象有时会影响我们对总体的判断。④同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。.⑤上例中,如果规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们可依据抽样分析统计出产品中优等品的比例,也就是它的频率。从上表或上图容易看出,这个频率值等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。工厂可以根据质量规范,看看是否达到优等品率的要求,如果没有达到,就需要进一步分析原因,解决问题。.频率分布直方图的特点从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。.例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm)。试作出该样本的频率分布表。168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166.解:最大值=180,最小值=151,极差=29,决定分为10组;则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数。可取区间[150.5,180.5].分组频数频率[150.5,153.5)40.04[153.5,156.5)80.08[156.5,159.5)80.08[159.5,162.5)110.11[162.5165.5)220.22[165.5,168.5)190.19[168.5,171.5)140.14[171.5,174.5)70.07[174.5,177.5)40.04[177.5,180.5)30.03合计1001.频率分布直方图为:.例2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表﹔(2)估计身高小于134cm的人数占总人数的百分比.。区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)

人数1165

.解:(1)样本频率分布表如下:.(2)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%..例3.为了了解一大片经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:cm)135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108.(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少..分组频数频率频率/组距[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计10010.2解:(1)这组数据的最大值为135,最小值为80,全距为55,可将其分为11组,组距为5.频率分布表如下:

.(2)直方图如图.(3)从频率分布表得,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于100cm的树木约占21%,周长不小于120cm的树木约占19%..1.有一个容量为的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91%B.92%C.95%D.30%A练习题:.2.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2. 则样本在区间(-∞,50)上的频率为() A.0.5 B.0.7 C.0.25 D.0.05B.3.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)[40,50),2;[50,0),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8;(1)列出样本的频率分布表(含累计频率);(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例;(4)估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论