版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.2.1 用样本的频率分布估计用样本的频率分布估计总体的分布总体的分布(一) 从一个总体得到一个包含大量数据的从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接样本时,我们很难从一个个数字中直接看出样本所包含的信息。看出样本所包含的信息。 如果把这些数据形成如果把这些数据形成频数分布频数分布或或频率频率分布分布,就可以比较清楚地看出样本,就可以比较清楚地看出样本数据数据的特征的特征,从而估计总体的,从而估计总体的分布情况分布情况。一、频率分布表与频率分布直方图:一、频率分布表与频率分布直方图: 1频数、频率频数、频率 将一批数据按要求分为若干个组,各将一批数据按要求分为若干个
2、组,各组内数据的个数,叫做该组的频数。组内数据的个数,叫做该组的频数。 每组的每组的频数除以样本容量的商频数除以样本容量的商叫做该叫做该组的组的频率频率; 频率反映每组数据在样本中所占频率反映每组数据在样本中所占比例比例的大小的大小。2样本的频率分布样本的频率分布 根据随机所抽样本容量的大小,分别根据随机所抽样本容量的大小,分别计算某一事件出现的频率,这些频率的计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的分布规律(取值状况),就叫做样本的频率分布。频率分布。 为了能直观地显示样本的频率分布情为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中况,通常我们会
3、将样本的容量、样本中出现该事件的频数以及计算所得的相应出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本的频率列在一张表中,叫做样本的频率分频率分布表布表。3用样本的频率分布估计总体的分布用样本的频率分布估计总体的分布 从一个总体得到一个包含大量数据的从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看样本时,我们很难从一个个数字中直接看出样本所包含的信息,如果把这些数据形出样本所包含的信息,如果把这些数据形成频数分布或频率分布,就可以比较清楚成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的地看出样本数据的特征,从而估计总体的分布情况。分布情况
4、。用样本估计总体用样本估计总体,是研究统计,是研究统计问题的一个基本思想方法,而对于总体的问题的一个基本思想方法,而对于总体的分布,我们总是用样本的频率分布对它进分布,我们总是用样本的频率分布对它进行估计。行估计。4列频率分布表的步骤列频率分布表的步骤 下面我们通过一个具体的实例来阐述这下面我们通过一个具体的实例来阐述这一方法。一方法。 某钢铁加工厂生产内径为某钢铁加工厂生产内径为25.40mm的钢的钢管,为了掌握产品的生产状况,需定期对管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中产品进行检测,下面的数据是一次抽样中的的100件钢管的内径尺寸:件钢管的内径尺寸:最大
5、值最大值最小值最小值列频率分布表的方法步骤:列频率分布表的方法步骤:求极差求极差(也称全距,即一组数据中最(也称全距,即一组数据中最大值与最小值的差):大值与最小值的差): 计算极差时,需要找出这组数据的计算极差时,需要找出这组数据的最最大值和最小值大值和最小值,当数据很多时,可借助,当数据很多时,可借助如下算法(最大值):如下算法(最大值):S1 把这把这100个数据命名为个数据命名为A(1)、A(2)、A(3)、A(100);S2 设变量设变量x=A(1);S3 把把A(i) (i=2,3,100)逐个与逐个与x比比较,如果较,如果A(i)x,则,则x=A(i); 运用上面的算法得出这组样
6、本数据的最运用上面的算法得出这组样本数据的最大值是大值是25.56,用类似的算法可以得出最,用类似的算法可以得出最小值是小值是25.24它们的差为它们的差为 25.5625.24= 0.32,所以,所以极差等于极差等于0.32mm.决定组距与组数决定组距与组数 那么组数那么组数= =10.67,于是于是分成分成11组组。极差极差组距组距 样本数据有样本数据有100个,由上面算得极差为个,由上面算得极差为0.32,取,取组距为组距为0.03,注意:为方便起见,组距的选择应力求注意:为方便起见,组距的选择应力求“取整取整”,如果极差不利于分组(,如果极差不利于分组( 如不如不能被组数整除)要适当增
7、大极差,如在左、能被组数整除)要适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加右两端各增加适当范围(尽量使两端增加的量相同)的量相同). 决定分点,将数据分组决定分点,将数据分组 将第将第1组的起点定为组的起点定为25.235,以组距为,以组距为0.03将数据分组时,可以分成以下将数据分组时,可以分成以下11组:组:25.235,25.265),25.265,26.295), , 25.535,25.565. 分组时,通常对组内数值所在区间取分组时,通常对组内数值所在区间取左左闭右开区间闭右开区间,最后一组取闭区间,当然也,最后一组取闭区间,当然也可以采用其他分组方法。可以采用其他
8、分组方法。登记频数,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表 频率频率= ,如第,如第1小组的频率小组的频率为为 =0.01.频数频数样本容量样本容量1100频率分布表:频率分布表: 绘制频率分布直方图绘制频率分布直方图 利用直方图反映样本的频率分布规律,利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称这样的直方图称为频率分布直方图,简称频率直方图。频率直方图。 下面仍以上例中的数据加下面仍以上例中的数据加以说明。以说明。(1)频率分布直方图的绘制方法与步骤)频率分布直方图的绘制方法与步骤S1 先制作先制作频率分布表频率分布表,然后作直角坐标,然后作直角
9、坐标系,以系,以横轴表示产品内径尺寸横轴表示产品内径尺寸,纵轴表示纵轴表示频率频率/组距组距.S2 把横轴分成若干段,每一段对应一个组把横轴分成若干段,每一段对应一个组的组距,即在横轴上标上的组距,即在横轴上标上25.235,25.265, , 25.565表示的点;表示的点;S3 在上面标出的各点中,分别以相邻两点在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该为端点的线段为底作矩形,它的高等于该组的组的频率频率/组距组距,每个矩形的面积恰好是该,每个矩形的面积恰好是该组的频率。组的频率。 这些矩形就构成了频率分布直方图。这些矩形就构成了频率分布直方图。(2)有关问题的
10、理解)有关问题的理解 因为小矩形的因为小矩形的面积面积=组距组距频率频率/组距组距=频率频率,所以各小矩形的面积表示相应各组,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率的形式反映了数据落在各个小组内的频率大小。大小。在频率分布直方图中,在频率分布直方图中,各小矩形的面各小矩形的面积之和等于积之和等于1.同样一组数据,如果组距不同,横轴、同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同。纵轴单位不同,得到的图的形状也会不同。不同的形状给人的印象也不同,这种印象不同的形状给人的印象
11、也不同,这种印象有时会影响我们对总体的判断。有时会影响我们对总体的判断。同一个总体,由于抽样的随机性,如果同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为随机抽取另外一个容量为100的样本,所的样本,所形成的样本频率分布一般会与前一个样本形成的样本频率分布一般会与前一个样本频率分布有所不同。但是,它们都可以近频率分布有所不同。但是,它们都可以近似地看作总体的分布。似地看作总体的分布。上例中,如果规定,钢管内径的尺寸在上例中,如果规定,钢管内径的尺寸在区间区间25.32525.475内为优等品内为优等品,我们可依,我们可依据抽样分析统计出产品中优等品的比例,据抽样分析统计出产品中优等品的
12、比例,也就是它的频率。从上表或上图容易看出,也就是它的频率。从上表或上图容易看出,这个频率值等于这个频率值等于0.12+0.18+0.25+0.16 +0.13=0.84,于是可以估计出所有生产的,于是可以估计出所有生产的钢管中有钢管中有84%的优等品。工厂可以根据质的优等品。工厂可以根据质量规范,看看是否达到优等品率的要求,量规范,看看是否达到优等品率的要求,如果没有达到,就需要进一步分析原因,如果没有达到,就需要进一步分析原因,解决问题。解决问题。频率分布直方图的特点频率分布直方图的特点 从频率分布直方图可以清楚的看出数从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身据分
13、布的总体态势,但是从直方图本身得不出原始的数据内容。所以,把数据得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体数据信息表示成直方图后,原有的具体数据信息就被抹掉了。就被抹掉了。 例例1. 从某校高一年级的从某校高一年级的1002名新生中用名新生中用系统抽样的方法抽取一个容量为系统抽样的方法抽取一个容量为100的的身高的样本,数据如下(单位:身高的样本,数据如下(单位:cm)。)。试作出该样本的频率分布表。试作出该样本的频率分布表。168165171167170165 170 152 175 174165 170168 169 171 166 164 155 164 158 170
14、 155 166 158 155 160 160 164 156 162 160 170 168 164 174 171 165 179 163 172180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177158 175 165 169 151 163 166 163 167178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 16
15、2 161 164 166解:最大值解:最大值=180,最小值,最小值=151, 极差极差=29,决定分为,决定分为10组;组; 则需将全距调整为则需将全距调整为30,组距为,组距为3,既每,既每个小区间的长度为个小区间的长度为3,组距,组距=全距全距/组数。组数。 可取区间可取区间150.5, 180.5 分组分组 频数频数 频率频率 150.5,153.5) 4 0.04 153.5,156.5) 8 0.08 156.5,159.5) 8 0.08 159.5,162.5) 11 0.11 162.5165.5) 22 0.22 165.5,168.5) 19 0.19 168.5,17
16、1.5) 14 0.14 171.5,174.5) 7 0.07 174.5,177.5) 4 0.04 177.5,180.5) 3 0.03 合计合计 100 1频率分布直方图为:频率分布直方图为:例例2下表给出了某校下表给出了某校500名名12岁男孩中用岁男孩中用随机抽样得出的随机抽样得出的120人的身高人的身高(单位单位cm) (1)列出样本频率分布表列出样本频率分布表 (2)估计身高小于估计身高小于134cm的人数占总人数的的人数占总人数的百分比百分比.。 区间界限区间界限122,126) 126,130) 130,134) 134,138) 138,142) 142,146)人数人
17、数5810223320区间界限区间界限146,150) 150,154) 154,158) 人数人数1165解:(解:(1)样本频率分布表如下:)样本频率分布表如下:(2)由样本频率分布表可知身高小于)由样本频率分布表可知身高小于134cm 的男孩出现的频率为的男孩出现的频率为0.04+0.07+ 0.08=0.19, 所以我们估计身高小于所以我们估计身高小于134cm的人数的人数占总人数的占总人数的19%例例3为了了解一大片经济林生长情况,为了了解一大片经济林生长情况,随机测量其中的随机测量其中的100株的底部株的底部 周长,得到周长,得到如下数据表(单位:如下数据表(单位:cm)13598
18、1021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100(1)编制频率分布表;)编制频率分布表;(2)绘制频率分布直方图;)绘制频率分布直方图;(3)估计该片经济林中底部周长小于)估计该片经济林中底部周长小于100 cm的树木约占多少,周长不小于的树木约占多少,周长不小于12
19、0cm的树木约占多少的树木约占多少分组分组频数频数频率频率频率频率/组组距距80,85)10.010.00285,90)20.020.00490,95)40.040.00895,100)140.140.028100,105)240.240.048105,110)150.150.030110,115)120.120.024115,120)90.090.018120,125)110.110.022125,130)60.060.012130,13520.020.004合计合计10010.2解:(解:(1)这组数据)这组数据的最大值为的最大值为135,最,最小值为小值为80,全距为,全距为55,可将其
20、分为可将其分为11组,组组,组距为距为5频率分布表频率分布表如下:如下: (2)直方图如图)直方图如图 (3)从频率分布表得,样本中小于)从频率分布表得,样本中小于100的的频率为频率为0.01+0.02+0.04+0.14=0.21,样本中,样本中不小于不小于120的频率为的频率为0.11+0.06+0.02=0.19, 估计该片经济林中底部周长小于估计该片经济林中底部周长小于100cm的树木约占的树木约占21%,周长不小于,周长不小于120cm的树的树木约占木约占19%1. 有一个容量为的样本数据有一个容量为的样本数据,分组后各组的分组后各组的频数如下频数如下: (12.5,15.5,3;
21、 (15.5,18.5,8;(18.5,21.5,9; (21.5,24.5, 11; (24.5,27.5,10;(27.5,30.5,4. 由此估计,不大于由此估计,不大于27.5的数的数据约为总体的据约为总体的 ( ) A91% B92% C95% D30%A练习题:练习题:2. 一个容量为一个容量为20的样本数据,数据的分的样本数据,数据的分组及各组的频数如下:组及各组的频数如下:(10,20),),2;(;(20,30),),3;(;(30,40),),4;(;(40,50),),5;(;(50,60),),4;(;(60,70),),2.则样本在区间(则样本在区间(,50)上的频)
22、上的频率为率为 ( )A0.5B0.7C0.25 D0.05B3. 从高三学生中抽取从高三学生中抽取50名同学参加数学竞名同学参加数学竞赛,成绩的分组及各组的频数如下:(单赛,成绩的分组及各组的频数如下:(单位:分)位:分)40,50),2;50,0),3;60,70),10;70,80),15;80,90),12;90,100),8; (1)列出样本的频率分布表)列出样本的频率分布表(含累计频率含累计频率);(2)画出频率分布直方图;)画出频率分布直方图;(3)估计成绩在)估计成绩在60,90)分的学生比例;分的学生比例;(4)估计成绩在)估计成绩在85分以下的学生比例。分以下的学生比例。解:(解:(1)频率分布表如下:)频率分布表如下:(2)频率分布直方图如下:)频率分布直方图如下:(3)估计成绩在)估计成绩在60,90
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高考物理总复习专题十一交变电流第1讲交变电流的产生和描述练习含答案
- 清算风险管理协议
- 油漆购销合同范例
- 九年级道德与法治上册 第一单元 富强与创新 第一课 踏上强国之路 第2框走向共同富裕教案1 新人教版
- 二年级品德与生活上册 玩中有发现教案1 首师大版
- 2024-2025学年新教材高中生物 第四章 生物的变异 第一节 基因突变可能引起性状改变教案(2)浙科版必修2
- 2024-2025学年高中历史 第一单元 第1课 第一次世界大战的爆发教案1 新人教版选修3
- 2024-2025学年高中地理 第二章 中国的主要自然灾害 2.1 自然资源利用中存在的问题教案 中图版选修6
- 广东省佛山市顺德区江义初级中学九年级化学上册 3.1 分子和原子教案3 (新版)新人教版
- 2023七年级语文下册 第四单元 写作 怎样选材配套教案 新人教版
- 品牌管理智慧树知到课后章节答案2023年下齐鲁工业大学
- 比亚迪财务报表分析
- 水压试验报告(带曲线图)
- Units68单元大单元教学设计课件英语七年级上册
- 2023年CSCO尿路上皮癌诊疗指南
- 在高三学生月考总结表彰会上的讲话
- 高价值医疗设备产品定价过程
- 保险行业创说会-课件
- 初中语文-江城子·密州出猎苏轼教学设计学情分析教材分析课后反思
- 压裂队安全管理制度
- -让生活更美好 作文批改评语
评论
0/150
提交评论