频率分布直方图、茎叶图_第1页
频率分布直方图、茎叶图_第2页
频率分布直方图、茎叶图_第3页
频率分布直方图、茎叶图_第4页
频率分布直方图、茎叶图_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用样本的频率分布估计总体分布统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。

整体介绍:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率。根据随机抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。说明:样本频率分布与总体频率分布有什么关系?通过样本的频数分布、频率分布可以估计总体的频率分布.如何用样本的频率分布

估计总体分布?2000年全国主要城市中缺水情况排在前10位的城市探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。例某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那

么标准a定为多少比较合理呢?

②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?

通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:

1.求极差(即一组数据中最大值与最小值的差)

2.决定组距与组数组数=

4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]

将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率。4.列频率分布表100位居民月平均用水量的频率分布表频率/组距月平均用水量/t0.500.400.300.200.100

0.511.522.533.544.5

5.画频率分布直方图小长方形的面积组距频率=组距×频率=探究:

同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。

一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)频率/组距月平均用水量/t0.500.400.300.200.100

0.511.522.533.544.5

如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗?100位居民月平均用水量的频率分布表练习1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?解:组距为3分组频数频率[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率/组距合计501频率分布直方图如下:频率/组距0.0100.0200.0300.0400.05012.515.50.0600.070例2、对某电子元件进行寿命跟踪调查,情况如下:1)、列出频率分布表2)、估计电子元件寿命在100h~400h以内的频率3)、估计电子元件寿命在400h以上频率课堂练习:1、为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)列出样本的频率分布表;(2)根据上述结果,估计此种产品为二级品或三级品的概率约是多少.

解:(1)样本的频率分布表为:

0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.

2.有一个容量为50的样本,数据的分组及其频数如下所示,请将其制成频率直方图.频率分布表如下:分组频率[25,30)[30,35)[35,40)[40,45)[45,50)3891110[50,55)[55,60]54

合计500.060.160.180.220.200.100.081.00频数3.已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5分组频数频率频数累计5.5~7.520.127.5~9.560.389.5~11.580.41611.5~13.540.220合计201.0D4.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组频数频率频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.00课堂小结编制频率分布直方图的步骤:①找最大值与最小值。②决定组距与组数③决定分点④登记频数,计算频率,列表,画直方图说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点稍微再小一点.

例3为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图.图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组的频数为12.(1)第二小组的频率是多少?(2)样本容量是多少?(3)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率约是多少?90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036频率分布直方图的优缺点:优点:能够很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。缺点:虽可以大致估计出总体的分布情况,但不能保留原来的数据信息,在精确度要求较高的情况下不适用。频率/组距月平均用水量/t0.500.400.300.200.100

0.511.522.533.544.5

频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量增大时,组数增加,组距减少,那么频率分布直方图就会变成怎么样的图形?(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?——总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.接近于一条光滑曲线注意:1.不是任意总体都有密度曲线,当总体个数比较少或者数据的分布过于离散不连续时,总体密度曲线都是不存在的2.总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到密度曲线。3.在总体情况未知的情况下,可通过样本频率折线近似估计得到密度曲线,样本容量越大,估计越精确。但是不能通过样本数据准确地画出总体密度曲线。茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图甲乙0123452554161679490846368389

1叶就是从茎的旁边生长出来的数,表示得分的个位数。茎是指中间的一列数,表示得分的十位数注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”部分;同一数据出现几次,就要在图中体现几次.画茎叶图的步骤:(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间的数按大小次序排成一列,写在一侧;(3)将各个数据的叶按大小次序写在其茎的另一侧.用茎叶图表示数据有两个突出的优点:(1)所有的信息都可以从这个茎叶图上得到;(2)茎叶图便于记录和表示.用茎叶图表示数据的缺点:(1)其分析是粗略的,对差异不大的两组数据不易分析;(2)当样本数据较多时,茎叶图就显得不太方便。1.有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考察体育达标程度,测验成绩如下:单位(米)甲9.127.888.426.945.207.227.968.066.694.92乙8.808.457.347.066.718.389.808.686.835.86

两个班相比较,哪个班整体实力强一些?

2.有一个容量为50的样本,其数据的茎叶图表示如下:

将其分成7组并要求:(1)列出样本的频率分布表;(2)画出频率分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论