频率分布直方图、茎叶图_第1页
频率分布直方图、茎叶图_第2页
频率分布直方图、茎叶图_第3页
频率分布直方图、茎叶图_第4页
频率分布直方图、茎叶图_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用样本的用样本的频率分布估计总体分布频率分布估计总体分布统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况. .统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、另一类是如何根据对样本的整理、计算、分析分析, ,对总体的情况作出推断对总体的情况作出推断. 用样本的有关情况去估计总体的相应情况用样本的有关情况去估计总体的相应情况, ,这种估计大体分为两类,这种估计大体分为

2、两类,一类是用样本频率分一类是用样本频率分布估计总体分布,布估计总体分布,一类是用样本的某种数字特一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应征(例如平均数、方差等)去估计总体的相应数字特征。数字特征。 整体介绍:整体介绍:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率频率。 根据随机抽取样本的大小,分别计算某一分别计算某一事件出现的频率事件出现的频率,这些频率的分布规律这些频率的分布规律(取值状况),就叫做样本的频率分布样本的频率分布。说明说明:样本频率分布与总体频率分布:样本频率分布与总体频率分

3、布有什么关系?有什么关系?通过样本的通过样本的频数分布、频率分布频数分布、频率分布可以可以估计总体的频率分布估计总体的频率分布. .如何用样本的频率分布如何用样本的频率分布估计总体分布?估计总体分布?20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市探究:我国是世界上严重缺水的国探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。家之一,城市缺水问题较为突出。 例例 某市政府为了节约生活用水,计划在本市试某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水行居民生活用水定额管理,即确定一个居民月用水量标准量

4、标准a ,a ,用水量不超过用水量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按议价收费。的部分按议价收费。 如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a a定为多少比较合理呢定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做为了较合理地确定这个标准,你认为需要做 哪些工作?哪些工作? 思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息? 通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某年的月平均用水量( (单位:单位:t) t) ,如下表:,如下表:

5、1.1.求极差(即一组数据中最大值与最小值的差)求极差(即一组数据中最大值与最小值的差) 2.2.决定组距与组数决定组距与组数组数组数= = 4.3 4.3 - - 0.2 = 4.10.2 = 4.14.14.10.50.5 = 8.2 = 8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5 ) ),0.50.5,1 1 ) ),4 4,4.54.5 将一批数据按要求分为若干个组,各组内数据的将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的个数,叫做该组的频数频数。频率:每组数据的个数除以全体数据个数的商频率:每组数据的个数除以全体数据个数的商叫做该组的叫做该

6、组的频率频率。4.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.画频率分布直方图画频率分布直方图小长方形的面积小长方形的面积组距组距频率频率=组距组距频率频率= =探究:探究: 同样一组数据,如果组距不同,横轴、纵轴的单位同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响

7、我们对总体的判断。分同的印象,这种印象有时会影响我们对总体的判断。分别以别以1 1和和0.10.1为组距重新作图,然后谈谈你对图的印象。为组距重新作图,然后谈谈你对图的印象。 一一、求求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数 :组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间 , 最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图, ,可以按以下的可以按以

8、下的步骤进行步骤进行: :五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 如果当地政府希望如果当地政府希望85%85%以上的居民每月的用水量不超出以上的居民每月的用水量不超出标准标准, ,根据频率分布表和频率分布直方图根据频率分布表和频率分布直方图, ,你能对制定你能对制定月用水量提出建议吗月用水量提出建议吗? ?你认为你认为3 3吨这个标准一定能够保证吨这个标准一定能够保证85%85%以上的居民用水以上的居民用水

9、量不超过标准吗量不超过标准吗? ?100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5, 15.512.5, 15.5) 3 315.5, 18.515.5, 18.5) 8 818.5, 21.518.5, 21.5) 9 921.5, 24.521.5, 24.5) 111124.5, 27.524.5, 27.5) 101027.5, 30.527.5, 30.5) 5 530.5, 33.530.5, 33.5) 4 4(1)(1)列出样本的频率分布表列出样本的

10、频率分布表; ;(2)(2)画出频率分布直方图画出频率分布直方图; ;(3)(3)根据频率分布直方图估计根据频率分布直方图估计, ,数据落在数据落在15.5, 24.515.5, 24.5)的百分比是多少的百分比是多少? ? 解解:组距为组距为3 分组分组 频数频数 频率频率12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率频率/

11、组距组距合计合计 50 1频率分布直方图如下频率分布直方图如下:频率频率/组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070例例2、对某电子元件进行寿命跟踪调查,情况如下:、对某电子元件进行寿命跟踪调查,情况如下:1)、列出频率分布表2)、估计电子元件寿命在100h400h以内的频率3)、估计电子元件寿命在400h以上频率课堂练习:课堂练习: 1、为检测某种产品的质量,抽取了一个容量为、为检测某种产品的质量,抽取了一个容量为30的样本,的样本, 检测结果为一级品检测结果为一级品5件,二级品件,二级品8件,三级品件,三级品13件,次品件,次品4件件

12、(1) 列出样本的频率分布表;列出样本的频率分布表; (2)(2)根据上述结果,估计此种产品为二级品或三级品的概率根据上述结果,估计此种产品为二级品或三级品的概率约是多少约是多少 解:解:(1)样本的频率分布表为:)样本的频率分布表为: 0.134次品次品0.4313三级品三级品0.278二级品二级品0.175一级品一级品频率频率频数频数产品产品(2)此种产品为二级品或三级品的概率约为此种产品为二级品或三级品的概率约为0.270.430.7 2.有一个容量为有一个容量为50的样本,数据的分组及其的样本,数据的分组及其频数如下所示频数如下所示,请将其制成频率直方图请将其制成频率直方图频率分布表如

13、下:频率分布表如下:分组 频率 25,30) 30,35) 35,40) 40,45) 45,50)38 9111050,55)55,6054 合计500.060.160.180.220.200.100.081.00频数3.已知样本已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11, 那么频率为那么频率为0.2范围的是范围的是 ( )A. 5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5 分组分组 频数频数 频率频率 频数累计频数累计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9

14、.511.5 8 0.4 1611.513.5 4 0.2 20 合计合计 20 1.0D4.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15) 615,18) 0.0818,21) 0.3021,24) 2124,27) 0.6927,30) 1630,33) 0.1033,36 1.00合计合计 100 1.00课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定

15、分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起点小组的起点稍微再小一点稍微再小一点. 例例3 3 为了了解高一学生的体能情况,某校随机抽为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图据整理后,画出了频率分布直方图. .图中从左到右图中从左到右各小长方形的面积之比为各小长方形的面积之比为2 2:4 4:1717:1515:9 9:3 3,第二小组的频

16、数为第二小组的频数为1212. .(1 1)第二小组的频)第二小组的频率是多少?率是多少?(2 2)样本容量是多)样本容量是多少?少?(3 3)若次数在)若次数在110110以以上(含上(含110110次)为达次)为达标,试估计该校全体标,试估计该校全体高一学生的达标率约高一学生的达标率约是多少?是多少?90 100 110 120 130 140 15090 100 110 120 130 140 150次数次数o o0.0040.0040.0080.0080.0120.0120.0160.0160.0200.0200.0240.0240.0280.028频率频率/组距组距0.0320.03

17、20.0360.036频率分布直方图的优缺点:频率分布直方图的优缺点:优点:优点:能够很容易表示大量数据,非常直观的表能够很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。楚的一些数据模式。缺点:缺点:虽可以大致估计出总体的分布情况,但不虽可以大致估计出总体的分布情况,但不能保留原来的数据信息,在精确度要求较高的情能保留原来的数据信息,在精确度要求较高的情况下不适用。况下不适用。频率频率/组距组距0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率分布直方图

18、如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量增大时,组数增加)当样本容量增大时,组数增加,组距减少,组距减少,那么频率分布直方图就会变成怎么样的图形那么频率分布直方图就会变成怎么样的图形?(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量

19、为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。 总体密度曲线反映了总体在各个范围内取值总体密度曲线反映了总体在各个范围内取值的百分比的百分比, ,精确地反映了总体的分布规律。是研究精确地反映了总体的分布规律。是研究总体分布的工具总体分布的工具. .接近于一条光滑曲线接近于一条光滑曲线注意:注意: 1

20、.1.不是任意总体都有密度曲线,当总体个数不是任意总体都有密度曲线,当总体个数比较少或者数据的分布过于离散不连续时,比较少或者数据的分布过于离散不连续时,总体密度曲线都是不存在的总体密度曲线都是不存在的 2.2.总体密度曲线与总体分布相互唯一确定,总体密度曲线与总体分布相互唯一确定,如果总体分布已知,就可以得到密度曲线。如果总体分布已知,就可以得到密度曲线。 3.3.在总体情况未知的情况下,可通过样本频在总体情况未知的情况下,可通过样本频率折线近似估计得到密度曲线,样本容量越率折线近似估计得到密度曲线,样本容量越大,估计越精确。但是不能通过样本数据准大,估计越精确。但是不能通过样本数据准确地画

21、出总体密度曲线。确地画出总体密度曲线。茎叶图茎叶图某赛季甲、乙两名篮球运动员每场比某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:赛得分的原始记录如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,3913,51,23,8,26,38,16,33,14,28,39乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,3949,24,12,31,50,31,44,36,15,37,25,36,39茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 36 83 8 9 1

22、叶就是从茎的旁边叶就是从茎的旁边生长出来的数,表示生长出来的数,表示得分的个位数。得分的个位数。 茎是指中间的茎是指中间的一列数,表示得分一列数,表示得分的十位数的十位数注意:注意:在制作茎叶图时,重复出现的数据要重复记录,不在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是能遗漏,特别是“叶叶”部分;同一数据出现几次,就要在部分;同一数据出现几次,就要在图中体现几次图中体现几次. .画茎叶图的步骤画茎叶图的步骤: :(1)(1)将每个数据分为茎将每个数据分为茎( (高位高位) )和叶和叶( (低位低位) )两部分两部分; ;(2)(2)将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序排成一列, , 写在一侧写在一侧; ;(3)(3)将各个数据的叶按大小次序写在其茎的另一侧将各个数据的叶按大小次序写在其茎的另一侧. .用茎叶图表示数据有两个突出的优点:用茎叶图表示数据有两个突出的优点:(1 1)所有的信息都可以从这个茎叶图上得到;)所有的信息都可以从这个茎叶图上得到;(2 2)茎叶图便于记录和表示)茎叶图便于记录和表示. .用茎叶图表示数据的缺点:用茎叶图表示数据的缺点: (1 1)其分析是粗略的,对差异不大的两组数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论