用样本的频率分布估计总体分布()_第1页
用样本的频率分布估计总体分布()_第2页
用样本的频率分布估计总体分布()_第3页
用样本的频率分布估计总体分布()_第4页
用样本的频率分布估计总体分布()_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2.1 用样本的频率分布估计总体分布(2) 频率分布表的制作频率分布表的制作、计算数据中、计算数据中最大值与最小值的差最大值与最小值的差,即即极差极差。据此,决定。据此,决定组数和组距组数和组距。、分组分组:通常对组内数据所在区间取通常对组内数据所在区间取 左闭右开区间左闭右开区间,最后一组取闭区间最后一组取闭区间,且且使分点比数据多一位小数。使分点比数据多一位小数。、登记频数,计算频率,列出频率分、登记频数,计算频率,列出频率分布表布表极差组距组数 某电子元件厂生产一批同型号的电子元件,今某电子元件厂生产一批同型号的电子元件,今从中随机地抽取从中随机地抽取40个测得其电阻值如下:个测得其

2、电阻值如下:10194103941039011399107100991009810199929710210394991039810798102110969510610210110510897102879397101试作出频率分布表试作出频率分布表:最小值最小值= 87,最大值最大值= 113,可取区间可取区间 86.5, 113.5并分成并分成 个小区间个小区间,每个小区间的长度为每个小区间的长度为1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数

3、(将数据分组)3、 将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在:将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。4.18.20.5极差组数=组距 表表22 100位居民月均用水量的位居民月均用水量的 频率分布表频率分布表 分组分组 频数累计频数累计 频数频数 频率频率 0 , 0.5) 4 0.04 0.5 , 1

4、) 8 0.08 1 , 1.5) 15 0.15 1.5 , 2) 22 0.22 2 , 2.5) 25 0.25 2.5 , 3) 14 0.14 3 , 3.5) 6 0.06 3.5 , 4) 4 0.04 4 , 4.5) 2 0.02 合计合计 100 1.00频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面小长方形的面积积=?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5频率分布直方图

5、如下频率分布直方图如下:小长方形的面小长方形的面积总和积总和=?注:小长方形的面积组距注:小长方形的面积组距频率频率/组距频率组距频率 各长方形的面积总和等于各长方形的面积总和等于1。频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最月均用水量最多的在那个区多的在那个区间间?频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5请大家阅读第请大家阅读第68页页,直方图有直方

6、图有那些优点和缺那些优点和缺点点?探究:探究: 同样一组数据,如果组距不同,横轴、纵轴的单位同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分同的印象,这种印象有时会影响我们对总体的判断。分别以别以1和和0.1为组距重新作图,然后谈谈你对图的印象。为组距重新作图,然后谈谈你对图的印象。 练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5, 15.5) 315.5, 18.5) 818.5, 21.5)

7、921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的)的百分比是多少百分比是多少? 解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/ 组距组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.16

8、0.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5100位居民的月均用水量的频率分布折线图位居民的月均用水量的频率分布折线图思考思考 : 如果当地政府希望使如果当地政府希望使 85% 以上的居民每月的用以上的居民每月的用水量不超出标准,根据

9、频水量不超出标准,根据频率率分分布表和频率分布直方布表和频率分布直方图,你能对制定月用水量图,你能对制定月用水量标准提出建议吗?标准提出建议吗? 频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图100位居民的月均用水量的频率分布折线图位居民的月均用水量的频率分布折线图利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增大,组

10、距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑那么频率分布直方图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢? 用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密

11、度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。 总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的(图中阴影部分的面积,表示总体在某个面积,表示总体在某个区间区间 (a, b) 内取值的百内取值的百分比)。分比)。总体密度曲线能够很

12、好的反映总体在各个范围总体密度曲线能够很好的反映总体在各个范围内的百分比,能够提供更准确的信息。尽管有些内的百分比,能够提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。象那样准确的地画出来。?思考一下图中阴影部分的面积表示什么?思考一下图中阴影部分的面积表示什么?总体在区间总体在区间 内取值的概率内取值的概率),(ba频率分布表频率分布表分组分组个数累计个数累计频数频数频率频率频率频率/组距组距 频率分布直方图频率分布直方图样本频率分布中,样本频率分布中,当样本容量无限增当样本容量无限增大,组距无限缩小大,组距

13、无限缩小样本频率分布直方图样本频率分布直方图接近接近于一条光滑曲线于一条光滑曲线总体总体密度曲线密度曲线,反映了总体分,反映了总体分布。布。引入:某篮球运动员在某赛季各场比赛引入:某篮球运动员在某赛季各场比赛的得分情况如下:的得分情况如下:12,15,24,25,31,31,36,37,39,44,49,50.问题问题1:如何分析该运动员的整体水平:如何分析该运动员的整体水平及发挥的稳定程度?及发挥的稳定程度?问题问题2:初中统计部分曾学过用什么来:初中统计部分曾学过用什么来反映总体的水平?用什么来考察稳定反映总体的水平?用什么来考察稳定程度?程度?.,:5049443937363631312

14、5241512下下各各场场比比赛赛的的得得分分情情况况如如某某篮篮球球运运动动员员在在某某赛赛季季?定定程程度度发发挥挥的的稳稳体体水水平平及及如如何何分分析析该该运运动动员员的的整整. )(.,.,displayleafandstem该该运运动动员员得得分分的的这这种种方方法法就就是是画画出出况况从从中中观观察察得得分分的的分分布布情情来来地地列列出出是是将将这这些些数数据据有有条条理理就就有有一一种种简简易易方方法法我我们们还还用用方方差差考考察察稳稳定定程程度度映映总总体体的的集集中中水水平平反反数数和和中中位位数数均均数数、众众初初中中统统计计部部分分曾曾学学过过平平茎叶图茎叶图123

15、452545116679049茎:茎:十位十位数字数字叶:表叶:表示个位示个位数字数字例:某篮球运动员在某赛季各场比赛的得分例:某篮球运动员在某赛季各场比赛的得分情况如下:情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50茎叶图:茎叶图:.)(, , :如下图茎叶图就得到该运动员得分的这样的顺序同行列出或从小到大般按从大到小共茎的叶一上向下列出茎按从小到大的顺序从茎相同者共用一个茎叶个位数字作为茎为字作将所有两位数的十位数制作茎叶图的方法.,:50494439373636313125241512情况如下情况如下赛的得分赛的得分比比场场各各季季赛赛某某在在员员

16、运动运动某篮球某篮球上述问题上述问题049116679452554321个个位位数数表表示示叶叶:十十位位数数表表示示茎茎:分分界界线线049116679452554321个个位位数数表表示示叶叶:十十位位数数表表示示茎茎:分分界界线线.,.,依次类推分一个分一个分两个分第三行说明有两个分分和明得分为第二行说同理分分和员的得分为这一行说明该运动这表示个位数字和的右侧字数表示十位左侧的线界行分一图中第3937363125241512521.,发发挥挥比比较较稳稳定定说说明明其其集集中中程程度度高高且且分分布布较较对对称称之之间间到到众众数数都都在在位位数数、该该运运动动员员平平均均得得分分及及中

17、中出出从从这这张张图图可可以以直直观观地地看看4020用茎叶图表示数据有两个突出的优点用茎叶图表示数据有两个突出的优点:一是所有的信息都可以从这个茎叶图一是所有的信息都可以从这个茎叶图 上得到;上得到;二是茎叶图便于记录和表示二是茎叶图便于记录和表示.用茎叶图表示数据有一个突出的缺点用茎叶图表示数据有一个突出的缺点:茎叶图茎叶图的的缺点缺点是其分析只是粗略的,对差是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以异不大的两组数据不易分析;表示三位数以上的数据时不够方便上的数据时不够方便.例例 某赛季甲、乙两名篮球运动员每场比赛得分的某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如

18、下:原始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,如图叶分左、右两侧间共用可将茎放在中为便于对比分析画出两人得分的茎叶图解甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 3 3 6 83 8 9 1.,.,:好了茎叶图的效果就不是很样本数据很多时但当叶图便于记录和表示二是茎从这张茎叶图中得到一是所有的信息都可以个优点用茎叶图刻画数据有两甲甲乙乙0123452 55 41 6 1 6 7 94 9

19、 084 6 3 3 6 83 8 9 1从这个茎叶图可以看出,乙运动员从这个茎叶图可以看出,乙运动员的得分大致对称,叶的分布是的得分大致对称,叶的分布是“单单峰峰”的,大多数的叶集中在茎的,大多数的叶集中在茎2,3,4上,中位数是上,中位数是36;甲运动员的得;甲运动员的得分除一个特殊得分外,也大致对称,分除一个特殊得分外,也大致对称,叶的分布也是叶的分布也是“单峰单峰”的,大多数的,大多数的叶集中在茎的叶集中在茎1,2,3上,中位数上,中位数是是26。由此可以看出,乙运动员的。由此可以看出,乙运动员的发挥更稳定,成绩更好。发挥更稳定,成绩更好。1.下面是甲、乙两名运动员某赛季一些下面是甲、

20、乙两名运动员某赛季一些场次得分的茎叶图:场次得分的茎叶图:(1)甲,乙两名队员的甲,乙两名队员的最高得分各是多少?最高得分各是多少?(2)哪名运动员)哪名运动员的成绩好一些?的成绩好一些?0123458247199362 50 32875421 1巩固练习:巩固练习:2、甲、乙两篮球运动员上赛季每场比赛的得、甲、乙两篮球运动员上赛季每场比赛的得分如下,分如下,甲甲 12,15,24,25,31,31,36,36,37,39,44,49,50乙乙 8,13,14,16,23,26,28,33,38,39,51 试用茎叶图将这些数据列出来,观察数试用茎叶图将这些数据列出来,观察数据的分布情况,比较

21、这两位运动员的得分水据的分布情况,比较这两位运动员的得分水平平.3.为了了解各自受欢迎的程度,甲、乙两个为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了网站分别随机选取了14天,记录下上午天,记录下上午8:0010:00间各自的点击量:间各自的点击量:甲:甲:73,24,58,72,64,38,66, 70,20,41,55,67, 8,25;乙:乙:12,37,21, 5,54,42,61, 45,19, 6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?乙两个网站哪个更受欢迎?4.有两个班级,每班各自按学号随机选有两个班级,每班各自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论