用样本的频率分布估计总体分布_第1页
用样本的频率分布估计总体分布_第2页
用样本的频率分布估计总体分布_第3页
用样本的频率分布估计总体分布_第4页
用样本的频率分布估计总体分布_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体我国是世界上严重缺水的国家之一,城市缺水问题较为突出.2精选ppt2.2用样本估计总体2.2.1用样本的频率分布估计总体分布为了节约生活用水,某市政府方案在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的局部按平价收费,超过a的局部按议价收费.(1)如果希望大局部居民的日常生活不受影响,那么标准a定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做哪些工作?4精选ppt3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2假设通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:

很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t,其他在0.2t~4.3t之间.5精选ppt频率分布表和频率分布直方图〔1〕求极差〔一组数据中的最大值与最小值的差〕.例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1t.〔2〕决定组距与组数.设k=极差÷组距,假设k为整数,那么组数=k,否那么,组数=k+1.【课堂探究1】为方便起见,组距的选择应力求“组数取整〞.在本问题中,组数=极差÷组距=4.1÷0.5=8.2,因此可以将数据分为9组,这个组数是比较适宜的,于是取组距为0.5,组数为9.当样本容量不超过100时,组数一般为5~12组6精选ppt〔4〕列频率分布表.计算各小组的频率,作出下面的频率分布表.〔频数=样本数据落在各小组内的个数,频率=频数÷样本容量〕〔3〕将数据分组.以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].7精选ppt列频率分布表:分组频数累计频数频率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计48152225146420.040.080.150.220.250.140.060.041001.00频率=样本容量频数注意:频数的合计应是样本容量,频率合计应是1.0.02频率/组距0.080.160.300.440.500.280.120.080.04频率分布表一般分“分组〞,“频数累计〞〔可省〕,“频数〞,“频率〞,“频率/组距〞五列,最后一行是合计8精选ppt(5)画频率分布直方图.根据频率分布表可以得到如下图的频率分布直方图:月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234

频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布.9精选ppt【提升总结】频率分布直方图第一步:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.0.100.200.400.50月均用水量/t0.30O频率/组距0.511.52.53.54.523410精选ppt各组的频率在图中哪里显示出来?各小长方形的面积=频率.各小长方形的面积之和是否为定值?各小长方形的面积之和为1.宽度:组距高度:频率组距月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.523411精选ppt

你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?【课堂探究2】月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234大局部居民的月均用水都在1t~3t之间12精选ppt如果市政府希望85%以上的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准〔即a的取值〕有何建议?88%的居民在3t以下,标准可定为3t.在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?在实际中,对统计结论是需要进行评价的.【课堂探究3】13精选ppt频率分布直方图如下:月均用水量/t0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.o频率/组距14精选ppt频率分布折线图:月均用水量/t0.100.200.300.400.500.511.522.533.544.5o频率/组距利用样本频率分布对总体分布进行相应估计:〔1〕上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假设增至10000呢?〔2〕样本容量越大,这种估计越精确.〔3〕当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线——总体密度曲线.15精选ppt总体密度曲线月均用水量/tab〔图中阴影局部的面积,表示总体在某个区间(a,b)内取值的百分比〕.o频率/组距总体密度曲线和横轴围成的面积之和为1!16精选ppt总体密度曲线

总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具.

用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比.17精选ppt例、某地区为了了解知识分子的年龄结构,随机抽样30名,其年龄分别如下:32,43,46,45,37,42,38,45,48,39,38,42,49,44,36,51,39,56,40,46,44,47,48,34,45,51,46,52,44,57.(1)列出样本频率分布表.(2)画出频率分布直方图.(3)估计年龄在37岁~52岁的知识分子所占的比例约是多少.18精选ppt解:(1)极差为57-32=25,取组距为5,分为5组.分组频数频率频率/组距

[32,37〕30.10.02[37,42〕60.20.04[42,47〕120.40.08[47,52〕60.20.04[52,57]30.10.02

合计301.00样本频率分布表:19精选ppt〔2〕样本频率分布直方图:年龄0.090.080.070.060.050.040.030.020.01323742475257O〔3〕因为0.2+0.4+0.2=0.8,故年龄在37岁~52岁的知识分子约占80%.频率/组距20精选ppt2、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.1、频率分布直方图的步骤:〔1〕求极值〔2〕决定组距与组数〔3〕分组〔4〕画频率分布表〔频数,频率,频率与组距的商〕〔5〕画频率分布直方图21精选ppt1.将样本容量为100的数据按从大到小的顺序分为8组如下表:912131514141310频数87654321组号那么第三组的频率为〔〕A.0.14B.1/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论