2.2.2用样本的数字特征估计总体的数字特征 (3)_第1页
2.2.2用样本的数字特征估计总体的数字特征 (3)_第2页
2.2.2用样本的数字特征估计总体的数字特征 (3)_第3页
2.2.2用样本的数字特征估计总体的数字特征 (3)_第4页
2.2.2用样本的数字特征估计总体的数字特征 (3)_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 2.2用样本估计总体(1)主讲:黄福生 余祥全问题提出1.随机抽样有哪几种基本的抽样方法?2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样.一、复习与回顾2000年全国主要城市中缺水情况排在前10位的城市二、情景导入要节约!要确定一个标准?【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民 生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得10

2、0位居民2007年的 月均用水量如下表(单位:t):(一) 频率分布表: 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1

3、.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2100位居民的月均用水量(单位:t)以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?0,0.5),0.5,1),1,1.5),4,4.5.分 组频数频数频率 0,0.5) 0.5,1) 1,1.5) 1.5,2) 2,2.5) 2.5,3) 3,3.5) 3.5,4) 4,4.5 合计 48152225146

4、421000.040.080.150.220.250.140.060.040.021.00100位居民的月均用水量的频率分布表思考:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议? 88%的居民月用水量在3t以下,可建议取a=3. 一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.第二步,决定组距与组数.第三步,确

5、定分点,将数据分组.第四步,列频率分布表.频率/组距月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 (二) 频率分布直方图 思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示: 思考2:频率分布直方图中小长方形的面积表示什么?所有小长方形的面积和?小长方形的面积=所有小长方形的面积和1组距=频率 直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,但是直观图也丢失了一些信息,例如,原始数据不能在图中表示出了.从图中我们可以看到,月均

6、用水量在区间2,2.5)内的居民最多,在1.5,2)内次之,大部分居民的月均用水量都在1,3)之间.0.00010.00030.00040.00051000 1500 2000 2500 3000 3500 4000月收入(元)频率/组距0.0002解:由直方图可得:在2500, 3000) (元)月收入段共有:按分层抽样应抽出: (人) 1. 一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如右图)为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在2500,3000)(元)月收入段

7、应抽出 人(人)O13141516171819秒频率/组距0.360.340.180.060.040.022某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )A0.9,35 B0.9,45C0.1,35 D0.1,45答案:A3.有一个容量为50的样

8、本数据的分组的频数如下:12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在15.5, 24.5)的概率约是多少? 解: 组距为3 分组 频数 频率 频率/ 组距 12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.07018.521.524.527.530.533.5样本数据数据落在15.5,24.5)范围的频率为 0.16+0.18+0.22 = 0.56数据落在15.5,24.5)内的概率约为0.56 1.求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.12.决定组距与组数(将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论