用样本的频率分布估计整体分布_第1页
用样本的频率分布估计整体分布_第2页
用样本的频率分布估计整体分布_第3页
用样本的频率分布估计整体分布_第4页
用样本的频率分布估计整体分布_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2 2.2 用样本估计总体用样本估计总体.2.1.2.1用样本的频率分布估计总体分布用样本的频率分布估计总体分布第一课时第一课时 问题提出问题提出1.1.随机抽样有哪几种基本的抽样方法?随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们基本特征,即用样本估计总体,是我们需要进一步学习的内容需要进一步学习的内容. .简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样. 3. 3.高一某班有高一某班有5050名学生,在数学必名

2、学生,在数学必修修结业考试后随机抽取结业考试后随机抽取1010名,其考试名,其考试成绩如下:成绩如下: 8282, 7575, 6161, 9393, 6262, 5555, 7070, 6868, 8585, 78.78. 如果要求我们根据上述抽样数据,如果要求我们根据上述抽样数据,估计该班对数学模块估计该班对数学模块的总体学习水平,的总体学习水平,就需要有相应的数学方法作为理论指导,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估本节课我们将学习用样本的频率分布估计总体分布计总体分布. . 知识探究(一):频率分布表知识探究(一):频率分布表 【问题【问题】 我国是世

3、界上严重缺水的国家我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居居民生活用水定额管理,即确定一个居民月用水量标准民月用水量标准a a,用水量不超过,用水量不超过a a的部的部分按平价收费,超出分按平价收费,超出a a的部分按议价收费的部分按议价收费. .通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的年的月均用水量如下表(单位:月均用水量如下表(单位:t t):):3.1 2.5 2.0 2.03.1 2.5 2.

4、0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.23.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2

5、.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.43.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42

6、.5 2.6 2.3 2.1 1.6 1.0 1.02.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考思考1 1:上述上述100100个数据中的最大值和最个数据中的最大值和最小值分别是什么?由此说明样本数据的小值分别是什么?由此说明样本数据的变化范围是什么?变化范围是什么?思考思考2 2:样本数据中的最大值和最小值样本数据中的最大值和最小值的差称为的差称为极差极差. .如果将上述如果将

7、上述100100个数据个数据按组距为按组距为0.50.5进行分组,那么这些数据进行分组,那么这些数据共分为多少组?共分为多少组? 0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.2思考思考3 3:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,各组数据的取值范围组,各组数据的取值范围可以如何设定?可以如何设定?思考思考4 4:如何统计上述如何统计上述100100个数据在各组个数据在各组中的频数?如何计算样本数据在各组中中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出的频率?你能将这些数据

8、用表格反映出来吗?来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5. 分分 组组 频数累计频数累计 频数频数 频率频率 00,0.50.5) 4 0.044 0.04 0.5 0.5,1 1) 正正 8 0.088 0.08 1 1,1.51.5) 正正 正正 正正 15 0.1515 0.15 1.5 1.5,2 2) 正正 正正 正正 正正 22 0.2222 0.22 2 2,2.52.5) 正正 正正 正正 正正 正正 25 0.2525 0.25 2.5 2.5,3 3) 正正 正正 14 0.1414 0.14 3 3,3.

9、53.5) 正正 一一 6 0.066 0.06 3.5 3.5,4 4) 4 0.044 0.04 4 4,4.5 2 0.024.5 2 0.02 合计合计 100 1.00100 1.00思考思考5 5:上表称为样本数据的上表称为样本数据的频率分布表频率分布表,由此可以推测该市全体居民月均用水量由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了用水量标准提供参考依据,这里体现了一种什么统计思想?一种什么统计思想? 用样本的频率分布估计总体分布用样本的频率分布估计总体分布. .思考思考6 6:如果市政府希

10、望如果市政府希望85%85%左右的居民每左右的居民每月的用水量不超过标准,根据上述频率分月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即布表,你对制定居民月用水量标准(即a a的的取值)有何建议?取值)有何建议?88%88%的居民月用水量在的居民月用水量在3t 3t以下,可建议取以下,可建议取a=3. a=3. 思考思考7 7:在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以以上的居民用水不超标吗?哪些环节可能会导上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?致结论出现偏差?分组时,组距的大小可能会导致结论出现偏分组时,组距的大小可能会导

11、致结论出现偏差,实践中,对统计结论是需要进行评价的差,实践中,对统计结论是需要进行评价的. . 思考思考8 8:对样本数据进行分组,其组数对样本数据进行分组,其组数是由哪些因素确定的?是由哪些因素确定的?思考思考9 9:对样本数据进行分组,组距的确定没对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况我们了解数据的分布情况. .数据分组的组数与数据分组的组数与样本容量有关,一般样本容量越大,所分组样本容量有关,一般样本容量越大,所分组数越多数越多. .按统计原理,若样本的容量为按统计原理,若样本的容量为n n,分,

12、分组数一般在(组数一般在(1+3.3lg1+3.3lgn n)附近选取)附近选取. .当样本容当样本容量不超过量不超过100100时,按照数据的多少,常分成时,按照数据的多少,常分成5 51212组组. .若以若以0.10.1或或1.51.5为组距对上述为组距对上述100100个个样本数据分组合适吗?样本数据分组合适吗?思考思考1010:一般地,列出一组样本数据的频率一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?分布表可以分哪几个步骤进行?第一步,求极差第一步,求极差. .(极差(极差= =样本数据中最大值与最小值的差)样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决

13、定组距与组数. .(设(设k=k=极差极差组距,若组距,若k k为整数,则组为整数,则组数数=k=k,否则,组数,否则,组数=k+1=k+1) 第三步,确定分点,将数据分组第三步,确定分点,将数据分组. .第四步,统计频数,计算频率,制成表格第四步,统计频数,计算频率,制成表格. . (频数(频数= =样本数据落在各小组内的个数,样本数据落在各小组内的个数, 频率频率= =频数频数样本容量)样本容量)知识探究(二):频率分布直方图知识探究(二):频率分布直方图 思考思考1 1:为了直观反映样本数据在各组中为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的分布情况,我们将上述频率分

14、布表中的有关信息用下面的图形表示:的有关信息用下面的图形表示: 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O上上图称为图称为频率分布直方图频率分布直方图,其中横轴,其中横轴表示月均用水量,纵轴表示频率表示月均用水量,纵轴表示频率/ /组距组距. . 频率分布直方图中各小长方形的和高频率分布直方图中各小长方形的和高度在数量上有何特点?度在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5

15、 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组距高度:高度:频率频率组距组距思考思考2 2:频率分布直方图中各小长方形的频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和面积表示什么?各小长方形的面积之和为多少?为多少?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O各小长方形的面积各小长方形的面积= =频率频率各小长方形的面积之和各小长方形的面积之和= =1 1思考思考3 3:频率分布直方图非常直观地表明频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看了样本数据的

16、分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来但原始数据不能在图中表示出来. .你能根你能根据上述频率分布直方图指出居民月均用据上述频率分布直方图指出居民月均用水量的一些数据特点吗?水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1

17、 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等. .思考思考4 4:样本数据的频率分布直方图是样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?率分布直方图的作图步骤如何? 第一步,画平面直角坐标系第一步,画平面直角坐标系. . 第二步,在横轴上均匀标出各组分点,第二步

18、,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度. .第三步,以组距为宽,各组的频率与第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的组距的商为高,分别画出各组对应的小长方形小长方形. .思考思考5 5:对一组给定的样本数据,频率分对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以在居民月均用水量样本中,你能以1 1为组为组距画频率分布直方图吗?距画频率分布直方图吗? 与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关. .月均用水量月均用水量/t频率频

19、率组距组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O理论迁移理论迁移 例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,3737,4444,4545,2929, 4848,4545,5353,4848,3737,2828,4646,5050,3737,4444, 4242,3939,5151,525

20、2,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少. .(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组. . 分分 组组 频数频数 频率频率 2727,3232) 3 0.063 0.06 32 32,3737) 3 0.063 0.06 37 37,4242) 9 0.189 0.18 42 42,4747) 16 0.3216 0.32 47 47,5252) 7 0.147 0.14 52 52,5757) 5 0.105 0.10 57 57,6262) 4 0.084 0.08 62 62,6767) 3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.01

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论