




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、问题提出1.1.随机抽样有哪几种基本的抽样方法?2.2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容. .简单随机抽样、系统抽样、分层抽样.第1页/共26页 3.3.高一某班有5050名学生,在数学必修结业考试后随机抽取1010名,其考试成绩如下: 8282, 7575, 6161, 9393, 6262, 5555, 7070, 6868, 8585, 78.78. 如果要求我们根据上述抽样数据,估计该班对数学模块的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布. .
2、第2页/共26页第3页/共26页引入第4页/共26页知识探究(一):频率分布表 【问题】 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a a,用水量不超过a a的部分按平价收费,超出a a的部分按议价收费. .通过抽样调查,获得100100位居民20072007年的月均用水量如下表(单位:t t):第5页/共26页3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2
3、 1.5 1.2 0.2 0.4 0.3 0.43.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0
4、 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.
5、7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2第6页/共26页列频率分布表的方法步骤:列频率分布表的方法步骤:求极差求极差(也称全距,即一组数据中最大值与(也称全距,即一组数据中最大值与最小值的差):最小值的差): 计算极差时,需要找出这组数据的计算极差时,需要找出这组数据的最大最大值和最小值。值和最小值。 此题中,此题中,4.34.30.2=0.2= 4.14.1,所以,所以极差等于极差等于4.14.1t t. .第7页/共26页决定组距与组数决定组距与组数 那么那
6、么 组距组距= = 0.50.5, ,于是于是组距为组距为0.50.5极差极差组数组数 样本数据有样本数据有100100个,可以把样本分为个,可以把样本分为512512组,组,这里取这里取9 9组。由上面算得极差为组。由上面算得极差为4.14.1,注:注: (1 1)一般样本容量越大,所分组数越多。)一般样本容量越大,所分组数越多。 (2 2)为方便起见,组距的选择应力求)为方便起见,组距的选择应力求“取取整整”,如果极差不利于分组(,如果极差不利于分组( 如不能被组数整除)如不能被组数整除)要适当增大极差,如在左、右两端各增加适当范要适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加
7、的量相同)。围(尽量使两端增加的量相同)。 第8页/共26页决定分点,将数据分组决定分点,将数据分组 将第将第1 1组的起点定为组的起点定为0 0,以组距为,以组距为0.50.5将数据将数据分组时,可以分成以下分组时,可以分成以下9 9组:组:0,0.5),),0.5,1),),1,1.5),),4,4.5. 分组时,通常对组内数值所在区间取分组时,通常对组内数值所在区间取左闭左闭右开右开区间,最后一组取闭区间,当然也可以采区间,最后一组取闭区间,当然也可以采用其他分组方法。用其他分组方法。第9页/共26页登记频数,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表 频率频率= = ,
8、如第,如第4 4小组的频率小组的频率为为 =0.04. =0.04.频数频数样本容量样本容量4 4100100第10页/共26页 分 组 频数累计 频数 频率 00,0.50.5) 4 0.044 0.04 0.5 0.5,1 1) 正 8 0.088 0.08 1 1,1.51.5) 正 正 正 15 0.1515 0.15 1.5 1.5,2 2) 正 正 正 正 22 0.2222 0.22 2 2,2.52.5) 正 正 正 正 正 25 0.2525 0.25 2.5 2.5,3 3) 正 正 14 0.1414 0.14 3 3,3.53.5) 正 一 6 0.066 0.06 3
9、.5 3.5,4 4) 4 0.044 0.04 4 4,4.5 2 0.024.5 2 0.02 合计 100 1.00100 1.00第11页/共26页 上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想? 用样本的频率分布估计总体分布用样本的频率分布估计总体分布. .第12页/共26页思考:如果市政府希望85%85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a a的取值)有何建议?88%88%的居民月用水量在的居民月用水量在3t 3t以下,可建议取以下
10、,可建议取a=3a=3. . 思考:在实际中,取a=3ta=3t一定能保证85%85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的大小可能会导致结论出现偏差,分组时,组距的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的实践中,对统计结论是需要进行评价的. . 第13页/共26页思考:对样本数据进行分组,其组数是由哪些因素确定的?思考:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况. .数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多. .按统计原理,若样本的容量为n n,分组数一般在(1+3.3
11、lg1+3.3lgn n)附近选取. .当样本容量不超过100100时,按照数据的多少,常分成5 51212组. .若以0.10.1或1.51.5为组距对上述100100个样本数据分组合适吗?第14页/共26页 5 5绘制频率分布直方图 月均用水量/t频率组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O频率分布直方图的绘制方法与步骤: 1.第一步,画平面直角坐标系. 2.第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度. 3.第三步,以组距为宽,各组的频率与组
12、距的商为高,分别画出各组对应的小长方形. 这些矩形就构成了频率分布直方图。第15页/共26页有关问题的理解:月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距高度:频率组距 因为小矩形的面积=组距频率/组距=频率,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小。在频率分布直方图中,各小矩形的面积之和等于1.第16页/共26页思考:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来. .你能根
13、据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第17页/共26页(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水
14、量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等. .第18页/共26页思考:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何? 第一步,画平面直角坐标系第一步,画平面直角坐标系. . 第二步,在横轴上均匀标出各组分点,在纵轴第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度上标出单位长度. .第三步,以组距为宽,各组的频率与组距的商第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形为高,分别画出各组对应的小长方形. .第19页/共26页思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用
15、水量样本中,你能以1 1为组距画频率分布直方图吗? 与分组数(或组距)及坐标系的单位长度有关与分组数(或组距)及坐标系的单位长度有关. .月均用水量/t频率组距0.40.40.30.30.20.20.10.11 2 3 4 5 1 2 3 4 5 O第20页/共26页理论迁移 例 某地区为了了解知识分子的年龄结构,随机抽样5050名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,3737,4444,4545,2929, 4848,4545,5353,4848,3
16、737,2828,4646,5050,3737,4444, 4242,3939,5151,5252,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表; (2)(2)画出频率分布直方图;(3)(3)估计年龄在32325252岁的知识分子所占的比例约是多少. .第21页/共26页(1)(1)极差为67-28=3967-28=39,分为8 8组, ,取组距为5.5. 分 组 频数 频率 2727,3232) 3 0.063 0.06 32 32,3737)
17、 3 0.063 0.06 37 37,4242) 9 0.189 0.18 42 42,4747) 16 0.3216 0.32 47 47,5252) 7 0.147 0.14 52 52,5757) 5 0.105 0.10 57 57,6262) 4 0.084 0.08 62 62,67 3 0.0667 3 0.06 合 计 50 1.0050 1.00样本频率分布表:第22页/共26页(2 2)样本频率分布直方图:年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37
18、 42 47 52 57 62 67频率组距O(故年龄在32325252岁的知识分子约占70%.70%.)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 第23页/共26页小结作业1.1.频率分布是指一个样本数据在各个小范围频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值内所占比例的大小,总体分布是指总体取值的频率分布规律的频率分布规律. .我们通常用样本的频率分我们通常用样本的频率分布表或频率分布直方图去估计总体的分布布表或频率分布直方图去估计总体的分布. .2.2.频率分布表和频率分布直方图,是对相同频率分布表和频率分布直方图,是对相同数据的两种不同表达方式数据的两种不同表达方式. .用紧凑的表格改变用紧凑的表格改变数据的排列方式和构成形式,可展示数据的数据的排列方式和构成形式,可展示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 集成茶楼品牌授权与合作合同
- 仓储配送与跨境电商仓储物流服务标准合同
- 商业综合体停车场地使用权出售协议
- 健身中心食堂餐饮租赁及服务协议
- 财务公司贷款代理中介服务合同范本
- 餐饮店面租赁合同(含品牌推广费用)
- 二手房买卖房屋租赁权处理与解除合同
- 生态农家乐综合承包经营合同范本
- 国际酒店管理公司员工外派服务合同
- 财务会计岗财务会计准则及政策解读劳动合同
- 2025年小学语文毕业升学全真模拟试卷(古诗词背诵默写)历年真题回顾
- 东莞滨海湾新区管理委员会下属事业单位招聘笔试真题2024
- 2025年云南省中考数学-26题二次函数降次幂题35道
- 2025届中考地理全真模拟卷 【江苏专用】(含解析)
- 2025年自动驾驶汽车商业化应用场景规划与风险评估报告
- 安徽宣城郎溪开创控股集团有限公司下属子公司招聘笔试题库2025
- 体育俱乐部托管协议书
- 2025届江苏省高三高考科研卷语文试题及参考答案
- 统编版语文六年级下册古诗词诵读考点巩固 期末复习专用课件
- 公共组织绩效评估-形考任务一(占10%)-国开(ZJ)-参考资料
- 国家开放大学电大《水利水电工程建筑物》期末题库及答案
评论
0/150
提交评论