版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2用样本估计总体复习回顾1、什么是简单随机抽样?什么样的总体适宜简单随机抽样?
2、什么是系统抽样?什么样的总体适宜系统抽样?
3、什么是分层抽样?什么样的总体适宜分层抽样?抽样是统计的第一步,接下来就要对样本进行分析简单随机抽样系统抽样分层抽样抽样过程中每个个体被抽取的概率相等将总体分成均衡几部分,按规则关联抽取将总体分成几层,按比例分层抽取用简单随机抽样抽取起始号码总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成从总体中逐个不放回抽取用简单随机抽样或系统抽样对各层抽样通过图、表、计算来分析样本数据,找出数据中的规律,就可以对总体作出相应的估计.这种估计一般分成两种:①是用样本的频率分布估计总体的分布.
②是用样本的数字特征(如平均数、标准差等)估计总体的数字特征.用样本去估计总体,是研究统计问题的一个基本思想.初中时我们学习过样本的频率分布,包括频数、频率的概念,频率分布表和频率分布直方图的制作.频率分布
样本中某数据(或数据组)的频数和样本容量的比,叫做该数据(数据组)的频率.频率分布的表示形式有:①样本频率分布表②样本频率分布条形图③样本频率分布直方图所有数据(或数据组)的频数的分布变化规律叫做样本数据的频率分布.2.2.1用样本的频率分布估计总体分布(1)我国是世界上严重缺水的国家之一,
城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市探究:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?由于城市居民比较多,因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.下面是通过抽样得到的.100位居民某年的月均用水量:根据这些数据你能得出用水量其他信息吗?1.
求极差:(最大值与最小值的差)最大值=4.3最小值=0.2所以,极差=4.3-0.2=4.12.
决定组距与组数:当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求”取整”.本题如果组距为0.5(t).则3.
将数据分组(给出组的界限)所以将数据分成9组较合适.[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9组.
步骤:画频率分布直方图4.列出频率分布表.(填写频率/组距一栏)5.画出频率分布直方图4.列频率分布表100位居民月均用水量的频率分布表频率=
频数样本容量显示了样本数据落在各个小组的比例大小!月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?5.画频率分布直方图小长方形的面积等于其相应组距上的频率.一般地,作频率分布直方图的方法为:把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,高等于该组的频率/组距,这样得到一系列矩形,每一个矩形的面积恰好是该组上的频率,这些矩形构成了频率分布直方图.月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积总和=?5.画频率分布直方图月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5月均用水量最多的在那个区间?5.画频率分布直方图月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5请大家阅读第68页,直方图有那些优点和缺点?5.画频率分布直方图
频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.例.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.应用举例:0.060.060.148160.160.210.51180.180.160.85100.9550.05已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5D练习1:240027003000330036003900X体重y0.001练习2.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:
;0.313练习4:有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?解:组距为3
分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027所以,数据落在[15.5,24.5)的百分比是56%.列出频率分布表:频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.07018.521.524.527.530.533.5
小结:频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.频率分布直方图月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?(4)它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.总体密度曲线频率组距月均用水量/tab
(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。2.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的,且中间一组的频数为10,则这个样本容量是______3.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0.1,0.3,0.3,0.1,则第五组的频率是_____,这五组的频数之比为_____________4.对于样本频率分布直方图与总体密度曲线的关系下列说法正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑的曲线,则这条光滑曲线为总体密度曲线400.21:3:3:1:2D
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布折线图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。
总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。我们还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是茎叶图。制作茎叶图的方法将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。123452545116679049茎:十位数字叶:表示个位数字例1:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50茎叶图:重复出现的数据要重复记录,不能遗漏;特别是“叶”部分;例题:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.茎叶图甲乙012345(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39313868634899421014657569(福建高考)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示,记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在核对时,发现有一个数字(茎叶图中的x)无法看清,如记分员计算无误,则数字x应该是______1作品A88999X23214茎叶图的特征
(1)优点:1.从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到2.茎叶图中的数据可以随时记录,随时添加,方便记录与表示
(2)缺点:茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 不得做饭的合同(2篇)
- 合伙人垫资经营协议书(2篇)
- 2024年度二手出租车交易安全保障协议
- 安卓界面设计研究
- 编号19-航天新材料力学行为与应用创新设计研究
- 2024年度美容院装饰装修服务合同
- 2024版企业通讯设备采购与部署合同
- 2024年度广告投放合同及效果评估
- 表征学习与降维技术
- 2024版电力设备出口贸易合同
- 学校购买乐器合同范例
- 2024-2030年中国汽车精细化学品行业竞争格局及发展风险研究报告
- 养老机构心理危机应急救援预案
- 《老年人生活照护》试卷A卷及答案
- 2024年上海公务员考试申论试题(A卷)
- 怎样做好接待工作培训课件
- 2024-2025苏教版一年级数学上册 第三单元《图形的初步认识(一)》检测卷(含答案)
- 电子信息产业园建设项目可行性研究报告
- 消防安全知识培训课件
- 2024年资格考试-WSET二级认证考试近5年真题附答案
- 高中历史选择性必修2知识点总结归纳
评论
0/150
提交评论