分层随机抽样913获取数据的途径课件高一下学期数学人教A版_第1页
分层随机抽样913获取数据的途径课件高一下学期数学人教A版_第2页
分层随机抽样913获取数据的途径课件高一下学期数学人教A版_第3页
分层随机抽样913获取数据的途径课件高一下学期数学人教A版_第4页
分层随机抽样913获取数据的途径课件高一下学期数学人教A版_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计9.1.2分层随机抽样复习

抽样调查最核心的问题是样本的代表性.简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本.例如,在对树人中学高一年级学生身高的调查中,可能出现样本中50个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差.能否利用总体中的一些额外信息对抽样方法进行改进呢?问题1:为了估计某班全体学生(共有50人,其中男生30人,女生20人)的平均身高,从班级学生中抽取出容量为10的样本进行调查,有几种抽样方法?方法1:用简单随机抽样从50人中抽取10人.方法2:从男生中抽取6人,从女生中抽取4人合成10人的样本.思考2:刚刚得出的这两种方法,哪种方法更为合理?为什么?方法2较好,因为男女生的身高存在明显的差异.思考1:高一阶段,影响学生身高的主要因素是什么呢?性别由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.思考3:方法2考虑到了性别的因素,不会出现男女生人数偏多或偏少的问题,但为什么男生、女生抽出的人数是6人和4人,而不是各抽5人呢?因为总体中的男女生人数之比是3:2,而样本是要反映总体,所以样本中男女生之比是3:2.男生样本量=×总样本量女生样本量=×总样本量无论是男生还是女生,每个学生被抽到的可能性相等.问题在树人中学高一年级的712名学生中,男生有326名、女生有386名.能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?当样本量为50时,应如何分配?当总样本量为50时,可以计算出从男生、女生分别应抽取的人数为一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.层:每一个子总体称为层.在分层抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.思考:如何进行分层抽样?步骤是什么?

每一层抽取的个体数=抽样比×该层个体数分层——计算抽样比——定数——抽样——成样我们按照上述方法抽取了一个容量为50的样本,其观测数据(单位:cm)如下:通过计算,得出男生和女生身高的样本平均数分别为170.6,160.6.

男生:173.0174.0166.0172.0170.0165.0165.0168.0164.0173.0172.0

173.0175.0168.0170.0172.0176.0175.0168.0173.0167.0170.0175.0女生:163.0164.0161.0157.0162.0165.0158.0155.0164.0162.5154.0154.0164.0

149.0159.0161.0170.0171.0155.0148.0172.0162.5158.0155.5157.0163.0172.0根据男生、女生身高的样本平均数以及它们各自的人数,可以估计总体平均数为即估计树人中学高一年级学生的平均身高在165.2cm左右.上面我们按性别变量,把高一学生划分为男生、女生两个身高差异较小的子总体分别进行抽样,进而得到总体的估计.问题5:为什么分层随机抽样能用样本平均数估计总体平均数?在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层被抽取样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层被抽取样本的各个个体的变量值,总体平均数样本平均数第1层第2层总体

探究:与考察简单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,与上一小节“探究”中相同样本量的简单随机抽样的结果比较,小明有了一个重要的发现.你是否也有所发现?抽样序号12345678910男生样本的平均数170.0170.7169.8171.7172.7171.9171.6170.6172.6170.9女生样本的平均数162.2160.3159.7158.1161.1158.4159.7160.0160.6160.2总样本的平均数165.8165.1164.3164.3166.4164.6165.2164.9166.1165.1我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用下图形进行表示,其中粉红线表示整个年级学生身高的平均数.从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样.但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了(第2个)偏离总体平均数的幅度较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.分层随机抽样的组织实施也比简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.选择抽样方法的规律:(1)当总体的个体数和样本量都较小时,可采用抽签法.(2)当总体的个体数较大,样本量较小时,可采用随机数法.(3)当总体按一个或多个变量可划分为若干个层时,采用分层随机抽样.第九章统计9.1.3获取数据的途径

获取数据的途径获取数据的基本途径有:(1)通过________获取数据;(2)通过________获取数据;(3)通过________获取数据;(4)通过________获取数据.调查试验观察查询练习1:要得到某乡镇的贫困人口数据,应采取的方法是 (

)A.通过调查获取数据

B.通过试验获取数据C.通过观察获取数据

D.通过查询获取数据【答案】A

【解析】某乡镇的贫困人口数据属于有限总体问题,所以可以通过调查获取数据.练习2:利用统计报表和年鉴属于哪种获取数据的途径?属于通过查询获取数据的途径.当堂检测2.有A,B,C三种零件,分别为a个、300个、200个,采取分层抽样法抽取一个容量为45的样本,A种零件被抽取20个,则此三种零件共有()A.700个B.800个C.900个D.1000个

C3.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5.现用分层抽样方法抽出一

个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量______.

804.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论