chap3简单随机抽样.ppt_第1页
chap3简单随机抽样.ppt_第2页
chap3简单随机抽样.ppt_第3页
chap3简单随机抽样.ppt_第4页
chap3简单随机抽样.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,Chap3 简单随机抽样,本章主要内容,3.1概述 3.2总体均值和总体总量的简单估计 3.3总体比例的简单估计 3.4样本量的确定 3.5放回简单随机抽样,3.1概述,简单随机抽样(单纯随机抽样) 概念:考虑一个包含N个单元的总体,从中随机的抽取n个作为样本,每个样本抽中的概率都相同。 分类: 放回简单随机抽样(重复抽样),每个样本抽中的概率: 不放回简单随机抽样(无重复抽样,每个样本抽中的概率: 实施方法 抽取方法1:一次抽n个签 抽取方法2:逐个抽取n个签 抽取方法3:实际运用中,常用抽取随机数,随机数产生方法:,随机数骰子:均匀材质的20面体, 每两个面标了数字0,1,29。m个不同颜色的骰子一次可产生m位随机数,或一个甩子掷m次产生。若m个数字均为0时,代表 m 。 随机数表:由09的随机数字组成的表,排列顺序也是随机的。 【例1(35)】 计算机产生 :伪随机数。对于抽取数额较大的样本时,一般均采用计算机操作,可以很快获得所需样本。,3.地位作用,地位:其他抽样方法的基础,效率、精度高。 局限性: 当N比较大的时候,抽样框难以编码。 抽得的样本常很分散,实际实施调查中会遇到很多困难。,3.2总体均值和总体总量的简单估计,回顾:(有限总体) 总体均值: 总体总量: 总体方差: 为大多数结论简便起见,定义总体方差: 样本均值: 样本方差: 简单估计法:用样本均值 估计总体均值 , 用 估计总体总量Y的方法,【例2】,考虑从一个N=6的总体中抽取n=3的样本,设这6个单元的值分别为 Y1=21,Y2=12,Y3=15,Y4=24,Y5=6,Y6=18,则总共可能有 个样本,每个样本所包含的单元号及其数值见表3.1 (P33) 总体均值: 总体方差: 秘密:样本均值的均值总体均值 样本方差的均值总体方差 这是偶然的吗?,先证明:,先引入个随机变量: 第i 个单元的入样概率为 第i ,j个单元的同时入样的概率为,简单估计是无偏估计,对无偏估计,其均方误差等于其方差,故,抽样比 f =n / N 有限总体修正系数:1- f,的直观意义,首先,对于大总体(N很大,f0), 取决于样本量,与抽样比无关。 其次, 与总体变异程度成正比。,再证明:,易得结论:,量 是 的无偏估计 量 是 的无偏估计。,3.3总体比例的简单估计,如死亡率的调查 ;问卷调查中对某个问题回答是或否的比例 设特殊的总体 则总体中具有该特征的个体的总数 所需估计的比例 因此对的估计即为对总体均值估计的特殊情形。,样本与总体类似处理,可设 则样本中具有该特征的个体的总数为 样本比例,方差用比例表示,总体方差 类似样本方差,简单估值法:用p去估计P,用Np去估计A,估计量p的均值和方差分别为 此方差的无偏估计为,,,类似易得A的估计量p有下列性质:,方差V(Np)的无偏估计为,3.4区间估计,理论表明,抽样调查中常用的估计量在大样本时是渐近正态的。故n充分大(n30,)时,近似有,的置信度为的区间估计为,类似得,Y的置信度为的区间估计为,其他情况,总体总量的置信度为的区间估计 总体比例的置信度为的区间估计 总体部分总量A的置信度为的区间估计,【例3】(例 3.),为调查某城镇成年居民的服装消费水平,在全体N=5443个成年人中,用简单随机抽样抽得一个n=36的样本,对每个抽中的成年人调查上一年中购买成衣的件数xi与支出金额yi如表3.4。试估计该城镇成年居民成衣平均支出金额及其95%的置信区间。,(1)求该城镇成年居民成衣平均购买件数及其95%的置信区间? (2)求该城镇所有成年人成衣消费额及其95%的置信区间?,解:,思考:,解:由表中数据,计算可得,置信区间上下限为,故该城镇成年居民成衣平均支出金额估计为649.722元,,其95%的置信区间约为469.97,829.47元,思考:,【例4】(例 3.),对某问题进行调查,在总体中抽取一个n=200的简单随机样本,若赞成,反对及不表态(不回答)的人数分别为n1=132,n2=51,n3=17,试给出赞成态度人的比例P1的90%近似区间。设N很大,f可忽略。,解:,置信区间上下限为,故赞成态度人的比例P1的置信度为90%的置信区间:,即0.6054,0.7146,60.54% ,71.46%,3.5样本量的确定,一.考虑费用决定样本量 调查费用一般形式为:F=F0+F1n 式中F0为基本调查费;F1为平均调查一个样本单元所需的费用。若受到限制,F0和F1给定,n就随之确定. 样本量要在费用与精度两者间权衡。,二.考虑精度决定样本量,1.按绝对精度d决定样本量 以估计总体均值为例,估计量的绝对精度d满足:,推论: 当较大时,nn0 n主要取决于总体方差,其他情况时按绝对精度d决定样本量,估计总体总量时 估计总体比例时 估计总体部分总量A时,按估计量的相对精度r决定样本量,估计总体均值 或总体总量时 估计总体比例或部分总量A时,(代替绝对误差),按估计量方差上限V决定样本量,(代替绝对误差),估计总体部分总量A时,估计总体比例时 ,估计总体总量时,估计总体均值 时,按估计量变异系数上限C决定样本量,估计总体均值 或总体总和Y时, 估计总体比例或部分总和A时 ,(代替相对误差),【例5】教材P54例3.7),在例3.5中若要求成衣人均消费件数 的估计的绝对误差限为0.2件,而人均消费成衣支出金额 的估计的相对误差限为5%.试求要求的样本量n.(已知1-=95%,X的总体标准差估计为4,Y的总体变异系数为0.9),解:对人均成衣消费件数的估计:已知,d=0.2,u2,Sx=4,对人均消费成衣支出金额的估计:已知,r=5%,u2,,【例6】教材P56例3.8),在人口变动情况调查中,出生率P是一个重要指标。根据以前调查数据,出生率P的估计可取为18。问在95%,的置信度下,实际调查估计P的绝对误差限为0.5 和相对误差限5%,各需要多大的样本量?,解:已知,U=1.96,p0= 18 =0.018,对给定的r=5%=0.05时,对给定的d= 0.5 =0.0005时,从一份共有3042人的人名录中随机抽取200人调查,发现38人的地址有变动,估计这份人名录中有多少人的地址需要修正?给出置信度为95%的置信区间若要求估计的相对误差不超过,还需再抽查多少人? 解:N=3042,n=200,a=38 p=a/n=0.19, =Np=578(人),,,的置信度为95%的置信区间:,练习:,1637.735,所以还需要再抽查1065-200=865人。,3.6放回简单随机抽样,定义:每次从总体中等概率的抽取一个单元,经观测后放回总体中去,再抽一个,共n次。 与放回简单随机抽样的不同之处:由于抽样放回,每次抽样总体结构不变,而且每次抽样相互独立。,总体均值的估计量及其性质,设 是放回简单随机样本 用样本均值 估计总体均值 按照放回简单随机抽样的定义,可得,设计效应与样本量的确定,放回简单随机抽样的估计量方差 不放回简单随机抽样的估计量方差 其比值 设计效应定义: 注:简单随机抽样指不放回、简单估计量 deff愈大,效率愈低。 若deff1,所考虑的抽样设计效率不如简单随机抽样; 若deff1,所考虑的抽样设计效率比简单随机抽样效率高。 设计效应的作用确定样本量 n=n1*deff,小结:简单抽样的公式一览表,比例P估计公式表,作业:68,3.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论