版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《抽样技术》第二章王学民编第二章简单随机抽样§2.1简单随机抽样的概念§2.2总体均值(或总值)的估计§2.3总体比例的估计§2.4样本容量的确定§2.5逆抽样§2.1简单随机抽样的概念一、简单随机抽样的定义二、简单随机抽样的抽选三、符号和定义一、简单随机抽样的定义简单随机抽样——从容量为N的有限总体中抽取n个单元,使得所有不同的样本每一个被抽中的概率相等。所得的样本称为简单随机样本。共有个不同的样本,每一个样本被抽中的概率为。任一个单元被选入样本的概率均为n/N。但不能将“每一个单元被选入样本的概率皆相等”作为简单随机抽样的定义。实践中,简单随机抽样一般是通过不放回地逐个从总体中等概率抽取单元来实现的,故通常将其称为不放回的简单随机抽样。若抽样是有放回地逐个等概率抽取的,则称为放回的简单随机抽样。当n/N很小时,放回与不放回的抽样几乎给出相同的结果。在实际应用中,一般都采用不放回抽样。
例2.2设总体有5个单元(1,2,3,4,5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为10个:1,12,33,44,51,22,43,51,32,51,4二、简单随机抽样的抽选首先将容量为N的有限总体中的所有单元从1到N编好号码,然后从这N个编号中抽取n个。具体的抽取方式一般有:
(1)抽签法;
(2)随机数表法;
(3)计算机产生伪随机数法。随机数表法随机数表是由0,1,2,⋯,9这十个数字组成的,书中表3.2给出了由2500个一位数字组成的随机数表。这个随机数表是这样产生的:在这2500个位置上分别独立地做一次等可能地产生0,1,2,⋯,9的随机试验。因此,在任意一个位置上0~9这十个数字出现的可能性都相同,在任意两个位置上00~99这一百个数字出现的可能性也都是相同的,在任意三个位置上000~999这一千个数字出现的可能性也都是相同的,依次类推。例1设总体中的所有个体编号从1到N,试在以下三种情况下分别抽取一个容量为n的简单随机样本。
(1)N=63,n=10,不放回抽样;
(2)在(1)中放回抽样;
(3)N=247,n=7,不放回抽样。计算机产生伪随机数法使用SAS的分析家菜单系统产生一个简单随机样本。三、符号和定义组成总体的N个单元的标志值:Y1,Y2,⋯,YN;样本中n个单元的标志值:y1,y2,⋯,yn。总体总值:;总体均值:
样本总值:;样本均值:方差的定义对有限总体,总体方差通常定义为
习惯上我们使用形式抽样的兴趣通常,抽样的兴趣都集中于总体的四项标志:⑴均值;⑵总值Y;⑶具有某一特征的单元所占的比例P(或所占的总数A=NP);⑷两个总值的比率或两个均值的比:比率的例子(1)调查某地区居民家庭食品消费支出占家庭收入的比重。令
Xi——第i个家庭的家庭收入 Yi——第i个家庭的食品消费支出
i=1,2,⋯,N
家庭食品消费支出占家庭收入的比重为比率的例子(2)在住户调查中,要估计每个成年女子化妆品的平均费用。令
Xi——第i个家庭的成年女子数
Yi——第i个家庭成年女子化妆品的总费用
i=1,2,⋯,N 每个成年女子化妆品的平均费用为比率的例子(3)在某住宅小区的房价调查中,要估计该小区的平均房屋单价。令
Xi——第i套住宅的建筑面积
Yi——第i套住宅的市场价格
i=1,2,⋯,N 该小区的平均房屋单价为§2.2总体均值(或总值)的估计定理1
样本均值
是总体均值
的无偏估计。
证明
方法一:方法二:
令
则推论1
是总体总值Y的无偏估计。定理2
。
其中f=n/N称为抽样比;1−f对方差,对标准误都称为有限总体的校正系数。
证明
令公式的说明推论2
的标准误推论3
作为总体总值Y的估计量,
的方差是推论4的标准误定理3
对简单随机样本,样本方差
是总体方差
的无偏估计。
证明
令
例1考虑从一个N=6的总体中抽取n=3的样本,设这6个单元的值分别为Y1=21,Y2=12,Y3=15,Y4=24,Y5=6,Y6=18
则。可用s来估计S,但它是有偏的,n较大时这个偏差一般可以忽略。推论5
和
的方差的无偏估计是我们取
作为
的估计量,它们是有偏的。样本均值分布的正态近似对有限总体的不放回抽样,哈杰克(Hajek)在1960年给出了样本均值
的分布趋于正态的充分条件。一般地,当n≥30时可认为
。置信区间现假定
,给定置信度1−α,可得均值
和总值Y的置信区间:
当n>50时,tα/2(n−1)可由uα/2代替。例2为估计某中学300名新生的平均身高,从中抽取了10名进行测量,得数据(单位:厘米)为158,149,156,153,160,151,157,145,152,159。试问是否求得出平均身高的置信区间?如何求?解
例3下页表列出美国1940年197个城市的居民数,分别按下述抽样方案估计197个城市的居民总数,请算出估计量的标准差: (1)容量为50的简单随机样本; (2)含有5个最大的城市。并从其余192个城市中抽出容量为45的简单随机样本; (3)含有9个最大的城市,并从其余188个城市中抽出容量为41的简单随机样本。组距(千人)f组距(千人)f组距(千人)f50~100105550~6002……100~15036600~65011500~15501150~20013650~7002……200~2506700~75001600~16501250~3007750~8001……300~3508800~85011900~19501350~4004850~9002……400~4501900~95003350~34001450~5003950~10000……500~55001000~105007450~75001城市大小的频数分布*例4为了估计学校上月用于教学的开支,从学校的2389项开支中抽取185项,得一简单随机样本。经分析,185项中有160项与教学有关。用z表示这160项开支的数值(单位:千元),经计算试求学校上月用于教学的总开支的点估计、标准误估计和0.95置信区间。解
令 0.95置信区间:*例5通常可以认为Y1是很小的,YN是很大的。1972年萨伦达尔(Sarndal)检验了下述
的估计量
其中c是一个常数。证明萨伦达尔的结果:(1)是无偏的;(2) 。证明(1)令(2)提示§2.3总体比例的估计设总体容量为N,其中具有某一特征的单元数为A,总体比例为P=A/N。现从总体中抽取一个容量为n的简单随机样本,又设样本中具有某一特征的单元数为a,样本比例为p=a/n。定理4
样本比例p=a/n是总体比例P=A/N的无偏估计。证明
令推论6
是A的无偏估计。定理5
p的方差是
其中Q=1−P。证明令
于是推论7
的方差是定理6
p的方差V(p)的无偏估计是
其中q=1−p。证明令推论8
的方差
的无偏估计是当n很大,p和q都不太小时,由中心极限定理知,p近似服从正态分布。由此可以构造出P的1-α置信区间:
其中
是连续性的校正项;A=NP的1-α置信区间:例6从一份共有3042人的人名录中随机抽200人,发现38人的地址已变动,试对这份人名录中需要修改的地址总数作出点估计和95%的置信区间。解§2.4样本容量的确定精度与费用之间是一对矛盾。一般地,调查所要求的精度越高,调查所需的费用也就越大。最简单的一种费用函数是:C=c0+cn,这时,确定C⟺确定n。本节讨论在精度给定的条件下如何来确定n。估计总体均值时样本容量的确定设V是一事先给定的值,若要求满足
(或
),则所需的样本容量当
很小时,可近似地表示为n≥n0(或n=n0)。当用
来估计
时,估计的绝对误差是
,而相对误差是
,它们都是随机变量。给定置信度1−α,称d为绝对误差限,称r为相对误差限,且
。当n足够大时,
。在确定n之前,先假定求出的n会足够大,使得
,这时有
其中
称为
的变异系数。
其中cv是总体的变异系数,称cv2为总体的相对方差。例7为调查学生购书支出,某高校在全校6000名大学生中按简单随机抽样抽出80名学生,调查了他们最近一个学期用于购书支出后,得到
(元),s2=13712,试估计该校大学生最近一个学期用于购书的总支出,并给出估计的标准差。如果在95%置信度下,估计的相对误差限不超过10%,则应该抽出多少学生进行调查?解估计总体比例时样本容量的确定可推得设计效应为比较不同抽样设计的效率,基什(L.Kish)提出一个称为设计效应的量。deff=所考虑抽样设计估计量的方差/相同样本容量下简单随机抽样估计量的方差设计效应值愈大,表明它的效率愈低。若deff>1,表明所考虑的抽样设计的效率不如简单随机抽样;若deft<1,则表明该抽样设计的效率比简单随机抽样高。放回简单随机抽样的设计效应为设计效应在实际中还有一个十分重要的作用,即用于确定样本容量。一种设计要达到与(不放回)简单随机抽样同样的精度(相等的方差),它的样本容量恰应是简单随机抽样的deff倍。抽样前未知参数的估计一般来说,
,S2,P皆未知,要算出n,必须先要对
S2(或P)作出点估计。常用的简单方法有:
⑴分两步抽取样本,先抽取一个容量为n1的较小样本,用来估计
S2(或P),计算出n后,再抽一个容量为n−n1的样本;
⑵从以往同一总体或同类总体的研究中得出S2(或P)的估计值;
⑶根据经验,给出一个足够大的n。估计总体比例时样本容量的放大§2.5逆抽样当用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版工程居间与项目管理合同2篇
- 婚姻介绍所合同模板
- 二零二四年大数据分析与处理合同3篇
- 简单版的工程承包合同范本
- 2024年度电子支付与结算条款3篇
- 管理者素质培训
- 《产品知识》课件
- 《阳光心态》课件
- 《恶性胶质瘤常识》课件
- 《广本奥运应对策略》课件
- 过度充电对电动车锂电池的热失控影响
- 【基于PLC的自动售货机控制系统设计开题报告2400字】
- 部编版七年级道德与法治上册《爱护身体养护精神》教案及教学反思
- 《Word技巧》ppt课件(图文)
- 国有控股企业受让非国有股东股权流程
- 中职《历史》期末考试及答案
- 房树人心理解析演示文稿
- 2023年小企业会计核算制度
- 《审计分析框架》
- 高中生读后续写现状调查报告1 论文
- 《工程结构有限元》课程讲义
评论
0/150
提交评论