抽样样本容量的确定_第1页
抽样样本容量的确定_第2页
抽样样本容量的确定_第3页
抽样样本容量的确定_第4页
抽样样本容量的确定_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样样本容量的确定

0抽样方法分类抽样应遵循随机原则,从整体中提取部分实际数据,并使用概率估算方法,根据样本信息确定样本的属性,样本信息是随机的。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。1确定样本量的必要性1.1样本容量的影响抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。1.2样本容量大小导致调查行为助力检验,不利于抽样调查的发展样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。2影响所需样品体积的主要因素2.1总体单位标志的变异程度小,总样本容量大,总单位标志变异程度一般用方差σ2或成数方差P(1-P)的大小来表示。在其他条件不变的情况下,为了达到同样的研究目的,总体单位标志的变异程度大,样本容量应越大;反之,总体单位标志的变异程度越小,则样本容量就应越少。二者成正比关系。2.2抽样概率估计的精确控制在一定范围内抽样极限误差又叫允许误差,是指在一定的把握程度下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围。在抽样推断中,需要把这个误差控制在一定的范围之内。抽样平均数极限误差一般用Δxˉ表示,抽样成数极限误差用ΔP表示。在其他条件不变的前提下,所允许的抽样极限误差越小,即抽样估计的精确度要求越高,样本容量应越大;所允许的抽样极限误差越大,所需的样本容量就越小。二者成反比关系。2.3样品概率度的计算抽样推断的可靠度是指总体所有可能样本的指标落在一定区间的概率度,即允许误差范围的概率保证程度。概率度用Zα2表示,即置信水平1-α的统计量,一般简写为t。在其他条件不变的情况下,抽样估计所要求的可靠程度越高,即概率保证程度越高,要求样本含有的总体信息就越多,只有增加样本容量才能满足高精确度的要求;反之,概率保证程度越低,所需的样本容量就越小。二者成正比关系。2.3抽样方法的选择概率抽样的主要类型有简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样、多阶段随机抽样等。在简单随机抽样中,根据同一单位是否允许重复抽取方式的不同,抽样方法可分为重复抽样和不重复抽样。由于在同样的条件下,不同的抽样方式会产生不同的抽样误差,因此,样本容量也应有所不同。一般来说,分层随机抽样和系统随机抽样的样本容量可定得小些,若用简单随机抽样和整群随机抽样方式,抽样的样本容量就要定得大些。至于抽样方法,由于不重复抽样的误差小于重复抽样的误差,因此,不重复抽样的样本容量可比重复抽样的样本容量小些。3不同抽样方法下样本量的确定3.1单位组成样本简单随机抽样是指按照随机原则从总体单位中直接抽取若干单位组成样本。简单随机抽样中分为重复简单抽样和简单不重复抽样,因此,简单随机抽样的样本容量计算公式包括两种。3.1.1模型a:成数方差在重复抽样条件下,样本容量的计算公式为:其中,n代表样本容量,t代表概率度,Δ代表极限误差,σ2代表总体方差,P(1-P)表示成数方差。3.1.2在不重复样本时,样本量在不重复抽样条件下,样本容量的计算公式为:上式中,N代表样本总数。3.2抽样数量的抽取和统计分层随机抽样,也称类型随机抽样,是指首先将调查对象的总体单位按照一定的标准分成各种不同的类别(或组),然后根据各类别(或组)的单位数与总体单位数的比例确定从各类别(或组)中抽取样本的数量,最后按照随机原则从各类(或组)中抽取样本。对于分层抽样,在总的样本量一定时,一个重要的问题是各层应该分配多少样本量。实际工作中有不同的分配方法,可以按对各层进行常数分配,也可以按各层单位数占总体单位数的比例分配,还可以采用在总费用一定条件下使估计量方差达到最小的最优分配等,其中等比例分配是较为常用的方法。分层抽样是对每一组抽样,不存在样本组间误差,抽样平均误差取决于各组内方差的平均水平,即以各组样本单位数为权数,计算各组内方差的平均数。因此可用组内方差平均数计算出抽样平均误差。3.2.1平均方差在重复抽样条件下,样本容量的计算公式为:其中,σ2是组内平均方差,代表成数的平均组内方差。,其中ni代表各组样本单位数,σi2代表各组的组内方差,n代表样本总数。3.2.2在不重复样本时,样本量在不重复抽样条件下,样本容量的计算公式为:3.2.3模型主要参数ni当样本容量n确定之后,各层应抽取的样本单位数可采用等比例法进行分配,计算公式为:其中,ni为第i层应抽取的样本数,n为样本容量,Ni为第i层样本数,N为总体单位数。3.3抽样平均误差计算整群随机抽样又称聚类抽样,是把总体先分为若干个子群,然后抽取若干群作为样本单位的一种抽样方式。整群抽样是对选中的群进行全面调查,所以只存在群间抽样误差,不存在群内抽样误差,因此抽样平均误差可根据群间方差推算出来。由于整群抽样一般是不重复抽样,故应按不重复抽样计算必要的抽样群数。由整群抽样的极限误差和抽样标准误差公式导出样本容量计算公式为:其中Pr代表成数的群间方差,σr2代表群间方差,,其中是第i群样本平均数,是全样本平均数,r是抽取的群数。3.4抽选间隔的确定等距抽样也称为系统抽样、机械抽样,是将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。3.4.1样本容量的确定若对总体采用按无关标志排队的等距抽样时,可采用简单随机抽样的公式确定等距抽样的样本容量。由于等距抽样一般都是不重复抽样,应采用在不重复抽样条件下的样本容量的计算公式。3.4.1样本容量的确定若对总体采用按有关标志排队的等距抽样,则样本容量的确定,可采用分层抽样的样本容量公式确定样本容量。但应注意有序系统抽样的样本容量计算所需的平均组内方差应根据以往的资料作出估计。4确定样本体积的相关问题4.1利用外部资料代替调查样本容量的确定是在调查之前进行的,这样总体方差(或样本方差)一般是未知的。在实际工作中往往利用有关资料代替。如果在本次调查之前,曾组织过同类问题的全面调查,可用全面调查的有关资料代替;在进行正式调查之前,组织两次或两次以上试验性抽样,用试验样本的方差来代替;成数方差在完全缺乏资料的情况下,可用成数方差的极大值0.25(P=0.5)来代替。4.2抽样时的调查应用公式计算的样本容量是最低的,也是最必要的样本容量。有时在进行抽样调查时,一次调查要同时满足平均数和成数两个方面需要,这样根据样本容量计算公式得出的必要样本容量可能不相等。为了同时满足两个推断的要求,一般应选用其中较大的样本单位数作为样本容量。4.3总体大小的精确性在抽样调查中,除上述利用公式来计算样本容量,还有一种常用的方法,即采用经验法则。经验法则建立在过去抽取满足统计方法要求的样本量所累积下来的经验上。使用这个方法时很少需要统计方法知识,但是得出的样本大小很接近统计方法计算出的结果。在采用经验法则时,有关样本量大小的一项原则是:总体越小,要得到精确样本,即有较高概率得出与总体相同结果的样本,抽样比率就要越大;较大的总体能够使较小的抽样比得出同样好的样本。这是因为随着总体人数的增长,样本大小的精确性会随之增加。对于规模较小的总体(1000以下),研究者需要比较大的抽样比率(大约30%)为要有较高的精确性,这时需要大约300个样本;对于中等规模的总体(如10000),要达到同样的精确度,抽样比率为10%或大约1000个样本量就可以了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论