抽样技术期末知识点(附考点大题)_第1页
抽样技术期末知识点(附考点大题)_第2页
抽样技术期末知识点(附考点大题)_第3页
抽样技术期末知识点(附考点大题)_第4页
抽样技术期末知识点(附考点大题)_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样期末知识点汇总绪论(一)抽样调查抽样调查是指非全面调查的总称。 只要是从研究的对象中抽取部分单位加以调查, 用来说明全体,就统称为抽样调查。 (广义)选样方法:非概率抽样 &概率抽样非概率抽样 抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样 ( 盖洛普民意 测验、自愿样本原因:(1)受客观条件限制,无法进行严格的随机抽样。(2)为了快速获得调查结果。(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发 (偶然 ) 事件进行现场调查等。(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。 优点:成本低,而且容易完成; 缺点:不能对估计的精度作出客观、准确的说

2、明。概率抽样(狭义抽样调查) 按照概率统计的原理,从研究的总体中按随机原则来抽选样本 , 通过对样本的调 查获取数据 , 以此来对总体的特征作出估计推断 ; 对推断中可能出现的抽样误差 可以从概率的意义上加以控制。特点:(1)对于一个具体的调查, 要求总体中的每一个 单元都有一个已知的非零概率被 抽中。(2)抽取样本的方法必须是随机的。(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。(4)能够以一定的概率控制抽样误差的范围。 概率抽样:等概率抽样 &不等概率抽样(二)抽样调查的常用概念1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获 取信息的总体,

3、它是由研究对象中所有性质相同的个体所组成, 组成总体的各个 个体称作总体单元或单位。2. 抽样总体:指从中抽取样本的总体。抽样框:抽样总体的具体表现。通常抽样框是一份包含所有抽样单元的名单。总体参数:总体的特征。统计量(估计量):样本观察值的函数。抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。9. 抽样标准误( S),抽样方差( V), V=S210.偏差:样本估计量的数学期望与总体真值间的离差, E( ?)- ?B(?)。均方误差: MSE E(?- )2 V(?)

4、B2 (?) 。精确度:每次抽样结果之间差别大小精度:估计量的抽样标准误差或方差与待估计参数之比。可靠性:置信度( 1-a)抽样效率:两个抽样方案在样本量相同的情况下的抽样方差之比。设计效果: Deff VD( ?)VSRS( ?)VD ( ?) 表示某设计方案的方差,VSRS( ?)表示相同样本量下简单随机抽样的方差。1-f 称为有限总体校正系数 (finite population correction ,简记为 fpc ), 当抽样比 f 很小时, 1-f 就接近于 1,这样抽样比对 y 的精度就没有直接影响; 一般地,当抽样比小于 5%,甚至小于 10%时, fpc 可以忽略不计,即认

5、为 1-f 为 1;事实上略去 fpc 的影响是使 V(y) 高了一些抽样调查步骤确定调研问题抽样方案设计问卷设计 实施调查过程 数据处 理分析撰写调查报告简单随机抽样 SRS(一)定义:从容量为 N的总体中抽取一个容量为 n的样本,若所有可能的 CN 个 样本中的每一个被抽到的概率都相等, 即每个可能样本被抽中的概率均为 1 CN , 这种抽样方法称为不放回的简单随机抽样, 简称简单随机抽样, 所得的样本称为 不放回的简单随机样本,简称简单随机样本(二)实施方法:将总体中的单元依次从 1到 N进行编号, 然后利用抽签法或随 机数法来进行简单随机抽样。(三)优点:简单直观。在抽样框完整时,可以

6、直接从中抽选样本,由于抽选的 概率相同,用样本统计量对目标量进行估计及计算抽样误差都比较方便。(四)局限性:它要求将包括所有总体单元的名单作为抽样框,当 N很大时,构 造这样的抽样框并不容易; 根据这种方法抽出的单元很分散, 给实施调查增加了 困难;这种方法没有利用其他辅助信息以提高估计的效率。 所以在规模较大的调 查中,很少直接采用简单随机抽样, 一般是把这种方法与其他抽样方法结合在起 使用。五)估计总体指标样本指标NYYi Y1 Y2YNi1Y1N1YiY1 Y2YN1n y 1 yy1 y2yniN i1 iNni1nPA1N1Yi (Yi0或1)a1 pnyi(yi0或1)NN i 1

7、 i inni1NnYiniRi1YYR? in1xiyyNXiXXxxi1i1S21N12(Yi Y)2N221n(yi y)2sN 1i 1N1n1i1(1)总体均值对于简单随机抽样, y是 Y 的无偏估计。即 E(y) Y对于简单随机抽样, y的方差为: V(y) N nS2 1 f S2 nN n1f2V y 的无偏估计为: v(y)s2nY的置信度为1 的近似置信区间为 (y u 1 f s,y u 1 f s)1 2 n 1 2 nNN(2)总体总量( Y NY N Y i )n i 1对于简单随机抽样, Y是Y 的无偏估计,即 E Y? YY?的方差为:V Y? N 2V y N

8、 1 f S2 nV Y? 的无偏估计为:2vY? N 2v y N 1 f s2 n3)总体比例设Yi10,若其第他i个单元具有所考虑的特 征,i 1,2, ,N,总体中有A个单元具有0,其他N这个特征,即 AYi ,总体中具有某种特征的单元在总体中所占的比例 P 即即 S21 NP NP2N PQ,其中 Q? 1 P.N 1 N 1i1是 Y 的均值:A 1 NYYi Y ;N N i 1 i总体方差为:S2 1Yi Y 1Yi2 NY2 ,由于 Yi的取值为 0N 1i1 i N 1 i 1 i iNN或1 ,所以Yi2Yi ,i1 i 1n yi 相应地,样本比例为 p a i 1 y

9、 , nnn样本方差为 s21yi y 2 n p1 p n pq( 其中 q 1 p)n 1i 1 n 1 n 1p为P的简单估计,且为无偏估计,即 E p Pp的方差为V p 1nf NN1PQNnn N 1PQ1 f 2 1 fV p 的无偏估计为: v p 1 f s2 1 f pq(其中 q 1 p)n n 1在大样本条件下,利用正态分布可得 P 的置信度为 1- 的近似置信区间为 p u 1 f pq,p u1 f pqp u pq, p u pq1 2 n 1 1 2 n 1 (六)样本量的确定 费用函数: CT C0 Cn,其中 CT为总费用, C0 为固定费用, C为每调查一

10、个 样本单元所需的费用。绝对误差限: d u V ? u S ?22相对误差限:r u V ? u S ? u Cv ? 其中Cv ? S ?S ?1 2 1 2 1 2 E ?七)简单随机抽样估计总体均值或总体总量时样本量的确定:1)精度要求:估计量 y 的方差上限为 V设n0V ,则n 1 0n0 ,因此取n 1 0n0 ,如果n0 N时,即 N0 0.05,则 NN样本量直接取 n0 ,否则对 n 0进行修正,取 n2)精度要求:3)精度要求:4)精度要求:估计量 y 的绝对误差为 d,则n0估计量 y的相对误差为 r,则 n0S2VuS12uSu12Sdu1 SrY2n0n0估计量 y

11、的变异系数上限为 C,则 n0 S S V CY1 S 2 C2 Y5)估计总体比例时样本量的确定:设n0u1 2PQ22u1 Q2r2PPQ Q2 ,则 n n0V C 2Pn0 11N三分层随机抽样(一)定义:如果抽样在每个层中独立进行,总的样本由各层样本构成,这种抽 样方法称为分层抽样。若在每层中的抽样采用 SRS,这样的分层抽样称为分层随 机抽样。(二)原则:同一层内差异小,不同层间差异大。(三)分层原因:当总体各单元差异比较大时,对参数估计误差比较大。将总体 分层,同一层中各单位差异小, 从每一层中抽取构成样本, 这样样本就有代表性, 可以提高估计的精度; 可以同时对子总体进行参数估

12、计; 便于依托各级管理机构 进行组织和实施。(四)优点:分层样本代表性好;活方便;提高估计精度。可总体参数估计,也可对层参数估计;实施灵五) 分层随机抽样总体均值:Y?st ? ystWhyh1h1LNh yh h1LE( yst)WhE(yh)h1Lh1WhYh YV( yst) V( Whyh)Wh2V ( yh )h1h1Lh1Wh21fh Sh2Shnh无偏估计:(六)分层随机抽样总体总值:Y?st Nyst七)分层随机抽样总体比例:LpstWh phh1(八)分别比估计 (对每层样本分别考虑比估计量, 然后对各层的比估计量进行 加权平均)九)联合比估计(先对两个指标先分别计算出分层估

13、计,然后再构造比估计)十)分别比估计与联合比估计的比较1. 当各层 nh的都比较大时,各层比率 Rh之间差异比较大,此时分别比估计要优 于联合比估计;2.当某些层 nh的不够大时, 或者各层的比率 Rh差异较小 ,还是采用联合比估计更 有效些。3. 分别比估计需要知道各层的子总体辅助变量信息, 而联合比估计只需要知道总体辅助变量的信息。十一)样本量在各层的分配LV ( yst )Wh2h11 nhfh Sh2L Wh2Sh2L Wh Sh2h 1 nhh 1 N常数分配:即 nh1.层大小差不多,且没有任何关于层的其他信息2. 比例分配:即 nh nWh层大小有差异,且每层的方差不大Neyma

14、n分配:使 nh与WhSh成正比 ,即nh n WhSh3.WhSh每层估计量达到相同精度当Sh相等时,最优分配就是比例分配nh n WhSh/ chn NhSh / ch4.最优分配:WhSh / chWh Sh / chNhSh / ch考虑简单的线性费用函数:LC Tc0c h n hh1式中 CT是总费用, c0是与样本量无关的固定费用,而 ch是 在第 h层中抽取一个单元的平均费用 .(十二)总样本量的确定1. 调查目标是估计总体均值L W 2S2L W S2若V是给定的估计量 yst方差的上限,则有 VWh ShWhShh 1 nhh 1 N对某种分配 nh n wh,h 1,2,

15、., L2WhSh2Lh1V L Wh2Sh2 L WhSh2 1 L Wh2Sh2 h 1 nhh 1 N n h 1 wh(Wh2Sh2 / wh)估计总体均值估计总体总值(1)常数分配1wh L , h 1,2,., L设V?是给定的 Y?st的方差上限,则将V V?/ N 2代入L2h Nh2Sh2 / whLWhSh2h1nnn0n V?h NhSh2L1n0 V ( WhSh2 / N )Nh1(2)比例分配wh Wh , h 1, 2,., L(2)比例分配 wh Wh,h 1,2,., LL2WhSh2 h1Nh Nh Sh2nn0V?h NhSh2nLh1n0 V ( WhS

16、h2 / N )Nh13) Neyman 分配 whWhShLWhShh13) Neyman 分配wWhShwhLWhShh1L2WhShh1n 1 L 2VWhSh2Nh1n ( h NhSh )2 n V?h NhSh24)最优分配WhSh chWhSh / chh 1 h 1LVWhSh2 / Nh1(4)最优分配( hNhSh ch)( hNhSh / ch) nV?h NhSh2形式给出,即2将 V z2 置换前面各结果z /2将V ( z/2N) 置换前面各结果 z /2若精度是对 yst的绝对误差限 (在给定置信度若下精度) 是对 Y?st的绝对误差限 (在给定置信度下 ) 形式

17、给出,即形式给出,即将 V ( Y )2置换前面各结果 z /2Y将V ( Y )2 置换前面各结果z /2若精度是对 yst的相对误差限 (在给定置信度若下精度) 是对 yst的相对误差限 (在给定置信度下 ) 形式给出,即2. 调查目标是总体比例 P将 Sh2=PhQh 置换前面估计总体均值结果V V V3. opt prop srs四整群抽样(一)定义:整群抽样是将总体划分为若干群,然后以群为抽样单元,从样本中 随机抽取一部分群, 对选中的群的所有基本单元进行调查的一种抽样技术。 目的 主要是扩大抽样单位,简化组织工作。(二)特点:抽样框的编制简单;实施便利,节省费用;抽样误差相对较大。

18、 发挥整群抽样的优势, 因为其省时省力, 每个单元的平均调查费用比较少, 故可 通过增大样本量的方法弥补精度的损失。(三)群的划分:尽量扩大群内差异,而缩小群间差异。这样,每个群都具有足 够好的代表性。所以分群的原则使“群内差异大、群间差异小”与分层的原则使层内差异小,层间差异大”是恰好相反的。四)群的规模: 组成群的单元的数量。 其选择一是取决于精度与费用之间的平 衡,二是从抽样实施的组织管理等因素来考虑。五)等概率整群抽样的情形(群规模相等)总体群间方差:Sb2M(Yi Y )2 总体群内方差:Sw2 N(M1 1) iYij Yi样本群间方差:j总体方差:1 N M 2 1 n M 2S

19、2NM11 i jYijY 样本方差:s2nM11yijy 22Msbn1ni( yi y)2 样本群内方差:1 n M1n(M 1) i jn1、总体均值 Y 的估计 Y? y 1 Yi ni12、总体总和 Y 的估计 Y? NM y N Yi N y n i 1 n3、总体比例的估计P? p 1Pi1n i 1 nMnii11 f 1V( y) 1 f 12(Yi Y)2=1 f 1(Yi /M Y /M)2nM 2 N 1 i 1 i n N 1 i 1 i1fn N1 1 (Yi Y )n N 1i 1 i2 1 f nMv( y)1fnMV(Y?) V(NMy) N2M2V(y) v

20、(Y?) N2M 2v(y)n(Pi P) 2(Pi P?)V (P?) 1 f i 1V? (P?) 1 f i 1n N 1 n n 1 (六)设计效应仍用总体均值估计量的方差进行讨论, 并且考虑等概率抽样的情形。 由前面的分析可知, Y 的估计量 y 的方差为 V(y) 1 f S21 (M 1) C nM1f如果按简单随机抽样从总体中抽取 nM 个次级单元,则: Vsrs(y) 1nMf S2所以,整群抽样的设计效应为:DeffV (y) V srs(y) 1 f 21 f S21 (M 1) C nM1 f S2nM S221 (M 1) Csb swsb2 (M 1)sw2当 C

21、0时, Deff 1, 则整群抽样的精度较简单随机抽样在相同样本量时要差 当 c 0时, Deff 1,则整群抽样的精度较相同样本量的简单随机抽样要高若令nsrs为简单随机抽样的样本量,则 nsrs dMenff =x,即可达到整群抽样 nM户样本量 相同的估计精度。四多阶段抽样(一)定义:在总体各单位(初级单位 PSU)中抽取样本单位,在抽中的初级单 位中再抽取若干个第二级单位 (SSU),在抽中的第二级单位中再抽取若干个第三 级单位,直至从最后一级单位中抽取所要调查的基本单位的抽样组织形式, 就叫做多阶段抽样。(二)特点:便于组织抽样;可以使抽样方式更加灵活和多样化;能够提高估计 精度;可

22、以提高抽样的经济效益;可以为各级机构提供相应的信息。(三)适用范围:在社会研究中,当总体的规模特别大,或者总体分布的范围特 别广时,研究者一般采取多阶段抽样的方法来抽取样本。(四)基本假定:初级单元中所包含的次级单元数目相同,均为M,因此从抽中的初级单元中再抽取的次级单元个数也相同,为 m;两个阶段的抽样方法都是简 单随机抽样;在抽中的初级单元中作第二阶抽样是相互独立进行的。(五)分层抽样、整群抽样、二阶抽样的共同点及区别 共同点:都将总体分为若干子总体(层、群) 区别:分层抽样对总体中每个子总体(层)都进行抽样; 整群抽样对总体中被抽中的若干个子总体(群)进行普查; 二阶抽样对总体中被抽中的

23、若干个子总体(群)再进行抽样。(六)二阶抽样的效率 通常情况下,二阶抽样的设计效应大于 1。这说明二阶抽样的效率要低于简单抽 样,但是由于二阶抽样有着样本分布集中,可以省时、省力和省费用的优点,因 此从这个意义来讲,二阶抽样的效率就不一定低于简单随机抽样了。 二阶抽样效率通常低于分层抽样。二阶抽样的效率有时低于整群抽样,有时高于整群抽样(七)估计第一阶段和第二阶段的抽样比:f1 n / N , f2 m / M初级单元间的方差:1 N 2 1 n 2S121Yi Ys121yi y 2N 1i 1 n 1i 11m yiyijmj1M1 YY i ijM j 11 N 1 nY N1 i 1Y

24、i y 1ni 1 yi初级单元内的方差:nmN M 1 i1 j 1YijYi2 s22nm11 yijyi2iji 2nm1i 1 j 1 iji?1. 总体均值: Y?1 n1nmyin1myijnm i 1 j 11 f1V y 1nS121fnmvy1 f 1 2 s1f 1 1 f 2 2 s2nm2. P 1N1Pi NM1N1Aip 1nn1pi1ainm 1Vp1 f1 1 Nn N 1 121Pi P 2 1N nm N M 1 1 PiQif1nf1 1n n 1 1pi p 1 fn nm 1 1 piqi五不等概抽样(一)定义: 如果总体中每个单元进入样本的可能性是不

25、相等的,则这种随机 抽样方式就称为不等概率随机抽样,简称不等概率抽样。(二)特点:将总体中每个单元的入样概率与其 “规模”大小联系起来, 使得“大 单元”被抽到的概率大, “小单元”被抽到的概率小。(三)优点:能够大大提高抽样精度,减少抽样误差。(四)局限性:必须具有能够说明单元规模大小的辅助变量来确定各个单元的入 样概率或包含概率。(五)适用场合:总体单元之间的差异较大。(六)分类抽样容量 n 固定时,单元入样的概率(不放回抽样)或每次抽样的概率(有放 回抽样)与单元的大小严格成比例。这种情况下的有放回抽样称为PPS抽样, 不放回抽样称为 PS抽样。代码法(汉森赫维茨 (Hansen-Hur

26、witz) 法) PPS抽样:有放回抽样拉希里 (Lahiri) 法(二次抽取法)规模累积等距抽选法 PS抽样:不放回抽样Brewer(布鲁尔)方法( 1963)Durbin (德宾)方法( 1967) 代码法:它适合于 N不太大的情形。 假定所有 Mi 为整数 ( 若不然也可以乘以一个 倍数 M0,使一切 Mi= M0Zi成为整数),对于具有整数 Mi的第 i 个单元赋予一个与 Mi 相等的代码数。每次抽样前,先在整数 1,2, ,M0 里面随机等可能地选取一 个整数,设为 m,若代码 m属于第 j 个单元拥有的代码数,则第 j 个单元入样。 这个过程重复 n 次,得到 n 个单元入样(当然

27、存在重复的可能) ,构成了 pps 样 本。Lahiri 法:令 M max M i 每次抽取一个 1,N 中的随机数 i及1,M 中的随机数 m.1 i N i若 M i m,则第 i个单元入样;否则重抽一组 (i,m).七)汉森赫维茨 (Hansen-Hurwitz) 估计量(总量估计)Y?HH1nni1yiziv Y?HH1n n11Zyi Y?HHn n 1 i 1 Zinn n 1 i 1M0六系统抽样 (Systematic sampling)(一)定义:又称为等距抽样、机械抽样。按照这种抽样方法,从总体中抽取第 一个样本点(随机起点),然后按某种固定的顺序和规律依次抽取其余的样本

28、点, 最终构成样本。(二)优点:样本分布比较均匀,在现实生活中比较容易接受;样本单位抽取简 便,有很高适用价值;简便易行,简化抽样手续。(三)缺点: 如果单元的排列存在周期性的变化, 而抽样者对此缺乏了解或处理 经验,抽取的样本可能代表性很差。 系统抽样的方差很复杂, 对估计带来很大困 难。有时估计量是有偏的。抽样误差计算上比较复杂。(四)特点:系统抽样只需要抽取一个样本单位,然后按照某种规律,顺 次地得到整个样本。(五)抽样一般方法:直线等距抽样假设总体单元数为 N,样本容量为 n,N=nk。在 1-k 中随机抽出一个单元编 号,然后每隔 k 个单元编号抽取一个单元编号,直到抽出 n 个单元

29、编号为止。循环等距抽样(适用于 k 不为整数)抽样间距 k 取最接近 N/n 的整数 , 从 1N中随机抽取一个随机起点作为起 始单元 ,然后每隔 k 个抽取一个,直到抽取满 n 个为止。如果序号大于 N 时, 将其减去 N 得到的在 1 N 中的号码入选。(六)抽样方法改进中心位置法 起点不是随机取,而是直接取第一阶段的 k 个单元中处于中间位置的单元。K奇数, r=(k+1)/2 ;k偶数 ,r=k/2 或r=k/2+1 。虽然可以提高精度, 但对于一定顺序排列的总体, 样本是确定的, 失去了随 机性。尤其对同样问题进行连续性调查,样本老化,会带来较大不利影响。对称系统抽样当 N=nk且

30、n 为偶数时,将总体分为 n/2 组,每组含有 2k 个单元,在各段内 随机抽取与两端等距地两个单元作为样本, 一端靠近低端, 一端靠近高端。 假设 随机起点为 i(1 i k) ,入样单元: i 2jk,2 j 1 k i 1 j 0,1,2, ,n 1( 七 ) 等概系统抽样(即等距抽样)估计量的性质1. Y 的估计量均值 ysy yryrjnj1当 N=nK,y sy为Y 的无偏估计量,当 N nK, ysy为Y 的有偏估计量Y 的估计量方差2 1 k 2V(ysy) E(ysy Y)2 k1r 1(yr Y)21nf s2 NnNnn11(yi ysy)2n nN n 1 i 1反映

31、sy 与 SRS关系的方差计算公式:kkV(ysy)(yr Y)2,又有r1kn2 1 2S2(yrj Y)2N 1 r 1 j 1kn22(N 1)S2(yrj Y) 2r1j1k k n2=n(yr Y)2(yrjr 1 r 1 j1knyr)2=nkV (ysy)(yrjyr)2r1j11)kn令 Sw2sy1 (yrjwsy rjk(n 1) r 1 j 1yr ) 2 (系统样本内方差)kn则将 k(n 1)Sw2sy(yrj yr)2代入(1)式r 1j 12便有:(N 1)S2 nkV(ysy) k(n 1)Sw2sy ,得: V ( ysy ) (N N1)Sk(nN 1)Sw

32、2sy22Nn系统抽样优于简单随机抽样的条件为 : (N 1)S K(n 1) Sw2sy N n S即(N N1)SNNn SnK(nN 1)Sw2sy,所当:k(n 1)Sw2sy (N 1) N nS2 k(n 1)S2 ,就是 Sw2sy S2,sy 效率高于 SRS。 n当总体单元的排列顺序与要研究的总体特征总量的大小高度相关, 不管是正 相关还是负相关, 则系统抽样更接近于分层抽样; 当总体单元的排列顺序与要研 究的总体特征变量的大小相关程度极低时,则系统抽样更接近于简单随机抽样; 当总体单元的排列顺序与要研究的总体特征变量的大小相关程度介乎于两者之 间,则很难知道系统抽样到底与其

33、他三种抽样方式的哪一种更相似。 附:考试范围抽样技术期末复习提纲第一章 绪论1、了解抽样调查的意义、特点、发展历史、应用及分类组织。2、理解和掌握总体、样本、抽样框、样本可能数目的基本概念。3、理解和掌握概率抽样与非概率抽样的区别,抽样误差与非抽样误差的区别与 联系等。4、系统地掌握和熟练地应用统计量的抽样分布、抽样误差的计算、抽样估计的 方法和步骤、抽样设计效果的评价等问题。第二章 简单随机抽样1、理解简单随机抽样的概念、地位和特点。2、熟练地掌握简单随机抽样的具体方法、总体均值、总量、比例的估计方法以 及样本容量的确定方法等并能够熟练应用。3、熟练掌握比率估计的构造定义。第三章 分层随机抽

34、样 1、理解分层抽样的概念与特点。 2、熟练掌握分层抽样的原则、特点、估计的方法。3、深入理解分层抽样中总样本量在各层间分配的方法。4、了解分层随机样本中的比率估计的构造。第四章 整群抽样与多阶段抽样 1、了解整群抽样的原则、特点、适用场合。2、掌握群规模相等时整群抽样的方法及对总体指标的估计方法。3、理解抽样效果与样本容量的分析确定方法,分清整群抽样与分层随机抽样的 区别。4、了解多阶段抽样的原则、特点及适用场合。5、了解初级单元相等时两阶段抽样中对总体指标的估计方法。第五章 不等概抽样 1、理解并掌握不等概率抽样的意义、特点、实施方法。2、熟练掌握 PPS抽样条件下估计量及其误差计算。3、

35、了解不放回不等概抽样的概念。第六章 系统抽样1、理解和掌握等距抽样的特点与实施方法。2、熟练掌握总体单元随机排列情形,总体参数的估计以及估计量方差的估计方 法。附:练习题简单随机抽样:为调查某 5443 户城镇居民服装消费情况,采用简单随机不重复抽样调查了 36 户进行调查,得到平均消费支出 y 649.72元, s2 304803试根据此估计:( 1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。( 2)如果希望服装平均消费支出的相对误差限不超过 5%,则样本量至少应为多 少? 解: N 5443, n 36, y 649.72,s2 304803,t 1.96n ? 1 f

36、 2(1) f 0.66%, Y Ny N t s2 NnY? N y 3536425.96 v( y) 1 f s2 8410.8695 nv(Y?) N2 v(y)SE(Y?) 4991.814 33区间为: (2558029 .55,4514822.37)22(2)r 5%, nn0 , n t s, n02 21 n0 0 r 2Y 2 N根据题中相关数据可得 n0 1110 户,由此可得 n 922户。要满足相应的精度要 求,至少得抽 922 户做样本。简单随机抽样(比例) :某地区 10000 名群众,现欲估计在拥有本科学历及以上的群众所占的比例, 随机 不重复抽取了 300 名群

37、众进行调查,得到 p 0.25 ,试估计该地区群众拥有本科 以上学历的比例,并以正态分布近似给出其 95%的置信区间。解: N 10000, n 300, f n 0.03, p 0.25,t 1.96 Nv( p) 1 f p (1 p) 6.08 10 4n1SE(p) 0.0247所以本科生中暑假参加培训班的 95%的置信区间为: p t SE(p) 25% (1.96 0.0247) 25% 0.0484 即(0.2016,0.2984)分层随机抽样:对某地区 171 980 户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和 乡村将居民划为 2 层,每层按简单随机抽样抽取 300户,经整理得如下数据:层NhyhWhsh城镇23560151800.1372972乡8632546试根据此估计:( 20 分)( 1)居

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论