抽样调查期中习题(答案)重点讲义资料_第1页
抽样调查期中习题(答案)重点讲义资料_第2页
抽样调查期中习题(答案)重点讲义资料_第3页
抽样调查期中习题(答案)重点讲义资料_第4页
抽样调查期中习题(答案)重点讲义资料_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.

《抽样调查》期中习题一、 选择题

1.(B )是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元2.抽样调查的根本功能是(C)

A.获取样本资料

B.计算样本资料

C.推断总体数量特征

D.节约费用

3.概率抽样与非概率抽样的根本区别是(B)

A.是否能保证总体中每个单位都有完全相同的概率被抽中

B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差

D.是否能计算和控制抽样误差

4.与简单随机抽样进行比较,样本设计效果系数Deff>1表明(A) A.所考虑的抽样设计比简单随机抽样效率低

B.所考虑的抽样设计比简单随机抽样效率高

C.所考虑的抽样设计与简单随机抽样效率相同

D.以上皆错。5.优良估计量的标准是(B)

A.无偏性、充分性和一致性

B.无偏性、一致性和有效性

C.无误差性、一致性和有效性

D.无误差性、无偏性和有效性

6.抽样标准误差的大小与下列哪个因素无关(C ) A.样本容量B.抽样方式、方法

C.概率保证程度D.估计量

7.抽样标准误差与抽样极限误差之间的关系是(B)A.SE(ˆ)B.tSE()C.ˆtSE(ˆ)D.SE(ˆ)t8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成(A)关系

A.正比例B.反比例C.负相关D.以上皆是9.能使V(ylr)1f(SY2SX2SYX)达到极小值的值为(B)nA.SYSX S

YXB.S

S YX2C.XS S2SYX2D.SYXY X10.某县欲估计今年的小麦总产量,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到y118.63吨,这些村去年的产量平均为x104.21吨。用比率估计方法估计今年该地区小麦总产量为(B )。A.12820.63B.14593.96C.12817.83D.14591.49..11.在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应 deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C)。A.375B.540C.240D.36012.抽样框最直接反映的是(C)A.目标总体B.实际总体C.抽样单元D.基本单元13.在给定费用下使估计量的方差达到最小,或者对于给定的估计量方差使得总费用达到最小的样本量分配为(C)A.常数分配B.比例分配C.最优分配D.梯次分配14.分层抽样也常被称为(D)A.整群抽样B.系统抽样C.组合抽样D.类型抽样15.非概率抽样与概率抽样的主要区别为(D)

A.适用的场合不同B.总体特征值的估计不同 C.样本量的确定不同D.抽样时是否遵循随机原则16.分层抽样中的层的划分标准为(B)。A.尽可能使层间的差异小,层内的差异大

B.尽可能使层间的差异大,层内的差异小

C.尽可能使层间的差异大,层内的差异大

D.尽可能使层间的差异小,层内的差异小二、判断题

×1.总体比率与总体比例两者是一样的概念,只是符号不同。( )

√2.比估计量是有偏估计量。( )

×3.分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。( )×4.对于同一总体,样本容量同抽样标准误差之间是正相关关系。( )×5.设总体容量为N,样本容量为n,采用有顺序放回简单随机抽样,样本配合种数为C N。( n )×6.一个调查单位只能对接与一个抽样单位。( )

√7.营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。( )

√8.当调查单位的抽样框不完整时,无法直接实施简单随机抽样。( )

)√9

分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。(×10 分层的基本原则是尽可能地扩大层内方差,缩小层间方差。( )

√11 分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。( )

√12 分层抽样克服了简单随机抽样可能出现极端的情况。( )

√13 分层抽样的样本在总体中分布比简单随机抽样均匀。( )

)×14 分层后各层要进行简单随机抽样。(

√15 分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。( )

√16

分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多 )抽一些样本。(

√17在不同的层中每个单位的抽样费用可能是不等的。( )

×18 在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。( )

有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。( )√19

×20 比例分配指的是按各层的单元数占样本单元数的比例进行分配。( )..√21 所谓最优分配是指给定估计量方差的条件下,使总费用最小。( )

√22 在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。( )

在实际工作中如果第k层出现kn超过kN,最优分配是对这个层进行100%的抽样。( )√23√24 在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。( )

)×25

无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。(×26 即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。( )×27.在任何条件下,估计量的方差都与估计量的均方差相等,因此一般所讲的估计误差也就是指估计量的方差。( )

)×28.估计抽样误差时,在各种抽样技术条件下都可以用样本方差代替总体方差。(×29.比估计就是比例估计。( )

×30.比估计与回归估计都充分利用了有关辅助变量,因此一般情况下都较简单估计的精度要高。( )三、名词解释1.PPS抽样2.概率抽样3.不等概率抽样4.πPS抽样的Brewer方法四、计算题

1、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N=1000户,调查了n=100户,得y=12.5吨,s=1252,有40户用水超过了规定的标准。要求计算:

○1该住宅区总的用水量及95%的置信区间;

○2若要求估计的相对误差不超过10%,应抽多少户作为样本?○3以95%的可靠性估计超过用水标准的户数;解:已知N=1000,n=100,fn N100 10000.1,y=12.5,s21252○1估计该住宅区总的用水量Y为:ˆY=Ny=100012.5=12500估计该住宅区总的用水量Y的方差和标准差为:v(Y)=Nv(y)=N2ˆ1-fs1000210.11252=11268000n100s(Y)=v(Y)ˆ ˆ112680003356.7842因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:..Y ts(Y)=125001.963356.784212500 6579即,我们可以以95%的把握认为该住宅总的用水量在5921吨~19079吨之间。○2根据题意,要求估计的相对误差不超过10%,即r≤0.1,假定置信度为95% t2s2 1.9621252

根据公式:n 30780 ry2 0.112.5由于n0N 3.0780.05,所以需要对n0进行修正:n 3078n=0 7551 n01+3.078N若要求估计的相对误差不超过10%,应抽不少于755户作为样本。○3以95%的可靠性估计超过用水标准的户数;令超过用水标准的户数为A,样本中超过用水标准的户数为a=40,估计超过用水标准的比例P为:p=a4040%n100估计超过用水标准的比例P的方差和标准差为:v(p)1f n 1pq10.140%60%0.0021821001s(p)v(p)0.0021824.67%在95%的可靠性下,超过用水标准的比例P的估计区间为:pts(p)40%1.964.67%因此,我们有95%的把握认为,超过用水标准的比例P在30.85%49.15%之间,超过用水标准的户数的点估计为:100040% 400户,超过用水标准的户数在100030.85%户~100049.15%户之间,即309户~492户之间。2、(内曼分配和按比例分配的均值和比例估计)有下列数据设n1000层Wysphhhh10.353.120.5420.553.93.30.3930.17.811.30.24○1采用按比例分层抽样的方法估计Y和P并计算其标准误;○2采用奈曼分配的方法估计Y和P并计算标准误;..解:○1根据题中已知条件,采用按比例分层抽样的方法估计Y为:y L

stWhyh0.353.10.553.90.17.84.01h1估计Y的方差和标准误差为:v(yst)n1fWLhS2h 10001(0.35220.553.320.111.32)0.0201585h1s(yst)v(yst)0.02015850.141981估计P及其方差和标准误差为:ppropWhph0.350.540.550.390.10.240.4275h1v(pprop)

1fn

Wpqh h h 10001(0.350.540.460.550.390.610.10.240.76)0.000218h1s(pprop)v(pprop)0.0002180.014765○2采用Neyman分配的方法估计Y和P的方法和与○1是一样的,即ystWhyh0.353.10.553.90.17.84.01h1ppropWhph0.350.540.550.390.10.240.4275h1但是采用Neyman分配估计Y和P的方差的方法不同,分别为:v(yst)n1(WhSh)WN hSh10001 (0.3520.553.30.111.3)20.013286h1 h1s(yst)v(yst)0.0132860.115265v(pprop)n1(Whphqh)21000

1(0.350.540.460.550.390.610.10.240.76)0.000236h1s(pprop)v(pprop)0.0002360.0153623、(比率估计)某养兔场共有100只兔子,上月末称重一次对每只兔的重量作了纪录,并计算平均重量为3.1磅,一个月后随机抽取10只兔子标重如下:序1322.932.842.853.16373.282.9910号上3.2次2.8本4.1次44.13.93.74.14.24.13.93.9○1估计这批兔子较上月末增重的比率及其标准误差;..○2估计现有兔子的平均重量及其标准误差;○3将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。解:○1已知:N=100,n=10,设X,Y分别代表上月兔子总重量和本月兔子总重量,则X=3.1,f=n100.1。N100由表中数据可得:y=101 yi4,x= 101 xi2.97i=1 i=12sy10-11 (yiy)20.0222i1s2x 10-11 (xix)20.0246i1syx10-11 (xix)(yiy)0.015i1因此,对这批兔子较上月末增重的比率估计为:R=x

ˆy2.97

41.3468Rˆ方差的估计为:v(R)ˆ1f(s2Rˆ2s22Rs )10.1(0.02221.346820.024621.34680.015)0.0002474Rˆ标准误nX2 y x yx 10(3.1)2差的估计为:s(R)=ˆv(R)ˆ0.00024740.015729○2对现有兔子的平均重量的比率估计为:yR=RX=1.34683.14.17508ˆyR方差的估计为:v(yR)1f(s2n yRsˆ22x2Rsˆ yx)10.110

(0.02221.346820.024621.34680.015)0.0023775yR标准误差的估计为:s(yR)= v(yR) 0.00237750.04876○3对现有兔子的平均重量的均值估计为:y=110

yi410i=1y方差的估计为:v(y)1fsy10.10.02220.001998n10..因此,得到现有兔子平均重量的比率估计量设计效应的估计为:deff=v(yR) v(y)=0.0023775 0.0019981.1899对于本问题,均值估计方法的效率比比率估计方法的效率要高。原因是:比率估计是有偏的,当样本量足够大时,估计的偏倚才趋于零,而本问题中的样本量较小,使用比率估计量时不能忽视其偏倚,所以无法保证估计的有效,使得估计效率比均值估计方法的效率低。 4、对某地区171980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下数据:层NhyhWhsh城镇23560151800.1372972乡8632546试根据此估计:

(1)居民平均收入及其95%的置信区间。(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少? 2解:(1)由题中相关数据资料:ystWh1hyh10585.39(元) 2v(yst)W(1fh)S2h

n

h545.571816059.736416605.3082(元)h1se(Yst)128.86(元/户),t1.96该地区居民平均收入的95%的置信区间为:Ysttse(Yst)(10332.82,10837.96)元 (2)按比例分配:n1nW16000.13782(户)n2nW26000.863518(户)按奈曼分配:nhnWL hShWhSh1407.164,W2S 2

22197.198,WhSh2604.362h1由表中资料:n600,W1Sh1由上可得根据奈曼分配,各层所需样本容量为:..n16002604.362407.16494n26002604.3622197.1985065、某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下:本地区本省外地外省区N1154N293N353S23.24

3S22.251S23.24C336C19C225若要求估计评价成绩均值的方差V(yst)0.1,并且费用最省(假定费用为线性形式),求样本量n在各层的分配。解:n(NNSyii/CstN

i)(Nii

ii

2

Ci)=126.382102.49000819.54

27.0628(Nii/ Ci)N2S2ystNii2(Nii/ Ci)=1541.53 931.85

531.86

126.38Ni i Ci)=154*1.5*393*1.8*553*1.8*62102.4N2S2yst=30020.129000 N2i i=154*2.2593*3.2453*3.24819.54n1nNN1i

1/i/

CC

1i)

28126.387717.05917n2nNN2i

2/i/

CC

2i)

28126.38

33.487.427n3nNN3i

3/i/

CC

3i)

28126.3815.93.5234即各层的样本量分别为17、7、4.. 6、一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。农场规模(英农场数Nh平均每一农场的玉米面积标准差Sh亩)Yh0—403945.48.341—8046116.313.381—12039124.315.1121—16033434.519.8161—20016942.124.5201—24011350.126.024114863.835.2201026.3--总和或均值现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:(1)按比例分配时,各层的样本量为多少?(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)解:(1)比例分配:根据表中所给的数据,利用公式nhnNh直接可计算出各层样本量: Nn120,n223,n319,n417,n58,n66,n77(2)最优分配:当各层的单位调查费用相等时,最优分配样本量计算公式为:nhnNhShNShhh1同样将表中的相关数据代入公式即可求出此时各层的样本量为:n110,n218,n317,n419,n512,n69,n7157、某县欲调查某种农作物的产量,由于平原、丘陵和山区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论