抽样调查期中习题(答案)重点讲义资料_第1页
抽样调查期中习题(答案)重点讲义资料_第2页
抽样调查期中习题(答案)重点讲义资料_第3页
抽样调查期中习题(答案)重点讲义资料_第4页
抽样调查期中习题(答案)重点讲义资料_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 抽样调查 期中习题 一、 选择题 1. ( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 2. 抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 3. 概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 4. 与简单随机抽样进行比较,样本设计效果系数Deff 1表明( A ) A.所考虑的抽样设计比简单随机抽样

2、效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆错。 5. 优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 6抽样标准误差的大小与下列哪个因素无关( C ) A样本容量 B抽样方式、方法 C概率保证程度 D估计量 7. 抽样标准误差与抽样极限误差之间的关系是( B ) A.?)?(SE? B.)?(?tSE? C.?)?(tSE? D.tSE)?(? 8. 应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A

3、 )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9. 能使)2(1)(222YXXYlrSSSnfyV?达到极小值的?值为( B ) A.YXXYSSS? B.2XYXSS C.2YYXSS D.XYXSS2 10. 某县欲估计今年的小麦总产量,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118?y 吨,这些村去年的产量平均为21.104?x吨。用比率估计方法估计今年该地区小麦总产量为( B ) 。 A.12820.63 B.14593.96 C.12817.83 D.14591.49 2 11. 在要求的精度水平下,不考虑其他因素的影响

4、,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为( C )。 A.375 B.540 C.240 D.360 12. 抽样框最直接反映的是( C ) A.目标总体 B.实际总体 C.抽样单元 D.基本单元 13. 在给定费用下使估计量的方差达到最小,或者对于给定的估计量方差使得总费用达到最小的样本量分配为( C ) A. 常数分配 B.比例分配 C. 最优分配 D.梯次分配 14. 分层抽样也常被称为( D ) A.整群抽样 B.系统抽样 C.组合抽样 D.类型抽样 15. 非概率抽样与概率抽样的主要区别为(

5、D ) A. 适用的场合不同 B. 总体特征值的估计不同 C. 样本量的确定不同 D. 抽样时是否遵循随机原则 16. 分层抽样中的层的划分标准为( B )。 A.尽可能使层间的差异小,层内的差异大 B.尽可能使层间的差异大,层内的差异小 C.尽可能使层间的差异大,层内的差异大 D.尽可能使层间的差异小,层内的差异小 二、判断题 1.总体比率与总体比例两者是一样的概念,只是符号不同。( ) 2.比估计量是有偏估计量。( ) 3.分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。( ) 4.对于同一总体,样本容量同抽样标准误差之间是正相关关系。( ) 5.设总体容量为N,样本容量为n,

6、采用有顺序放回简单随机抽样,样本配合种数为nNC。( ) 6一个调查单位只能对接与一个抽样单位。( ) 7. 营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。( ) 8. 当调查单位的抽样框不完整时,无法直接实施简单随机抽样。( ) 9 分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。( ) 10 分层的基本原则是尽可能地扩大层内方差,缩小层间方差。( ) 11 分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。( ) 12 分层抽样克服了简单随机抽样可能出现极端的情况。( ) 13 分层抽样的样本在总体中分布比简单随机抽样均匀。( ) 1

7、4 分层后各层要进行简单随机抽样。( ) 15 分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。( ) 16 分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。( ) 17 在不同的层中每个单位的抽样费用可能是不等的。( ) 18 在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。( ) 19 有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。( ) 20 比例分配指的是按各层的单元数占样本单元数的比例进行分配。( ) 3 21 所谓最优分配是指给定估

8、计量方差的条件下,使总费用最小。( ) 22 在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。( ) 23 在实际工作中如果第k层出现kn超过kN,最优分配是对这个层进行100%的抽样。( ) 24 在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。( ) 25 无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。( ) 26 即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。( ) 27在任何条件下,估计量的方差都与估计量的均方差相等,因此一般所讲的估计误差也就是指

9、估计量的方差。( ) 28估计抽样误差时,在各种抽样技术条件下都可以用样本方差代替总体方差。 ( ) 29比估计就是比例估计。 ( ) 30比估计与回归估计都充分利用了有关辅助变量,因此一般情况下都较简单估计的精度要高。( ) 三、名词解释 1. PPS抽样 2. 概率抽样 3. 不等概率抽样 4. PS抽样的Brewer方法 四、计算题 1、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N=1000户,调查了n=100户,得y=12.5吨,2s=1252,有40户用水超过了规定的标准。 要求计算: 1该住宅区总的用水量及95%的置信区间; 2若要求估计的相

10、对误差不超过10%,应抽多少户作为样本? 3以95%的可靠性估计超过用水标准的户数; 解:已知N = 1000,n = 100,n100f0.1N1000?,2y=12.5s1252?, 1估计该住宅区总的用水量Y为: ?Y=Ny=100012.5=12500? 估计该住宅区总的用水量Y的方差和标准差为: 22221-f10.1?v(Y)=Nv(y)=Ns10001252=11268000n100?s(Y)=v(Y)112680003356.7842? 因此,在95%的置信度下,该住宅总的用水量的置信区间估计为: 4 ?Yts(Y)=125001.963356.7842125006579? 即

11、,我们可以以95%的把握认为该住宅总的用水量在 5921吨19079吨之间。 2根据题意,要求估计的相对误差不超过10%,即r0.1,假定置信度为95% 根据公式:22202222ts1.961252n3078ry0.112.5? 由于0n3.0780.05N?,所以需要对0n进行修正: 00n3078n = 755n1+3.0781N? 若要求估计的相对误差不超过10%,应抽不少于755户作为样本。 3以95%的可靠性估计超过用水标准的户数; 令超过用水标准的户数为A,样本中超过用水标准的户数为a = 40,估计超过用水标准的比例P为: a40p = 40%n100? 估计超过用水标准的比例

12、P的方差和标准差为: 1f10.1v(p)pq40%60%0.002182n11001s(p)v(p)0.0021824.67%? 在95%的可靠性下,超过用水标准的比例P的估计区间为: pts(p)40%1.964.67%? 因此,我们有95%的把握认为,超过用水标准的比例P在30.85I.15%之间,超过用水标准的户数的点估计为:100040%400?户,超过用水标准的户数在100030.85%?户100049.15%?户之间,即309户492户之间。 2、(内曼分配和按比例分配的均值和比例估计)有下列数据 层 hW hy hs hp 1 0.35 3.1 2 0.54 2 0.55 3.

13、9 3.3 0.39 3 0.1 7.8 11.3 0.24 设1000?n 1采用按比例分层抽样的方法估计Y和P并计算其标准误; 2采用奈曼分配的方法估计Y和P并计算标准误; 5 解:1根据题中已知条件,采用按比例分层抽样的方法估计Y为: Lsthhh1yWy0.353.10.553.90.17.84.01? 估计Y的方差和标准误差为: L2222sthhh1stst1f1v(y)WS(0.3520.553.30.111.3)0.0201585n1000s(y)v(y)0.02015850.141981? 估计P及其方差和标准误差为: Lprophhh1Lprophhhh1proppropp

14、Wp0.350.540.550.390.10.240.42751f1v(p)Wpq(0.350.540.460.550.390.610.10.240.76)0.000218n1000s(p)v(p)0.0002180.014765? 2采用Neyman分配的方法估计Y和P的方法和与1是一样的,即 Lsthhh1Lprophhh1yWy0.353.10.553.90.17.84.01pWp0.350.540.550.390.10.240.4275? 但是采用Neyman分配估计Y和P的方差的方法不同,分别为: LL222sthhhhh1h1ststL2prophhhh1prop111v(y)(W

15、S)WS(0.3520.553.30.111.3)0.013286nN1000s(y)v(y)0.0132860.11526511v(p)(Wpq)(0.350.540.460.550.390.610.10.240.76)0.000236n1000s(p)?propv(p)0.0002360.015362? 3、(比率估计)某养兔场共有100只兔子,上月末称重一次对每只兔的重量 作了纪录,并计算平均重量为3.1磅,一个月后随机抽取10只兔子标重如下: 序号 1 2 3 4 5 6 7 8 9 10 上次 3.2 3 2.9 2.8 2.8 3.1 3 3.2 2.9 2.8 本次 4.1 4

16、4.1 3.9 3.7 4.1 4.2 4.1 3.9 3.9 1估计这批兔子较上月末增重的比率及其标准误差; 6 2估计现有兔子的平均重量及其标准误差; 3将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。 解:1已知:N = 100 ,n = 10 ,设X,Y分别代表上月兔子总重量和本月兔子总重量,则 X = 3.1,n10f = 0.1N100?。 由表中数据可得: 1010iii=1i=11022yii11022xii110yxiii111y = y4 x = x2.9710101s(yy)0.022210-11s(xx)0.024610-11s(xx)(yy)0.015

17、10-1?, 因此,对这批兔子较上月末增重的比率估计为: y4?R = 1.3468x2.97? ?R方差的估计为: 2222yxyx221f10.1?v(R)(sRs2Rs)(0.02221.34680.024621.34680.015)0.0002474nX10(3.1)?R标准误差的估计为: ?s(R) = v(R)0.00024740.015729? 2对现有兔子的平均重量的比率估计为: R?y = RX=1.34683.14.17508? Ry方差的估计为: 2222Ryxyx1f10.1?v(y)(sRs2Rs)(0.02221.34680.024621.34680.015)0.0

18、023775n10? Ry标准误差的估计为: RRs(y) = v(y)0.00237750.04876? 3对现有兔子的平均重量的均值估计为: 10ii=11y = y410? y方差的估计为: 2y1f10.1v(y)s0.02220.001998n10? 7 因此,得到现有兔子平均重量的比率估计量设计效应的估计为: Rv(y)0.0023775?deff = =1.1899v(y)0.001998? 对于本问题,均值估计方法的效率比比率估计方法的效率要高。原因是:比率估计是有偏的,当样本量足够大时,估计的偏倚才趋于零,而本问题中的样本量较小,使用比率估计量时不能忽视其偏倚,所以无法保证估

19、计的有效,使得估计效率比均值估计方法的效率低。 4、对某地区171980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居 民划为2层,每层按简单随机抽样抽取300户,经整理得如下数据: 层 hN hy hW hs 城镇 23560 15180 0.137 2972 乡村 148420 9856 0.863 2546 试根据此估计: (1)居民平均收入及其95%的置信区间。 (2)若是按比例分配和奈曼分配时,各层样本量分别应为多少? 解:(1) 由题中相关数据资料:元)(39.1058521?hhhstyWy (元)3082.166057364.160595718.545)1()(

20、2212?hhhhhst nSfWy户),元/(86.128)(?stYse96.1?t 该地区居民平均收入的95%的置信区间为: 元)96.10837,82.10332()(?ststYsetY (2)按比例分配: 户)(82137.060011?Wnn 户)(518863.060022?Wnn 按奈曼分配: ?LhhhhhhSWSWnn1 由表中资料:362.2604,198.2197,164.407,600212211?hhhSWSWSWn 由上可得根据奈曼分配,各层所需样本容量为: 8 94362.2604164.4076001?n 506362.2604198.21976002?n

21、5、某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下:本地外15?N 932?N 533?N 25.221?S 24.322?S 24.323?S 91?C 252?C 363?C 若要求估计评价成绩均值的方差1.0)(?styV,并且费用最省(假定费用为线性形式),求样本量n在各层的分配。 解:?222)(/(iistiiiiiiNySNCNCNn?=2806.2754.81990004.210238.126? ?222)/(iistiiiNySNCN? ?)/(iiiCN?=38.12

22、668.15358.19335.1154? ?)iiiCN?=4.21026*8.1*535*8.1*933*5.1*154? ?stySN22=90001.030022? ?2iiN?=54.81924.3*5324.3*9325.2*154? 17059.1738.1267728)/1111?iiiCNCNnn? 742.738.12648.3328)/2222?iiiCNCNnn? 4523.338.1269.1528)/3333?iiiCNCNnn? 即各层的样本量分别为17、7、4 9 6、 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下 表中。 农场

23、规模(英亩) 农场数hN 平均每一农场的玉米面积hY 标准差hS 040 4180 81120 121160 161200 201240 241? 394 461 391 334 169 113 148 5.4 16.3 24.3 34.5 42.1 50.1 63.8 8.3 13.3 15.1 19.8 24.5 26.0 35.2 总和或均值 2010 26.3 - 现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问: (1)按比例分配时,各层的样本量为多少? (2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等) 解:(1)比例分配: 根据表中所给的数据,利用公式hhNnnN?直接可计算出各层样本量: 123456720,23,19,17,8,6,7nnnnnnn? (2)最优分配: 当各层的单位调查费用相等时,最优分配样本量计算公式为: 1hhhLhhhNSnnNS? 同样将表中的相关数据代入公式即可求出此时各层的样本量为: 123456710,18,17,19,12,9,15nnnnnnn? 7、 某县欲调查

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论