《抽样技术复习题》_第1页
《抽样技术复习题》_第2页
《抽样技术复习题》_第3页
《抽样技术复习题》_第4页
《抽样技术复习题》_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 抽样技术期末复习1、设计效应(Deff)答:设计效应(deff)是由基什提出的,用来对不同抽样方法进行比较,其定义为:deffV(y)为不放回简单随机抽样简单估计量的方差Y(y)为某个抽V(y)srssrs样设计在同样样本量条件下估计量的方差。设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果deff1,则所考虑的抽样设计比比简单随机抽样的效率低。deff对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量*比较容易得到,如果可以估计复杂抽样的deff,那么复杂抽样所需的样本量为:n=n,deffo2、概

2、率抽样答:概率抽样也称随机抽样。概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。(2)每个单元被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。因此,概率抽样可以排除调查者的主观影响,抽选出较其他方

3、法更具代表性的样本。3、非抽样误差答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。同抽样误差相比,非抽样误差有如下特点:(1)非抽样误差不是由于抽样的随机性带来的,所以在抽样调查中,它不可能随着样本量的增大而减小。(2)在抽样调查中,由于非抽样误差的影响,往往造成估计量的有偏。(3)有些非抽样误差难以识别和测定。(4)产生非抽样误差的渠道众多,成因复杂,对调查数据质量和估计结果的负面影响非常大。非抽样误差按其来源、性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。4、不等概率抽样答:不等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就

4、成为等概率的抽样。不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。5、最优分配答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。6、比率估计答:比率估计(radioestimator)又称比估计,在进行抽样调查时,目标量本身就是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计

5、量的精度,它是有偏的。7、试述分别比估计和联合比估计的比较答:如果每一层都满足比率估计量有效的条件,则除非Rr,都有分别比率估计量的h方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实际使用时,如果各层的样本量都较大,且有理由认为各层的比率R差异较大,则分别h比率佑计优于联合比率估计。当各层的样本量不大,或各层比率R差异很小,则联合比率估h计更好些。8、试述设计效应在抽样设计中的应用。答:设计效应(designeffect,简称deff)是指在相同样本量的条件下,采用特定的抽样设计(一般为较复杂的

6、抽样设计)与不放回简单随机抽样简单估计量的方差之比,如果deff1,则所考虑的抽样设计比简单随机抽样的效率低。设计效应是抽样调查中的一个重要参数,它可以表明特定抽样设计的估计效率;如果有设计效应的经验数据,也可以用于确定不同调查方式所需要的样本量,从而大大节约计算样本量的时间,因此倍受抽样调查设计人员的关注。9、有人认为“总体愈大,应抽的样本量也愈大”,请对此加以评价。答:这种说法是不正确的。因为,虽然在其他条件相同的条件下,样本量越大,抽样误差越小,但是从抽样误差与样本量的关系图可以看出,抽样误差在开始时随着样本量的增大而显著减小,但经过一定阶段后便趋于稳定。也就是说,经过一定阶段后,用增大

7、样本量的方式减少抽样误差一般是不合算的。当样本增大到一定能够程度,无论总体再大,抽样的精度都差不多。所以,这种说法是不正确的。10、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N=1000户,调查了n=100户,得y=12.5吨,s2=1252,有40户用水超过了规定的标准。要求计算:该住宅区总的用水量及95%的置信区间;0若要求估计的相对误差不超过10%,应抽多少户作为样本?以95%的可靠性估计超过用水标准的户数;解:已知N=1000,n=100,f=上=I0!=0.1,y=12.5,s2=1252N1000M古计该住宅区总的用水量Y为:Y=Ny=100

8、012.5=12500估计该住宅区总的用水量Y的方差和标准差为:八1-f1一01v(Y)=N2v(y)=N2s2,10002x1252=11268000n100s(Y)=:VY)=11268000沁3356.7842因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:Yts(Y)=125001.96x3356.7842125006579即,我们可以以95%的把握认为该住宅总的用水量在5921吨19079吨之间。2根据题意,要求估计的相对误差不超过10%,即r0.1,假定置信度为95%根据公式:n,竽,1.962x1252沁30780r2y20.12x12.52由于春,3.0780.05

9、,所以需要对*进行修正:n3078n=0,沁7551丄n1+3.0781+0_N若要求估计的相对误差不超过10%,应抽不少于755户作为样本。3以95%的可靠性估计超过用水标准的户数;令超过用水标准的户数为A,样本中超过用水标准的户数为a=40,估计超过用水标准的比例P为:a40p=,40%n100估计超过用水标准的比例P的方差和标准差为:v(p),!一01x40%x60%沁0.002182100一1s(p),戶p).0.002182沁4.67%在95%的可靠性下,超过用水标准的比例P的估计区间为:pts(p),40%1.96x4.67%因此,我们有95%的把握认为,超过用水标准的比例P在30

10、.85%49.15%之间,超过用水标准的户数的点估计为:1000 x40%,400户,超过用水标准的户数在1000 x30.85%户1000 x49.15%户之间,即309户492户之间。12、(内曼分配和按比例分配的均值和比例估计)有下列数据层WysPhhhh10.353.120.5420.553.93.30.3930.17.811.30.24设n,1000采用按比例分层抽样的方法估计Y和P并计算其标准误;0采用奈曼分配的方法估计Y和P并计算标准误;解:並根据题中已知条件,采用按比例分层抽样的方法估计Y为:yLwy0.35X3.1,0.55x3.9,0.1x7.8=4.01sthhh1估计Y

11、的方差和标准误差为:v(y)=廿艺WS2(0.35X22+0.55x33+0.1x11.3)0.0201585stnhh1000h=1s(y)=.v(y)=耳0.020158*0.141981Stst估计P及其方差和标准误差为:p=Wp=0.35X0.54,0.55X0.39,0.1x0.24=0.4275prophhh=1v(p)u巴Hwpq丄(0.35x0.54x0.420.55x0.39x0.61+0.1x0.24x0.76)0.000218propnhhh1000h=1s(p)=;V(=0.0002180.014765propprop2采用Neyman分配的方法估计Y和P的方法和与1是

12、一样的,即y=Wy=0.35x3.1+0.55x3.9+0.1x7.8=4.01sthhh=1p=工Wp=0.35x0.54+0.55x0.39+0.1x0.24=0.4275prophhh=1但是采用Neyman分配估计Y和P的方差的方法不同,分别为:v(y)=!(EwS)2-丄艺WS2L(0.35x2+0.55x3.3+0.1x11.30.013286stnhhNhh1000h=1h=1s(y)=Jv(y)=叮0.0132860.115265ststv(p)-propnh=12爲(0.3X054x0.46+0.55xx.0.39x0.61+0.lxJ0.24x0.76)0.000236s(

13、p)=0.0002360.015362propprop13、(两阶段抽样)某市为了了解职工收入情况,从该市的630个企业中随机抽取了5个企业,在中选的企业中对职工在进行随机抽样,有关数据如下:企业号Mimiyi(元)s22i152010328400.056210810400301.13431400203101303.15841200203701205.786590001004204200.000其中,Mi为企业职工数,件为样本量;yi为样本均值,咒为样本方差。试估计该市职工平均收入及标准差。解:已知:N=630,n=5,M,m,y,s2iii2i估计该市职工的平均收入为:Myii52(328+

14、108103140031312003739000420y=z,沁398M520+108+1400+1200+9000ii=1估计该市职工平均收入的方差及标准差为:v(y)=fy)2+-上2厶2nn1inm2iTOC o 1-5 h zi=li=li1丄!,630(328-398)2+(400-398)2+(310-398)2+(370-398)2+(420-398)2+55-1I。I。20201001JLJLJLJLJL,-520X400.056+迪X301.134+一显00X1303.158+1200 x1205.786+9000 x4200510102020100u667.460317+4

15、5.321254=713.781571s(y)=;vy),*:713.781571u26.71669因此,估计该市职工平均收入为398元,标准差为26.71669元14、(比率估计)(14)某养兔场共有100只兔子,上月末称重一次对每只兔的重量作了纪录,并计算平均重量为3.1磅,一个月后随机抽取10只兔子标重如下:序号123456789103.32.2.2.3.33.2.2.298812984.44.3.3.4.4.4.3.3.119712199估计这批兔子较上月末E增重的比匕率及其标准误差;0估计现有兔子的平均重量及其标准误差;将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。

16、解4已知:N=100,n=10,设X,Y分别代表上月兔子总重量和本月兔子总重量,则X=3.1,f=上,21,0.1。N100由表中数据可得:y=昱y4,x=昱x2.9710i10ii=1i=1s2L昱(y一y)2,0.0222y10-1叭i1s2L昱(x-x)2,0.0246x10-1ii1sL昱(x-x)(y-y)0.015yx10-1iii1因此,对这批兔子较上月末增重的比率估计为:y4R=,1.3468x2.97R方差的估计为:v(R),1-fnX22R2S2-2Rs)=1-0.1yxyx10(3.1,0.0002474R标准误差的估计为:s(R)=,:v(R)*0.0002474,0.0157292对现有兔子的平均重量的t比率彳古计为:y=RX=1.34683.1=4.17508Ry方差的估计为:R1-f,-1-01v(y),(S2R2S2-2Rs)=(0.022*1.346&0.0246-2x1.3468x0.015),0.0023775Rnyxyx10y标准误差的估计为:Rs(y)=:vyj*.0023775,0.048

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论