抽样技术练习题5及答案_第1页
抽样技术练习题5及答案_第2页
抽样技术练习题5及答案_第3页
抽样技术练习题5及答案_第4页
抽样技术练习题5及答案_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

习题一1.请列举一些你所了解的以及被接受的抽样调查。2.抽样调查基础理论及其意义;3.抽样调查的特点。4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:5676016657323669374626192792876905205023124525625575743508758342035939801722877532592768766923718876413994429274429181117841640521058797746153644476计算样本均值y与样本方差s2;若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;根据上述样本数据,如何估计v(y)?假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。习题二一判断题普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。抽样单元与总体单元是一致的。偏倚是由于系统性因素产生的。在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。偏倚与抽样误差一样都是由于抽样的随机性产生的。偏倚与抽样误差一样都随样本量的增大而减小。抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。精度和费用也是评价抽样设计方案优劣的两条准则。简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128157506455127789867954938622设N=678n=5利用随机数字表抽取一个简单随机样本如下:556485098260485在实际工作中,如果抽样比接近于1时,人们会采用全面调查二填空题抽样比是指(),用()表示。偏倚为零的估计量,满足(),称为()。简单随机抽样的抽样误差等于()。简单随机抽样时重复抽样的抽样误差等于()抽样时某一总体单元在第m次被选入样本的概率是()简单随机抽样时总体单元被选入样本的概率是()某一样本被选中概率是()。大数定理是指()的规律性总是在大量()的观察中才能显现出来,随着观察次数()的增大,()影响将互相抵消而使规律性有稳定的性质。中心极限定理证明了当()增大时,观察值的均值将趋向于服从(),即不论()服从什么分布,在观察值足够多时其均值就趋向()分布。抽样调查的核心是估计问题,选择估计量的标准是()()()。三简答题概率抽样与非概率抽样的区别普查与抽样调查的区别3何谓抽样效率,如何评价设计效果?何谓三种性质的分布?它们之间的关系怎样?简述抽样估计的原理。四计算题已知总体N={5,6,7,8,9,10,11},n=5试求:重复抽样与不重复抽样的所有可能样本数。第一个单位在第m次被选入样本的概率第一个单位被选入样本的概率抽到{5,6,7,8,9}的概率不放回简单随机抽样的所有可能样本某调查公司受一消费品生产公司的委托,想在某一地区进行一项民意测验,了解消费者中喜欢该公司消费品的人占多大比例,要求允许绝对误差不超过0.1,调查估计值的置信水平为95%,预计的回答率为65%,试问此次调查的样本量应取多少才能满足需要?3.欲调查我校大一学生平均每月生活费支出情况,采用简单随机抽样抽出35名学生,他们每月的生活费支出平均为285元,计算得到的样本方差为73,试计算我校一年级学生平均每月生活费的支出额标准差、变异系数、置信区间(置信水平为95%)。。4.某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为名称粮食棉花大豆变异系数0.380.390.44若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少?五设计题为了了解北京市民对目前北京市公共环境卫生以及绿色建设方方面的满意程度和期望程度,计划组织一次关于“北京市公共环境卫生状况的调查”,从而为绿色北京的建设提供指导性建议和意见,为2008年奥运会尽一份力量。请针对这一调查目的,设计一份调查问卷。要求问卷能真正反映调查目的,并对相关部门的实际工作起到指导性的作用。同时还要充分考虑数据处理的难易程度。习题三一、单选题分层抽样设计效应满足()deff1B、deff1C、deff1D、deff1分抽样的特点是()层内差异小,层间差异大层间差异小,层内差异大层间差异小层内差异大下面的表达式中错误的是()f1B、nnC、W1D、N1 h h h h在给定费用下估计量的方差V(y)达到最小,或者对于给定的估计量方差V使得总费用达st到最小的样本量分配称为()常数分配B、比例分配C、最有分配D、奈曼分配最优分配(V)、比例分配(V )的分层随机抽样与相同样本量的简单随机抽样(V)opt prop srs的精度之间的关系式为()A、VV VB、V VVopt prop srs prop opt srsC、V VVD、VV Vprop opt srs srs prop opthLhhLhhhhhhcSNcSNnnhB、NNhh1 n NS n WSC、hhhD、hhhnL nL NS WShh hhh1 h1hLhhLhhhhhhcSNcSNnnA、hB、 N Nhh1 n NS n WSC、hhhD、hhhnL nL NS WShh hhh1 h1二、多选题1.分层抽样又被称为()A.整群抽样B.类型抽样C.分类抽样D.系统抽样E.逆抽样2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用()A.分层比估计B.联合比估计C.分别回归估计D.联合回归估计E.分别简单估计3.样本量在各层的分配方式有()A.常数分配B.比例分配C.最优分配D.奈曼分配E.等比分配4.分层抽样的优点有()A.在调查中可以对各个子总体进行参数估计B.易于分工组织及逐级汇总可以提高估计量的精度D.实施方便E.保证样本更具有代表性5.关于分层数的确定,下面说法正确的有()A.层数多一些比较好B.层数少一些比较好C.层数一般以不超过6为宜层数一般以4层为最好E.应该充分考虑费用和精度要求等因素来确定层数6.下面哪种样本量分配方式属于奈曼分配?()hn n n NS/c n NSN N nLnLh NS/c NSh A.hB.hhh hC.khhhhhhh1 h1 n WS n WS/chD.hhhE.hhhhnL nLh WS WS/chh hhh1 h17.事后分层的适用场合有()各层的抽样框无法得到几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难一个单位到底属于哪一层要等到样本数据收集到以后才知道总体规模太大,事先分层太费事一般场合都可以适用三、判断题分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。分层的基本原则是尽可能地扩大层内方差,缩小层间方差。分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。分层抽样克服了简单随机抽样可能出现极端的情况。分层抽样的样本在总体中分布比简单随机抽样均匀。分层后各层要进行简单随机抽样。分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。在不同的层中每个单位的抽样费用可能是不等的。在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。多主题抽样中,不同的主题对样本量大小的要求不同。在费用允许的情况下,应尽可能地选择较大的样本量。有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。比例分配指的是按各层的单元数占样本单元数的比例进行分配。等容量分配时各层的样本单元数与各层的层权是相同的。所谓最优分配是指给定估计量方差的条件下,使总费用最小。在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。在实际工作中如果第k层出现n超过N,最优分配是对这个层进行100%的抽样。 k k在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。四填空题分层抽样又称为类型抽样,它是将包含N个单位的总体分成各包含N,N,…,N个单位的 1 2 L(),这些()互不重复,合起来就是整个的总体,因此N=()。分层抽样的基本原则是()分层抽样中层权是(),抽样比是()。4分层抽样中的样本均值是(),样本方差是()。分层抽样中,对总体的均值进行估计时,其抽样误差是(),对总体的总量进行估计时,其抽样误差是()。分层抽样在对各层分配样本量时,可以采用不同的分配方法,各种方法所考虑的因素不同。最优分配时主要考虑的因素是()、()、()。7在实际工作中,通常分层抽样比简单随机抽样的精度要高。但如果出现不合理地划分()或分配()的情况,可能使分层抽样的更()的结果发生。事后分层的层权与实际情况相差很大,则不能利用其提高()。分层抽样要求在抽取样本之前()对()。如果要给出估计量方差的无偏估计,则层数不能超过()。五简答题何谓分层抽样?简述分层抽样的意义?试举一例说明分层抽样的抽样效率比简单随机的抽样要好。3分层抽样的分层的原则及其意义。简述分层抽样的局限性。简述分层抽样中总样本量的分配方法。怎样分层能提高精度?六计算题一个由N=1000个人构成的总体被划分为两层:第一层由N400名男性组成,第二层由1N600名女性组成。从中抽取一个样本量为n=250的样本,将样本等比例地分配给各层,2使得两层的抽样比都等于n/N=1/4。求各层的样本量分别是多少?一公司希望估计某一个月肭由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:工人工人技术人员行政管理人员1321N3621s922N2522s273N923s若样本量n=30,试用奈曼分配确定各层的样本量。某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下:本地本地区本省外地区外省1541N932N533N25.221S24.322S24.323S91C252C363C若要求估计评价成绩均值的方差V(y)0.1,并且费用最省(假定费用为线性形式),求样本量nst在各层的分配。某林业局欲估计植树面积,该局共辖240个林场,按面积大小分为四层,用等比例抽取40个林场,取得下列资料(单位:公顷)第一层第一层第二层第三层第四层861N141n722N122n523N93n304N54niy1976742259210586274559535212543iy2125155679625647310236220352142190iy3142256310440495510320396196iy4167655220540780试估计该林业局总的植树面积及95%的置信区间。5.一个样本为1000的简单随机样本,其结果可分为三层,相应的y=10.2,12.6,17.1,s2=10.82(各层相同),s2=17.66,估计的层权是w=0.5,0.3,0.2,已h h h知这些权数有误差,但误差在5%以内,最不好的情况是W=0.525,0.285,0.190或W=0.475,h h0.315,0.210,你认为是否需要分层?习题四所谓比率估计就是通过样本中的变量的来推断总体的比率。比率估计是一种估计的方法而不是抽样的方式。比率和比例是区别的在于它们的比值总是小于1或大于1。在估计比率问题时,只有分子是随机变量。采用比率估计的原因之一是在估计总体均值或总体总量时可以通过一个辅助变量来提高抽样效率。比率估计是个有偏的估计量,只有样本比较大时其偏误可以忽略不计。当辅助变量与调查变量呈现正相关关系时用比估计,呈现负相关关系时用乘积估计。若研究变量对辅助变量的回归直线通过原点即研究变量与辅助变量成正比例关系,则用比估计,否则用回归估计。对于分别估计要求每层的样本量都较大。由于回归估计在小样本时偏倚有可能更大,因此采用比估计更保险些。差值估计量与回归估计量一样都是无偏估计量。不等概率抽样时,总体中某些单元比其它单元出现在样本中的机会大,就会使我们所推算的总体指标偏向于这些单元的标志值。即使抽样单元是区域本身也不能直接进行抽样。PPS抽样是放回的简单随机抽样,由于抽样是放回的,就使某个单元可能在样本中出现多次。放回抽样与不放回抽样所得到的样本代表性有差别,在样本量一样时,放回抽样的估计精度高一些。推算总体总量时,此时若总体单元的差异较大,则进行简单随机抽样的效率比不等概率抽样要低。使用不等概率抽样,其入样概率是由说明总体单元大小的辅助变量不确定的,即辅助变量确定每一个总体单元的入样概率。使用不等概率抽样的必要条件是每一个总体单元都要有一个已知的辅助变量,用以确定单元的入样概率。不等概率抽样可以改善估计量,提高抽样效率。在PPS抽样时,若用代码法,则单元愈大被赋予的代码数就愈多,使每个单元入样的概率与单元大小成比例。二填空题利用比率估计提高抽样效率要求推断的变量与辅助变量之间存在()关系。样本相关系数为(),其中:s是(),s是(),xy ys是()。x3用样本的比率估计总体比率,在大样本时对总体比率R的估计可用()表示,对抽样误差的计算可用()用表示。4对于分层随机抽样,如果采用比率估计量,各层的样本量都比较大时可采用(),否则采用()。比率估计量优于简单估计量的条件是()、()。当回归系数为事先给定的()时,回归估计量是()估计量;为样本回归系数时,则回归估计量是()估计量。分层抽样时如果采用回归估计,则当各层样本量()时,采用(),否则采用()。在PPS抽样中每个单元有说明其大小或规模的的度量M,则可取Z等于()。i i严格的PS抽样实施起来非常复杂,在实际工作中可以通过分层,在每层中进行严格的()的PS抽样。不等概率抽样主要用于总体单元差异非常大,而推算目标量是()的情形。三简答题简述比率估计提高抽样效率的条件。简述比率估计的应用条件。从等概率抽样与不等概率的区别来分析进行简单抽样的有效性。简述不等概率抽样的主要优点。试举一个利用区域可以直接进行抽样的例子。6.分析PPS抽样与PS的抽样效率。7.回归估计、比估计与简单估计间的区别;8.辅助变量的选择原则;9.回归系数的选择与确定。四计算题1某单位欲估计今年第一季度职工的医疗费支出,但这一费用要等到合同医院送来帐单才能知道,因此从1000个工人中随机抽取了100人作调查,这100人的总支出为1750元,若已知去年同期这100个工人的费用支出是1200元,全单位去年第一季度总支出为12500元。若根据样本计 100 100 100算y2316500,x215620,xy22059.35,试用比率估计的方法估计该单iiiii1i1i1位第一季度平均每人医药费支出的95%的置信区间。 2.一家大公司欲估计上一季度每个工人的平均病假天数。该厂共有8个车间,人数分别为1200人,450人,2100人,860人,2840人,1910人,290人,3200人。现拟抽取三个车间作样本,若采用与车间工人数成比例抽样,抽中第三个车间2100人,病假为4320天;第六车间1910人,病假共4160天;第八车间3200人,病假共5790天,试估计全工厂的平均每人病假天数,以及全工厂因工人病假而损失的人日数。3.某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分平原和山区两层采用分层抽样。同时当年产量与去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下:平原山区样本样本去年产量(百斤)当年产量(百斤)1234562041438225627519821016075280300190样本样本去年产量(百斤)当年产量(百斤)123456789137189119631031071596387150200125601101001807590试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误差,并对上述两种结果进行比较和分析。习题五一、单选题1.整群抽样中的群的划分标准为()。A.群的划分尽可能使群间的差异小,群内的差异大B.群的划分尽可能使群间的差异大,群内的差异小C.群的划分尽可能使群间的差异大,群内的差异大D.群的划分尽可能使群间的差异小,群内的差异小2.整群抽样的一个主要特点是()。A.方便B.经济C.可以使用简单的抽样框D.特定场合中具有较高的精度3.群规模大小相等时,总体均值Y的简单估计量为()。ˆ1nMA.Y ynM iji1j1 ˆ 1nMB.YM1yijni1j1ˆ1nM C.Y yn iji1j1ˆ1nMyD.YN iji1j14.群规模大小相等时,关于总体方差S2的说法正确的是()。A.总体方差的一个无偏估计为:Sˆ2M1[(N1)S2N(M1)S2] NM1 b B.总体方差的一个无偏估计为:Sˆ2M [(N1)S2N(M1)S2] NM1 b C.总体方差的一个无偏估计为:Sˆ21 [(N1)S2N(M1)S2] N(M1) b D.总体方差的一个无偏估计为:Sˆ21[(N1)S2N(M1)S2] NM1 b 5.下面关于群内相关系数的取值说法错误的是()。A.若群内次级或基本单元变得值都相等则S20,此时Pc取最大值1B.若群内方差与总体方差相等,则P0,此时表示分群是完全随机的cC.若群内方差大于总体方差时,则P取负值cD.若S20时,P达到极小值,此时P1 b c cM16.整群抽样中,对比例估计说法正确的是()。A.群规模相等时,总体比例P的估计可以为:1nApn ii1B.群规模不等时,总体比例P的估计可以为:p(nA)/(nM)i ii1 i1C.群规模相等时,总体比例P的方差估计为:v(p)n(n11)n(Pip)2i1D.群规模不等时,总体比例P的方差估计为:1n(AipMi)2v(p) i1 nM2 n1二、多选题1.下面关于整群抽样的说法,有哪些是正确的?()A.通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样C.调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单随机抽样的方差的1(M1)倍cE.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(M1)倍c2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有() V(y) A.deffV1(M1) (y) csrsB.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(M1)倍cˆs2s2C.群内相关系数的估计值为bc2(M1)s2sD.要的差异实现E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高3.关于群规模不等时,可以采用的估计量形式有()。1A.yny1n(Miy/M)n in ij ii1 i1 j1B.y1nziM0nMyiy n n i1 i i1 iny ˆ iC.YRni1Mii1ˆYˆ 1nyMn i D.YM 0 i1E.y1nyn ii14.关于群规模大小不等时,下列说法正确的是()。A.若M相差不多,则一般以平均群大小M代替M,依照群规模M大小相等的情形处i i理B.如果M相差较大,可将群按大小分层,使每一层内群的规模M大小基本相等,从而i i仍可使用群规模M大小相等时的处理方法iC.对群仍用简单随机抽样,采用简单估计的形式D.对群仍用简单随机抽样,采用比例估计的形式E.对群仍用简单随机抽样,采用加权估计的形式三判断题整群抽样对中选的群中的所有总体单元进行调查。构造群的抽样框同构造简单随机抽样的抽样框一样都很容易。在总体单元分布较广的情形下,进行简单随机抽样可以节省费用。在群是以行政单位划分时,将有助于调查的实施。整群抽样的抽样单元不一定基本单元的集合。如果群内的差异较大,群内各单位的分布与总体分布一致,那么任意抽出一个群来进行观察就可以对总体进行准确的推断。整群抽样抽取样本效率同简单随机抽样一样高。整群抽样时可以在抽样前知道调查总体的样本量。若群内各单元之间的差异较大这时进行整群抽样的效率就会较高。为提高抽样效率,应使群内的方差尽可能地小,从而使群间方差尽可能地大。进行整群抽样的目的就是节约人力、物力。而为了达到规定的精度要求,往往需要多抽一些群。整群抽样有构造抽样框相对简单,样本量相对集中、调查费用节约的特点。在整群抽样中,比率估计可以有效地提高抽样的估计精度。以家庭户为整群抽样的抽样单元,并不能很好地做到群间结构的相近,使群间方差较小。可以这样看,整群抽样适应于总体的抽样单元差异较大的情形,而分层抽样则适应于抽样单元具有趋同性的总体。考虑划分群,就是考虑在相同调查费用时,抽样误差最小的情形。在群的规模相等时,对总体的估计量是无偏估计量。当各群的规模差异很大,并且总体估计量与群的规模高度相关时,估计量的偏差会很大。19在群的规模不等时,对总体的估计量是有偏的估计量。20对于自然形成的群,无法通过调整群内单元而控制,这时要提高抽样效率就只能增大样本量。四、填空题整群抽样的抽样比是(),其中n为(),N为()。整群抽样时样本的群间方差为(),均值估计量的方差为(),总量估计量的方差为()整群抽样的估计精度与()有关,当群内相关系数为()时,其抽样效率()简单随机抽样。对自然形成的群,无法人为地控制(),因此,要控制抽样误差,就只好控制()。整群抽样时总体参数的无偏估计适用条件是(),()。在群规模不等的整群抽样中,把()作为抽取样本的辅助信息,其目的是()。比率估计是()的估计,当()其抽样效率高于()。比例是()的一个特例,即均值等于(),其中y的取值为i()和()。群与群之间的结构(),就意味着(),这时群内相关系数为()。五、简答题简述整群抽样的分群原则。您如何认识影响整群抽样抽样误差的主要因素是群间方差?整群抽样时,采用无偏估计的方法与比率估计的方法来估计总体总量有何不同?简述整群抽样的优点。5整群抽样时,比率估计的方法估计总体总量与比估计量中的辅助变量有什么不同?6简述使用整群抽样的原因。7.整群抽样与分层抽样的区别;8.整群抽样群大小的计量方法;9.整群抽样的设计效应。六计算题1.在某城市一次对居民小区的食品消费量的调查中,以楼层为群进行进行整群抽样,每个楼层有8家住户。用简单随机抽样在全部N=600个楼层中抽取n=12个楼层,其户人均月食品消费额(按楼层计算)如下:iiiiyis1188.0027.192180.5017.983149.7517.324207.87529.175244.2545.206278.5063.877182.7538.778211.5027.489253.12544.5210191.12528.2911274.7543.7012258.37543.52要求:(1)试估计该次调查中居民小区的人均食品消费额的95%的置信区间。对居民小区的食品消费总额进行区间估计。) 若规定允许误差不超过) 10000,应抽多少群来估计小区的食品消费总额?2已知某运输公司在抽样检查所使用的车辆中安全轮胎所占的比例,在200辆车中抽了30辆,其资料如下:安全轮胎数安全轮胎数ix汽车数fxfaiMfMi23MfMiiiaMfxai220404*001334*31*328164*164*839274*279*946244*2416*6307030*4=12016*30=4804*70=280212估计该运输公司的汽车安全轮胎的比例及其估计量的方差。以95%的把握对安全轮胎的比例作出区间估计。习题六一判断题系统抽样中最简单也是最常用的规则是等间隔抽取,所以又称系统抽样为等距抽样。第一个样本抽取后,其它所有的样本就都确定了,这种抽样看来似乎很机械,所以系统抽样又被称为机械抽样。在直线等距抽样中,总体容量是样本容量的整数倍。循环等距抽样中总体单元数同样也是n的整数倍。总体单元按有关标志排队就是指各单元的排列顺序与所研究的内容无关,但与总体单元的规模大小有关。如果系统抽样时总体单元的排列有周期性的变化,就可能抽出代表性很差的样本。7如果按总体单元的有关标志排列,则系统抽样时样本单元在总体中分布较均匀。系统抽样可以看成是分层抽样的一个特例,但样本单元在各层的位置相同。系统抽样可以看成整群抽样的一个特例,从k群中随机抽取1个群的整群抽样。当N=nk时有k个可能样本,其样本均值是总体均值的无偏估计量。当Nnk时采用直线等距抽样得到k个可能样本,其样本均值是总体均值的无偏估计量。12当Nnk时采用循环等距抽样得到k个可能样本,其样本均值是总体均值的有偏估计量。有效地应用系统抽样,必须了解总体的特征。按无关标志排列的总体单元可以看成是随机排列的,当为有限总体时其系统抽样方差与简单随机抽样的方差相等。当总体单元有趋势顺序排列时,其方差估计有一些近似的公式,不论n为何值,都可用合并层和连续差的方法来估计总体方差。中心位置抽样法起始单元的抽选是在第一段的k个单元中在(1k)之间随机抽取。Sethi的方法和Singn的方法在抽取样本单元时起始单元有两个,因此这就被称为对称系统抽样。对称系统抽样与一般系统抽样的主要区别在于此时起始单元不是一个而是两个,它们的位置对称,数值大小相低,因而改进了估计量的精度。交叉子样本的方法又称为随机组法,它是解决周期性波动总体的系统抽样的有效方法之一。当系统抽样的间隔恰好与循环周期的整数倍相一致时,系统抽样的误差将会很大。二填空题1系统抽样时总体单元的排序有两种方法:一是()排列,二是按与调查标志()的特征进行排列。系统抽样的抽样误差与总体单元的()有关。在一般情况下,系统抽样使样本单元在总体中的分布较为()。使用对称系统抽样的方法其目的是通过改变样本的(抽选方法)以消除由于()引起的系统偏差。对称等距抽样当n为()时,应()一个单位:()。6在循环等距抽样时,抽样间距k()整数,随机起点在()中抽取。当总体单元的排列发生聚集现象时,()的简单随机抽样精度()系统抽样的精度。当N=555,k=20在直线等距抽样时可能的样本量是(),可能的样本配合是()。N=555,k=20在循环等距抽样时可能的样本量是(),可能的样本配合是(),若随机起点为503,则首先抽出的前5个样本单元的总体编号是(在直线等距系统抽样时当N=nk时,样本均值是总体均值()估计量,当Nnk样本均值是总体均值的()估计量。三简答题1简述系统抽样的主要优点。2系统抽样的局限性有哪些?对于周期性波动的总体上在组织系统抽样的时候应注意什么问题?对线性趋势的总体进行系统抽样时应该如何组织?试举一个总体单元按无关标志排列进行直线等距抽样的例子。简要分析影响系统抽样误差的因素。四计算题1.一周期波动的总体N=240,原准备抽取一个系统样本n=24,现为消除因变动带来的影响,改为抽3个容量为8的样本,即n=3,原来的间隔k=240/24=10,现在的k=nk=3×10=30,s s假设样本的数据如下:样本i 观察值 合计 均值1715191821211517 143 17.875151916182018172314618.253221615202123201715419.25要求:试以95%的把握估计总体的均值和总体的总量。2下面是美国1900年以来每隔5年的离婚率资料:年份年份离婚率%年份离婚率%19000.719453.519050.819502.619100.919552.319151.019602.219201.619652.519251.519703.519301.619754.819351.719805.219402.0要求:根据以上资料估计1900—1980年的平均离婚率。根据这一资料讨论用系统抽样好还是简单随机抽样好?六、设计题某公司下有10个分公司,N=10,每个分公司的人数M见下表。现在欲考察分公司的日常i办公费用状况,采用PS系统抽样方法抽取n=3个分公司,试回答如何进行抽取?按照你的方法,入样的分公司编号为多少?分公司编号分公司编号人数iM分公司编号人数iM110367324327205396816842469146558410317习题七一、单选题1.两阶(段)抽样中,对于一个估计量ˆ的均值可以表示为()。E(ˆ)E[E(ˆ)] 1 2E(ˆ)E[E(ˆ)]1E(ˆ)1[E(ˆ)E(ˆ)]1 2D.E(ˆ)1[E(ˆ)E(ˆ)] 21 2关于多阶段抽样的阶段数,下列说法最恰当的是()。A.越多越好B.越少越好C.权衡各种因素决定D.根据主观经验判断在初级单元大小相等的分层二阶段抽样中,关于自加权的说法错误的是()。A.自加权在这里是指在每层抽样中,每个次级单元被抽中的概率皆相等或是等价的B.每一层总的抽样比f为常数hC.自加权估计量一般计算比较简单nND.分层二阶段抽样自加权的条件为:h hf(h1,2,,L)mM 0h h在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用()。A.系统抽样B.简单随机抽样C.不等概率抽样D.非概率抽样5.初级单元大小不等的多阶段抽样中,无偏估计量成为自加权的条件是()。A.第一阶段每个单元被抽中的概率相等B.第二阶段每个单元被抽中的概率相等C.最终阶段每个单元被抽中的概率相等D.最终阶段每个单元被抽中的概率不等6.在初级单元大小相等的二阶段抽样中,当抽取次级单元的数量相等时,二阶段抽样的方差与整群抽样方差以及分层抽样方差之间的关系通常为()。A.二阶段抽样的方差<整群抽样的方差<分层抽样的方差二阶段抽样的方差>整群抽样的方差>分层抽样的方差分层抽样的方差<二阶段抽样的方差<整群抽样的方差分层抽样的方差>二阶段抽样的方差>整群抽样的方差二、多选题1.二阶段抽样中,初级单元大小不等时,一般可采用下面方法()。A.通过分层,将大小近似的初级单元分到一层,然后采用分层二阶段抽样B.可按初级单元大小相等的方法处理C.考虑用不等概率的抽样方法抽取初级单元D.采用简单随机抽样抽取初级单元但改变估计量的形式E.近似看成初级单元大小相等2.确定样本量时需要考虑的因素有()。A.调查的费用B.调查要求的精度C.调查的时间D.调查的技术E.调查的目的3.初级单元大小不等时,下面关于二阶段抽样总体总和Y的估计的说法正确的有()。A.可以采用放回的抽样方式,按不等概率抽取初级单元,此时可得总体总和Y的估计量Yˆ1nYˆi1nMiyi HH n zn z i1i i1 iB.采用不放回抽样方式,按简单随机抽样抽取初级单元,此时有YˆNnMyNnYˆun iin ii1 i1C.采用不放回抽样方式,按简单随机抽样抽取初级单元,此时nYˆ YˆM i1i R 0nMii1D.采用不放回抽样方式,按不等概率抽样,此时有YˆnMiyinYˆi HT i1 i i1 iE.可以采用放回的抽样方式,按简单随机抽样抽取初级单元,此时有YˆNnMyn iii13.在二阶段抽样中,对比例的估计通常采用()。A.两阶段均采用等概率抽样,用比率估计的方法B.第一阶段采用PPS抽样,第二阶段采用等概抽样C.两阶段均采用简单随机抽样,用简单估计的方法D.两阶段均采用PPS抽样E.第一阶段采用等概抽样,第二阶段采用等概抽样5.多阶段抽样相对于简单随机抽样的优点有()。A.实施方便B.每个基本单元的调查费用比较低C.能够充分发挥抽样的效率D.节省人力、物力E.可以分级准备抽样框6.二阶段抽样中,关于总体比例P的表达可以为() 1n 1n 1n A.PYB.P PC.P YD.P ANiMNiMii1i1i11n E.P AMN ii1五、设计题某学校欲调查学生每月的零用钱数量。假设该学校共有18个班级,每个班级都有60个学生。请你设计一个调查方案,并说明你是如何确定样本量的。简答题参考答案习题一请列举一些你所了解的以及被接受的抽样调查。略抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。抽样调查的特点。答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。4.样本可能数目及其意义;答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。5.影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。三简答题(习题二)概率抽样与非概率抽样的区别答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。普查与抽样调查的区别答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。3何谓抽样效率,如何评价设计效果?答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比较时通常以样本量相同时的方差进行比较。何谓三种性质的分布?它们之间的关系怎样?答:三种分布是指总体分布、样本分布、抽样分布。总体分布是指总体的标志值的分布;样本分布是指容量为n的样本标志值的分布;抽样分布则是指样本估计量的分布,它是一个变量,据中心极限定理:当n增大时估计量的分布趋向于正态分布,可用大样本理论对其进行区间估计。简述抽样估计的原理。答:如果样本的估计量E(ˆ),而且已知道在大样本的情况下ˆ趋向于正态分布,只要知道ˆ的抽样标准误差S(ˆ),就可以根据正态分布原理对进行区间估计。习题三五简答题何谓分层抽样?简述分层抽样的意义?答:分层抽样是在概率抽样的前提下,按某种标志将总体划分为若干层,然后按随机原则对每层都进行抽样。分层抽样的效率高于简单随机抽样,能够推算子总体。试举一例说明分层抽样的抽样效率比简单随机的抽样要好。答:简单简单随机抽样可能得到一个差的样本,如一个总体进行简单随机抽样,N=6,其标志值为1,2,3,4,5,6,当眉2时其均值的变动范围在(1.5—5.5);若1,2,3为一组,4,5,6为一组进行分层抽样进行则均值的范围在(2.5,4.5),则分层抽样的精度提高。3分层抽样的分层的原则及其意义。答:在总体分层后:总体方差=层内方差+层间方差。据方差分析原理,在分层抽样的条件下,抽样误差仅与层内方差有关,和层间方差无关,因此从其组织形式上看所谓的分层抽样是先将总体分层,然后在每层中抽取样本,遵循扩大层间方差,缩小层内方差的原则对总体进行分层,就可以提高估计的精度。简述分层抽样的局限性。答:分层抽样一般说来比简单随机抽样的精度要高,但若层的划分或样本量的分配不合理时,可能会使分层随机抽样的精度比简单随机抽样要差。简述分层抽样中总样本量的分配方法。答:当样本量一定时考虑样本量的分配问题,主要有三种分配方法按层要进行分配:1、比例分配;2、最优分配;3、内曼分配。怎样分层能提高精度?答:考虑分层标志的选择及合理的确定层数。一般来说,增加层数能够提高估计的精度,同时考虑增加层数提高的精度和费用之间的平衡,即增加层数而降低量在精度上是否合算。习题四三简答题简述比率估计提高抽样效率的条件。答:(1)有相应的准确的辅助可以利用;(2)推断的变量与辅助变量之间存在着相关关系;(3)要求的样本量较大简述比率估计的应用条件。答:(1)比估计是有偏估计,要求的样本量较大;(2)研究变量与辅助变量之间有较好的相关关系。从等概率抽样与不等概率的区别来分析进行简单抽样的有效性。答:当总体单元的差异不大时进行简单随机抽样,即等概率抽样是有效的,但若总体单元之间的差异较大时,要用不等概率抽样。简述不等概率抽样的主要优点。答:提高估计的精度,减少抽样误差,以说明单元规模大小的辅助变量来确定每个单元的入样概率;改善估计量。试举一个利用区域可以直接进行抽样的例子。答:特点:区域本身就是抽样单元,如调查某师团的总收入或总支出,以连队或团为抽样单元。6.分析PPS抽样与PS的抽样效率。答:PPS抽样重复抽样,PS产是不重复抽样,因此从抽样效率上分析,前者的效率低于后者。7.回归估计、比估计与简单估计间的区别;答:回归估计一般优于比估计和简单估计。当回归系数等于总体比率(即总体回归直线通过原点)时,回归估计量与比估计量的效果相同;当调查变量与辅助变量间的相关系数ρ等于0时,回归估计与简单估计效果相同。8.辅助变量的选择原则;答:选择与调查变量Y之间有密切相关程度的变量X作为辅助变量。9.回归系数的选择与确定。答:1)β的不同取值当然会影响V(Yˆ)的值,β取得合理,V(Yˆ)就小,否则就大,事实 lr lr上β为一特定常数时,Yˆ是无偏的,可取到最优值,B=Sxy,V达到最小值。lr S2x2)β为样本回归系数,此时回归估计量Yˆ不是无偏的。lr习题五五、简答题简述整群抽样的分群原则。答:扩大群内方差,缩小群间方差,以提高整群抽样的抽样效率。您如何认识影响整群抽样抽样误差的主要因素是群间方差?答:在整群抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论