第九章二阶与多阶抽样抽样调查理论与方法北京商学院_第1页
第九章二阶与多阶抽样抽样调查理论与方法北京商学院_第2页
第九章二阶与多阶抽样抽样调查理论与方法北京商学院_第3页
第九章二阶与多阶抽样抽样调查理论与方法北京商学院_第4页
第九章二阶与多阶抽样抽样调查理论与方法北京商学院_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章二阶与多阶抽样

二阶抽样与分层抽样、整群抽样的一个共同特点是:将总体分为若干个群;所不同的是:分层抽样是每个群内都进行抽样,整群抽样是抽若干个群再在群内普查,而二阶抽样则是抽若干个群再在群内抽样。因此,可将分层抽样与整群抽样看作是二阶抽样的特殊情况。在整群抽样中,如果抽中的群内所含的次级单元个数相当地多,此时对该群作普查会感到“心有余而力不足”。特别当群内的次级单元差异不大,即比较大,这种情形下对群内所有的次级单元一一访问似乎完全没有必要,一个省时省钱又省力的念头会在调查者的头脑中油然而生,何不在抽到的群内再作一定方式的抽样呢?这种在选中的初级单元中再进行抽样的方法称为二阶抽样。倘若在抽取的次级单元中又包含许多更次一级的单元,在这些单元中继续抽样就自然地称为三阶抽样。抽样形式第一阶段第二阶段分层抽样整群抽样二阶抽样抽全部抽部分抽全部抽部分抽部分抽部分二阶与多阶抽样的优点:1、它具有实施上的方便,比如在编制抽样框时那些没有被抽到的群或次一级群内的单元就没有必要也去编制抽样框。仅需对那些已抽中的单元才去准备下一级单元的抽样框,而且许多抽样调查常常采用行政系统及隶属单元,这给多阶抽样本身创造了有利的条件。另外,多阶抽样方法可以用到关于散料的抽样。所谓散料是指连续松散的不易区分为个体或抽样单元的材料。例如,煤、粮食、水泥、化肥等原料的质量检测,此时抽样单元常常需要人为划分,一般取自然单位,诸如一公斤、一杯子等;而初级单元则为包装袋、一卡车、一个车皮等。这种数量众多的散料的质量检测采用二阶或多阶抽样也许是最有效的手段。为方便,本章主要讨论二阶抽样。2、能够满足各级政府部门对抽样调查资料的需求。因为各级政府领导都关心全国和本地区、本部门的社会经济发展状况,希望抽样调查能同时满足全国性和地方性的需要。因而采用二阶或多阶抽样,在一定程度上能够满足各级政府、部门对调查资料的需求。3、有利于减少抽样误差、提高抽样估计精度。这种抽样调查方法,可以使每个一阶样本单位分布比较均匀,具有很好的代表性;对于方差大的阶段多抽些样本单位以提高精度。先纺作追一老些查基跳本稻假惜设包:(墓1跟)初嘴级密单魂元靠中位包迟含名的胡次牧级达单瞎元茫个得数颈同变为M瘦,因哪此鉴在碑抽骆中轨的刑初通级裳单问元辆中旨再巨抽原取急的伯次姻级亮单呀元抢个香数民也天相千等鹊,蔑记付为m亿。§1初钢级职单塘元获大膏小泼相从等迫的棒二秀阶殊抽胆样(沙2东)两折个妨阶烫段也的路抽雪样净方洽法乎都爽是弦简前单但随川机倦抽姨样。(区3去)在捕抽纳中攻的宁若法干尚初店级累单罗元软中巴作帮第洽二译阶夹抽您样索是获相决互惭独夏立哨进忘行治的。再肠引踩进左一丈些枪必付要黄的欲记出号爹:——表示第初级单元中第个次级单元——表示样本中第初级单元中第个次级单元的观测值—第初级单元总和—第初级单元平均值—总体平均值—初级单元(群)内的方差—总体中初级单元(群)间方差将改为,N改为n,M改为m,则为相应的样本指标值第i群跑内役次坡级吊单毙元绣间员的活方酬差笑记亮为胳:显然有——所有的平均数。1、扎估荷计乐量篇及抱其丽方论差总体平均数的估计是用样本平均数进行估计的容易证明,这个估计量是的无偏估计。其茶方遮差量为悬:(9.1)其中,方差的无偏估计为:(9.2)总体总数的估计为:方差的无偏估计为:总体平均数95%的置信区间为总体总数95%的置信区间为例奋9饮.含1练:新域华裕书腹店董某仔柜受台肆上握月渴共昂用严去暖发蒜票狠7波0堂本许,舞每企本你1菌0冤0班张霞,现炒随亏机门从应中福抽盖出置1醒0草本倾,结每谣本斩随粪机玩抽粘出卖1末5潜张沃发胳票虹,婚得份到烘数撒据如魂下胶表镇:每给武出运上岭月脊柜妥台痛营攻业军总塔额激的眉估苦计钥及送其正方吓差拼。i12345678910375.25408.30323.40502.50234.00387.75284.20256.60314.10280.5011280.2512115.998752.7617833.753953.0011302.506573.044822.366921.015827.2525.0227.2221.5633.5015.6025.8518.9517.1120.9418.70135.0271.58127.1671.4321.6197.3784.7530.7924.5541.56解愿:N晴=凉7户0,n姻=位1旦0,M稻=辣1狡0余0写,古m猜=佳1丸5故犬上发月船柜鲜台狂营沾业泄总怠额培的里估滥计盯为恢1槽5鹅7汽1钟0测8跃.梯0茧0蓄元标准差为元营淡业淹总痒额煤9烧5伐%舟的库置秘信贯区必间游为2、膛最伞优拐抽暖样越比如堆果的初裕级庙单宽元伟(绑或睛群迷)腰之鲁间餐的鸦旅诞行串费藏用斜不门占揭重悔要斤地岁位棵的话预,似常密采狂用染简础单晚线情性熄费恒用琴函搏数言:二阶抽样存在两次概率抽样,因而存在两个抽样比因此我们面临的问题是:(1)在总费用给定的条件下,如何确定与而使的方差达到最小;(2)在给定估计量的精度条件下,如何确定与以使总费用最小。其中是基本费用,是每调查一个初级单元与次级单元所花费的费用。(9.3)将淋方章差样表夫达黄成证:(9.4)于是,在固定C下极小化或在固定下极小化C均等价于使下式极小化:其中:。但这里要求。假如,表明群内差异明显地大于群间的差异,因此对于抽到的群来说,最好作全面调查才能保证样本的代表性,此时总使m=M。现考虑(9.5)在(9.5)式中,由于都是常数,为使(9.5)达到最小,只要(9.6)达到最小,这两个加项的乘积恰好为常数,因此只要这两项相等就可使Q达到最小,此时应取或者m的最优取值为:(9.7)一般地,不是整数,记为的最小整数部分,那么(为的小数部分,且)。如果,则取如果,则取易见,对于的小数部分大于或等于0.5的情况,我们总取,这符合通常的“五入”规则,是否“四舍”?当时,就要看的最小整数部分的大小了。由m的叛选衣取雁,怨代港入兰(脏9夫.丝式3著)争或忘(恋9田.哈4鸦)姻立从即搁可肢以钻得附到n的意数护值雨。3、份分晨层嘉二船阶斥抽戴样所钓谓解分驴层域二烂阶绝抽怖样长就扁是摊将莫总可体累分呆为k个狸层光,皇在掠每诱层朴内闸进行术二肯阶则抽锋样衰。巷比在如幸,庙一脑所令大仿学货有置8驱个材系德,妇每赶个曾系棵有窗若饰干萝个厘班级苍,踩每要班斩大贵约会人颜数向为朗4税0狡人功,油为圈了路解惜学狸生枝的林情房诚况懒需愤要央作册一直次蔽抽样败调子查给,纳在液每当个屈系衫都饲随耳机席抽喜几泪个脸班阅,熊再皂在颜抽态中保的索班丸级含里叶抽团取若尚干婆人咬的向简原单贸随什机司抽河样酸,号这投就智构术成陵二矛阶鬼分返层隔抽莲样胜。本节讨论的二阶分层抽样,假设在同一层内初级单元大小相等,但不同层可以不相等。设第h层含个初级单元,每个初级单元包含个次级单元,于是总体中共含有个次级单元。又假设在第h层按照简单随机抽样方法抽取个初级单元,在每个被抽中的初级单元中再抽取容量为的简单随机抽样。设第h层中样本的(二阶抽样)平均数为,因此按照分层估计的技巧,总体的(按次级单元)平均数的分层二阶估计量为:(9.8)其中为第h层(按次级单元)的层权:(9.9)(9.10)而由于各层的抽样相互独立,而由二阶抽样的有关讨论,的方差及其方差估计是已知的,因此:(9.11)(9.12)其中分别为第h层中的两个抽样比。和是第h层中的群间和群内方差,与是第h层中样本的群间和群内方差。显轿然宣,巨总物体逃总扎和环的辜分贝层肃二峰阶稿抽册样袄估碌计缩慧为沟:(9.13)其宴方到差逆及删其帽方兽差脊估已计挠为夕:在召分疏层炭二草阶旨抽步样稍中济当绑然康也抚存蹄在适最拳优太抽希样至比承的著问怨题比,握不日过纹此时减假颠定枕费策用各函先数胸一聋般熄应员当澡与豆“冒层菜”块有震关有系召:(9.14)固定费用C而使方差达到最小或方差有一定精度要求下使费用达到最小,此时的最优选择为:(9.15)其中总假设对所有的h,都有。§2初失级疼单恶元巾大春小注不恢等揭的街二劳阶姐抽圆样在浑实才践悉中米,铺除纠少催数筝情纸况份外污,扯初皆级邀单允元的的沙大释小室不讽一愈定火相题等当父然雪理酱想银一峡些仓的员情寺况粉,晨我猾们叨在善分违群奸时输就殃注赤意溜到哪先魔将毅单将元迁按必照纽奉大戴小侵分婶层落,牧使期得改同胃一缝层泛中某初怀级冷单辽元阅大企小技相拘等批,爽然璃后绵利葛用贯上摘面善所肤讲播的巾分帅层汤二盖阶钳抽旨样示的液办咐法酬来述做乌。椒只味可尿惜嘉在承实齐际旗操辈作慌中粪,随分那层察分沿群卷常护常衔有拨一碍些津“饰自旺然削”曾形市式啄,域例必如勿从慈行锐政态系擦统伙划聚分勇等牵。碍因夕此章,解我逐们尼只壮能抽面翻对遇初好级插单窜元艺大止小蠢不蛙等悄的织情矮形鸦,程由笼于贷初善级淋单漏元专大学小运不落一种样谢,谜合摇理拢的西手旅段践是旷对识初饼级必单缠元咬采枪用进不暖等联概垄率汗抽律样峡。先次给锯出砌一反些妹相夹关曲的稀记装号引:——表示第初级单元中第个次级单元—第初级单元总和—第初级单元平均值——总体总和——总体平均数(按次级单元)——总体平均数(按初级单元)—第i初级单元内方差1、项只甚抽辱取称一酷个宾初挂级钟单区元雾情枣形因(n脱=半1丝式)先插考潮虑江从N个锤初套级秤单肺元奥中追随国机层选趋取把1六个付以登推烧断知总抽体似.刃这功种谁情顾形脾看叠起缩慧来旋似妥乎蜂很盘特效殊栋,袜但贡在其生镇活慢中袄也球不慨少族见肚,透例简如颠在感随上机蛇地鸽选油的反一揭个哈班奏级筛中维抽扑取孔几堆个袖人粉进娃行射考狸试悦以环测垒试滋全婚年微级距的惩教效育拦质这量晶。忆只啄选肆取爪1漏个牙单穿元哑,捧仍雷有餐等杏概闹率珠与痰不锦等蒙概义率导之污分益.(也1蚀)等巩概恒率股抽喷取凑初陶级宗单斧元考虑对总体平均数的估计.首先使用抽中的初级单元中的样本平均数对进行估计(9.16)对第i初级单元来讲,由盒子模型可知,是的无偏估计。由于第i个抽样单元是等概率抽取,相当于从盒子中等可能抽取一次,那么所得之数一定是这个盒子平均数的无偏估计,即而,那么不是的无偏估计,而是有偏估计!因此,对只能求均方误差:作为的有偏估计,的均方误差由三部分构成:一是由偏倚引起的平方和,这就是(9.17)式右边的第一项;二是按初级单元(此时初级单元的特征指标当然只能是其平均数)而计算的总体方差,(9.17)式右边的第二项恰好体现出这一点;最后一部分是初级单元中次级单元的方差平方和,这恰好是(9.17)式右边的第三项。从的表达式可以看出,其第一项和第二项都与的选择没有任何关系,倘若要尽力减少误差,目标自然注意到第三项,然而第三部分是无法知道且也是无法估计的,因为既然我们只选取一个初级单元,又如何能估计所有的呢?由于是二阶抽样,也不可能取。在一般情况下,为了方便起见,常采用选取=常数,不管取到哪一个初级单元,总抽预先指定好的样本容量,要不,取与成一定的比例比较合理一些。不是的无偏估计这一缺陷是由“等可能”抽取而引起的,这时候每一个有着同等重要的地位而由于初级单元大小不同,在的构造中显然不是有着同等地位的,这个事实使我们找到了一个弥补“等可能”所引起缺陷的办法,那就是在构造估计量时考虑被抽到的初级单元的大小作为“权”:(9.18)其中表示所有初级单元的平均大小。这个估计的意义很清楚,它的乘以成为第i个初级单元内总和的估计,再乘以N成为总体总和的估计,这个估计除以作为的估计量是合理的。“权”的作用是使初级单元的指标化为次级单元的有关指标。既然是第i个初级单元的总和的无偏估计,由于第一阶抽样的“等可能性”,应当是总体总和的无偏估计,于是有:(9.19)(9.20)的方差为:应当指出,对弥补的只是“期望”或“平均”上的偏倚,至于在精度上是否获益则很难定。例如,倘若各个初级单元的平均数比较稳定,而相距较大,引起前的系数的差异较大,这种场合下比起来变化范围显然大得多,效果就比较差。(界2尾)不孤等下概狮率丹抽浇取盾初流级旧单开元用焰等珍概羞率来方载法劝抽侮取厌初证级获单吨元市对向于熟大斥小授不犯等闯的打初夸级恨单即元撤情形唐显歪然太不鼠太染合钟理雨,氧精傍度高较贞差辞是雁可蚊想沈而滑知逗的完。虾一景般尊地匆,欠我租们局采用袄的性不学等逗概摆率指抽躺取孩法嘴有架如蚕下财几锈种皂:①按概率抽取到第i个初级单元,此时构造的估计量为:(9.21)与表面上形式相同,只不过取的概率为而取的概率为(9.22)即是的无偏估计量。(9.23)②抽取概率按预先指定的一组概率来实施,构造估计量为:(9.24)(9.25)即是的无偏估计量。(9.26)显然,若取,则。若取,则。③抽取方式与②相同,但构造的关于的估计量为:(9.27)此时,每个具有权,因此(9.28)一般地,因此是有偏估计。其均方误差为:(9.29)C宋o敞c叨h腊r主a沈n构房诚造叠了踏一绝个奖虚笼拟淹总汗体(蛛N=3汗)进枣行离抽柏样闲以邀对昆上歇述五挑种充方滔法插进跌行刘比丸较雨:例9坡.地2C塑o城c碌h涌r讨a熟n尸(普1亭9置7炼7选)N渣=软3初哑级得单阻元(大叫小河不生等)的颜虚核拟霸总置体1230,11,2,2,33,3,4,4,5,524618240.5000.6670.8000.52.04.0方法抽取各单元的概率的估计量是否无偏单元间单元内总计Ⅱ无偏05.7920.2566.048Ⅲ无偏01.8130.1892.002Ⅳ无偏03.5830.2133.796Ⅴ有偏0.0621.8000.1732.035ⅠⅠ有偏0.3402.0560.1442.5410.3402.0560.1832.579取Ⅰ唯取上表中最后一列的MSE是比较优劣的关键,尽管是无偏估计,但是效果最差。同样是无偏估计,的效果最好。这两个事实也表明了“无偏性”对于估计量的误差判断并非是决定性的,有时为了使均方误差小一些,人们宁可放弃无偏性,作为有偏估计其效果几乎不亚于。注意到Ⅲ、Ⅳ、Ⅴ三种方法都是不等概率抽样,Ⅴ与Ⅲ除了不同外其余均相同,由于与差异不大,因此Ⅴ的效果相对也就比较好。而对于,尽管与相同,但对其估计量“刻意”要求无偏却引起了均方误差的很不理想!2、抽取个初级单元情形两病个钻以窑上贺的井初若级代单愉元犹里海进坑行畜第傻二颈阶矩抽死样剩,万合声理每的民基俯本资假定精是双在勒不前同习的摩初件级夫单俭元芝内大的垮抽棵样绝过吧程狱相尼互紫之宝间典独毯立妻。远为悟方犯便起原见填,止仍组像甩以但前奇一假样咐假父定梁第根二蹲阶沿抽枣样甘为摇简裕单忍随商机羡抽汗样坦,末在施这一泊小洲段潮讨叠论由中酿,队我岂们适主宋要缠考舞虑白总谣体汪总润和中的螺估柄计研。(1)支初击级寇单的元霞按袄多箭项丽抽仆样夫方闯法售抽吴取设初级单元以给定的一组概率逐个放回地抽取n次,在每个被抽中的初级单元里实施容量为的简单随机抽样:假若第i个初级单元在第一阶抽样中被抽中二次或二次以上,那么在第i个初级单元中将独立地对全体次级单元进行二次或二次以上的容量为的简单随机抽样。显然,对第i个初级单元的总和可自然地找到无偏估计,以这些代替的话,那么整群抽样中的Hansen—Hurwitz型估计无疑为提供了无偏估计:(9.30)其平方扯差制为在:(9.31)其中(2)王初醋级因单映元慎按做简沈单搜随拦机薯抽吩取永方勉式暗抽绒取由齐于纸二扮阶浆抽丙样包都罚是屋采局用沟简益单曾随患机雹抽焰样妥形堆式蓝,臂于琴是艰可竹对斑总体脆总樱和梯采榴用木一祖个谷最蓬为内简效单绳的轰估夺计类形响式棵:(9.32)由于与是与的无偏估计,因此也是的无偏估计。其租方典差荣为化:(9.33)方差的无偏估计为:(9.34)其中这暂类竖简贪单酱估肤计场虽土然帮形洁式供简暗单尽,肢而慰且至结作构耀也白容变易岔为经人振们百接受状,刘同机时电又扭是述总士体餐的馆无演偏荡估摧计惰,叼但期是亮它弦的救效讯果划并宫不细理贫想尺,迹方差谦显辉得厉较耕大廊。(3)围按呆不万放渠回娘不问等匠概副率湖抽会取协初虽级押单拔元如果抽取到的第i个初级单元的总和估计为(简单随机抽样下的无偏估计),那么由第六章第二节易知,总体总和的二阶估计可采用如下形式的Horvitz—Thompson估计量。现在考虑初级单元是按不放回不等概率抽取,而第二阶抽取仍为在抽取的初级单元中实行简单随机抽样。那么在第一阶抽样中就存在包含概率。(9.35)由于或是的无偏估计,又是的无偏估计,所以是的无偏估计。其匀方选差撤为讽:(9.38)其中方差的无偏估计为:(9.39)其中§3三怖阶尺及爸多漫阶色抽京样将锹有却关歇二怨阶预抽痛样李的射一燥些芝公平式冤与旅估津计达推搂广行到惧三疾阶蛛乃冷至兄更平高阶沟的锻情伐况讨是窝很网现瓜实怠的各,是其睛实埋基掩本剩上竭是困依充样凤画陈葫邻芦商,告只东不宴过合在符冈号魂与修计熔算础方啊面滴更观为缎复协杂出些名,针尤植其斜是激对御于沾各健级填单碑元僚大糖小京都拿相等让时督更宁是纽奉如矩此揭,炭下妇面烂以密三旁阶任为艘例厦。1、艳各纱级臂单尝元撒大技小饼均运相敲等吐时钻的乓三敬阶扶抽西样设励总周体脖中胆含锁有N个库初城级覆单粱元柔,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论