




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章抽样
抽样使我们能从总体具有代表性的部分样本中获取数据,从而可以得到关于整个总体的有效结论。
———[英]托尼·普罗科特社会调查方法浙江工业大学开篇案例例我们知道道,近几几十年来来,美国国总统大大选前夕夕,总有有一些民民意测验验机构喜喜欢对总总统选择择投票的的结果进进行预测测。1936年美国总总统选举举前夕,,盖洛普普民意测测验所仅仅仅调查查了3000人,就成成功地预预测了民民主党人人罗斯福福将当选选为美国国的新一一任总统统。1984年这家民民意测验验机构又又一次成成功地预预测了罗罗纳得•里根将以以59%比41%的优势战战胜蒙代代尔而当当选为美美国的新新一任总总统。这这一预测测结果与与实际投投票结果果(59%::41%%)相一致致。而当当时盖洛洛普民意意测验所所在将近近1亿美国选选民中,,调查的的对象还还不到2000人。社会调查查方法浙江工业业大学案例——2004年美国大大选主要要民调样样本数调查机构样本量福克斯新闻1200盖洛普1573全国广播公司/《华尔街日报》1014哥伦比亚广播公司/纽约时报939美国广播公司/华盛顿邮报939《新闻周刊》882社会调查查方法浙江工业业大学51.34%48.31%2004年美国总总统大选选一周前前民调结结果社会调查查方法浙江工业业大学抽样与我我们的生生活生活中充充满了抽抽样冬泳之前前,用脚脚尖试探探一下水水温;做菜时,,用勺子子舀起一一些试试试味道浓浓了还是是淡了;;在书店挑挑选一本本营销调调研的书书籍,随随手拿起起一本,,翻看其其中几页页以决定定是否购购买;体检时抽抽一试管管的血看看看身体体血液情情况;……社会调查查方法浙江工业业大学为什么需需要抽样样?一些实验验本质上上是破坏坏性的物理上不不具备考考察总体体所有项项目的可可能性对总体每每一项目目逐一考考察费用用过高对总体每每一项目目逐一考考察相当当耗时样本结论论充分性性社会调查查方法浙江工业业大学抽样方法法论抽样过程程就是使使用少量量项目或或者总体体的一部部分得出出关于整整个总体体的结论论样本(sample)是一个更更大的总总体的子子集或一一部分抽样的目目的在于于帮助我我们对总总体的一一些未知知特征进进行估计计社会调查查方法浙江工业业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234社会调查查方法浙江工业业大学一、抽样样的有关关术语1、总体(Population)(此指调查查总体))(在社会调调查中用用N表示)通常与构构成的元元素共同同定义,,总体是是构成它它的所有有元素的的集合,,而元素素则是构构成总体体的基本本单位。。(1)研究总体体:是在在理论上上明确界界定的个个体(分分析单位位)集合合体。((是理论论上的总总体)(2)调查总体体:是研研究者实实际抽样样样本的的个体((分析单单位)的的集合体体。(是是实际操操作中的的总体))二者不同同:研究究总体是是我们概概念上的的,而调调查总体体是我们们实际抽抽取样本本的集合合。二者关系系:调查总体体应当无限限趋近直直至等于于研究总体体。如:开展展对某省省大学生生择业倾倾向调查查时,该该省所有有在校大大学生的的集合就就是研究总体,每每个在校校大学生生就是构构成总体体的元素素。该省省所有在在册大学生则构成调调查总体体。2、样本(Sample)(社会会调查中中用n表示)是从调查查总体中中按一定定方式抽抽取出来来的那一一部分代代表的集集合体。。社会调查查方法浙江工业业大学3.抽样(Sampling)是一种选选择调查查对象的的程序与与方法,,即从总总体中选选取一部部分代表表的过程程,也即即从总体体中按一一定方式式选择或或抽取样样本的过过程。如:从某某省总数数为10万人的大大学生总总体中按按照一定定方式抽抽取出1000名大学生生进行调调查,这这1000名大学生生就是构构成总体体的一个个样本。。(从一个总总体中可可以抽取取出若干干个不同同的样本本)4.抽样单位位(SamplingUnit)一次直接接的抽样样所使用用的基本本单位。。抽样单单位和构构成总体体的元素素有时相相同,有有时不同同。5.抽样框(SamplingFrame)也称抽样样范围,,指抽取取样本的的所有抽抽样单位位的名单单。如:从某某所大学学全体学学生中直直接抽取取200名学生作作为样本本—该校全体体学生的的名单从某一所所大学所所有班级级中抽取取3个班级作作为样本本—该校所有有班级的的名单社会调查查方法浙江工业业大学6.参数值(Parameter)也称总体体值,是是关于总总体中某某一变量量的综合合描述。。如:某厂厂职工的的平均收收入、平平均年龄龄……7.统计值(Statistic)也称样本本值,是是关于样样本中某某一变量量的综合合描述。。如:某厂厂职工中中抽取出出一部分分,得到到的平均均收入、、平均年年龄……﹠参数值与与统计值值之间的的区别与与联系::(1)参数值是是确定不不变的、、唯一的的,并且且通常是是未知的的。(2)统计值则则是变化化的,即即对于同同一个总总体来说说,不同同样本所所得到的的统计值值常常是是有差别别的;对对于某一一个特定定的样本本来说,,统计值值是已知知的,是是可以通通过计算算得到的的。(3)联系:通通过样本本统计值值可以推推算总体体参数值值,从而而达到调调查部分分以认识识总体的的目的。。这就是是抽样调调查的作作用所在在。社会调查查方法浙江工业业大学8.抽样误差差(SamplingError)是指在用用样本统统计值去去推估总总体参数数值时所所存在的的偏差。。它是由由抽样本本身的随随机性引引起的,,是不可可避免的的。但是是抽样误误差的大大小是控控制的。。﹠抽样误差差的意义义:是衡衡量样本本代表性性好坏的的标准,,抽样误误差越小小,说明明样本的的代表性性越好,,反之,,则越不不好。社会调查查方法浙江工业业大学9.置信水平平与置信信区间(1)置信水水平(ConfidenceLevel)也称置信信度,指指的是总总体参数数值落在在样本统统计值某某一区间间内的概概率。(2)置信区区间(ConfidenceInterval)是指在一一定范围围的置信信水平下下,样本本统计值值与总体体参数值值之间的的误差范范围(3)置信水水平与置信区间间的关系﹠置信水平平反映的的是抽样样的可靠靠性程度度,置信信区间反反映的是是抽样的的精确性性程度。。﹠在其他条条件不变变的情况况下,置置信水平平越高,,置信区区间越大大;置信信水平越越低,置置信区间间越小。。对抽样样的可靠靠性程度度要求越越高,抽抽样的精精确性程程度将越越低;对对抽样的的可靠性性程度要要求越低低,则抽抽样的精精确性程程度将越越高。社会调查查方法浙江工业业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234社会调查查方法浙江工业业大学二、抽样样的基本本程序(一)界界定总体体即在具体体抽样前前,对从从中抽取取样本的的总体范范围作出出明确的的界定。。﹠为什么要要对总体体进行界界定?原因之一一:是由由抽样调调查的目目的决定定的,其其目的是是调查部部分以反反映总体体。原因之二二:界定定总体是是达到良良好的抽抽样效果果的前提提条件。。例如:1936年美国总总统大选选前《文学文摘摘》杂志的抽抽样社会调查查方法浙江工业业大学思考美国的《文学文摘摘》是一本1890年—1938年间在美美国发行行颇为流流行的新新闻杂志志。1920年、1924、1928、1932年的美国国总统大大选前都都作出了了准确的的预测。。1936,《文学文摘摘》进行了一一次最具具雄心的的民意测测验活动动:选票票寄给了了从电话簿与车牌登登记单中中挑选出出来的1000万人。收收到了200万人以上上的回应应;结果果显示,,有57%人支持共共产党候候选人阿阿尔夫·兰登,而而当时在在任的美美国总统统富兰克克林·罗斯福的的支持率率为43%。两个星期期以后全全民选举举的结果果出来了了,罗斯斯福以历历史上最最大的优优势61%的得票率率获得第第二届任任期。思考:为为什么《文学文摘摘》的预测会会失败??社会调查查方法浙江工业业大学(二)选选择抽样样的具体体方法,,确定抽抽样的精精确性程程度与样样本规模模﹠如何确定定抽样的的精确性性和样本本规模((待)(三)制制作抽样样框(回回顾什么么是抽样样框)当采用一一次性抽抽样时,,应依据据已经明明确界定定的总体体范围,,收集总总体中全全部抽样样单位的的名单,,并对名名单按随随机原则则进行统统一编号号,建立立起供抽抽样使用用的抽样样框。﹠例如:我我们要在在浙江工工业大学学进行一一项该校校学生职职业观的的抽样调调查。﹠注意:当当采取多多级抽样样时,则则需制作作多个抽抽样框。。﹠例如:为为了了解解某市小小学生的的学习情情况,需需要从全全市500所小学中中抽取500名小学生生调查。。社会调查查方法浙江工业业大学﹠准确的抽抽样框原原则:1、完整性性2、不重复复性例如:在城市居居民户的的抽样中中,会经经常出现现一户有有多处住住房的情情况,这这样很容容易把一一户重复复列入抽抽样框,,使得他他们在抽抽样中的的中选概概率高于于其他居居民,相相反,许许多城市市居民居居住条件件比较差差,很多多居民同同住在一一个门牌牌号中,,因此很很容易遗遗漏。两两种情况况均违背背了随机机抽样的的等概率率原则。。社会调查查方法浙江工业业大学(四)实实际抽取取样本即在前进进几个步步骤的基基础上,,严格按按照所选选定的抽抽样方法法,从抽抽样框中中抽取一一个个抽抽样单位位,构成成调查样样本。(五)评评估样本本质量所谓样本本评估,,就是对对样本的的质量、、代表性性、偏差差等进行行初步的的检验和和衡量,,其目的的是防止止由于前前面步骤骤中的失失误而使使样本偏偏差太大大,进而而导致整整个调查查的失误误。﹠评估样本本的基本本方法:将可得得到的反反映总体体中某些些重要特特征及其其分布的的资料与与样本中中的同类类指标的的资料进进行对比比。若二二者之间间的差别别很小,,则可认认为样本本的质量量较高,,代表性性较好;;反之,,若二者者之间的的差别十十分明显显,则表表明样本本的质量量和代表表性不可可能高。。因而需需要对前前面的抽抽样步骤骤进行检检查、修修正,直直到抽出出质量较较高、代代表性较较好的样样本为止止。社会调查查方法浙江工业业大学﹠例如:从我校3000名学生中中抽取300名学生作作为样本本。同时时,我们们从学校教务处或或学生处处得到下下列统计计资料::全校男生占学生总总数的53%,女生占占47%;本市学生生占40%,外省学学生占60%。那么,,我们可可以对抽抽出的300名学生进进行这两两方面分分布情况况的统计计。假定定样本统统计得到到的结果果是:男生占52%,女生占48%;本市学生生占41%,外省学生生占59%。两相对对比,可可以发现现二者之之间的差差距很小小,这就就在一定定程度上上说明,,样本的的质量较较高,代代表性较较好,从从这样的的样本中中得到的的结果往往往能较较好地反反映和体体现总体体的情况况。社会调查查方法浙江工业业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234社会调查查方法浙江工业业大学三、抽样样类型﹠根据调查查总体中中每一个个个体有有无同等等的机会会入选样样本,可可以将抽抽样分为为概率抽抽样与非非概率抽抽样两大大类。﹠概率抽样样─是依据据概率论论的原理理,按照照等概率原原则进行的抽抽样,因因而它能能够避免免抽样过过程中的的人为误误差,保保证样本本的代表表性。此此法在社社会调查查最常用用。﹠非概率抽抽样─主要是是依据研研究者的的主观意意愿、主主观判断断或是否否方便等等因素来来抽取调调查对象象,它不考虑抽抽样中是是否等概概率,因而往往往产生生较大的的误差,,难以保保证样本本的代表表性。此此法在社社会调查查中用得得较少。。社会调查查方法浙江工业业大学﹠根据抽取取调查对对象的具具体方式式的不同同,又可可分将概概率抽样样与非概概率抽样样分为若若干小类类,具体体分类如如下图所所示。简单随机机系统抽样样概率抽样样分层抽样样整群抽样样抽样方法法多段抽样样偶遇抽样样非概率抽样样判断抽样样定额抽样样雪球抽样样probabilitysampleNon--probabilitysamplesample社会调查查方法浙江工业业大学(一)概率抽抽样1、简单随随机抽样样(SimpleRandomSampling)★概念:它它是按等等概率原原则直接接从含有有N个个体的的总体中中抽取n个个体组组成样本本(N>n)。其典典型就是是抽签。。★方法:一一是抽签签;二是是利用随随机数表表来抽样样。★利用随机机数表进进行抽样样的具体体步骤是是:(1)先取得得一份调调查总体体所有个个体的名名单(即即抽样框框);(2)将总体体中所有有个体一一一按顺顺序编号号;(3)根据总总体规模模是几位位数来确确定从随随机数表表中选几几位数码码;(4)以总体体规模为为标准,,对随机机数表中中的数码码逐一进进行衡量量并决定定取舍;;(5)根据样样本规模模的要求求选择出出足够的的数码个个数;(6)依据从从随机数数表中选选出的数数码,到到抽样框框中去找找出它所所对应的的个体。。这些个个案的集集合就构构成样本本。★适用范围围:总体体单位数数目和所所需样本本数目都都比较少少。例:某总总体共6000人,现需需要从中中抽取300名作为样样本进行行调查,,运用随随机数表表法。社会调查查方法浙江工业业大学2、系统抽抽样(SystematicSampling)★概念:是是把总体体中的个个体进行行随机编编号并排排序,再再计算出出某种间间隔,然然后按这这一固定定的间隔隔抽取个个体的号号码来组组成样本本的方法法。★具体步骤骤:(1)给总体体中的每每一个个个体随机机编上号号码并按按号码排排序,即即制作抽抽样框;;(2)计算出出抽样间间距,公公式为::K=N//n(K—抽样间隔隔,N—总体规模模,n—样本规模模);(3)在最前前面的K个个体中中,随机机抽取一一个个体体,并记记号其编编号(假假定为A),作为为随机起起点;(4)在抽样样框中,,自A开始,每每隔K个个体抽抽取一个个个体,,即所抽抽取个体体的编号号分别为为A,A+K,A+2K,.,A+(n-1)K;(5)将这n个个体合合起来,,就构成成了该总总体的一一个样本本。社会调查查方法浙江工业业大学例如:某学院共有1000名学生,,要抽取取一个容容量为100的大学生生样本,,使用系系统抽样样的方法法如何抽抽取。课堂练习习:现要对某某一产品品的口味味进行测测试,需需要从调调查总体体的150人中抽取取12人进行测测试,请请使用系系统抽样样的方法法抽取样样本。?思考:如如果总体体的个体体数不能能被样本本容量整整除时,,如何处处理?社会调查查方法浙江工业业大学001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√社会调查查方法浙江工业业大学★注意:一一般不选选用系统统抽样方方法的情情况。(1)在总体体的名单单中,个个体的排排列具有有次序上上的先后后和等级级上的高高低的时时候。
(2)在总体体名单中中,个体体的排列列上有与与抽样间间隔相对对应的周周期性分分布的情情况。
★适用范围围:总体体数量不不大,个个体排列列无次序序性和周周期性。。社会调查查方法浙江工业业大学3、分层抽抽样(StratifiedSampling)★概念:是是先将总总体中的的所有个个体按某某种特征征或标志志划分为为若干类类型,然然后再在在各类型型中采用用简单随随机抽样样或系统统抽样的的方法抽抽取一个个子样本本,最后后将这些些子样本本合起来来构成总总体的一一个样本本。其中,N为总体,,Ni为子总体体,n为样本,,ni为子样本本社会调查查方法浙江工业业大学★具体步骤骤:(1)确定分分类标准准,如性性别、年年龄、地地区等。。(2)按确定定的标准准将总体体单位分分为若干干类型。。(3)计算各各类型单单位数量量占总体体单位数数量的比比重。设总体单位位数为N,各类型型单位数数为Ni,各类型单位数占占总体单单位数的的比重为Ri。公式:Ri=Ni//N(4)根据Ri计算出各各类型中中应抽取取样本单单位的数数量。设各类型型的样本本单位数数为ni,所需抽抽取的样样本总数数为n。公式:ni=n×Ri(5)按简单单随机抽抽样或系系统抽样样方法从从各类型型中按比比例抽取取样本。。社会调查查方法浙江工业业大学分类随机抽样样总体样本子群社会调查查方法浙江工业业大学★例如:某某省1000个乡,其其中山区区乡500个,丘陵陵乡300个,平原原乡200个,现在在要抽取取100个乡进行行调查,,如何运运用分层层抽样来来抽取样样本?解:设山山区i=1,,丘陵i=2,,平原i=3R1=N1/N×100%=500/1000××100%=50%R2=N2/N×100%=300/1000××100%=30%R3=N3/N×100%=200/1000××100%=20%n1=R1×n=50%×100=50n2=R2×n=30%×100=30n3=R3×n=20%×100=20即从500个山区乡乡中抽取取50个,从300个丘陵乡乡中抽取取30个,从200个平原乡乡中抽取取20个。其中中各阶段段均使用用简单随随机抽样样的方法法进行。。社会调查查方法浙江工业业大学★课堂练习习:某地共有有居民20000户,其中中高收入入居民4000户,中等等收入居居民12000户,低收收入居民民4000户,现要要从中抽抽取500户做购买买力调查查,如何何运用分分层抽样样抽取样样本?社会调查查方法浙江工业业大学★优点:(1)可以在在不增加加样本规规模的前前提下,,降低抽抽样误差差,提高高抽样的的精度。。(2)便于了了解总体体内不同同层次的的情况,,便于对对总体中中不同层层次和类类别进行行单独研研究,或或进行比比较。★注意:(1)分层标标准:A.以调查所所要分析析和研究究的主要要变量或或相关的的变量作作为分层层标准;;B.以保证各各层内部部同质性性强,各各层之间间异质性性强、突突出总体体内在结结构的变变量作为为分层标标准;C.以那些已已有明显显层次区区分的变变量作为为分层变变量。社会调查查方法浙江工业业大学(2)分层比例例:A.按比例分分层B.不按比例例分层——在用样本本资料去去推断总总体时,,要调整整样本中中各层的的比例,,使数据据资料恢恢复到总总体中各各层实际际的比例例结构。。例如:某厂有工工人600人,按性性别分层层则有男男工500人,女工工100人,现要要抽取60人作为样样本进行行调查,,分别按按比例分分层和不不按比例例分层抽抽样。★适用范围围:总体体单位数数量较多多,单位位之间差差异性较较大。社会调查查方法浙江工业业大学4、整群抽抽样(ClusterSampling)
思考:某高中有有8000名学生,,分为200个班级,,每班有有40名学生,,现在要要从中抽抽取400名学生调调查本校校学生消消费情况况,问::使用简简单随机机抽样方方法和系系统抽样样方法分分别如何何抽取样样本?除除了使用用以上方方法,还还能怎样样抽取样样本?社会调查查方法浙江工业业大学NnN1N2N3N4N5N6N2N6N3★概念::是从总总体中随随机抽取取一些小小群体,,然后由由所抽出出的若干干个小群群体内的的所有元元素构成成调查的的一个样样本。其中,N为总体,,Ni为子总体体,n为样本社会调查查方法浙江工业业大学划分子群随机抽样社会调查查方法浙江工业业大学★整群抽样样与前几几种抽样样方法的的最大区区别在于于,它的的抽样单单位不是是单个的的个体,,而是成群的个个体。★具体步步骤:1、将总体体各单位位按一定定标准划划分为若若干群体体。2、以群为为单位,,从整体体中抽取取部分群群(数量量确定))3、将这些些群中的的所有个体体合起来,,形成总总体的一一个样本本。社会调查查方法浙江工业业大学★特点::(1)优点::可简化化抽样的的过程,,降低调调查中收收集资料料的费用用,同时时还能相相对地扩扩大抽样样的应用用范围。。(2)缺点::是样本本的分布布面不广广,样本本对总体体的代表表性相对对较差。。(解释::在95℅的置信度度下,置置信区间间为+3℅这一范围围,简单单随机抽抽样500个个体,,整群抽抽样800个个体。。)★整群抽抽样的应应用范围围较广,,在简单单随机抽抽样与系系统抽样样中,都都要求有有一份总总体所有有成员的的名单,,即抽样样框。但但在实际际调查过过程中,,这样的的名单往往往难获获得,此此时可采采用整群群抽样来来解决问问题。★适用范围围:总体体规模较较大,各各群体之之间差异异性不大大,而群群体内部部个体之之间差异异性较大大。社会调查查方法浙江工业业大学★思考:分分层抽样样与整群群抽样的的适用范范围有何何不同??为什么么?
当群间同同质性高高,群内内异质性性高时,,适合于于采用整整群抽样样的方法法当群间异异质性高高,群内内同质性性高时,,则适于于采用分分层抽样样的方法法社会调查查方法浙江工业业大学课堂练习习:某中学有有4800名学生,,分为4个年级,,80个班,现现在要抽抽取480名学生进进行学生生身体健健康状况况调查,,运用简简单随机机抽样、、系统抽抽样、分分层抽样样和整群群抽样的的方法分分别如何何抽取样样本?社会调查查方法浙江工业业大学5、多段抽抽样(Multi-stagesampling)按抽样单单位的隶隶属关系系或层次次关系,,把抽样样分为几几个阶段段来进行行。例如:从从全市300所小学抽抽取300名小学生生调查,,可以分分为几个个阶段来来进行??每个阶阶段的抽抽样单位位分别是是什么??优点:简简化抽样样过程。。缺点:抽抽样误差差大。在同等条条件下,,减少多多段抽样样误差的的方法是:适当增加加开头阶阶段的样样本数而而相对减减少后面面阶段的的样本数数。社会调查查方法浙江工业业大学
例如:某某地有2.4万名教师师,他们们分布在在全市10个区的200所学校里里,现在在要抽取取一个由由1200名教师组组成的样样本,按按照三级级抽样的的方法,,有以下下几种抽抽样方案案:?思考:1、哪一种种方案最最节省人人力和经经费?2、哪一种种方案得得到的样样本精确确度最高高?3、考虑到到实际情情况,你你在抽样样中会选选择哪种种方案??为什么么?第一阶段第二阶段第三阶段方案110个区每个区抽4所学校每所学校抽30名教师方案210个区每个区抽20所学校每所学校抽6名教师方案3从10个区中抽5个区每个区抽12所学校每所学校抽20名教师方案4从10个区中抽3个区每个区抽10所学校每所学校抽40名教师方案5从10个区中抽1个区每个区抽12所学校每所学校抽100名教师社会调查查方法浙江工业业大学假设我们们的总体体是全国国所有城城市的集集合,我我们要抽抽取一个个规模为为40个个城市的的样本。若按简单单随机抽抽样或系系统抽样样的方法法,则首首先需要要弄到一一份全国国城市的的名单,,然后根根据随机机数表或或通过计计算抽样样间距直直接从抽抽样框中中抽取城城市;若按分层层抽样的的方法,,则可以以先按城城市规模模将总体体分为特特大城市市、大城城市、中中等城市市和小城城市四类类,然后后分别从从每一类类中抽取取若干城城市,并并将这些些城市合合起来构构成样本本;如果采用用整群抽抽样的方方法,则则可以以以省(自治区,直辖市市)为抽抽样单位位,从全全国31个省((自治区区、直辖辖市)中中随机抽抽取三至至五个省省(自治治区、直直辖市)),再以以所抽中中的这些些省(自自治区、、直辖市市)中所所包含的的全部城城市的集集合作为为样本。。几种抽样样方法的的比较社会调查查方法浙江工业业大学五种概率率抽样方方法的图图示比较较简单随机机抽样社会调查查方法浙江工业业大学五种概率率抽样方方法的图图示比较较不按比例例分层按比例分分层社会调查查方法浙江工业业大学五种概率率抽样方方法的图图示比较较整群抽样样社会调查查方法浙江工业业大学五种概率率抽样方方法的图图示比较较系统抽样样社会调查查方法浙江工业业大学五种概率率抽样方方法的图图示比较较多段抽样样社会调查查方法浙江工业业大学6、PPS抽样当元素的的大小不不同,或或者元素素在总体体中的地地位不同同时,我我们需要要采用不等概率率抽样的方法。。比如,,从全市市几百家家企业中中抽取20家企企业进行行调查时时,一个个有着数数万职工工的大型型企业与与一个只只有一二二百人的的小企业业所占的的地位,,显然是是很不一一样的。。如果此此时仍然然采用等等概率抽抽样的方方法,则则样本的的代表性性和精度度都会比比较差。。而如果果采用不不等概率率抽样的的方法,,使大的的企业入入选样本本的概率率大一些些,小企企业入选选样本的的概率小小一些,,这样就就可以大大大提高高估计的的精度。。社会研究究中最重重要、也也最常用用的一种种不等概概率抽样样叫做““概率与与元素的的规模大大小成比比例的抽抽样”(samplingwithprobabilityproportionatetosize),简称PPS抽样样。社会调查查方法浙江工业业大学假设要从从全市100家企业,,总共20万名职工工中,抽抽取1000名职工进进行调查查。已知知最大的的企业多多达16000名职工,,而最小小的企业业则只有有200名职工。。如果我们们采取多多段抽样样的方法法,先从从100家企业中中随机抽抽取若干干家企业业,比如如说抽取取20家;然后后再从这这20家企业中中分别抽抽取50名职工(50××20==1000)构成样本本。第一阶段段:入选选概率是是相同的的,即都都为20÷100==20%%第二阶段段:规模大的的企业中中每个职职工被抽抽中的概概率则为为20%%×(50÷÷16000)=0.0625%;规模小的的企业中中每个职职工被抽抽中的概概率为20%××(50÷200)=5%社会调查查方法浙江工业业大学采用PPS的方法::先将各各个元素素(即企业)排列起来来,然后写出出它们的的规模、、计算它它们的规规模在总总体规模模中所占占的比例例;将它它们的比比例累计计起来,,并根据据比例的的累计数数依次写写出每一一元素所所对应的的选择号号码范围围,然后后采用随随机数表表的方法法或系统统抽样的的方法选选择号码码,号码码所对应应的元素素入选第第一阶段段样本,,最后再再从所选选样本中中进行第第二阶段段抽样(即从每个个被抽中中的元素素中抽取取50名职工)。社会调查查方法浙江工业业大学用PPS方法抽取取第一阶阶段样本本举例序号规模所占比例累计选择号码范围所选号码入样元素企业1企业2企业3企业4企业5企业6企业7企业8企业9企业10…企业98企业99企业10030002000160002001200600080060014004200…40018006001.5%1%8%0.1%0.6%3%0.4%0.3%0.7%2.1%…0.2%0.9%0.3%1.5%2.5%10.5%10.6%11.2%14.2%14.6%14.9%15.6%17.7%…98.8%99.7%100%000-014015-024025-104105106-111112-141142-145146-148149-155156-176…978-987988-996997-999012048、095133148171…995元素1元素2、3元素4元素5元素6…元素20社会调查查方法浙江工业业大学由于规模模大的企企业其所所对应的的选择号号码范围围也大,,而选样样号码范范围大时时,被抽抽中的概概率也大大(有些特别别大的企企业还可可能抽到到不止一一个号码码,比如如企业3就抽到两两个号码码。那么么在第二二阶段抽抽样中,,就要从从企业3中抽取50×2=100名职工)。由于规规模大的的企业在在第一阶阶段抽样样时被抽抽中的概概率大于于规模小小的企业业,这样样就补偿偿了第二二阶段抽抽样时规规模大的的企业中中每个职职工被抽抽中的概概率小的的情况,,使得无无论规模模大还是是规模小小的企业业中,每每个职工工总的被被抽中的的概率都都是相等等的。所所以,这这种方法法最终抽抽出的样样本对总总体的代代表性也也大。社会调查查方法浙江工业业大学7、户内抽抽样户内抽样样的概念念——以家庭为为单位时时,从入入选家庭庭中抽取取一个成成年人构构成访谈谈对象的的抽样方方法。方法之一一:科什什选择法法(kish)方法之二二:生日日法社会调查查方法浙江工业业大学科什选择择法具体体做法::1、调查表编编号表编号AB1B2CDE1E2F表数量(N)1/61/121/121/61/61/121/121/62、印制选选择卡,,给每个个调查员员发一套套(八种种)社会调查查方法浙江工业业大学Kish选择表A式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213141516或以上1F式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上6社会调查查方法浙江工业业大学3.给抽中家家庭每个个成年人人进行编号并排排序。方法是是男性在在前、年年级大的的在前。。序号年龄和性别特征1最年长的男性2次年长的男性……n最年幼的男性n+1最年长的女性n+2次年长的女性……n+m最年幼的女性序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁社会调查查方法浙江工业业大学4.根据调查查表上的的编号找找出编号号相同的的那种““选择表表”查出出中选个个体的序序号,进进行调查查。序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁F
式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上6社会调查查方法浙江工业业大学生日法具具体做法法:1、随机确确定一年年中的某某一天为为标准日日前2、了解所所抽中的的户中18岁以上的的人口数数,以及及每人的的生日3、计算每每人的生生日距离离标准日日期的天天数4、从中选选出生日日距离标标准日期期最近或或最远的的人作为为调查对对象社会调查查方法浙江工业业大学(二)非概率率抽样1.偶遇抽样样(AccidentalorConvenienceSampling)是指研究究者根据据现实情情况,以以自己方方便的形形式抽取取偶然遇遇到的人人作为调调查对象象,或者者仅仅选选择那些些离得最最近的、、最容易易找到的的人作为为调查对对象2.判断抽样样(JudgmentalorPurposiveSampling)是调查者者根据研研究目标标和自己己的主观观分析来来选择和和确定调调查对象象的方法法(对调调查者的的要求比比较高))。3.定额抽样样(QuotaSampling)是按调查查对象的的某种属属性或特特征将总总体中所所有个体体分成若若干类或或层,然然后在各各层中按按比例抽抽样。抽抽样时不不要求遵遵守随机机原则。。社会调查查方法浙江工业业大学例如:某某高校2000名学生,,其中男男生60﹪,女生40﹪;文科学学生和理理科学生生各占50﹪,一、二二、三、、四年级级学生分分别占40﹪、30﹪、20﹪、10﹪,现用定定额抽样样方法依依上述三三个变数数抽取一一个规模模为100的样本。。男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(20人)一二三四一二三四一二三四一二三四129631296386428642表1100个人的定额样本分布表社会调查查方法浙江工业业大学课堂练习习某工厂有有3000名工人,,男工占占30℅,女工70℅,30岁以下的的60℅,30-40岁的30℅,40岁以上的的10℅,问如何何采用定定额抽样样的方法法抽取一一个规模模为300人的样本本?社会调查查方法浙江工业业大学男工(90人)女工(210人)30岁以下30—40岁40岁以上30岁以下30—40岁40岁以上54人27人9人126人63人21人表2300个人的定额样本分布表社会调查查方法浙江工业业大学4.滚雪球抽抽样(SnowballSampling)是先从几几个适合合的个体体开始,,然后通通过他们们得到更更多的个个体,这这样一步步步地扩扩大样本本规模的的抽样方方法。此此法常用用于去寻寻找具有有相同性性质的个个体,就就象滚雪雪球一样样。(如如下图))AB社会调查查方法浙江工业业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差1234社会调查查方法浙江工业业大学四、样本本规模((Samplesize)与抽样样误差((SamplingError)思考并回回答下列列问题:1、什么是是样本规规模?社社会调查查中对样样本规模模有什么么要求??2、表4-7说明了一一个什么么问题??3、影响样样本规模模确定的的因素有有哪些??4、如果总总体为3000时,所需需样本为为600,那么在在总体为为9000时,所需需的样本本应为多多少?((图4-8)5、表4-8说明一个个什么问问题?6、抽样的的精确度度与哪两两个因素素有关??分别如如何影响响的?在其他条条件一定定的情况况下,置置信度越越高,所所需要样样本规模模())在其他条条件一定定的情况况下,置置信区间间越小,,所需要要样本规规模())7、要达到到同样的的精确度度,在同同质性程程度高和和异质性性程度高高的总体体中,对对样本的的规模的的要求有有何不同同?8、什么是是抽样误误差?抽抽样误差差是否可可以避免免?调查查和研究究中的人人为因素素(如录录入错误误、填答答错误、、计算错错误等))是否属属于抽样样误差??社会调查查方法浙江工业业大学样本规模模又称样样本容量量,是指指样本中中所含个个体的多多少。大大样本((n≥30个个体));小样样本(n<30个个体))。大样样本的平平均数的的分布接接近于正正态分布布,可用用样本的的资料对对总体进进行推论论。但在在社会调调查中,,样本规规模一般般不能少少于100个个体。。(一)影影响样本本规模确确定的因因素(正相关关+,负相关关-)1.规模大小小((+))2.总体异质质性程度度((+))3.估计的精精确性要要求((+))4.调查者所所拥有的的经费、、人力和和时间((+))(二)样样本规模模与抽样样误差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CAQI 273-2022水处理构筑物用钢结构模块
- 办公助手考试题及答案
- opc面试题及答案
- 环保顾问考试题及答案
- 工商助理面试题及答案
- 传统故事面试题及答案
- 我初心使命演讲稿
- 小餐饮店承包合同范本
- 和解协议书和调解协议书
- 劳务合同纠纷调解协议书
- GB/T 44951-2024防弹材料及产品V50试验方法
- 2024年公路水运工程试验检测师《桥梁隧道工程》考试题库大全(含真题)-上(单选题)
- 2025届内蒙古鄂尔多斯市康巴什区鄂尔多斯一中高考考前模拟数学试题含解析
- 宁夏银川市一中2025届高考数学押题试卷含解析
- 高考3500词汇表(完整版)
- 中国咳嗽基层诊疗与管理指南(2024年)解读
- 经营高危险性体育项目游泳申请表
- 风险管理师-国家职业技能标准(2022年版)
- 13马尔可夫链公开课获奖课件
- 梯控系统解决方案
- 银行行长任职表态发言稿(7篇)
评论
0/150
提交评论