版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样使我们能从总体具有代表性的部分样本中获取数据,从而可以得到关于整个总体的有效结论。———[英]托尼·普罗科特2021/5/91开篇案例
我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主党人罗斯福将当选为美国的新一任总统。1984年这家民意测验机构又一次成功地预测了罗纳得•里根将以59%比41%的优势战胜蒙代尔而当选为美国的新一任总统。这一预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民意测验所在将近1亿美国选民中,调查的对象还不到2000人。2021/5/92浙江工业大学案例——2004年美国大选主要民调样本数调查机构样本量福克斯新闻1200盖洛普1573全国广播公司/《华尔街日报》1014哥伦比亚广播公司/纽约时报939美国广播公司/华盛顿邮报939《新闻周刊》8822021/5/93浙江工业大学51.34%48.31%2004年美国总统大选一周前民调结果2021/5/94浙江工业大学抽样与我们的生活生活中充满了抽样冬泳之前,用脚尖试探一下水温;做菜时,用勺子舀起一些试试味道浓了还是淡了;在书店挑选一本营销调研的书籍,随手拿起一本,翻看其中几页以决定是否购买;体检时抽一试管的血看看身体血液情况;
……2021/5/95浙江工业大学为什么需要抽样?一些实验本质上是破坏性的物理上不具备考察总体所有项目的可能性对总体每一项目逐一考察费用过高对总体每一项目逐一考察相当耗时样本结论充分性2021/5/96浙江工业大学抽样方法论抽样过程就是使用少量项目或者总体的一部分得出关于整个总体的结论样本(sample)是一个更大的总体的子集或一部分抽样的目的在于帮助我们对总体的一些未知特征进行估计2021/5/97浙江工业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差12342021/5/98浙江工业大学一、抽样的有关术语1、总体(Population)(此指调查总体)(在社会调查中用N表示)
通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的基本单位。(1)研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论上的总体)(2)调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是实际操作中的总体)
二者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样本的集合。二者关系:调查总体应当无限趋近直至等于研究总体。如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是研究总体,每个在校大学生就是构成总体的元素。该省所有在册大学生则构成调查总体。2、样本(Sample)(社会调查中用n表示)
是从调查总体中按一定方式抽取出来的那一部分代表的集合体。2021/5/99浙江工业大学3.抽样(Sampling)
是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,也即从总体中按一定方式选择或抽取样本的过程。
如:从某省总数为10万人的大学生总体中按照一定方式抽取出1000名大学生进行调查,这1000名大学生就是构成总体的一个样本。(从一个总体中可以抽取出若干个不同的样本)4.抽样单位(SamplingUnit)
一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相同,有时不同。5.抽样框(SamplingFrame)
也称抽样范围,指抽取样本的所有抽样单位的名单。如:从某所大学全体学生中直接抽取200名学生作为样本—该校全体学生的名单
从某一所大学所有班级中抽取3个班级作为样本—该校所有班级的名单2021/5/910浙江工业大学6.参数值(Parameter)也称总体值,是关于总体中某一变量的综合描述。如:某厂职工的平均收入、平均年龄……7.统计值(Statistic)
也称样本值,是关于样本中某一变量的综合描述。如:某厂职工中抽取出一部分,得到的平均收入、平均年龄……﹠参数值与统计值之间的区别与联系:
(1)参数值是确定不变的、唯一的,并且通常是未知的。
(2)统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值常常是有差别的;对于某一个特定的样本来说,统计值是已知的,是可以通过计算得到的。
(3)联系:通过样本统计值可以推算总体参数值,从而达到调查部分以认识总体的目的。这就是抽样调查的作用所在。
2021/5/911浙江工业大学8.抽样误差(SamplingError)
是指在用样本统计值去推估总体参数值时所存在的偏差。它是由抽样本身的随机性引起的,是不可避免的。但是抽样误差的大小是控制的。﹠抽样误差的意义:是衡量样本代表性好坏的标准,抽样误差越小,说明样本的代表性越好,反之,则越不好。2021/5/912浙江工业大学9.置信水平与置信区间(1)置信水平(ConfidenceLevel)
也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。(2)置信区间(ConfidenceInterval)
是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围(3)置信水平与置信区间的关系﹠置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程度。﹠在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;对抽样的可靠性程度要求越低,则抽样的精确性程度将越高。2021/5/913浙江工业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差12342021/5/914浙江工业大学二、抽样的基本程序(一)界定总体
即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。﹠为什么要对总体进行界定?
原因之一:是由抽样调查的目的决定的,其目的是调查部分以反映总体。原因之二:界定总体是达到良好的抽样效果的前提条件。例如:
1936年美国总统大选前《文学文摘》杂志的抽样
2021/5/915浙江工业大学思考美国的《文学文摘》是一本1890年—1938年间在美国发行颇为流行的新闻杂志。1920年、1924、1928、1932年的美国总统大选前都作出了准确的预测。1936,《文学文摘》进行了一次最具雄心的民意测验活动:选票寄给了从电话簿与车牌登记单中挑选出来的1000万人。收到了200万人以上的回应;结果显示,有57%人支持共产党候选人阿尔夫·兰登,而当时在任的美国总统富兰克林·罗斯福的支持率为43%。两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优势61%的得票率获得第二届任期。思考:为什么《文学文摘》的预测会失败?2021/5/916浙江工业大学(二)选择抽样的具体方法,确定抽样的精确性程度与样本规模﹠如何确定抽样的精确性和样本规模(待)(三)制作抽样框(回顾什么是抽样框)当采用一次性抽样时,应依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并对名单按随机原则进行统一编号,建立起供抽样使用的抽样框。﹠例如:我们要在浙江工业大学进行一项该校学生职业观的抽样调查。﹠注意:当采取多级抽样时,则需制作多个抽样框。﹠例如:为了了解某市小学生的学习情况,需要从全市500所小学中抽取500名小学生调查。2021/5/917浙江工业大学﹠准确的抽样框原则:1、完整性2、不重复性
例如:
在城市居民户的抽样中,会经常出现一户有多处住房的情况,这样很容易把一户重复列入抽样框,使得他们在抽样中的中选概率高于其他居民,相反,许多城市居民居住条件比较差,很多居民同住在一个门牌号中,因此很容易遗漏。两种情况均违背了随机抽样的等概率原则。2021/5/918浙江工业大学(四)实际抽取样本
即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成调查样本。(五)评估样本质量
所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致整个调查的失误。﹠评估样本的基本方法:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量较高,代表性较好;反之,若二者之间的差别十分明显,则表明样本的质量和代表性不可能高。因而需要对前面的抽样步骤进行检查、修正,直到抽出质量较高、代表性较好的样本为止。
2021/5/919浙江工业大学﹠例如:
从我校3000名学生中抽取300名学生作为样本。同时,我们从学校教务处或学生处得到下列统计资料:全校男生占学生总数的53%,女生占47%;本市学生占40%,外省学生占60%。那么,我们可以对抽出的300名学生进行这两方面分布情况的统计。假定样本统计得到的结果是:男生占52%,女生占48%;本市学生占41%,外省学生占59%。两相对比,可以发现二者之间的差距很小,这就在一定程度上说明,样本的质量较高,代表性较好,从这样的样本中得到的结果往往能较好地反映和体现总体的情况。2021/5/920浙江工业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差12342021/5/921浙江工业大学
三、抽样类型
﹠根据调查总体中每一个个体有无同等的机会入选样本,可以将抽样分为概率抽样与非概率抽样两大类。﹠概率抽样─是依据概率论的原理,按照等概率原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。此法在社会调查最常用。﹠非概率抽样─主要是依据研究者的主观意愿、主观判断或是否方便等因素来抽取调查对象,它不考虑抽样中是否等概率,因而往往产生较大的误差,难以保证样本的代表性。此法在社会调查中用得较少。2021/5/922浙江工业大学﹠根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分为若干小类,具体分类如下图所示。简单随机系统抽样概率抽样分层抽样整群抽样抽样方法多段抽样
偶遇抽样非概率抽样判断抽样定额抽样雪球抽样
probabilitysample
Non-probabilitysample
sample2021/5/923浙江工业大学(一)概率抽样
1、简单随机抽样(SimpleRandomSampling)★概念:它是按等概率原则直接从含有N个个体的总体中抽取n个个体组成样本(N>n)。其典型就是抽签。★方法:一是抽签;二是利用随机数表来抽样。★利用随机数表进行抽样的具体步骤是:(1)先取得一份调查总体所有个体的名单(即抽样框);(2)将总体中所有个体一一按顺序编号;(3)根据总体规模是几位数来确定从随机数表中选几位数码;(4)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5)根据样本规模的要求选择出足够的数码个数;(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的个体。这些个案的集合就构成样本。★适用范围:总体单位数目和所需样本数目都比较少。例:某总体共6000人,现需要从中抽取300名作为样本进行调查,运用随机数表法。2021/5/924浙江工业大学2、系统抽样(SystematicSampling)★概念:是把总体中的个体进行随机编号并排序,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。★具体步骤:(1)给总体中的每一个个体随机编上号码并按号码排序,即制作抽样框;(2)计算出抽样间距,公式为:K=N/n(K—抽样间隔,N—总体规模,n—样本规模);(3)在最前面的K个个体中,随机抽取一个个体,并记号其编号(假定为A),作为随机起点;(4)在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A+K,A+2K,.,A+(n-1)K;(5)将这n个个体合起来,就构成了该总体的一个样本。2021/5/925浙江工业大学例如:
某学院共有1000名学生,要抽取一个容量为100的大学生样本,使用系统抽样的方法如何抽取。课堂练习:
现要对某一产品的口味进行测试,需要从调查总体的150人中抽取12人进行测试,请使用系统抽样的方法抽取样本。?思考:如果总体的个体数不能被样本容量整除时,如何处理?2021/5/926浙江工业大学001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√2021/5/927浙江工业大学★注意:一般不选用系统抽样方法的情况。(1)在总体的名单中,个体的排列具有次序上的先后和等级上的高低的时候。
(2)在总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况。
★适用范围:总体数量不大,个体排列无次序性和周期性。
2021/5/928浙江工业大学3、分层抽样(StratifiedSampling)★概念:是先将总体中的所有个体按某种特征或标志划分为若干类型,然后再在各类型中采用简单随机抽样或系统抽样的方法抽取一个子样本,最后将这些子样本合起来构成总体的一个样本。其中,N为总体,Ni为子总体,n为样本,ni为子样本2021/5/929浙江工业大学★具体步骤:(1)确定分类标准,如性别、年龄、地区等。(2)按确定的标准将总体单位分为若干类型。(3)计算各类型单位数量占总体单位数量的比重。
设总体单位数为N,各类型单位数为Ni,各类型单位数占总体单位数的比重为Ri。公式:Ri=Ni/N(4)根据Ri计算出各类型中应抽取样本单位的数量。设各类型的样本单位数为ni,所需抽取的样本总数为n。公式:ni=n×Ri(5)按简单随机抽样或系统抽样方法从各类型中按比例抽取样本。2021/5/930浙江工业大学分类随机抽样总体样本子群2021/5/931浙江工业大学★例如:某省1000个乡,其中山区乡500个,丘陵乡300个,平原乡200个,现在要抽取100个乡进行调查,如何运用分层抽样来抽取样本?解:设山区i=1,丘陵i=2,平原i=3R1=N1/N×100%=500/1000×100%=50%R2=N2/N×100%=300/1000×100%=30%R3=N3/N×100%=200/1000×100%=20%
n1=R1×n=50%×100=50n2=R2×n=30%×100=30n3=R3×n=20%×100=20
即从500个山区乡中抽取50个,从300个丘陵乡中抽取30个,从200个平原乡中抽取20个。其中各阶段均使用简单随机抽样的方法进行。2021/5/932浙江工业大学★课堂练习:
某地共有居民20000户,其中高收入居民4000户,中等收入居民12000户,低收入居民4000户,现要从中抽取500户做购买力调查,如何运用分层抽样抽取样本?2021/5/933浙江工业大学★优点:(1)可以在不增加样本规模的前提下,降低抽样误差,提高抽样的精度。(2)便于了解总体内不同层次的情况,便于对总体中不同层次和类别进行单独研究,或进行比较。★注意:(1)分层标准:A.以调查所要分析和研究的主要变量或相关的变量作为分层标准;B.以保证各层内部同质性强,各层之间异质性强、突出总体内在结构的变量作为分层标准;C.以那些已有明显层次区分的变量作为分层变量。2021/5/934浙江工业大学(2)分层比例:A.按比例分层B.不按比例分层——在用样本资料去推断总体时,要调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。
例如:
某厂有工人600人,按性别分层则有男工500人,女工100人,现要抽取60人作为样本进行调查,分别按比例分层和不按比例分层抽样。★适用范围:总体单位数量较多,单位之间差异性较大。2021/5/935浙江工业大学4、整群抽样(ClusterSampling)
思考:
某高中有8000名学生,分为200个班级,每班有40名学生,现在要从中抽取400名学生调查本校学生消费情况,问:使用简单随机抽样方法和系统抽样方法分别如何抽取样本?除了使用以上方法,还能怎样抽取样本?
2021/5/936浙江工业大学NnN1N2N3N4N5N6N2N6N3★概念:是从总体中随机抽取一些小群体,然后由所抽出的若干个小群体内的所有元素构成调查的一个样本。其中,N为总体,Ni为子总体,n为样本2021/5/937浙江工业大学划分子群随机抽样2021/5/938浙江工业大学★整群抽样与前几种抽样方法的最大区别在于,它的抽样单位不是单个的个体,而是成群的个体。★具体步骤:1、将总体各单位按一定标准划分为若干群体。2、以群为单位,从整体中抽取部分群(数量确定)3、将这些群中的所有个体合起来,形成总体的一个样本。2021/5/939浙江工业大学★特点:(1)优点:可简化抽样的过程,降低调查中收集资料的费用,同时还能相对地扩大抽样的应用范围。(2)缺点:是样本的分布面不广,样本对总体的代表性相对较差。(解释:在95℅的置信度下,置信区间为+3℅这一范围,简单随机抽样500个个体,整群抽样800个个体。)★整群抽样的应用范围较广,在简单随机抽样与系统抽样中,都要求有一份总体所有成员的名单,即抽样框。但在实际调查过程中,这样的名单往往难获得,此时可采用整群抽样来解决问题。★适用范围:总体规模较大,各群体之间差异性不大,而群体内部个体之间差异性较大。2021/5/940浙江工业大学★思考:分层抽样与整群抽样的适用范围有何不同?为什么?
当群间同质性高,群内异质性高时,适合于采用整群抽样的方法当群间异质性高,群内同质性高时,则适于采用分层抽样的方法2021/5/941浙江工业大学课堂练习:某中学有4800名学生,分为4个年级,80个班,现在要抽取480名学生进行学生身体健康状况调查,运用简单随机抽样、系统抽样、分层抽样和整群抽样的方法分别如何抽取样本?2021/5/942浙江工业大学5、多段抽样(Multi-stagesampling)按抽样单位的隶属关系或层次关系,把抽样分为几个阶段来进行。例如:从全市300所小学抽取300名小学生调查,可以分为几个阶段来进行?每个阶段的抽样单位分别是什么?优点:简化抽样过程。缺点:抽样误差大。
在同等条件下,减少多段抽样误差的方法是:适当增加开头阶段的样本数而相对减少后面阶段的样本数。2021/5/943浙江工业大学
例如:某地有2.4万名教师,他们分布在全市10个区的200所学校里,现在要抽取一个由1200名教师组成的样本,按照三级抽样的方法,有以下几种抽样方案:
?思考:1、哪一种方案最节省人力和经费?2、哪一种方案得到的样本精确度最高?3、考虑到实际情况,你在抽样中会选择哪种方案?为什么?第一阶段第二阶段第三阶段方案110个区每个区抽4所学校每所学校抽30名教师方案210个区每个区抽20所学校每所学校抽6名教师方案3从10个区中抽5个区每个区抽12所学校每所学校抽20名教师方案4从10个区中抽3个区每个区抽10所学校每所学校抽40名教师方案5从10个区中抽1个区每个区抽12所学校每所学校抽100名教师2021/5/944浙江工业大学假设我们的总体是全国所有城市的集合,我们要抽取一个规模为40个城市的样本。若按简单随机抽样或系统抽样的方法,则首先需要弄到一份全国城市的名单,然后根据随机数表或通过计算抽样间距直接从抽样框中抽取城市;若按分层抽样的方法,则可以先按城市规模将总体分为特大城市、大城市、中等城市和小城市四类,然后分别从每一类中抽取若干城市,并将这些城市合起来构成样本;如果采用整群抽样的方法,则可以以省(自治区,直辖市)为抽样单位,从全国31个省(自治区、直辖市)中随机抽取三至五个省(自治区、直辖市),再以所抽中的这些省(自治区、直辖市)中所包含的全部城市的集合作为样本。几种抽样方法的比较2021/5/945浙江工业大学五种概率抽样方法的图示比较简单随机抽样2021/5/946浙江工业大学五种概率抽样方法的图示比较不按比例分层按比例分层2021/5/947浙江工业大学五种概率抽样方法的图示比较整群抽样2021/5/948浙江工业大学五种概率抽样方法的图示比较系统抽样2021/5/949浙江工业大学五种概率抽样方法的图示比较多段抽样2021/5/950浙江工业大学6、PPS抽样
当元素的大小不同,或者元素在总体中的地位不同时,我们需要采用不等概率抽样的方法。比如,从全市几百家企业中抽取20家企业进行调查时,一个有着数万职工的大型企业与一个只有一二百人的小企业所占的地位,显然是很不一样的。如果此时仍然采用等概率抽样的方法,则样本的代表性和精度都会比较差。而如果采用不等概率抽样的方法,使大的企业入选样本的概率大一些,小企业入选样本的概率小一些,这样就可以大大提高估计的精度。
社会研究中最重要、也最常用的一种不等概率抽样叫做“概率与元素的规模大小成比例的抽样”(samplingwithprobabilityproportionatetosize),简称PPS抽样。2021/5/951浙江工业大学假设要从全市100家企业,总共20万名职工中,抽取1000名职工进行调查。已知最大的企业多达16000名职工,而最小的企业则只有200名职工。如果我们采取多段抽样的方法,先从100家企业中随机抽取若干家企业,比如说抽取20家;然后再从这20家企业中分别抽取50名职工(50×20=1000)构成样本。第一阶段:入选概率是相同的,即都为20÷100=20%第二阶段:规模大的企业中每个职工被抽中的概率则为20%×(50÷16000)=0.0625%;规模小的企业中每个职工被抽中的概率为20%×(50÷200)=5%2021/5/952浙江工业大学采用PPS的方法:先将各个元素(即企业)排列起来,然后写出它们的规模、计算它们的规模在总体规模中所占的比例;将它们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围,然后采用随机数表的方法或系统抽样的方法选择号码,号码所对应的元素入选第一阶段样本,最后再从所选样本中进行第二阶段抽样(即从每个被抽中的元素中抽取50名职工)。2021/5/953浙江工业大学用PPS方法抽取第一阶段样本举例序号规模所占比例累计选择号码范围所选号码入样元素企业1企业2企业3企业4企业5企业6企业7企业8企业9企业10…企业98企业99企业10030002000160002001200600080060014004200…40018006001.5%1%8%0.1%0.6%3%0.4%0.3%0.7%2.1%…0.2%0.9%0.3%1.5%2.5%10.5%10.6%11.2%14.2%14.6%14.9%15.6%17.7%…98.8%99.7%100%000-014015-024025-104105106-111112-141142-145146-148149-155156-176…978-987988-996997-999012048、095133148171…995元素1元素2、3元素4元素5元素6…元素202021/5/954浙江工业大学由于规模大的企业其所对应的选择号码范围也大,而选样号码范围大时,被抽中的概率也大(有些特别大的企业还可能抽到不止一个号码,比如企业3就抽到两个号码。那么在第二阶段抽样中,就要从企业3中抽取50×2=100名职工)。由于规模大的企业在第一阶段抽样时被抽中的概率大于规模小的企业,这样就补偿了第二阶段抽样时规模大的企业中每个职工被抽中的概率小的情况,使得无论规模大还是规模小的企业中,每个职工总的被抽中的概率都是相等的。所以,这种方法最终抽出的样本对总体的代表性也大。2021/5/955浙江工业大学7、户内抽样户内抽样的概念
——以家庭为单位时,从入选家庭中抽取一个成年人构成访谈对象的抽样方法。方法之一:科什选择法(kish)方法之二:生日法2021/5/956浙江工业大学科什选择法具体做法:1、调查表编号表编号AB1B2CDE1E2F表数量(N)1/61/121/121/61/61/121/121/62、印制选择卡,给每个调查员发一套(八种)2021/5/957浙江工业大学Kish选择表A式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213141516或以上1F式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上62021/5/958浙江工业大学3.给抽中家庭每个成年人进行编号并排序。方法是男性在前、年级大的在前。序号年龄和性别特征1最年长的男性2次年长的男性……n最年幼的男性n+1最年长的女性n+2次年长的女性……n+m最年幼的女性序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁2021/5/959浙江工业大学4.根据调查表上的编号找出编号相同的那种“选择表”查出中选个体的序号,进行调查。序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁F
式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上62021/5/960浙江工业大学生日法具体做法:1、随机确定一年中的某一天为标准日前2、了解所抽中的户中18岁以上的人口数,以及每人的生日3、计算每人的生日距离标准日期的天数4、从中选出生日距离标准日期最近或最远的人作为调查对象2021/5/961浙江工业大学(二)非概率抽样
1.偶遇抽样(AccidentalorConvenienceSampling)
是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象2.判断抽样(JudgmentalorPurposiveSampling)
是调查者根据研究目标和自己的主观分析来选择和确定调查对象的方法(对调查者的要求比较高)。3.定额抽样(QuotaSampling)
是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中按比例抽样。抽样时不要求遵守随机原则。2021/5/962浙江工业大学例如:某高校2000名学生,其中男生60﹪,女生40﹪;文科学生和理科学生各占50﹪,一、二、三、四年级学生分别占40﹪、30﹪、20﹪、10﹪,现用定额抽样方法依上述三个变数抽取一个规模为100的样本。男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(20人)一二三四一二三四一二三四一二三四129631296386428642表1100个人的定额样本分布表2021/5/963浙江工业大学课堂练习某工厂有3000名工人,男工占30℅,女工70℅,30岁以下的60℅,30-40岁的30℅,40岁以上的10℅,问如何采用定额抽样的方法抽取一个规模为300人的样本?2021/5/964浙江工业大学男工(90人)女工(210人)30岁以下30—40岁40岁以上30岁以下30—40岁40岁以上54人27人9人126人63人21人表2300个人的定额样本分布表2021/5/965浙江工业大学4.滚雪球抽样(SnowballSampling)
是先从几个适合的个体开始,然后通过他们得到更多的个体,这样一步步地扩大样本规模的抽样方法。此法常用于去寻找具有相同性质的个体,就象滚雪球一样。(如下图)AB2021/5/966浙江工业大学抽样的有关术语抽样的基本程序抽样类型(方法)样本规模与抽样误差12342021/5/967浙江工业大学四、样本规模(Samplesize)与抽样误差(SamplingError)思考并回答下列问题:1、什么是样本规模?社会调查中对样本规模有什么要求?2、表4-7说明了一个什么问题?3、影响样本规模确定的因素有哪些?4、如果总体为3000时,所需样本为600,那么在总体为9000时,所需的样本应为多少?(图4-8)5、表4-8说明一个什么问题?6、抽样的精确度与哪两个因素有关?分别如何影响的?在其他条件一定的情况下,置信度越高,所需要样本规模()在其他条件一定的情况下,置信区间越小,所需要样本规模()7、要达到同样的精确度,在同质性程度高和异质性程度高的总体中,对样本的规模的要求有何不同?8、什么是抽样误差?抽样误差是否可以避免?调查和研究中的人为因素(如录入错误、填答错误、计算错误等)是否属于抽样误差?2021/5/968浙江工业大学
样本规模又称样本容量,是指样本中所含个体的多少。大样本(n≥30个个体);小样本(n<30个个体)。大样本的平均数的分布接近于正态分布,可用样本的资料对总体进行推论。但在社会调查中,样本规模一般不能少于100个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林大学《汽车与车身构造》2021-2022学年第一学期期末试卷
- 吉林大学《体内药物分析学》2021-2022学年第一学期期末试卷
- 大学生疫情防控核酸检测方案
- 交通基础设施项目预算编制方案
- 青少年艺术节歌唱活动方案
- 美术工具课件教学课件
- 课件怎么结尾教学课件
- 2024-2025年高中政治第一单元公民的政治生活2.4民主监督:守望公共家园教案新人教版必修2
- 高中历史第五单元欧洲的宗教改革5.3马丁路德的新教理论文本素材新人教版选修1历史上重大改革回眸
- 2024-2025学年八年级道德与法治下册第四单元崇尚法治精神8.1公平正义的价值课时作业新人教版
- 《世界主要海峡》
- 中医确有专长综述范文(5篇)
- 非小细胞肺癌NCCN指南解读
- 广东省2020年中考英语试题【含答案】
- EBO管理体系与案例分享
- 拦砂坝施工设计方案
- GB/T 20934-2016钢拉杆
- 教研课平行四边形和梯形的复习ppt
- S曲线和技术进化法则TRIZ专题培训课件
- 铜矿普查简报铜矿
- 消防设施定期检查、检测、维修保养记录
评论
0/150
提交评论