社会调查方法03抽样一_第1页
社会调查方法03抽样一_第2页
社会调查方法03抽样一_第3页
社会调查方法03抽样一_第4页
社会调查方法03抽样一_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章抽样社会调查方法03抽样一共69页,您现在浏览的是第1页!

抽样概述一.抽样的含义抽样:从总体中按一定规则抽取部分单位的过程。二.抽样的分类非概率抽样:依据调查目的和对调查对象的分析,主观有意识地在由研究对象构成的总体中选择样本。概率抽样:依据概率理论计算抽样误差,按照随机原则选择样本,对总体进行推断,完全不带调查者的主观意识。社会调查方法03抽样一共69页,您现在浏览的是第2页!

三.抽样的基本术语个体与抽样单位(SamplingUnit):个体是指一次直接的抽样所使用的基本单位,它往往与抽样单位相同,但并不完全等同;总体(population):所有调查对象的集合体。它包括研究总体和调查总体,二者也不能完全等同;总体规模:总体中含有的抽样单位的数目(N)。

样本(Sample):从总体中抽取出的一部分抽样单位的集合体。样本容量:样本中含有的抽样单位的数目(n)。社会调查方法03抽样一共69页,您现在浏览的是第3页!

抽样框(SamplingFrame):一次抽样时总体中所有抽样单位的名单。总体参数值(Parameter):关于总体中某一变量取值的综合描述。样本统计值(Statistic):关于样本中某一变量取值的综合描述。抽样误差(samplingerror):样本统计值和总体参数值之间的差异。不可避免置信水平(confidencelevel):总体参数值落在样本统计值某一正负区间的概率。置信区间(confidenceinterval):在一定的置信水平下,样本统计值与总体参数值偏差的最大允许范围。社会调查方法03抽样一共69页,您现在浏览的是第4页!四.抽样的基本规律随机原则(randomprinciple):在完全排除主观上人为选择的前提下,使总体中每一个单位有相同被抽中的机会。——概率抽样社会调查方法03抽样一共69页,您现在浏览的是第5页!四.抽样的基本规律大数规律:大量重复观察的结果的平均数几乎接近某个确定的数值。试验者抛硬币的次数N正面次数n出现正面的机会n/N蒲丰404020480.5069皮尔逊1200060190.5016皮尔逊24000120120.5005大数规律的抛币实验社会调查方法03抽样一共69页,您现在浏览的是第6页!1.确定总体根据调查目的,确定调查对象的范围,包括时间,地点,和人物。并排列调查总体中所有能找到的调查对象。美国《文学摘要》的失败社会调查方法03抽样一共69页,您现在浏览的是第7页!3.设计和选取样本确定样本的数量1.抽样误差2.调查成本选择抽样的具体方法:不同的抽样方法产生的样本代表性不同。——先抽好样本再调查——边抽部分样本边调查

社会调查方法03抽样一共69页,您现在浏览的是第8页!五.抽样的特点

1.

更少投入2.

速度快,周期短3.

应用范围广4.设置较多的较复杂的调查项目,并能集中时间和精力作详细的分析,可获得内容丰富的资料5.

准确性较高6.由样本情况来推断总体情况社会调查方法03抽样一共69页,您现在浏览的是第9页!第二节概率抽样概率抽样:总体内的所有个体具有相同的不为零被抽入样本的机会。等概率抽样与不等概率抽样社会调查方法03抽样一共69页,您现在浏览的是第10页!2.方法总体较小时:抓阄,抽签法如果要你从3000总体中抽取100个,用抽签法如何?社会调查方法03抽样一共69页,您现在浏览的是第11页!2.评价优点:概率抽样的理想类型,无偏见,简单易行,能对总体进行推断,误差小。缺点:1.

需要为总体每个要素编号,当总体所含个体的数目太多时采用这种方法费时费力;2.总体内分类明显时,这种抽样无法按类别特征自动分配样本数,若想保证样本的代表性,必须增大样本量,使工作量增大社会调查方法03抽样一共69页,您现在浏览的是第12页!★●★■■▼■●●★■▼▼★★★★★●●●▼▼▼■■■■■■▼★★●分类随机抽样社会调查方法03抽样一共69页,您现在浏览的是第13页!

2.分层抽样的种类:划分标准:各层子样本容量的确定方式(一)按比例分层抽样按比例分层抽样要求:各子样本在总样本中所占比例=各层在总体中所占的比例——简单便利,常用

(二)非比例分层抽样(最优分层抽样)

根据其他因素(如各层平均数或标准差的大小等),调整各层样本的单位数。各子样本在总样本中所占比例≠各层在总体中所占的比例,不同层的单位入样的概率不同,是不等概率抽样。——对总体中规模太小的层作比较研究不等概率抽样的后期统计一般要做特殊处理。

社会调查方法03抽样一共69页,您现在浏览的是第14页!分层抽样的适用性1.当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。2.分层抽样可以提高总体参数估计的精确度。3.有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。4.便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。社会调查方法03抽样一共69页,您现在浏览的是第15页!三.系统抽样(SystematicSampling)

(等距抽样)(一)直线等距抽样(抽样间距K为整数)1.将总量的所有个体按一定顺序排列。2.计算抽样间距。抽样间距是由总体数目与样本数目决定的。如果总体数为N,样本数为n,则抽样间距应是:NK=——n3.在1—K范围内,随机抽取一个起点数r4.自r开始,每隔K个单位抽取一个单位,依次抽取的单位号码为r,r+k,r+2k,r+(n-1)k特点:每一列被选中的概率相同(图)社会调查方法03抽样一共69页,您现在浏览的是第16页!(二)循环等距抽样(k不为整数)方法1.1.将总体N首尾相连,NK=——,取接近K的整数;2.随机起点r从1-N中随机抽取n方法2.调整直线等距抽样1.将K的小数点后移,便为整数[K]2.确定整数的随机起点[r],从10-[K]中选3.确定非整数的随机起点r,即将[r]的小数点移回来4.从r开始,每隔K各单位抽取一个单位5.再将所有抽取的号码的小数点略去特点:所有单位有相同的中选概率1/K社会调查方法03抽样一共69页,您现在浏览的是第17页!系统抽样练习某杂志对其订阅者进行一次邮寄访问,以更好地了解读者市场。N=150万(1500000),n=1500。如何抽取样本?社会调查方法03抽样一共69页,您现在浏览的是第18页!四.整群随机抽样(ClusterSampling)

将总体按照某种标准分为i个群(互不重叠),每个群作为一个抽样单位,用随机的办法从中抽取若干群,将抽出的群中所有个体合在一起作为总体的样本。整群抽样与分层抽样有相似之处,步都是按某种标准将总体划分为一些子群。但是分层抽样是在所有子群中均抽取一个子样本,作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中。所以整群抽样的分群标准要求群间异质性低,群内异质性高。适用于界定不清的总体。社会调查方法03抽样一共69页,您现在浏览的是第19页!N5000R153R250R358R448R153R448R3352R9850n250总体群(互不重叠)子群样本确定分群特征R11047……R13045社会调查方法03抽样一共69页,您现在浏览的是第20页!比较分层抽样和整群抽样分层抽样整群抽样样本每层均要选取子样本作为总样本的一部分只选择某几个子群作为整体的代表层与层的关系层的划分具有较高的代表性,即层之间异质性高群间异质性低层内性质层内则尽可能同质群内异质性高变量选择研究变量的选择与研究问题高度相关研究变量与研究问题相关社会调查方法03抽样一共69页,您现在浏览的是第21页!练习调查城市居民的情况,拟抽取1000样本。该城市有500个居委会,每个居委会平均有100户居民。利用整群抽样如何操作?社会调查方法03抽样一共69页,您现在浏览的是第22页!某市23个区,714万人,从中抽1000人的样本将区作为初级抽样单位每区人数不等,把每区人数的号码范围列出,东区是1-120000号,西区是120001-270000号……一直排到7140000号从这些号码中用随机数字表确定10个号码,这10个号码所落入的区即为调查区。如抽中340000号,它落在南区,则南区为调查区从这10个调查区中,每区再随机抽取100人就构成最终样本多阶段抽样举例社会调查方法03抽样一共69页,您现在浏览的是第23页!多阶段抽样要注意平衡类别和个体举例:某市2.4万教师,分布在10个区200所学校,要抽1200教师组成样本。三阶段抽样阶段第二阶段第三阶段方案1抽10个区抽4所学校每所学校抽30教师方案2抽2个区抽20所学校每所学校抽30教师方案3抽10个区抽20所学校每所学校抽6教师方案4抽8个区抽15所学校每所学校抽10教师方案5抽5个区抽12所学校每所学校抽20教师方案6抽4个区抽10所学校每所学校抽40教师方案7抽3个区抽10所学校每所学校抽40教师方案8抽2个区抽10所学校每所学校抽60教师方案9抽1个区抽12所学校每所学校抽100教师社会调查方法03抽样一共69页,您现在浏览的是第24页!第三节样本规模

样本规模:样本容量,样本中所含个体的多少适当样本规模:既能有比较好的代表性,还考虑成本。社会调查方法03抽样一共69页,您现在浏览的是第25页!确定样本规模应考虑的因素(1)研究的精确度要求;(2)总体的性质,包括总体规模和总体内异质程度;(3)分析要求(4)抽样方法;(5)无回答情况(6)可用于调查的人力、财力、物力。社会调查方法03抽样一共69页,您现在浏览的是第26页!两类代表性误差①随机误差(抽样误差):由于样本范围与总体范围的不同而产生,受样本规模、总体变异程度等影响②系统误差:由于抽样方法的不科学所致,如果采用严格的概率抽样就可以消除样本的系统误差,这时误差的主要来源就是抽样误差.

社会调查方法03抽样一共69页,您现在浏览的是第27页!总体的异质性程度与抽样误差总体内个体间差异不大,选用少量的个体就可以代表总体,如士兵,中小学生如果总体内部个体间差异很大,较大的样本才能保证总体中各类个体均有自己的代表在决定精确度后,样本大小的确定不仅与总体规模有关,还与总体的异质程度有关社会调查方法03抽样一共69页,您现在浏览的是第28页!社会调查方法03抽样一共69页,您现在浏览的是第29页!★非概率抽样的特点样本的取得基于调查者对总体的了解及调查目的的主观判断总体的每个单位没有相同的被选择机会样本的调查结果推断总体,可靠性不能正确估计社会调查方法03抽样一共69页,您现在浏览的是第30页!二.判断抽样(JudgmentalorPurposiveSampling)

判断抽样(立意抽样):调查者根据研究目的和自己主观经验来选择和确定调查对象。作用:发现问题,提出假设(前测)适用:1.

总体结构差异较大,样本容量较小2.无法确定总体边界3.研究者的时间和设备有限无法进行概率抽样社会调查方法03抽样一共69页,您现在浏览的是第31页!三.配额抽样(QuotaSampling)按照调查对象的某种特征将总体中所有单位分成若干类或层,然后在各层中非随机抽取子样本,样本中各层所占的比例与它们在总体中所占的比例一样。步骤:1.按研究需要决定对总体进行分层或分类的标准2.按照标准将总体细分为若干层,确定不同特征的总体单位在总体中的比例3.依据上述比例,决定样本单位在各层中的配额4.在各层中自由地选择总体单位进行调查社会调查方法03抽样一共69页,您现在浏览的是第32页!年龄独立控制配额抽样年龄样本18-308031-506550以上55总计200举例:分层标准:性别、婚姻状况、年龄,n=200社会调查方法03抽样一共69页,您现在浏览的是第33页!缺点1.分层不可能兼顾总体的众多属性,只能考虑其中的几种,不可能做出很细的分类2.总体分布变化的最新信息不容易得到,因而配额的合理性很难保证3.主观性很大。如一个访问员会本能地避免访问难以找到的受访者。社会调查方法03抽样一共69页,您现在浏览的是第34页!优点1.保证抽取的样本具有某总体特征,抽样误差和成本比较小2.推荐获得的样本较好地满足抽样对样本的人口统计学和心理统计学的要求,因为推荐人对这些特征比随机情景更熟悉缺点1.要求样本单位间必须有一定的联系并且愿意保持和提供这种联系2.最后仍有可能许多个体无法找到,还有些个体因某些原因被提供者故意漏掉。社会调查方法03抽样一共69页,您现在浏览的是第35页!美国《文学摘要》抽样的失败1936年,美国进行总统选举,竞选的是民主党的罗思福和共和党的兰登,罗思福是在任的总统。美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封,这在调查史上,样本容量这么大是少见的,杂志社花费了大量人力和物力,他们相信自己的调查统计结果,即兰登以57%对43%的比例获胜,并大力进行宣传。最后选举结果却是,罗思福以62%对38%的巨大优势获胜,连任总统。这个调查使《文学摘要》杂志社威信扫地,不久,只得关门停刊。试分析这次调查失败的原因。社会调查方法03抽样一共69页,您现在浏览的是第36页!?为什么要知道一个人的血液情况,只需要抽一点点血来化验就可以了?社会调查方法03抽样一共69页,您现在浏览的是第37页!?一个新闻记者就市民关心的问题,在街头碰到谁调查谁,是不是遵循了随机原则。社会调查方法03抽样一共69页,您现在浏览的是第38页!五.抽样的基本程序

1.确定总体.2.确定抽样框3.设计和选取样本4.对样本进行评估社会调查方法03抽样一共69页,您现在浏览的是第39页!2.确定抽样框——操作层面

对于不同类型的总体抽样框的形式也有多种。社会调查方法03抽样一共69页,您现在浏览的是第40页!

4.对样本进行评估初步检查样本的代表性,避免因失误使样本偏差太大收集若干容易得到的资料作为总体和样本之间的比较方法。社会调查方法03抽样一共69页,您现在浏览的是第41页!抽样成功的依据样本能代表总体能判断抽样误差社会调查方法03抽样一共69页,您现在浏览的是第42页!一.简单随机抽样(SimpleRandomSampling)1.特点简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会。要保证抽样框的充分性,如果某些个体被漏掉,它们就丧失了进入样本的机会,就破坏了随机原则。社会调查方法03抽样一共69页,您现在浏览的是第43页!总体较大时:随机数字表随机数法的步骤:1.确定总体N,并编号(N的位数决定所有号码的位数,如N=1000,编号为0001,0002……1000)2.随意指出随即表上其中一个同位数码——起点(如0556)3.确定选择规则(上-下,左-右或其他规则),依次选择足够样本——规则一旦确定,就不变,碰到大于总体的随机数和重复的随机数,跳过(舍去)社会调查方法03抽样一共69页,您现在浏览的是第44页!二.分层抽样(StratifiedSampling)1.分层抽样的内涵:分层抽样是将总体N依照某一种或某几种特征分为几个子总体(层),然后从每一层中采取简单随机抽样或等距抽样方式抽取一个个子样本n1,n2……将这些子样本合在一起即为总体样本n。★使用什么分层变量?一般是选择与调查目标变量高度相关的变量。

★要协调层的数量和每层样本量★分层抽样适用于总体数目较多,异质,一个或多个变量可能影响调查结果的情况,且对所研究的总体有详细的名单。分层后,每层同质,层之间不同质,然后在每层按照比例抽。社会调查方法03抽样一共69页,您现在浏览的是第45页!N10000N11800N23500N33000N41700n118n235n330n417n100总体层(互不重叠)子样本样本确定分层特征社会调查方法03抽样一共69页,您现在浏览的是第46页!举例:20000户居民,按经济收入高低分类,高收入居民4000户,占总体20%;中等收入12000户,占总体60%;低收入户4000户,占总体20%,从中抽取200户,进行购买力调查。等比例分层抽样高收入层样本数:200×20%=40户中收入层样本数:200×60%=120户低收入层样本数:200×20%=40户社会调查方法03抽样一共69页,您现在浏览的是第47页!某高一学生共500人,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%。为了考察学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为50的样本某公司有500人,其中35岁以下的125人,35-49的280人,50以上的95人。为了调查员工的身体健康情况,从中抽取100人,怎样用分层抽样抽?某大学食堂为了了解新生的饮食习惯,以分层抽样方式从1500名新生中抽取200人进行调查,新生中南方学生500人,北方学生800人,西部学生200人,如何抽?某市电视台在网上征集节目现场观众,报名的总人数12000人,来自4城区,东城区2400人,西城区4605人,南城区3795人,北城区1200人。用分层抽样抽取60人参加,如何抽?社会调查方法03抽样一共69页,您现在浏览的是第48页!直线等距抽样练习题:

某大学有12000名学生,欲了解其生活态度,决定采用系统抽样的方法从中抽查200名学生,用简单随机抽样的方法抽出名学生序号为12,请计算第十位,第十五位学生的序号是多少?

社会调查方法03抽样一共69页,您现在浏览的是第49页!等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小

注意:等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差,降低样本的代表性

等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差。在这种情况下应采用另一种分层抽样方法。社会调查方法03抽样一共69页,您现在浏览的是第50页!练习从编号1到900的总体中用系统抽样的办法抽取9个样本某产品共有2563件,产品按出厂顺序编号,号码从1到1563,检测员要从中抽取15件产品进行检测,请给出一个系统抽样方案。要考察某商场2006年的日销售额,从一年时间中抽取52天的销售额作为样本,请给出你的系统抽样方案,并说说你的抽样方案的优点和不足社会调查方法03抽样一共69页,您现在浏览的是第51页!★●★■■▼■●●★■▼▼★★●▼★■★●■▼■★●▼■★●▼■划分子群随机抽样社会调查方法03抽样一共69页,您现在浏览的是第52页!整群抽样评价优点:节省人力物力;可以在没有总体名单即抽样框的条件下进行,扩大抽样的范围。缺点:样本的代表性较差,与其他方法比,在样本数量相同的情况下,抽样误差比较大。社会调查方法03抽样一共69页,您现在浏览的是第53页!思考和讨论对北京市现住人口进行调查,由于流动人口的不确定性,很难得到现住人口的住户清单。1.在这种条件下应该采取那种概率抽样方法?2.大概的思路应该如何?社会调查方法03抽样一共69页,您现在浏览的是第54页!五.多阶段抽样(MultistageSamlping)在整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,既不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法抽出最终样本。因最终样本的获取经过两次抽样,我们称之为二阶段抽样,同样地可进行三阶段,四阶段,即多阶段的抽样。通常在阶段使用严格的随机抽样方法,第二阶段起使用概率比例抽样,即根据每一群所含个体的多少分配样本额。社会调查方法03抽样一共69页,您现在浏览的是第55页!多阶段抽样优点:不需要总体的全部名单适用:调查范围大,单位多,情况复杂的调查对象缺点:在每一阶段抽样都会产生误差社会调查方法03抽样一共69页,您现在浏览的是第56页!选择—标准1.各个抽样阶段子总体的同质性程度同质性程度高—样本规模小2.人力和经费,方案9最节约3.样本误差一般,样本覆盖面越大,代表性越高——增加开头阶段的样本数,适当减少最后阶段的样本数,减少误差社会调查方法03抽样一共69页,您现在浏览的是第57页!统计学与社会调查的样本统计学中通常以30为界,把样本分为大样本和小样本,之所以这样区分,是因为当样本规模大于30时,其平均值的分布将接近于正态分布,从而许多统计学的公式就可以运用,也可以用样本的资料对总体进行推论社会研究样本规模至少不能少于100个社会调查方法03抽样一共69页,您现在浏览的是第58页!抽样误差与样本规模抽样误差:用样本值(统计值)去估计总体值(参数值)时所出现的误差①调查误差(登记误差或工作误差):调查过程中,因记录、整理资料,被调查者回答问题与真实情况不符以及问题本身含糊等出现的差错②代表性误差:样本不能代表总体所造成的误差社会调查方法03抽样一共69页,您现在浏览的是第59页!样本规模与抽样误差密切相关样本越小与总体差异越大,误差越大①样本的大小根据研究所要求的精确度而定,对样本的精确度要求越高所允许的误差则越小,样本就要越大,反之亦然。②在一定的精确度要求下,总体越大则样本也应越大,但是当总体增大到一定规模后,样本规模基本上不再增加。一般研究的误差界限是5%社会调查方法03抽样一共69页,您现在浏览的是第60页!经验确定的样本规模一般社会调查的样本数在50-5000之间精确的抽样调查需要抽样专家和专业研究人员的指导一般的社会调查,实际上并不要求很高的精确度,查人员一般是凭经验确定样本数目的大致范围社会调查方法03抽样一共69页,您现在浏览的是第61页!第四节非概率抽样非概率抽样的适用1.很多情况下严格的概率抽样很难进行2.调查目的仅仅是探索,不是由样本推论总体3.物质和时间条件不允许概率抽样时社会调查方法03抽样一共69页,您现在浏览的是第62页!一.偶遇抽样(AccidentalorConvenienceSampling)偶遇抽样(方便抽样):调查者根据实际情况,以自己方便的形式抽取偶然遇到的人作为样本,或者仅仅选择那些离得最近的,最容易找到的人作为对象。优点:方便省力,花费最小(经费和时间)缺点:样本的代表性差,有很大的偶然性,不能代表总体和推断总体,要谨慎对待调查结果。社会调查方法03抽样一共69页,您现在浏览的是第63页!优点:充分发挥调研人员的主观能动性,尤其是调研人员对研究的情况比较熟悉,判断力比较强,研究方法和技术十分熟练,经验比较丰富时,此方法十分方便。缺点:受到的主观影响很大,若判断不准,误差极大,代表性难以判断。二.判断抽样社会调查方法03抽样一共69页,您现在浏览的是第64页!性别独立控制配额抽样性别样本男99女101总计200婚姻状况独立控制配额抽样婚姻状况样本已婚142未婚58总计200举例:分层标准:性别、婚姻状况、年龄,n=200社会调查方法03抽样一共69页,您现在浏览的是第65页!举例:分层标准:性别、婚姻状况、年龄,n=200交互控制配额抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论