版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章社会调查的抽样4.1抽样的概念和意义4.1.1抽样的概念1.总体(population)2.样本(sample)3.抽样(sampling)4.抽样单位(samplingunit)5.抽样框(samplingframe)6.总体值(parameter)7.样本值(statistic)1.总体总体通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本就是从总体中按一定方式抽取出的—部分元素的集合。或者说一个样本就是总体的一个子集。
3.抽样所谓抽样,指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位就是一次直接的抽样所使用的基本单位。5.抽样框抽样框又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。6.总体值参数值也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。7.样本值统计值也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。抽样的类型4.1.2抽样的意义抽样作为人们通过部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。解决了对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。4.2概率抽样的原理与方法4.2.1概率抽样的原理抽样的最终目的在于通过对样本的统计值的描述来相对准确地勾画出总体的面貌。概率抽样的方法可以帮助我们实现这一目标,并且可以对这种勾画的准确程度作出估计。随机抽取是这一过程的关键。所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。或者说,总体中的每一个成员被抽中的概率相等(也即被抽中的机会相等)。而且,任何一个个体的入选与否,与其他个体毫不相关,互不影响。或者说,每一个个体的抽取都是相互独立的,是一种随机事件。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好地按总体内在结构中所蕴涵的各种随机事件的概率来构成样本,使样本成为总体的缩影。4.2.2概率抽样的方法1.简单随机抽样
简单随机抽样又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。1)抽签法当总体数目较少时,可以使用抽签法进行简单随机抽样。2)随机数法当总体中的个体数目较多时,通常采用随机数法,即利用随机数表、随机数骰子、计算机产生的随机数等进行抽样。
使用随机数表抽取数码的具体步骤先取得一份总体所有元素的名单(即抽样框);将总体中所有元素一一按顺序编号;根据总体规模是几位数来确定从随机数表中选几位数码;以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;根据样本规模的要求选择出足够的数码个数;依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。2.系统抽样系统抽样又称等距抽样或机械抽样。它是把总体中的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔来抽取个体号码组成样本的方法。它和简单抽样一样,需要有完整的抽样框,是直接从总体中抽取个体,无其他中间环节。系统抽样的具体步骤
给总体中的每一个个体按顺序编号,制定出抽样框。计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式求得:
K(抽样间距)=N(总体规模)/n(样本规模)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的个体编号为A),它称做随机的起点。在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A十K,A十2K,…,A十(n-1)K。将这n个个体合起来,就构成了该总体的一个样本。系统抽样的注意事项(1)总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况。(2)总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况。3.分层抽样分层抽样又称类型抽样,它是先将总体中的所有单位按某种特征或标志划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。分层抽样的优点在不增加样本规模的前提下降低抽样误差,提高抽样的精度。
非常便于了解总体内不同层次的情况,以便对总体内不同的层次进行单独研究,或者进行比较研究。分层抽样应考虑的问题(1)分层的标准问题
通常的分层原则有:第一,以所要分析和研究的主要变量或相关的变量作为分层的标准。第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。第三,以那些已有明显层次区分的变量作为分层变量。分层抽样应考虑的问题(1)分层的比例问题
分层抽样中有按比例和不按比例分层两种方法。
按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。采取按比例分层抽样的方法,可以确保得到一个与总体结构完全一样的样本。不按比例抽样的方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较,但若要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,即通过调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。4.整群抽样整群抽样与前几种抽样的最大差别在于,它的抽样单位不是单独的个体,而是成群的个体。它是从总体中随机抽取—些小的群体,然后由所抽出的若干个小群体内的所有元素构成的样本。整群抽样中对小群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。整群抽样的优缺点优点:
1、采取整群抽样的方法,不仅可以简化抽样的过程,更重要的是它可以降低收集资料的费用,同时还能相对地扩大抽样的应用范围;
2、节省经费、人力;
3、研究的可行性高。
缺点:
1、样本的分布面不广
2、样本对总体的代表性相对较差5.多阶段抽样多段抽样又称多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。在社会研究中,当总体规模特别大,或者总体分布范围特别广时,一般采取多段抽样的方法来抽取样本。多段抽样的具体做法是:先从总体中随机抽取若干大群(组),然后再从这几个大群(组)内抽取几个小群(组),这样一层层抽下来,直至抽到最基本的抽样元素为止。多阶段抽样的注意事项就是要在类别和个体之间保持平衡,即保持合适的比例。选择多阶段抽样方案的考虑因素(1)各个抽样阶段中的子总体同质性程度同质性程度越高的子总体,所抽的规模就应相对小一点;反之,则应大一点。(2)要考虑研究者所拥有的人力和经费
多段抽样的方法适用于总体范围特别大、对象的层次特别多的社会研究。由于它不需要总体的全部名单,各阶段的抽样单位数一般较少,因而抽样比较容易进行。但由于每级抽样时都会产生误差,故这种抽样方法的误差较大,这是它的主要不足。在同等条件下减少多段抽样误差的方法是:相对增加开头阶段的样本数而适当减少最后阶段的样本数。所以,当研究者的人力和经费允许时,应尽量扩大开头阶段的抽样规模。6.户内抽样与PPS抽样
(1)户内抽样的方法
当研究者以家庭作为分析单位,以入户访谈的方法收集资料,试图研究城乡家庭的结构、关系、生活方式或其他内容时,常常不仅需要抽出家庭户的样本,同时还要进行户内抽样——从所抽中的每户家庭中抽取一个成年人,以构成访谈对象的样本。在抽取家庭中的成年人之前的每个抽样阶段中,我们可以采用前面所介绍的某种方法来抽。而这最后一个阶段的抽样则可以采取一种被称做“Kish选择法”的方式进行。根据这种方法,每户家庭中所有的成年人(比如说18岁以上者)都具有同等的被选中的概率(机会)。Kish的具体做法
研究者先将调查表分为(编号为)A、B1、B2、C、D、E1、E2、F八种,每种表的数目分别占调查表总数的1/6、1/12、1/12、1/6、1/6、1/12、1/12、1/6。同时,印制若干套(一套八种)“选择卡”发给调查员,每人一套。“选择卡”的形式如下表。Kish选择表Kish选择表Kish选择表Kish选择表
调查员首先要对每户家庭中的成年人进行排序和编号,排序的方法是男性在前,女性在后;年纪大的在前,年纪小的在后,如下表。
然后,调查员按照调查表上的编号找出编号相同的那种“选择表”,根据家庭人口数目从“选择表”中查出该选个体的序号,最后对这一序号所对应的那个家庭成员进行访谈。优点:不仅可以使研究者收集到样本家庭的资料,同时也可以收集到由这些被访者所构成的个人样本的资料,这种资料可以用来描述这一地区所有成年人所构成的总体。
(2)PPS抽样
以上所介绍的抽样方法有一个共同的特点:总体(或子总体)中的每一个元素都具有同等的被抽中的概率。如果总体中每个元素的“大小”基本相同,或者每一个元素在总体中的地位或重要性相差不多,则这种基于同等概率的抽样是合适的。但当元素的大小不同,或者元素在总体中的地位不同时,则需要采用不等概率抽样的方法。社会研究中重要、也最常用的一种不等概率抽样叫做“概率与元素的规模大小成比例的抽样”,简称PPS抽样。
PPS抽样方法
先将各个元素排列起来,然后写出它们的规模、计算它们的规模在总体规模中所占的比例,将它们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围(该范围的大小等于元素规模所占的比例),然后用随机数表的方法或系统抽样的方法选择号码,号码所对应的元素入选第一阶段样本。最后再从所选样本中进行第二阶段抽样。
4.3非概率抽样的方法和应用
非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其他条件来抽取样本。常用的非概率抽样有以下几种。
偶遇抽样判断抽样定额抽样雪球抽样
1、偶遇抽样定义:
偶遇抽样又称方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近的、最容易找到的人作为对象。
注意:
偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概率。那些最先被碰到的、最容易见到的、最方便找到的对象具有比其他对象大得多的机会被抽中。正是这一点使我们不能依赖偶遇抽样得到的样本来推论总体。
2、判断抽样定义:判断抽样又称立意抽样,它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。
优缺点:主要优点在于可以充分发挥研究人员的主观能动作用,特别是当研究者对研究总体的情况比较熟悉、研究者的分析判断能力较强、研究方法与技术十分熟练、研究的经验比较丰富时,采用这种方法往往十分方便。但是它仍属于一种非概率抽样,所以,其所得样本的代表性往往难以判断。
3、定额抽样定额抽样又称做配额抽样,它是一种比偶遇抽样复杂一些的非概率抽样方法。进行定额抽样时,研究者要尽可能地依据那些有可能影响研究变量的因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例,然后依据这种划分以及各类成员的比例去选择对象,使样本中的成员在上述各种因素、各种特征方面的构成及其在样本中的比例都尽量接近总体。
3、定额抽样定额抽样又称做配额抽样,它是一种比偶遇抽样复杂一些的非概率抽样方法。进行定额抽样时,研究者要尽可能地依据那些有可能影响研究变量的因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例,然后依据这种划分以及各类成员的比例去选择对象,使样本中的成员在上述各种因素、各种特征方面的构成及其在样本中的比例都尽量接近总体。
4、雪球抽样
雪球抽样是一种极特殊的抽样方法。当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并再询问他们知道的人。
4.4样本规模与抽样误差4.4.1样本规模与抽样误差概述样本规模又称为样本容量,它指的是样本中所含个案的多少。统计学中通常以30为界,把样本分为大样本(30个个案及以上)和小样本(30个个案以下)。需要注意的是,30个个案的样本对于社会研究来说却常常是不够的。
95%置信水平下不同抽样误差所要求的样本规模
4.4.2影响样本规模确定的因素1.抽样的精度一般来说,对抽样精度要求越高,那么所需的样本规模就越大。应该注意到,在样本规模达到一定程度的情况下,存在增加样本规模的“投入”和降低抽样误差的“产出”效益的问题。考虑抽样误差与样本规模的关系,还应该考虑抽样方案的设计问题。
4.4.2影响样本规模确定的因素2.总体的规模一般来说,总体越大时,则样本也要越大,这样才能保证一定的精确度。但当总体规模大到一定程度时,样本规模的增加与它并不保持同等的增长速度。在其他有关因素一定时,样本规模的增加速度大大低于总体规模的增加速度。换句话说,当总体规模达到一定程度时,样本规模的改变量是很小的。
4.4.2影响样本规模确定的因素3.总体的异质性程度一般来说,要达到同样的精确性,在同质程度高的总体中抽样时,所需要的样本规模就小一些;而在异质程度高的总体中抽样时,所需要的样本规模就大一些。与总体异质性程度有关的另一个因素是,当总体中的大部分成员对某个问题的问答或选择与小部分成员的回答或选择不同时,则所需要的样本规模要小一些;而当选择两种不同回答的成员比例相差无几时,则所需要的样本规模为最大。
4.4.2影响样本规模确定的因素4.研究者所拥有的时间、经费与人力
从样本的代表性、抽样的精确性考虑,则样本规模当然是越大越好;但抽样所得到的样本是要用来进行调查的。样本规模超大,同时也意味着所需要投入的人力、物力和时间越多;意味着所可能受到的限制和障碍也越多。因此,究竟选择多大规模的样本,往往需要作出选择。而这种选择的一个重要砝码,就是研究者所拥有的经费、人力和时间。
复习思考题:1.何谓随机抽取?其内涵是什么?2.举例说明分层抽样和整群抽样的适用情况。3.在一个由900人构成的总体中,按简单随机抽样的方法抽取一个30人的样本,请列出具体步骤。4.在某大学30000名学生中,使用系统抽样的方法直接抽取一个容
量为1000的大学生样本,请列出具体步骤。5.简单随机抽样、系统抽样是怎样保证其随机性的?6.有人说使用分层抽样法抽取的样本最具有代表性,你是否同意这
个说法?请说明理由。复习思考题:7.通过户内抽样的方法,在一个由祖父、祖母、父亲、母亲、儿子(>18岁)的五口之家中选择访谈对象(假设给定的Kish表为B1式或E1式),并说明理由。8.如果条件允许,多段抽样应该尽可能扩大哪一级的样本规模?为
什么?9.影响样本规模的因素主要有哪些?10.从社会科学期刊中选择几篇调查报告,分析并评价这些调查研
究中所采用的抽样方法。11.为什么说“街头拦人”不是随机抽样?复习思考题:12.判断抽样在哪些场合下比较适用?13.分层抽样和配额抽样的主要区别在哪里?14.在PPS抽样中,如何保证规模不等的群中的元素有同等概率入选
样本?15.系统抽样能否自动保证可测性?为什么?拓展练习题:一、名词解释总体和个体2.抽样3.参数值与统计值4.抽样框
5.置信区间6.置信度7.非概率抽样8.分层抽样9.整群抽样10.判断抽样11.配额抽样12.系统抽样13.抽样分布14.样本规模拓展练习题:二、判断并改错1.
在样本容量一定的情况下,研究者所要求的置信度越高,则置信区间越窄。2.在其他条件一定的情况下,置信度越低,则所要求的样本规模越大。3.非概率抽样能够保证样本对总体的代表性。4.抽样调查中,存在抽样误差与样本规模误差,因此,社会研究应尽量用整体调查的方法。拓展练习题:三、简答题1.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大班数学活动认识时间
- 最简单的劳务合同模板
- 婚庆公司合作协议书范本全新版
- 聘请运营经理合同协议书(2024版)
- 2024年度无人机飞行服务协议3篇
- 软件系统合同模板
- 房产过户协议书范本
- 项目工程合同执行与监督合同规定(2024版)
- 气胸手术营养支持
- 《家禽的品种与育种》课件
- 颈椎间盘突出护理查房
- 110升压站1#主变就位作业票
- 防爆型除湿机施工方案
- 大学语文优质课件《韩孟诗派》
- 2023年国家宪法宣传周知识竞赛答题考试题库300题(含答案)
- 机械原理-第4章力分析
- 浙江省衢州市衢江区2023-2024学年六年级上学期11月期中科学试题
- 液化石油气脱硫技术研究
- 1999-2023年南京大学844环境工程学考研真题及答案解析汇编
- 06K131 风管测量孔和检查门
- 第20课 皮影戏(说课稿)2022-2023学年美术三年级上册
评论
0/150
提交评论