




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会调查中的抽样dys@
董运生
吉林大学社会学系以调查对象的范围为分类1、普查2、抽样调查3、个案调查4、典型调查
普查
抽样调查
个案调查
典型调查运用一定的方法在调查对象总体中抽取一部分调查对象作为样本,并对样本调查结果来推断总体的方法。如何通过选择一小部分人进行研究,并将结论推及到千百万未被研究的人。抽样调查(Samplingsurvey)一、基本术语元素(element)
元素是构成总体的最基本单位,是搜集信息的单位和进行分析的基础
总体(population)
总体是构成它的所有元素的集合
总体通常与构成它的元素(Element)共同定义:总体是构成它的所有元素的集合,而元素则是构成总体的基本单位。(一个总体所包含的元素数常用大写字母N表示)研究总体
研究总体是在理论上明确界定的个体的集合体它必须受几个方面的限定:
内容、单位、范围、时间
调查总体
调查总体是研究者从中实际抽取调查样本的个体的集合体它往往是对研究总体的进一步界定,即对时间、范围做更进一步规定一般地说,样本只能推论调查总体而不是研究总体样本
样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合一个样本就是总体的一个子集抽样
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程
抽样是从总体中按一定方式选择或抽取样本的过程
抽样单位
(samplingunit)
抽样单位就是一次直接的抽样所使用的基本单位指在抽样各阶段中考虑选取的某个元素或者某组元素
在更复杂的抽样中,需要采用不同层次的抽样单位
抽样框
抽样框(samplingframe)又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单
参数值
参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现在统计中最常见的参数值是某一变量的平均值
参数值只有通过对总体中的每一个元素都进行调查或测量才能得到
统计值
统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述是样本中所有元素的某种特征的综合数量表现
抽样的目的之一,就是要通过这些样本值去估计和推断各种参数值抽样设计的目标,就是尽可能使所抽取的样本的估计量接近总体的参数值抽样误差
概率抽样方法很少能提供与所要推论的总体参数值完全相等的统计值置信水平与置信区间
置信水平与置信区间是测量抽样误差程度的两个关键概念我们用置信水平来表示样本统计值的精确度,它是指样本统计值落在参数值某一正负区间内的概率
置信区间是某个统计值的扩展,可使我们的置信度提高
抽样方法非概率抽样概率抽样多段抽样系统抽样分层抽样整群抽样简单随机抽样偶遇抽样判断抽样定额抽样雪球抽样二、非概率抽样方法偶遇抽样判断抽样定额抽样滚雪球抽样空间抽样1、偶遇抽样(accidentalsampling)
又称作方便抽样或自然抽样是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象2、判断抽样(judgmentalsampling)
又叫立意抽样
(purposivesampling)调查者根据研究的目标和自己主观的分析来选择和确定调查对象的方法3、定额抽样(quotasampling)
(重点)又称作配额抽样研究者尽可能地依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例然后依据依据这种划分以及各类成员的比例选择调查对象例:
假设某高校有4000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学生分别占30%、20%和l0%。
现在要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。
依据总体的构成和样本规模,我们得到的定额表
男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(30人)年级一二三四一二三四一二三四一二三四人数129631296386428642
社区调查对象配额表(200人,性别,年龄,职业)4、滚雪球抽样(snowballsampling)
当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并再询问他们知道的人。
5、空间抽样(spacesampling)
游行、集会时适用三、概率抽样方法简单随机抽样系统抽样分层抽样整群抽样多段抽样……….同质性与异质性
所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。总体中的每一个成员被抽中的概率相等(也即被抽中的机会相等)。而且,任何一个个体的入选与否,与其他个体毫不相关,互不影响。每一个个体的抽取都是相互独立的,是一种随机事件。常用的方法:
A、总体元素较少时,类似于抽签方法。
B、总体元素较多时,随机数表法基本原理:从N中抽取n
练习1:我系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取60人进行调查。具体方法(总体元素少时):先编制一个抽样框,把总体各单位编上号码写在纸片上搓成纸团,作成签和阄(给每个学生编号,从001到300,并写在纸片上);然后,把签和阄放在一个盒子内搅拌均匀;最后,随机从盒子内抽取签和阄,被抽中的签和阄上的号码所代表的单位就是样本,直到抽满规定的样本为止(从300张纸条里抽取60张,并找相关同学)。特点:总体单位很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法经常在总体规模较小的时候使用随机数表总体元素多时,采用随机数表利用随机数表进行抽样的具体步骤:先取得一份总体所有元素的名单(即抽样框)将总体中所有元素一一按顺序编号
根据总体规模是几位数来确定从随机数表中选几位数码以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍根据样本规模的要求选择出足够的数码个数依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素对照附表中的随机数表,练习随机抽样。要从3000个人(或其他分析单位)的总体中用简单随机抽样的方法选取100个人作为样本进行调查。
练习是把总体的单位进行编号排序后,在计算出来某种间隔,然后按照这一固定的间隔抽取个体的号码来组成样本的方法。
练习:在某大学总共3000名学生中,抽取一个容量为300的大学生样本。 001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√值得注意的是,系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。因此,我们在使用系统抽样方法时,一定要注意抽样框的编制方法。注意:总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初始号码为38,那么肯定前者家庭平均收入远远高于后者。
解决措施:重新编排总体名单;改用其他抽样方法。总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况
例如:某大学总共3000名学生,抽取100人,抽样间隔为30。但是如果总体名单按教学班排列、每班刚好30人左右,而且各班的名单按照成绩高低排列,如果样本的初始号为2号,那么样本全是好学生;如果样本初始号为25号,样本全部为差学生。3、分层抽样(stratifiedsampling)
又称做类型抽样是先将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地域等)划分为若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。分类随机抽样总体子群样本分层抽样示意图需要注意:分层的标准问题(分层原则):以调查所要分析和研究的主要变量或相关的变量作为分层的标准。以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。以那些已有明显层次区分的变量作为分层变量。分层的比例问题:按比例分层:指的是按照各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。不按比例分层:便于对不同层次的子总体进行专门研究或进行相互比较,但若要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理。例题:长春市朝阳区共有居民20000户,根据统计年鉴,按照收入高低进行分类。其中高收入的居民有4000户,收入标准差为300元;中收入的居民有12000户,收入标准差为200元;低收入的居民有4000户,收入标准差为100元;现在要抽取200户居民进行调查,请分别以等比例分层抽样和非比例分层抽样两种方法计算样本组成。答案:等比例:40;120;40
非等比例:60;120;20(公式)
4、整群抽样(ClusterRandomSampling)
抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。整群抽样示意图划分子群随机抽样5、多阶段抽样(multistagesampling)
又称为多级抽样或分段抽样是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行
e.g.大学——院系——班级——学生假设某市共有2.4万名教师,他们分布在全市10个区的200所学校中。现在要抽取一个由1200名教师组成的样本。例题:
抽样方案选择第一阶段第二阶段第三阶段方案1:方案2:方案3:方案4:方案5:方案6:方案7:方案8:方案9:抽10个区抽2个区抽10个区抽8个区抽5个区抽4个区抽3个区抽2个区抽1个区每个区抽4所学校每个区抽20所学校每个区抽20所学校每个区抽15所学校每个区抽12所学校每个区抽10所学校每个区抽10所学校每个区抽10所学校每个区抽20所学校每个学校抽30名教师每个学校抽30名教师每个学校抽6名教师每个学校抽10名教师每个学校抽20名教师每个学校抽30名教师每个学校抽40名教师每个学校抽60名教师每个学校抽50名教师主要考虑的因素各个抽样阶段中的子总体同质性程度要考虑研究者所拥有的人力和经费
6、户内抽样(KISH)一、户内抽样
——以家庭为单位时,从入选家庭中抽取一个成年人构成访谈对象的抽样方法。(一)方法:科什选择法(kish)
具体做法:1、调查表编号。表编号AB1B2CDE1E2F表数量(N)1/61/121/121/61/61/121/121/62、印制选择卡,给每个调查员发一套(八张)Kish
选择表A式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213141516或以上1B1式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213141526或以上2B2式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213142526或以上2C式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11213242536或以上3D式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223243546或以上4E1式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223343536或以上5E2式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223244556或以上5F式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上63、给抽中家庭每个成年人进行编号并排序。方法是男性在前、年级大的在前。序号年龄和性别特征1最年长的男性2次年长的男性……n最年幼的男性n+1最年长的女性n+2次年长的女性……n+m最年幼的女性序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁4、根据调查表上的编号找出编号相同的那种“选择表”查出中选个体的序号,进行调查。序号成员特征1爸爸50岁2儿子23岁3奶奶70岁4妈妈48岁5女儿27岁F
式选择表如果家庭户中18岁以上人口数为被抽选人的序号为11223344556或以上618周岁及以上且在这一户内居住的人口按“先排男性,后排女性;在同一性别中,先排年龄大者,后排年龄小者”的规则进行排序,并按此顺序将成员的性别和年龄填在下面的《KISH选样表》中;选样表的第一行有A到H共8个字母,其中有一个字母所在列被加以阴影。这一列和住户成员排序的最后一位所在的那一行的交汇处的数字,就是被选中的住户成员的序号;请在《KISH选样表》Y1一栏以√标出被选中的被选者。
7、PPS抽样
8、绘图抽样在抽中的村委会和居委会中抽取要调查的家庭时,最重要的一点是建立一个尽可能覆盖在调查时点上,身处该村委会或居委会的全体个人的清单(抽样框)。由于我国流动人口众多,人户分离状况严重,无法利用村委会和居委会户籍资料进行抽样;而村委会和居委会的常住人口登记又非常不完备,无法充当抽样框。在此情况下,较为可靠的方法是利用村委会和居委会中的住址进行抽样,但由于我国尚未建立起完备的门牌地址系统,所以在调查中我们只能深入村委会和居委会的实地,用地图法绘制出村委会和居委会的所有建筑物,并进一步列举出建筑物中的所有住宅,以此作为抽样框来抽取家庭。地图法实地抽样是在中国这样快速变迁的发展中国家所采用的一种独特的抽样方法。四、样本规模样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 设备防雷安全管理制度
- 2025年中国加湿风扇行业市场全景分析及前景机遇研判报告
- 设计文件收发管理制度
- 诊所升级健康管理制度
- 诊所诊疗规范管理制度
- 豪宅装修团队管理制度
- 财厅办公用品管理制度
- 账务代理公司管理制度
- 货品流程制度管理制度
- 货车司机闭环管理制度
- Python语言与经济大数据分析智慧树知到课后章节答案2023年下上海财经大学
- 矿山安全培训课件
- 激光的基本原理及其特性教学课件
- 新编跨文化交际英语教程 复习总结
- 2022年上海市青浦区盈浦街道社区工作者招聘考试真题及答案
- 中国石油天然气股份有限公司工程建设项目质量监督管理规定
- 江西制造职业技术学院教师招聘考试真题2022
- 博物馆文本的常见翻译问题与改进策略
- 开源节流、降本增效
- 教学设计专题研究:大概念视角下的单元教学设计智慧树知到答案章节测试2023年浙江大学
- GB/T 18860-2002摩托车变速V带
评论
0/150
提交评论