




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、CompanyLOGO第四章第四章 社会调查的抽样社会调查的抽样1 抽样的概念和意义2 概率抽样的原理与方法3 非概率抽样的方法和应用4 样本规模与抽样误差1 抽样的概念和意义抽样的概念和意义v一、概念一、概念 总体:全体研究对象被统称为总体。总体:全体研究对象被统称为总体。 样本:是从总体中按一定规则抽取出的一部分元素的集合。 抽样:是从总体中,按一定方式选择和抽取一部分元素的过程。 抽样单位:一次直接抽样时所使用的基本单位。 抽样框:一次直接抽样时总体中所有抽样单位的名单。 总体值:关于总体某种特征的综合数量表现。 样本值:关于样本某种特征的综合数量表现。二、意义二、意义 是由部分推及总体
2、、了解复杂多变的社会现象的桥梁 解决了如何从总体中选出一部分对象作为总体的代表的问题一个案例一个案例主办机构主办机构日期日期布什布什克里克里Fox/OpinDynamics10月28日50505050TIPP10月28日53534747CBS/NYT10月28日52524848ABC10月28日51514949Fox/OpinDynamics10月29日49495151Gullup/CNN/USA10月29日49495151NBC/WSJ10月29日51514949TIPP10月29日51514949Harris10月29日52524848Democracy Corps10月29日494951
3、51CBS10月29日51514949Fox/OpinDynamics10月30日49495252TIPP10月30日51514949Marist10月31日50505050GWUBattleground200410月31日52524848选举结果11月2日202048482004美国总统大选前夕的民意调查结果美国总统大选前夕的民意调查结果2 概率抽样的原理与方法概率抽样的原理与方法v一、基本原理一、基本原理 随机抽取(random selection) 就是保证总体中的每一个个体都有同等的机会入选样本,而且,任何一个个体是否入选,与其他个体毫不相干,是彼此独立的。二、概率抽样方法二、概率抽样
4、方法1、简单随机抽样 简单随机抽样也称作纯随机抽样,是严格按照随机原则从含有N个元素的总体中抽取n个元素(Nn),在抽样的过程中,总体的每一个元素都有同等的机会入选样本,而且每个元素的抽取都是相互独立的。抽签法:总体及样本元素较少时使用 例:P56随机数法:总体或样本元素较多时使用随机数筛子法:较少使用随机数法的具体步骤随机数法的具体步骤v 第一步,获得总体中所有元素的名单v 第二步,将总体中的所有元素按顺序一一编号v 第三步,使用随机数表抽取足够的数码个数 起 点:任意起点 数码位数:根据总体规模的位数确定 数字顺序:任意顺序 数码筛选:以总体的规模为标准 数码个数:按样本规模的要求v 第四
5、步,通过上述步骤的顺序所抽取的元素的集合,就构成了使用随机数表抽中的样本案例案例 某企业共350名员工,老总打算从中抽取60人进行一次对企业管理满意度的调查,具体步骤如下:v 第一步,获得总体这350名员工的名单;v 第二步,把这些人名按顺序一一编号;v 第三步,使用随机数表抽取足够的数码: 假如我们任意选择第四行、第二列这个数字9作为随机的起点;按照从上到下的方法,从随机数表中选取一个三位数;按总体规模进行衡量和取舍,选取280、106、180;直到选中60个不同的数码为止。v 第四步,在刚才已经编好的员工名单中,找到这60个不同数码所对应的员工,即组成60人的样本。2、系统抽样、系统抽样
6、系统抽样又称作机械抽样或等距抽样,它先将N个总体元素按一定的顺序排列,然后在前面K个个体中,先随机抽取一个起始元素,再间隔K个距离,按照固定的抽样间隔K抽取其他n-1个元素。注意事项:非整数抽样间距问题总体元素的排序问题系统抽样的具体步骤系统抽样的具体步骤第一,将总体的所有个体按顺序编号第二,计算抽样间距K: K=总体规模/样本规模=N/n第三,在头K个个体中确定随机起点(A) 第四,从A开始,每隔K个个体抽取一个个体组成样本,A,A+K,A+2K.,A+(n-1)K案例案例 在某企业20000名职工中,使用系统抽样的方法抽取出2000人组成样本,具体步骤如下:v 第一步,获得总体中全部200
7、00名职工的名单;v 第二步,将这20000名职工按顺序编号;v 第三步,计算抽样间距K=20000/2000=10;v 第四步,在前面10个元素中,按简单随机抽样的方法抽取一个元素,假设抽到的是数码2,作为随机的起点;v 第五步,抽取数字2、2+10=12、2+210=22,2+310=32,2+(2000-1)10=19992v 找到这2000个数码所对应人的名单。3、分层抽样、分层抽样 分层抽样也叫类型抽样,是先将总体N个单位,按某种特征划分为若干个层次或子类型,然后在每个层次或子类型中分别独立的进行简单随机抽样或系统抽样,最后,将抽取的子样本集合成总体的样本。注意事项:分层标准问题分层
8、比例问题案例案例v在某大学2000名教职工中用分层抽样方法抽取一个200人的样本。职称职称人数人数百分比(百分比(% %)等比例分层样本等比例分层样本数数教授教授37837818.918.93838副教授副教授60360330.130.16060讲师讲师56156128.128.15656助教助教23023011.511.52323教辅教辅22822811.411.42323合计合计20002000100.0100.02002004、整群抽样、整群抽样 整群抽样又称作聚类抽样,是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位用简单随机抽样、系统抽样或分层抽样的
9、方法抽取样本的一种抽样方式。 步骤:确定分群的标注将总体N按一定标准划分为互不重叠的部分,每个部分为一个子群根据个子群的样本量,确定应该抽取的群数根据个子群的样本量,确定应该抽取的群数eg:P615、多阶段抽样、多阶段抽样(1)多段抽样)多段抽样 多段抽样又称为多级抽样、分段抽样或多阶段抽样,是指按总体内的层级关系,把抽样分为几个阶段来进行,在每一个阶段都使用简单随机抽样、系统抽样、分层抽样的方法来进行。 案例案例v 某市有某市有10所高校,所高校,20万名大学生,研究者想使用多段抽万名大学生,研究者想使用多段抽样的方法,从中抽取样的方法,从中抽取2000人组成样本,有多种组合方式人组成样本,
10、有多种组合方式具体方案具体方案第一阶段第一阶段第二阶段第二阶段第三阶段第三阶段方案一方案一抽取抽取2 2所高校所高校每所高校抽取每所高校抽取5 5个院个院( (系系/ /所所) )每个学院抽取每个学院抽取200200名学生名学生方案二方案二抽取抽取2 2所高校所高校每所高校抽取每所高校抽取1010个院个院( (系系/ /所所) )每个学院抽取每个学院抽取100100名学生名学生方案三方案三抽取抽取4 4所高校所高校每所高校抽取每所高校抽取5 5个院个院( (系系/ /所所) )每个学院抽取每个学院抽取100100名学生名学生方案四方案四抽取抽取5 5所高校所高校每所高校抽取每所高校抽取2 2个
11、院个院( (系系/ /所所) )每个学院抽取每个学院抽取200200名学生名学生方案五方案五抽取抽取5 5所高校所高校每所高校抽取每所高校抽取4 4个院个院( (系系/ /所所) )每个学院抽取每个学院抽取100100名学生名学生方案六方案六抽取抽取5 5所高校所高校每所高校抽取每所高校抽取1010个院个院( (系系/ /所所) )每个学院抽取每个学院抽取4040名学生名学生方案七方案七抽取抽取8 8所高校所高校每所高校抽取每所高校抽取5 5个院个院( (系系/ /所所) )每个学院抽取每个学院抽取5050名学生名学生方案八方案八抽取抽取1010所高校所高校每所高校抽取每所高校抽取2 2个院个
12、院( (系系/ /所所) )每个学院抽取每个学院抽取100100名学生名学生方案九方案九抽取抽取1010所高校所高校每所高校抽取每所高校抽取1010个院个院( (系系/ /所所) )每个学院抽取每个学院抽取2020名学生名学生缺点缺点 多段抽样过程中暗含了一个假定,即每个阶段抽样时,子群元素的规模是相同的。而现实生活中,这种情况非常少,按照上述方法抽取,样本个体入选的概率其实不完全相同。例:P64 如果研究者第一个阶段抽中了两个社区:甲和乙。甲社区中的居民有800户,而乙社区是200户。此时,甲社区中的居民户被抽中的概率是10/20100/800=1/16,而乙社区居民户被抽中的概率则是10/
13、20100/200=1/4。(2)分层多阶段等概率抽样)分层多阶段等概率抽样 先将总体中规模不等的子群按规模或重要性进行分层,然后在不同阶段对不同的层使用不同的抽样比。以两阶段抽样为例,假如将总体分为大群、中群、小群三个层。第一个阶段时,大群、中群、小群三个层的抽样比fa依次递减,第二个阶段时,大群、中群、小群三个层的抽样比fb依次递增。假如f=1/400,可以进行以下样本设计:层层fafbf大群11/4001/400中群1/201/201/400小群1/40011/400(3)多阶段PPS抽样 多阶段PPS抽样即“概率与元素的规模大小成比例的抽样”, 英文缩写简称为PPS抽样。它的基本原理在
14、于以阶段性的不等概率换取最终总体的等概率。例:从全市100家企业、总共20万名职工中,抽取1000名职工进行调查。采取多段抽样的方法,先从100家企业中随机抽取20家企业,然后再从这20家企业中分别抽取50名职工,构成了一个1000人的构成样本。方法方法1企业企业规模规模所占比例所占比例累计累计选择号码范围选择号码范围所选号码所选号码入样元素入样元素企业16003302企业2160008083382020、076元素1、2企业3200010938392企业460003012393122098、112元素3、4企业52001124123企业618009133124132130元素5企业71000
15、5138133137企业998004994990993企业100120061000994999997元素20方法方法2规模规模频数频数累计频数累计频数所选号码所选号码入样元素入样元素企业1600600企业216000166001000、11000元素1、2企业3200018600企业460002460021000元素3、4企业520024800企业6180026600元素5企业7100027600企业99800198800企业1001200200000元素206、户内抽样、户内抽样 一般情况下,多阶段抽样的最后一级抽样单位常常是居民住户,但事实上,居民住户中大多是由多名成员组成的,因此实际调查
16、中,仍需要按随机原则从这些成员里按一定的规则抽取一位成年人作为调查对象,而户内抽样可以帮助我们。方法:Kish选择法掷骰子法生日法Kish选择法选择法 调查员要先向住户家庭征求意见,询问其家庭成员的基本情况,包括性别、年龄、与住户的关系。然后,按男性在前、女性在后,年长者在前、年幼者在后的顺序排序。最后,借助kish表确定调查对象。Kish表表A A式选择表式选择表B1B1式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 4
17、5 56 6人或以上人或以上1 11 11 11 11 11 11 12 23 34 45 56 6人或以上人或以上1 11 11 11 12 22 2Kish表表B2B2式选择表式选择表C C式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 11 11 12 22 22 21 12 23 34 45 56 6人或以上人或以上1 11 12 22 23 33 3Kish表表D D式选择表式选
18、择表E1E1式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 12 22 23 34 44 41 12 23 34 45 56 6人或以上人或以上1 12 23 33 33 35 5Kish表表E2E2式选择表式选择表F F式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被
19、抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 12 22 24 45 55 51 12 23 34 45 56 6人或以上人或以上1 12 23 34 45 56 63 非概率抽样的方法和应用非概率抽样的方法和应用v一、一、偶遇抽样 偶遇抽样又称为方便抽样或就近抽样,指的是研究者使用对自己最为方便的形式来抽取样本。 eg:街头拦人:街头拦人二、二、判断抽样v判断抽样又称为立意抽样或目标式抽样,是指研究者根据对总体的知识和认识,并结合自身对研究目的判断或专家的判断来选择适当调查对象的抽样方法。三、三、配额抽样v也称为定额抽样,是按总体某种特征,确定不同总体类别中的样本单位数额,然后按比例在各类别中进行方便抽样。v例例P72性别性别合计合计男男女女年龄年龄3535岁及以下岁及以下24241616404035-6535-65岁岁2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45457.2-2025重型燃气轮机叶片无损检测第2部分:视觉检测
- 疫苗接种与群体免疫动力学考核试卷
- 管道工程社会责任报告与评估考核试卷
- 礼仪用品行业服务品质管理考核试卷
- 组织文化与员工参与度考核试卷
- 原动设备制造企业的战略管理与规划考核试卷
- 租赁设备的市场调研方法与技巧考核试卷
- 礼仪用品行业市场风险防范考核试卷
- 稀土金属压延加工的智能化制造趋势分析考核试卷
- 天津农学院《发动机原理》2023-2024学年第二学期期末试卷
- ···管道巡护方案
- 2024新版(闽教版)三年级英语上册单词带音标
- 浙江省杭州市2024年中考英语真题(含答案)
- 有限空间中毒窒息事故警示教育
- 2024年国家公务员考试《行测》真题卷(行政执法)答案和解析
- DB12∕T 947-2020 城市道路交通指引标志设置规范
- 2024年黑龙江省哈尔滨市中考数学试卷(附答案)
- 08J933-1体育场地与设施(一)
- 生猪屠宰兽医卫生检验人员理论考试题库及答案
- 2024职场人压力调查报告-智联招聘-202407
- ISO9001-ISO14001-ISO45001三体系内部审核检查表
评论
0/150
提交评论