版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于常用的抽样方法第1页,共49页,2022年,5月20日,0点5分,星期四一、单纯随机抽样(simple random sampling) 1、抽样方法 根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。 具体方法 随机数字法 抽签法第2页,共49页,2022年,5月20日,0点5分,星期四 2、优缺点 对所有观察单位编号,当数量大时,有难度 抽样误差的计算较方便第3页,共49页,2022年,5月20日,0点5分,星期四 3、抽样误差的估计 有限总体与无限总体 总体类型 均数标准误 率的标准误 无限总体 有限总体
2、 第4页,共49页,2022年,5月20日,0点5分,星期四 二、系统抽样(systematic sampling) 又称等距/机械抽样 1、抽样方法 先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本。 第5页,共49页,2022年,5月20日,0点5分,星期四 2、优缺点(1)抽样方法简便(2)易得到一个按比例分配的样本,抽样误差较小(3)仍需对每个观察单位编号(4)当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性第6页,共49页,2022年,5月20日,0点5分,星期四 3、抽样误差 无固定的计算公
3、式,常按单纯随机抽样方法来计算,与总体的性质和被抽样个体间的间隔有关。第7页,共49页,2022年,5月20日,0点5分,星期四三、整群抽样(cluster sampling) 1、抽样方法 先将总体划分为若干个“群”组,每个群包括若干个观察单位,再随机抽取n个群,被抽到的各群的全部观察单位则组成样本。第8页,共49页,2022年,5月20日,0点5分,星期四 2、优缺点(1)在较大规模的现场调查中,易组织,较节省。(2)若各群间的差异较大,该抽样方法的误差较大。 3、抽样误差第9页,共49页,2022年,5月20日,0点5分,星期四四、分层抽样(stratified sampling) 1、
4、抽样方法 先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。第10页,共49页,2022年,5月20日,0点5分,星期四(1)按比例分配:按总体各层观察单位数的多少分配(2)最优分配:按各层观察单位数多少及其变异大小分配 第11页,共49页,2022年,5月20日,0点5分,星期四 2、优缺点(1)在一定程度上控制了抽样误差,尤其是最优分配法(2)应尽量使层内差别小而层间差别大,以提高效率(3)事先应了解各层的总体含量,最优分配还应了解标准差第12页,共49页,2022年,5月20日,0点5分,星期四多阶段随机抽样第13页,共49页,2022年,5月20日,
5、0点5分,星期四 样本含量的估计第14页,共49页,2022年,5月20日,0点5分,星期四单纯随机抽样一、先决条件 1、容许误差,预计样本统计量与相应总体参数的最大相差控制在什么范围。常取可信区间长度一半。 2、所调查总体标准差,若不了解,须通过预试验的标准差S或前人的资料作出估计; 3、第一类错误的概率 4、对有限总体抽样时,还须了解总体观察单位数。第15页,共49页,2022年,5月20日,0点5分,星期四二、计算公式第16页,共49页,2022年,5月20日,0点5分,星期四随机应答技术Randomized Response Techniques (RRT)第17页,共49页,2022
6、年,5月20日,0点5分,星期四 敏感问题(sensitive problem) 是指涉及个人(或单位)的隐私或利益的问题以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括一些违法犯罪的行为。 第18页,共49页,2022年,5月20日,0点5分,星期四敏感问题的特点:一般是社会舆论导向所不认同的或反对的行为或观点不同特征的人群有不同的敏感问题不同敏感问题在敏感程度上存在差异敏感问题的分类:属性特征敏感问题数量特征敏感问题第19页,共49页,2022年,5月20日,0点5分,星期四 对于敏感性问题,若采用直接回答的形式,被调查者难免产生抵触情绪,不愿据实回答,这样导致调查数据
7、失真、调查结果无效。 因此寻求解决敏感性问题调查的有效方法至关重要。 第20页,共49页,2022年,5月20日,0点5分,星期四 随机化回答是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任。 RRT技术的基本原理在于当被调查者确信调查者及其他人无法从被调查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进行回答。并且RRT技术保护调查对象的个人隐私,能充分得到调查对象的配合,最终可显著降低无应答率和误答率,得到高质量的调查结果。 随机应答技术Randomized Response Tech
8、niques (RRT)第21页,共49页,2022年,5月20日,0点5分,星期四(一)沃纳模型(Warner model) 1965年由Warner提出的,其设计思想是向被调查者显示两个与敏感性问题(具有特征A)有关,但完全对立的问题,让调查者按预定的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问题,从而起到了为被调查者保密的效果。 (二)西蒙斯模型 1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但有一些改进,它将沃纳模型中与敏感性问题相对的具有特征A的问题改为一个与敏感性问题不相关的其它问题。 (三)“随机变量和”回答模型随机化应答模型第22页,共49页,2022年
9、,5月20日,0点5分,星期四一、随机应答技术的步骤 设计一对问题,使两个问题的答案种数和编码完全一致,应答者随机选取一个问题,将答案编码选出,在答案上做出相应的记号。由于答卷上没有问题的编号,只有一套答案编码,人们无从知晓应答者回答的是哪一个问题,因而起到保密作用。 1向应答者提出一对问题第23页,共49页,2022年,5月20日,0点5分,星期四 (1)两个相关联问题模式: 设计两个相对立的陈述。 例如 问题1:你曾经吸过毒吗? 是 否 问题2:你从未吸过毒吗? 是 否(2)两个不相关联问题模式: 第一陈述为敏感性问题,第二陈述是与第一陈述无关的非敏感性问题,可以得到确切的答案。 例如 问
10、题1:你曾经吸过毒吗? 是 否 问题2:你是工人吗? 是 否第24页,共49页,2022年,5月20日,0点5分,星期四2设置一个随机装置进行调查 使用一个内装许多黑、白两色小球的匣子,黑白球的比例接近1:1,但不等于1:1,例如可以是60和40。 混合均匀后,被调查者从匣子中随机摸取一球,摸取的是黑球还是白球只有被调查者知道。若摸取的是黑球,则回答第一个问题,否则,回答第二个问题。 答卷上只有答案选择,没有题号,可按如下格式设计:“请将你的回答在相应的编号处做上记号:是 否”。第25页,共49页,2022年,5月20日,0点5分,星期四3根据概率理论进行计算(1) 问题1:你曾经吸过毒吗?
11、是 否 问题2:你从未吸过毒吗? 是 否 假设黑球所占的比例为P,白球所占的比例为1-P,应答者中回答“是”的总比例为r,那么对第一个问题回答“是”的比例RA可以由下式推算: rPRA+ (1-P)(1-RA) RA= r - (1-P)/(2P-1) (1P0.50)第26页,共49页,2022年,5月20日,0点5分,星期四(2) 问题1:你曾经吸过毒吗? 是 否 问题2:你是工人吗? 是 否 假设回答者中工人占的比例为RU,则r与RA的关系为: r PRA+(1-P) RU RAr (1-P) RU/ P 第27页,共49页,2022年,5月20日,0点5分,星期四例14-1: 欲调查某
12、地已婚育龄妇女有无婚前性行为的比例。 (1)先把这项技术的意义、性质和方法,特别是其保密功能,坦诚地告诉调查对象,以取得理解、信任和合作。 (2)问卷中设A、B两个问题。 (3)备有一个口袋,里面装有黑白两种颜色的球(也可用围棋的黑子和白子),两种球的比例不是1:1,例如可以是60和40。第28页,共49页,2022年,5月20日,0点5分,星期四(4)调查对象在填写答案前,先随机抽取一个球(球的颜色对调查员保密),据球的颜色决定回答两个问题中的哪一个。(5)由于调查员不知道某一对象抽取的球是什么颜色的,所以无法知道某一对象回答的是问题A还是问题B,也无法知道调查对象的“秘密”。(6)设立两个
13、问题: 问题A:婚前有过性行为?回答: 是 否 问题B:婚前没有性行为?回答: 是 否 第29页,共49页,2022年,5月20日,0点5分,星期四(7)如果调查对象抽取的球是黑色的,则回答问题A;如果调查对象抽取的球是白色的,则回答问题B。(8)计算调查对象中婚前有性行为者的比例。第30页,共49页,2022年,5月20日,0点5分,星期四若调查200人,回答“是”的比例为=0.48,第31页,共49页,2022年,5月20日,0点5分,星期四第32页,共49页,2022年,5月20日,0点5分,星期四二、估计比例用的3种改进模型1、模型I 把问题 B改为一个完全无关、答案为“是”的概率是已
14、知值的问题将沃纳模型中与敏感性问题相对的具有特征A的问题改为一个与敏感性问题不相关的其它问题。 BA第33页,共49页,2022年,5月20日,0点5分,星期四例14-: 欲调查某地已婚育龄妇女有无婚前性行为的比例。问题A:婚前有过性行为?回答: 是 否 问题B:你生日(月日)除以余数是吗? 回答: 是 否第34页,共49页,2022年,5月20日,0点5分,星期四有无性行为第35页,共49页,2022年,5月20日,0点5分,星期四 如果黑球比例为p=60%,同时回答问题A和B均为是的比例=0.24,生日(月日)除以余数是占0=33.33%,则第36页,共49页,2022年,5月20日,0点
15、5分,星期四西蒙斯模型的不足之处(1) 是预先已知或待估计的值, 的估计偏差会增加估计方差。(2)要提高估计精度,应增大P值和减小 值。但随着P值的增大和 的减小,被调查者的疑虑会增加。第37页,共49页,2022年,5月20日,0点5分,星期四2、模型II 将模型I中设立无关联问题B的方法改为两套抽取球的装置 优点:对问题B回答“是”的概率不必是已知的。 要求调查对象抽取两次彩球和回答问题两次。 装置中黑球的比例是P1和P2,有专家建议,两者都不要取0或0.5,习惯k常取P2=1P1。 不论对于第一装置还是对于第二装量,摸到黑球者如实回答问题A,摸到白球者如实回答问题B。 要求调查对象在两次
16、回答问题中不能有矛盾。 第38页,共49页,2022年,5月20日,0点5分,星期四例14-3 对于前面所说的调查婚前性行为的研究中,假定共480名调查对象。问题A:你在婚前有过性行为吗? 回答 是 否 。问题B:你在这3天内是吃过鱼吗?回答 是 否 。 第39页,共49页,2022年,5月20日,0点5分,星期四第40页,共49页,2022年,5月20日,0点5分,星期四第41页,共49页,2022年,5月20日,0点5分,星期四课本上有误第42页,共49页,2022年,5月20日,0点5分,星期四第43页,共49页,2022年,5月20日,0点5分,星期四两次试验模型的主要缺陷(1)若对同
17、一批被调查者试验两次,他们两次回答的结果必具有相关性,从而破坏了模型的随机性。但如果对两批被调查者分别进行试验,又不容易保证两次的结构具有相似性,从而产生较大误差。(2)方差V()是两次试验产生的方差之和,在相同条件下,它比西蒙斯模型的方差要大得多。(3) P1和P2不能太接近。当p1=p2时,模型就没有意义了。要减小方差V() ,就应该增大P1而减小P2 ,但当p1增得过大时, 又会减少被调查者的配合。第44页,共49页,2022年,5月20日,0点5分,星期四3模型III 本方法的优点是不需要设立非敏感问题。但是球的颜色要有3种(红、黑、白)。每种球的比例是已知的(P31-P1-P2),要求摸到红球者如实回答问题,摸到黑球者全部回答“是”,摸到白球者全部回答“否”。 第45页,共49页,2022年,5月20日,0点5分,星期四第46页,共49页,20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中班语言活动不浪费水
- 新生儿过敏知识培训
- 江西省宜春市丰城市第九中学2024-2025学年八年级上学期第一次段考化学试卷(含解析)
- 甘肃省会宁县第四中学2024-2025学年高三上学期第一次月考化学试卷
- 全球无人机探测与防控系统市场运营现状及发展策略研究报告2024-2030年
- 初中七年级生物上学期期中考前测试卷(人教版)含答案解析
- T-YNRZ 019-2024 珠芽黄魔芋组培种苗生产技术规程
- 内蒙古自治区通辽市科尔沁左翼中旗联盟校2024-2025学年六年级上学期期中考试英语试题
- 【课件】Unit+3+SectionB+1a-2b+课件人教版英语七年级上册
- 高中语文11琵琶行并序锦瑟课件苏教版必修
- 中考英语二轮专题复习+冠词和数词+导学案
- 吉林长春市普通高中2025届高三数学第一学期期末达标测试试题含解析
- 期中测试卷(1-4单元) (试题)-2024-2025学年四年级上册数学人教版
- 北京市道德与法治初一上学期期中试卷及答案指导(2024年)
- 高校实验室安全基础学习通超星期末考试答案章节答案2024年
- 四川省绵阳市高中2025届高三一诊考试物理试卷含解析
- DL∕T 1919-2018 发电企业应急能力建设评估规范
- 《中国糖尿病地图》要点解读
- 小学作文稿纸语文作文作业格子模板(可打印编辑)
- 氢氧化钠(CAS:1310-73-2)安全技术说明书
- 交通安全伴我行(优质课课件).ppt
评论
0/150
提交评论