抽样调查原理与方法课件_第1页
抽样调查原理与方法课件_第2页
抽样调查原理与方法课件_第3页
抽样调查原理与方法课件_第4页
抽样调查原理与方法课件_第5页
已阅读5页,还剩175页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 绪论一、数据的来源 1. 统计数据的重要性 量化研究的需要 抽样调查是数据来源的重要途径 样本的有效性问题 第一章 绪论 美国总统竞选预测: 民主党候选人 共和党候选人 实际 汉佛莱(50%) 尼克松(50%) 尼(50.3%) 尼克松(62%) 尼(61.8%) 卡特(51%) 卡(51.1%) 里根(52%) 里(55.3%)1984 里根(59%) 里(59.2%)1988 布什(56%) 布(53.9%)对人的评价比对物的评价要更困难 2. 数据的间接来源 3. 数据的直接来源 试验数据 调查数据本课程是对调查而言。第一章 绪论二、抽样调查的作用 1. 抽样调查的概念 2. 抽

2、样调查的作用 有些现象不可能进行全面调查 实际操作有困难 检查、核查作用 第一章 绪论 3. 抽样调查优点 费用低 速度快 有助于提高数据质量 第一章 绪论三、抽样调查的历史 1. 国际上抽样调查的进展 1802年法国数学家拉普拉斯进行人口抽样估计,这是文字记载最早的抽样案例。 目前抽样方法用于各个领域: 人口调查,经济领域调查,社会问题研究,电视收视率调查,民意调查,等。 第一章 绪论2. 我国情况 不同的发展阶段 目前,政府调查,社会调查,市场调查,收视率调查等,都有长足进展。 与国外差距:热情有余,科学性不够,对抽样理论缺乏了解。 第一章 绪论四. 调查步骤一个完整的调查包括几个阶段性的

3、工作。 1. 调查目标确定 属于调查策划。明确通过调查所要获取的信息,确定 调查内容,决定向谁进行调查(确定调查对象) 2. 调查问卷设计 3. 抽样方法确定 4. 调查方式(数据收集)确定 5. 数据编码与录入第一章 绪论6. 数据审核与插补7. 数据估计(包括权数确定,计算置信区间)8. 调查结果表述(调查报告)第二章 基本概念一、总体与样本 1. 总体 2. 样本二、目标总体与抽样总体 1. 目标总体 2. 抽样总体 3. 抽样框 良好抽样框的标志 第二章 基本概念 三、概率抽样与非概率抽样 1. 概率抽样 特点与作用 2. 非概率抽样 (1)方便选样 (2)目的选样 (3)自愿样本 (

4、4)配额选样 特点第二章 基本概念 四、 等概抽样与不等概抽样 1. 等概抽样 2. 不等概抽样 第二章 基本概念五、抽样误差与非抽样误差 1. 抽样误差 可以计算 可以控制 2. 非抽样误差 (1)抽样框误差 (2)无回答误差 (3)计量误差 第二章 基本概念六、方差、偏差与均方误差 方差反映随机因素 为 的估计值 偏差反映系统因素 为总体真值 第二章 基本概念均方误差 第二章 基本概念 七、估计量的优良性准则1. 一致性 当 越大时, 接近于 的概率越大第二章 基本概念2. 无偏性3.有效性 令 , 为 的两个无偏估计量 若 则 是较 有效的估计量 第二章 基本概念八、精度与费用 精度10

5、0%95%60%20%40% .费用第三章 简单随机抽样 第一节 基本问题 一、什么是简单随机抽样 1. 放回抽样 2. 不放回抽样 二、实施方法 抽签 随机数表 计算机抽取 第三章 简单随机抽样 三、符号说明 总体样本 单位数 总和 均值 比例 方差 及 第三章 简单随机抽样第二节 简单随机抽样的误差计算 例题:A、B 、C 、D 4人,体重分别为 100,110,120,130斤 可知: 现采用抽样方法估计 , ,放回抽样第三章 简单随机抽样 样本 样本 A,A 100 225 A,B 105 100 A,C110 25 A,D 115 0 B,A105 100 B,B 110 25 B,

6、C115 0 B,D 120 25 C,A110 25 C,B 115 0 C,C120 25 C,D 125 100 D,A115 0 D,B 120 25 D,C125 100 D,D 130 225 合计第三章 简单随机抽样 100 105 110 115 120 125 130频数 1 2 3 4 3 2 1频率 0.0625 0.125 0.1875 0.25 0.1875 0.125 0.0625 说明样本分布近似正态分布并且: 样本分布第三章 简单随机抽样抽样误差(标准差)抽样误差计算公式 误差也可用方差形式表现第三章 简单随机抽样 若采用不放回抽样 计算公式第三章 基本概念 为

7、 修正系数 为 修正系数 令 ,称抽样比, 故, 有限总体调整系数第三章 简单随机抽样第三节 简单随机抽样中的估计 一、均值估计 不放回抽样是常用方法 是 的估计第三章 简单随机抽样 置信区间 :概率度 当 时, 称为允许抽样误差第三章 简单随机抽样 二、 总量估计 第三章 简单随机抽样 三、比例估计 令 总体比例 样本比例 例: , , 有 户家庭拥有彩 电,全市居民家庭彩电拥有率? 第三章 简单随机抽样 置信区间 (81.9% 88.1%)第三章 简单随机抽样 第四节 样本量的确定 影响样本量的因素 调查经费 总体方差 允许误差范围 置信度 第三章 简单随机抽样一、样本量计算基本公式 1.

8、 调查费用确定样本量 先确定费用函数,如 C 一定时,可得到样本量上限 第三章 简单随机抽样2. 放回抽样 由 得 第三章 简单随机抽样 3. 不放回抽样 由 得 将分子,分母同除以 故 第三章 简单随机抽样 4. 比例估计中的样本量 放回抽样 不放回抽样 第三章 简单随机抽样 二、控制相对误差的样本量 (放回抽样) 令 则: 在不放回抽样条件下第三章 简单随机抽样 三、总体方差的事先确定 1. 以往数据或经验数据 2. 预调查解决 的估计问题 3. 全距与标准差之间的关系推测 4. 先抽取 ,根据 ,求出总体方差 估计,进而求得 ,再抽四、样本量设计中的误区 1. 估计精度越高越好吗? 简单

9、随机抽样估计比例P的样本量与误差(当P=0.5时) 样本量 误差 50 0.14 100 0.10 500 0.045 1000 0.032 对精度要求的判断十分重要。为得到最小误差而选择最大样本量不是好的选择。第三章 简单随机抽样2. 样本量与总体规模N有关吗?例:简单随机抽样估计P,置信度95%,允许误差5%,在P=0.5条件下 总体规模(N) 所需样本量(n) 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400 抽样调查中的样本量抽样调查中的样本量 由此可知,在精度要求相

10、同条件下,在北京市进行一项调查和在全国进行一项调查,样本量的差别并不大。 总体规模越大,进行抽样调查的效率越高。 若分类、分区、分层分别进行估计则另当别论。 总体规模越大,抽样调查的效率越高。 对于很小规模的总体,要取得所期望的精度,通常必须调查较大比例的样本,在经济上不合算。 所以,从抽样理论而言,抽样调查与“满足各级政府需要”存在矛盾。抽样调查中的样本量第四章 分层随机抽样 第一节 基本问题 一、什么是分层随机抽样第四章 分层随机抽样 二、特点 1. 提高估计精度 2. 可对各层进行估计 3. 便于组织 三、分层原则 层内方差尽可能小 层间方差尽可能大 第四章 分层随机抽样 四、符号 总体

11、 样本第 层单位数 单位数总和 第 层均值 第 层方差 第 层权数 第 层抽样比 第四章 分层随机抽样 等比例抽样 即:不等比抽样 第四章 分层随机抽样 第二节 均值与总量估计 一、估计量性质 性质1. 若 无偏,则 是 的无偏估计量第四章 分层随机抽样 性质2. 的方差是 证 第四章 分层随机抽样 在总量估计中:第四章 分层随机抽样 例: 类别(户) 总村数 0-15 635 153 4.05 20.19 16-30 570 13810.31 69.96 31-50 475 11515.29 63.13 51-75 303 7323.16 170.32 76-100 89 2128.71 1

12、84.90 合计 2072 500 以95.45%概率估计耕牛总头数的置信区间第四章 分层随机抽样 第四章 分层随机抽样 第三节 各层中样本单位数的分配 一、不同分配方式 层 常数分配 与 成正比 与 成正比 内曼分配 1 0.2 20 100 49 60 40 20.3 30 100 110 90 90 30.5 34 100 141 150 170 n 300 300 300 300 3.86 3.11 3.09 3.00 第四章 分层随机抽样 1. 常数分配,实际中采用不多; 2. 与 成正比; 3.与 成正比,按比例分配,常采用 4. 内曼分配第四章 分层随机抽样 5. 最优分配 分配

13、样本量时考虑费用因素 费用函数 式中, 为抽样固定费用 1)当方差一定时使 C 最小(2)当 C 一定时使方差最小第四章 分层随机抽样 分配样本量的准则 实际运用中的考虑 比例分配,内曼分配较多使用 第四章 分层随机抽样 二、样本量的确定 1. 一般公式 由 令, 代入上式 (1) 因为: 故第四章 分层随机抽样 2. 不同条件下一般公式的运用 在比例分配条件下 将 代入(1)式, 得 或 第四章 分层随机抽样 在内曼分配条件下 在 条件下, 故内曼分配样本量小于比例分配样本量 第四章 分层随机抽样 在最优分配条件下 由 代入到 中 解得 或 第四章 分层随机抽样 在给定费用 条件下 第四章

14、分层随机抽样 第四节 估计比例的分层抽样 一、目标量的估计 第四章 分层随机抽样 例:类别 小学25000 150 0.02中学20000 120 0.10大学 5000 30 0.80合计50000 300 对硕士学位教师所占比例进行区间估计 第四章 分层随机抽样 第四章 分层随机抽样 二、比例估计中样本量的确定 一 分层抽样的效率 200,000 800,000 1,000,000 4,000,000 1,000,000 1,800,000 有几种分配方案 第一种 第二种 第三种 第四种 简单随机抽样第五节 分层抽样中的其他问题第四章 分层随机抽样 四种抽样方案各自方差: 分层抽样: 简单

15、抽样: 省略 第四章 分层随机抽样 方案一 方案二第四章 分层随机抽样 方案三方案四设计效果第四章 分层随机抽样 二、层的构造1. 分几层L=6层数抽样方差第四章 分层随机抽样 2. 层的分点 (1)建立联立方程,求方差极小化的解 (2)若总体均匀分布,可等距分层 第四章 分层随机抽样 (3)累积 法 ID 职工人数 累积 1 1-10 10,000 100 100 2 11-20 2,500 50 150 3 21-30 1,600 40 190 层距第四章 分层随机抽样 三、事后分层1. 什么是事后分层 抽取 ,调查后得到 和 又已知第四章 分层随机抽样 2. 估计 当 充分大时 故 第四

16、章 分层随机抽样 四、 的情况 例题企业规模 小企业10,000 0.8 8000 200中企业1,000 8 8000 200大企业100 80 8000 200合计11,100 24000 600调整后目录抽样(List Sampling)的含义。 第四章 分层随机抽样 五、多指标样本量的分配 理论上的研究 1. 最优分配平均法 选K个指标,对每个指标 计算 h=1,2L 例如,某项调查分为4层,有3个关键指标,样本量1000,数据如下:2Chatterjee(查特吉法) 最优分配为考虑实际分配 对偏离 , 会引起方差增量,取nh 使方差增量的平均值为最小。本质上仍是一种平均方法,处理结果

17、与平均法相差甚微。3Yates(耶茨法) 给所考虑的每个指标,按重要性赋予权数 ,同时考虑层权 ,方差和调查费用 ,经过推导可得出如下分配公式该法的思路是将每个指标估计量的方差看作为损失,考虑总的损失函数(包括方差和费用)为最小。第五章 比率估计第一节 基本问题一、什么是比率估计不是抽样方式,而是估计方法二、作用1. 目标量本身就是比率2. 利用辅助变量提高估计效率第五章 比率估计三、应用条件 1. 有相应辅助资料 2. 目标变量与辅助变量存在相关关系 3. 大样本第五章 比率估计四、符号 :目标变量 :辅助变量 :总体比率 :样本比率第五章 比率估计第五章 比率估计第五章 比率估计第二节 比

18、率估计量 一、总体比率R的估计(1)第五章 比率估计证明(1)式第五章 比率估计第五章 比率估计第五章 比率估计例: , , 报告期不动产价值 基期不动产价值 , , , , 对 进行置信区间估计。第五章 比率估计 置信区间 即 方差公式还可写成:第五章 比率估计二、总体均值的估计第五章 比率估计三、总体总量的估计第五章 比率估计四、例题:估计职工一季度医药费支出: 估计 的置信区间。第五章 比率估计解: 置信区间:第五章 比率估计第三节 样本量的确定 以估计 为例 事实上 解得: 令 则第五章 比率估计 基本公式 当估计 时, 当估计 时, 当估计 时,第五章 比率估计例: , , ,问 ?

19、由于缺乏信息,故预调查先抽取15项,得如下资料:样本帐面价值实际值1215182416.520合计242237.5第五章 比率估计由上表资料可计算 则 第五章 比率估计因为估计实际财产总金额,属总量估计 第五章 比率估计 第四节 分层抽样中的比率估计 一、分别比估计 , , 第五章 比率估计 第五章 比率估计例:N=2500,N1=1000,N2=1500下标1代表临时工,2代表正式工X:辅助信息,Y:报告期数据n=20,其中n1=10,n2=10第五章 比率估计调查结果: , , , , , , 第五章 比率估计已算出: 第五章 比率估计二、联合比估计由 计算 ,由 计算 ,然后综合起来 第

20、五章 比率估计在前例中 第五章 比率估计三、两种方法的对比 1. 样本足够,分别比估计较好。 2. 各层样本量小,联合比估计较好。 3. 若各层比估计量 相似,二种方法 差别 不大。 第五章 比率估计第五节 比率估计的效率 简单随机抽样方差 比率估计方差第五章 比率估计比率估计更为有效的条件为: 即 第六章 等距抽样(系统抽样) 第一节 一般问题一、什么是等距抽样 等距抽样三种情况 1. 按无关标志排列 2. 按有关标志排列 3. 按自然顺序排列第六章 等距抽样 二、特点 1.便于操作 2.便于审核 3.在一些情况下可以提高估计效率 4. 估计量方差计算复杂第六章 等距抽样 第二节 抽选样本方

21、法一、直线等距抽样 总体单位N,样本容量n,抽样间隔K=N/n, 第一个抽取单位i,样本组成i,i+k,i+2k第六章 等距抽样二、对称等距抽样三、循环等距抽样 当Nnk时, 为 的有偏估计量 当N=nk时, 为 的无偏估计量第六章 等距抽样例:N=9,n=3,k=3 当 i=1, Y1 Y4 Y7 i=2, Y2 Y5 Y8 i=3, Y3 Y6 Y9 则: 第六章 等距抽样若N=10,n=3,k取3或4,Nnk取k=3,当 i=1, Y1 Y4 Y7 Y10 i=2, Y2 Y5 Y8 i=3, Y3 Y6 Y9 同理可证k=4时,第六章 等距抽样循环等距抽样 1 2 3在1-N中抽取随机

22、起点,每隔间距K抽出一个单位,直到抽满为止。弱点:操作比较麻烦第六章 等距抽样四、修正直线等距抽样 在1-N中取一随机数r, r/k=商余数 将余数作为起点i。 余数为1的概率4/10 余数为2的概率3/10 余数为3的概率3/10第六章 等距抽样五 总结: 1. 当N=nk时, 是 的无偏估计量 2. 当Nnk时 若N很大时,偏差可忽略不计 若偏差不可忽略时,可采用循环等距 或修正直线等距。第六章 等距抽样 第三节 估计量的方差一、按无关标志排列时第六章 等距抽样二、按有关标志排列时 可忽略若样本单位分布均匀,若样本分布随机, 趋近于若样分布集聚,第六章 等距抽样例:N=9,n=3 i=1

23、1 4 7 i=2 2 5 8 i=3 3 6 9 又知 计算方差可先计算 第六章 等距抽样当 时当 时当 时第六章 等距抽样第六章 等距抽样又知第六章 等距抽样若样本分布集聚 i=1 1 2 3 i=2 4 5 6 i=3 7 8 9 可算出 第六章 等距抽样第四节 有单调趋势情况下的系统抽样 为计算方差,可合并层第六章 等距抽样例: N=4000, n=40, 1-f=0.99 10, 8, 6, 5, .5, 4 第五节. 有周期波动的系统抽样 如每周的销售额,每天不同时间的车流量。 处理方法一. 抽取间隔k避开周期跨度。处理方法二. 采用交叉样本。 交叉样本的设计方法 原系统样本 k=

24、N/n 现抽 m 个等容量系统样本,新间隔 k=mk 由此得到m个样本均值 例:N=240, 原准备抽一个n=24的系统样本,为消除周期影响,改为抽4个容量为6的样本,k=240/24m=4, k=mk=40样本 1 21 21 16 21 16 20 19.17 2 17 19 19 17 21 16 18.17 3 15 19 16 18 20 21 18.17 4 16 15 16 21 24 17 18.17若采用简单随机抽样置信区间为 (17.46 19.37)第七章 PPS抽样一、什么是PPS抽样 Probability Proportional to Size二、抽选方法 Mi表

25、示i的规模单位ui Mi Mi 区间 1 8 8 1-8 2 20 28 9-28 3 40 68 29-68第七章 PPS抽样1有放回抽样 在1至Mi抽取随机数,与随机数相对 应的单元入样2系统抽样法 在1k中抽取随机起点 i 第七章 PPS抽样三、估计方法 令 为第i个单元(群)入样概率 忽略不计第七章 PPS抽样例:N=8,n=3车间 人数Mi 区间 11200 1-1200 2 450 1201-1650 3 21001651-3750 4 860 3751-4610 5 28404611-7450 6 1910 7451-9360 7 290 9361-9650 8 3200 965

26、1-12850第七章 PPS抽样 设抽中随机号I=3255, 3、6、8车间作为样本被抽中。 第七章 PPS抽样 置信区间 即第七章 PPS抽样总量估计第一节 估计总体单位个数N N n r t例1: 某狩猎场在狩猎季节来临前想了解一下该地区猎物的数量,故采用抽样的方法,先扑捉到300只狍子,做上记号后放回,2星期后又扑捉到200只,发现其中有62只狍子带有记号。问该猎场地区大约有多少只狍子?( )第二节 逆抽样估计N例2: 有关部门欲了解自然保护区内一种鸟类的数量。先随机扑捉了150只,做了记号,然后放飞,一个星期后又进行抽选,目标是扑捉到有记号的鸟35只,结果扑捉了100只后才完成目标。以95%的把握程度估计自然保护区中该种鸟的数目。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论