已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样调查,(Survey Sampling),第一章 概论,社会生活中的调查 抽样调查 基本概念 抽样调查的误差来源 抽样方法 实施抽样调查的一般步骤,内容提要,一、社会生活中的调查,现代社会对于统计信息的需求非常广泛。 调查(survey)是收集数据、获取统计信息的基本手段。是统计研究的起点。 调查:针对特定的人、事件,或特定的群体、系统等进行的收集资料、证据,获取信息的活动。 我们主要关心:为了解某特定群体的某些整体的数值特征所进行的调查(survey),而不是其他调查。关心整体的信息,而不是个别个体的情况。,例如:,例1. 政府部门需要了解青岛市居民的家庭年收入情况。 关心的整体(总体):青岛市全部的家庭。 待收集的数据: 某年各个家庭的年收入。 欲了解的总体数值特征:家庭平均年收入、各收入段中家庭的比例(低收入家庭的比例、高收入家庭的比例)、贫富的差距,等等。 例2. 预测某一届美国总统选举结果的民意调查。 关心的整体: 选举当年全体合法选民。 待收集的数据:各个选民准备投哪个候选人的票。 欲了解的总体数值特征:各候选人在全体选民中的得票率。,调查与抽样,面对某个庞大、复杂的总体,往往不可能全面调查其中的每一个个体来获得总体信息。只能从中抽选部分个体(样本)作调查,然后再由部分个体的数据推断总体的信息。 抽样调查是社会调查中最常用的手段。 特点:“以偏概全”、归纳、有一定误差。,调查举例:1. 政府部门的调查,大规模的社会调查最早大概就是出于政府的统治需要进行的。人类历史上很早就有关于人口、土地面积、税收等方面的调查。 一个较完整的早期抽样调查的例子:数学家Laplace受法国政府的委托作的对法国人口的推算。首先按不同的自然条件抽选30个行政区,在抽中的行政区中再抽一些小区。最后利用各小区中人口总数与出生人口数之间的比率来推断法国总人口。他调查的时点是1802年9月22日,那时各小区的总人口数为2037615人,出生人口用前三年的总数215599除以3来算,算得出生率为35.27。由此推算当时全法国的人口总数。(p6),调查举例:2. 民间和大众媒体的调查,市场调查 某些商品的市场调查,例如化妆品、家用电器、汽车等 保险业需求调查( “关于分红保险的调查研究”) 一些商场、超市做的顾客调查 境外游客的调查 广告投放效果的评估,例如:广告效果的调查,调查举例:2. 民间和大众媒体的调查,民意测验(poll) 美国的Literary Digest 杂志在1912-1932年间数次针对总统选举结果预测进行民意测验获得成功。但在1936年遭遇了失败。 美国Gallup民意调查所于1935年成立,起初专门从事民意测验,在1936年预测总统选举结果取得成功。 1990年与1992年全国科协组织的公众对科学技术态度的调查,调查举例:2. 民间和大众媒体的调查,电视收视率调查 城市交通状况调查 产品质量状况调查 目前,全世界已有众多诸如Gallup公司这样的专业从事各类调查的企业、咨询机构,已经形成“调查行业”。,调查举例:3. 其他方面的调查,学术研究 心理学:儿童智商测验的量表、股民投资心理的研究、成功的关键因素等等 社会学:1987与1992年中国儿童情况调查,1990年全国妇联组织的中国妇女社会地位调查 经济学 教育学:教育质量评估、不同教育方式的比较 自然科学的研究 等等。,调查举例:3. 其他方面的调查,企业管理 资产评估 财务审计 产品质量抽样检验 新产品的市场调查 等等,调查方式,问卷式(questionnaire) 把要调查的内容转换成若干个问题,集中在一份调查表中,让被调查对象回答。是用得较多的一种调查方式。 问题的形式主要有:封闭性的选择题、填写少量的数据的问题、开放性的问题。 问卷可以:由专门的调查员直接发放收集、用信函邮寄、通过电话询问、在网上调查等 问卷设计至关重要,调查方式,报表登记形式 例如,我国的工业报表制度 仪器测量 工业生产中产品质量的自动化检验 交通流量的自动检测 空气、水质量的检测 查阅资料 例如,财务审计 实验、观察,对调查的一般要求,充分性:能否获得所需的各项信息 及时性:每项调查都有一定的时效性,故调查周期不可太长。 经济性:省时、省力、便于组织实施 准确性:误差应控制在可接受的范围内 任何实际的调查,都只能在有限的人力、物力、财力和时间下,追求尽可能多且精确、有效的信息。,二、 抽样调查的意义与应用,(一)什么是抽样调查 (Survey Sampling),抽样调查是按一定程序从所研究对象的(总体)中抽取一部分(样本)进行调查,获取数据,并以此对总体的一定目标量作出推断。,普查与抽样调查,在普查中,我们从总体的所有单元中收集信息;而在抽样调查中我们仅仅从总体中的一部分(通常是很小的一部分)单元中收集信息。,抽样调查的必要性,有些调查不可能全面调查。 比如:空气、水质污染状况,破坏性的产品质量试验等 节约人力、物力、财力,大大降低调查费用。 缩短调查、数据整理分析的时间,时效性强。 能够提高调查质量,所获信息精确程度往往高于全面调查。 适用于大规模的社会调查。,抽样调查优点,能在充分满足客户所需信息质量的前提下,提供一种更快、更节省的方法。 相对于普查来说,抽样调查规模小,因而更容易进行监控,对被调查者的心理压力也小。 一项经科学设计并严格实施的抽样调查完全有可能获得比全面调查(普查)更为准确、更为可靠的结果。,抽样调查的主要技术问题,如何抽? 只有当抽出的样本能够代表总体时,才能用样本的信息正确地推断总体的信息。 抽多大的样本合适? 如何作推断、下结论? 结论的误差多大?可信度多大? 对这四个问题的讨论是本课程核心内容。,(二) 抽样调查发展简史,发端于1895年, 第五届国际统计学会(ISI) 挪威第一任统计局长凯尔提出建议: 用代表性样本调查方法来代替全面调查。,凯尔的观点,一个良好的,也即对总体有代表性的样本应该是总体的一个缩影。 样本各种平均性的指标应该与总体相应的指标十分接近。 “代表性抽样”(或称目的抽样),奈曼的理论,采用概率(随机)抽样而不是代表性抽样。 在对总体有所了解的情况下, 使用分层抽 样可以提高精度。 因为根据概率抽样, 得 到的样本通常可以获得总体目标量的无偏 估计, 而且估计量的方差也可从样本进行 估计。,非概率抽样 (non-probability sampling),用一种主观的方法从总体中抽选单元。 随意抽样; 志愿者抽样; 判断抽样; 配额抽样;,非概率抽样的缺点,为了对总体进行推断,需要对样本的代表性做很强的假定。 不可能得到可靠的估计值以及抽样误差估计值。,概率抽样 (probability sampling),两条基本准则: 单元是随机抽取的; 调查总体中的每个单元都有一个非零的入样概率,并且能计算出这些概率。,概率抽样的优点,能得到总体的可靠估计值 能计算估计值的抽样误差 能对总体进行推断,如何抽到一个“好”样本,用好的抽样方法 用好的估计方法 好的抽样策略 辅助信息(变量)的充分利用,抽样设计的类型,放回抽样与不放回抽样 等概率抽样与不等概率抽样 一次性抽样与重复性抽样(连续抽样),简单随机抽样 系统抽样 分层抽样 整群抽样 多阶抽样 多重(相)抽样 PPS抽样,抽样方法,估计方法(等概率抽样),简单估计 (用样本均值估计总体均值) 比(率)估计 回归估计 (利用与调查指标相关的 辅助变量),估计方法(PPS抽样),汉森赫维茨估计 霍维茨汤普森估计,抽样调查的误差来源,误差可分两大类: 抽样误差(sampling error) 用样本(局部)信息推断总体信息总难免的误差。 若采用概率抽样(随机抽样),则可根据概率论原理定量地描述这部分误差;或根据误差控制要求设计合适的抽样方案。 非抽样误差(non-sampling errors) 并非样本与总体间固有差异造成的误差, 主要有两个方面原因造成: 样本选择偏差(selection bias) 测量偏差(measurement bias),样本选择偏差,根本原因:抽样总体不同于目标总体 可能来源: 取样方式与关心的目标量有关 由调查员的主观判断、经验取样 按方便程度取样 样本全由自愿回答者构成 目标总体的确定有误 抽样框不完善 对于样本中无回答单元的处理,样本选择偏差的典型案例,(Freedman, D.等著,魏宗舒等译(1997),统计学,中国统计出版社,第19章) 对1936年美国总统选举结果的预测 当时最大的民意测验机构 Literary Digest 杂志花了50万美元,按全国各地的电话号码簿发出一千万张问卷,回收二百多万张,预测共和党人Landon当选。预测得票率57%,而实际得票率38%。预测失败。 Gallup领导的三家民意测验机构只调查了50000选民,准确预测民主党人Roosevelt当选。,样本选择偏差的典型案例,对1936年美国总统选举的预测,样本选择偏差的典型案例,问卷是邮寄给一千万人的,这些人的名字、地址摘自电话簿或俱乐部会员名册。包括的主要是富人。而当时,富人与穷人的政治倾向差异很大。 有严重的不回答现象。回答者(主要市中等收入者)与不回答者(低收入与高收入者)差异很大。,Literary Digest预测失败的原因,测量偏差,不论抽样调查还是普查,都存在测量偏差。 主要原因: 测量仪器的精度 问卷设计的原因:问题有歧义、有导向性、用词不准确、难以精确回答等 调查员的素质:对调查项目的理解、责任性、专业水平等 被调查者的原因:遗漏、虚报、瞒报、随意报 数据收集、整理过程中的错、漏 测量偏差一般随被调查对象数量增加而增加。故抽样调查结果常比普查更精确。,对误差的研究、控制,尽量精心、充分地准备、设计抽样调查方案,减小非抽样误差 采用科学、有效的方法抽样,减小样本选择偏差、抽样误差,二、我国抽样调查应用概况,统计部门(国家及地方统计局) 其他政府部门与学术机构 专业调查与咨询机构(公司),统计局承担的抽样调查 项目列举,人口变动情况调查; 城市与农村住户调查; 农产量调查; 规模以下工业调查; 限额以下批发零售业餐饮业调查,政府其他部门与学术机构 组织与承担的部分项目(1),卫生部 流行病学调查 (高血压,结核病) 5岁以下儿童死亡情况调查 国家卫生服务总调查,政府其他部门与学术机构 组织与承担的部分项目(2),交通部 公路、水路交通运输量调查 环境保护总局 粮食农药污染调查 全国科协 公众科学素养调查,政府其他部门与学术机构 组织与承担的部分项目(3),全国妇联 妇女社会地位调查 教育部与国家语委 语言与文字使用情况调查,政府其他部门与学术机组织 特点,目的明确,了解总体基本情况 通常是一次性的或周期较长 设计较有特色 样本量较大,精度要求较高,专业调查咨询机构(公司),电视收视率调查 观众行为调查 报刊阅读调查 市场(消费行为)调查 社会热点调查,专业调查咨询机构组织项目 特点,目的明确,基本了解总体情况 讲究时效与成本,样本量多有限制 设计要求不甚严格,质量相差悬殊 回答率较低,拒访率较高,三、我国抽样调查应用中的主要问题,尽可能提高抽样效率(费用与精度),同时具有可操作性; 满足多层次需要问题; 非抽样误差的控制与调整。,如何满足多层次需要,中国国情 各级政府都要管经济 解决途径 分层(事先分层与抽样后分层) 样本追加策略,冯士雍,施锡辁. 抽样调查
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国聚丙烯膜电容器行业应用趋势及前景动态预测研究报告(2024-2030版)
- 中国硬酯酸行业市场现状分析及竞争格局与投资发展研究报告(2024-2030版)
- 中国番泻叶供需状况及市场规模预测分析研究报告(2024-2030版)
- 中国电抗器行业现状趋势及应用前景预测研究报告(2024-2030版)
- 中国焦化行业发展状况及市场调研分析研究报告(2024-2030版)
- 梵高加谷类作品课程设计
- 迷宫寻路c语言课程设计
- 普通机床12级课程设计
- 食品标签课程设计
- 梦醒美式民主 课程设计
- 《护理文书书写》课件
- 2024年小轿车买卖合同标准版本(三篇)
- 动火作业施工方案5篇
- 河南省郑州市第四中学教育集团2024-2025学年七年级上学期期中地理试题
- 八年级生物中考备考计划
- 2024-2030年全球及中国湿巾和卫生纸行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2024高考物理一轮复习 第13讲 牛顿第二定律的基本应用(课件)
- 公务员2019年国考《申论》真题及答案(省级)
- 2024年会计专业考试初级会计实务试卷与参考答案
- 职业技术学院材料工程技术专业调研报告
- 五年级阅读《概括题专项训练》
评论
0/150
提交评论