抽样调查 第一章课件_第1页
抽样调查 第一章课件_第2页
抽样调查 第一章课件_第3页
抽样调查 第一章课件_第4页
抽样调查 第一章课件_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样调查课----第一课时单位:浙江财经学院数统学院课程:抽样调查课教师:张锐1信息社会一、什么是信息二、信息如何采集三、信息如何存储和传播四、信息如何处理五、信息如何解释2一、什么是信息如何给信息下个定义?差异就是信息信息就是价值3二、信息如何采集非统计方法记者新闻采访仓库管理员的统计统计方法随机概率保证4三,信息如何存储和传播计算机信息存储的介质,也是信息革命的开端。网络信息传播渠道的拓宽。5五,信息如何解释数学与哲学解释自然科学解释物理化学社会科学解释宏观经济学(GDP核算)博弈论(拍卖理论)系统科学控制学信息学7统计时代信息的采集统计方法,是信息采集最合理的方法。信息的处理非确定性社会下,统计方法是信息处理最常用的方法。8一、统计学的历史人口普查-------罗马帝国时代,恺撒大帝为了炫耀国家实力,进行了有史以来第一次的人口普查。经济统计开始逐步发展起来。随机变量的引入让统计由数数演变到了一门数学科学。Fisher对统计推断的研究,开辟出了现代数理统计这一学科。10二、数理统计学估计假设检验数据的收集(抽样调查)数据的分析处理断面数据(回归分析,计量经济学)

时间数据(随机过程,时间序列)多纬度数据(多元统计)11三、统计学的应用政府机构(统计局等)金融机构(银行、证券、保险)研究所调研公司大型外资消费企业12五、市场调研公司的人员构成访问员督导总督导数据分析员14六、市场调研公司的流程确立研究对象样本量的确定抽选方案的设计费用的计算问卷的设计现场执行质量的控制数据分析15抽样调查课程概述一、抽样调查和抽样技术二、课程要求三、撰写调查报告四、调查报告的四个部分五、课程的主要内容六、教材资料七、模型结构17一、抽样调查和抽样技术抽样调查和抽样技术抽样调查《市场调查方法与技术》

中国人民出版社简明金勇进蒋妍等抽样技术

《抽样技术》

中国人民出版社金勇进蒋妍李序颖等18二、课程要求掌握概率抽样的方法、理论了解和掌握抽样的公式及部分公式的推导会写一份调查报告会使用不同的软件进行分析19三、调查报告的格式论文格式报告格式20四、调查报告的四个部分调查目的抽样方案数据描述、分析建议21经济五、课程的主要内容医学工程….生活计量第1章绪论第2章简单随机抽样第3章分层随机抽样第4章等概率整群抽样和多阶段抽样第5章不等概抽样第6章系统抽样第10章调查中的非抽样误差穿插具体的抽样调查的实例

共计51学时

22七、模型结构统计推断的模型结构抽样调查的模型结构回归分析、计量经济学的模型结构时间序列的模型结构24统计推断的模型结构25回归分析、计量经济学27抽样调查的基本概念一、抽样调查和普查二、概率抽样和非概率抽样三、等概率抽样和不等概率抽样四、主要的研究指标五、如何评价抽样的好坏六、如何抽到好的样本28一,抽样调查和普查一、定义二、区别三、抽样调查和普查的选择抽样调查只调查的是总体的一部分单元收集信息,而普查需要调查总体的所有单元来收集信息。取决于多方面的因素,包括预算,要求的时限,总体的大小等等选择抽样调查的最主要原因是抽样调查能在充分满足客户所需要信息质量的前提下,更快更节省。对于普查而言,抽样调查规模小,容易监控。当然有些情况普查会更好的。29抽样调查与普查抽样调查的作用

抽样调查的应用我国的统计调查体系30抽样调查与普查(抽样调查的作用)一、节约费用:统计调查有一个经济效益问题,抽样调查的数据来源只是总体的一小部分,能节约调查的人力、物力和财力,所以调查费用低。例如,美国政府在进行最重要的调查时,使用的样本常在105,000人左右(美国人口为1亿3千万左右),即1240个人中抽一个人。二、时效性强:抽样收集的数据远远少于全面普查的数据,需要处理的数据自然就比较少。这样,由抽样调查提供的数据资料和决策、预测等往往比全面普查更为及时。在迫切需要有关信息时,这一点非常重要。三、可以承担全面调查无法承担的项目对那些不可能进行全面观察的,又需要了解全面情况的客观对象(总体),只能抽样。a所研究的个体是无限的。比如想知道大气的污染程度。b.观察或测试是具有破坏性的。如测试一批显象管的寿命。四、能提高调查的质量,有较高的精确度为什么??31抽样调查与普查错觉:抽样调查是一种非全面调查,抽样调查当然不如全面调查准确.抽样调查是用局部来推断总体,当然存在抽样误差。但是调查的误差是多方面的,任何一项调查都存在观察或调查误差,也有可能发生遗漏和重复。因此,调查数据的质量更加重要。一个错误的数据比没有更糟。在抽样人员上,全面培训大量人员比较困难,但是小批的工作人员是完全可以的,这就保证了质量。基本点——科学的抽样手段、确保质量的调查数据、精确严格的统计计算程序。一项经科学设计并严格实施的抽样调查完全有可能获得比全面调查(普查)更为准确、更为可靠的结果。32抽样调查与普查的关系抽样调查和普查的关系是相互补充,相辅相成。抽样调查并不可以替代普查。普查收集的资料比较容易为大众所接受,能较好的获得公众的支持,可以取得小单位的资料等等。抽样调查作为普查的补充:我国的人口调查是十年一次的普查和每年一次的抽样调查用抽样调查对全面统计资料进行评估和修正利用抽样调查,提前获得总体目标量的估计普查为抽样框提供资料33抽样调查的应用1.人口调查人口调查是抽样调查最早应用的领域。2.经济调查如对各类产品、商品的市场调查和消费行为调查等等3.社会调查包括公众和民意调查等等4.卫生调查5.环境资源调查等等34我国的统计调查体系以必要的周期性普查为基础;

以经常性的抽样调查为主体;

辅之以重点调查、科学推算和有限的全面报表综合运用我国的统计调查体系35二、概率抽样和非概率抽样抽样框名录框区域框自然框抽样单元是构成抽样框的基本元素36概率抽样按一定的概率以随机原则抽取样本。每个单元被抽中的概率是已知的。估计量不仅与样本单元的观测值有关,也与其入样概率有关。非概率抽样方便抽样自愿样本37非概率抽样例子例子一从实验室中一个装有100只兔子的大笼子里抓10只兔子做实验,不经任何有意识的选取,抓到哪只就算哪只,抓满10只为止。例子二将笼子里的100只兔子编上1~100号,任意列出10个数字,相应号码的兔子作为实验用的兔子。38三、等概率抽样和不等概率抽样例子一全班有40个人,按学号进行编号,从中随机抽取一个人。研究这个人的身高。例子二全班40个人,按学号进行编号,以41号代表01号同学,从01-41中随机抽取一人,研究这个人的身高。39四、主要的研究指标总体总量总体均值总体比例总体比率40研究目标量例子判断下面要估计的总体目标量分别是什么类型。测试一名大学生的英语词汇量调查城市居民家庭平均用电量估计空气中氮氧化合物的含量估计湖中鱼的数量估计居民家庭用于做饭菜及饮用的用水量占家庭总用水量的比重估计婴儿出生性别比41五、如何评价样本的好坏42误差非抽样误差抽样误差

由于抽样造成的误差,由于用样本估计总体而产生的误差。调查误差不完整的抽样框引起的误差不回答误差由于填写或录入调查数据中的谬误而产生的误差…43

抽样误差产生的原因

样本只是总体的一部分,用局部数据作为整体数据的估计不可能完全正确。对任何一种抽样方案,可能的样本会有很多,而实际抽到的只是一个样本。因此抽到哪一个样本完全是随机的、偶然的。如果抽到的是另一个样本,对总体的估计就会不同。这就是抽样误差产生的根本原因。只要是抽样调查,这个误差是不可避免的。但与非抽样误差不同的是,抽样误差是能够计量的,即可用各种量值来表示,而且它可以得到控制,即只要愿意,人们可以将抽样误差控制在任意小的范围内。原因在于抽样调查直接与样本量有关。44

抽样误差与样本量抽样误差样本量45

抽样误差与样本量样本量越大越好?样本量给定的情况下,如何衡量抽样误差,选择抽样方法呢?未必。抽样误差虽然在开始时随样本增加而缩小,但在一定阶段后便趋于稳定。在经过一定阶段后,再努力减少抽样误差通常是不合算的。所以,过了这个阶段,只要稍微降低一点精度,就可以省下可观的成本。需要考虑抽样方案的设计,通常用抽样的方差与标准差等等度量抽样误差。46

非抽样误差与样本量至于非抽样误差,其特性恰好和抽样误差相反,是随样本增大而增大。因为抽样调查的访问和资料整理都比普查易于进行,因此非抽样误差远小于普查。有时,普查中的非抽样误差竟然大于抽样调查中的抽样误差与非抽样误差的总和,此时更值得使用抽样调查。当然非抽样误差在调查的各个环节规定并实施质量保证措施才能使非抽样误差控制在一个比较理想的水平。47用均方误差评价抽样的好坏均方误差(平均平方误差)(meansquareerror):例子48

=

由均方误差的分解可知,均方误差可分解为估计量的方差和偏倚的平方。通常情况下,我们用均方误差的大小来衡量抽样方案设计的优劣。由于偏倚指的是系统误差,所以用估计量的方差衡量抽样误差的大小。当然当估计量是无偏时,均方误差就等于估计量的方差了。49抽样误差的度量50

样本的估计量与估计值样本的估计量?样本的估计值?一个估计量的(抽样)分布?

样本的函数基于某个特定的样本在使用相同的抽样设计,从同一个总体中抽取所有可能的样本的估计值的分布。估计量的抽样分布依赖与抽样设计即采取何种具体的概率抽样方式。还有估计量的具体形式。估计量的抽样分布对于确定估计量的性质比如偏倚和抽样方差等非常重要。我们希望所得的估计量应该具有哪些性质呢?51估计量的偏性与均方误差设总体的某个待估参数为

,用样本数据计算的一个统计量

作为

的估计(estimator)。用

估计

的实际误差是

,且未知

偏倚(Bias):称为估计量的偏倚,记为

b)均方误差(平均平方误差)(meansquareerror):

称为均方误差。由于

未知(在通常情况下)但它可分解为:

注意到,偏倚由于正负的抵消不足以反映误差的大小。因而我们考虑也就是平均平方误差或均方误差52问题:“多大的标准差是可以接受的?”例如,标准差等于100

用来测度人的体重可能很大,但是用来测度年收入就显得不是很大。

问题:如何比较不同量纲单元的样本估计值的抽样误差时?变异系数;估计值的标准差与估计值本身之比,

经常见到报纸采用如下方式报道调查结果:“根据一项最新的调查,15%的渥太华市民每周都参加宗教活动。这个结果是基于一个1345名市民的样本得出的,在95%的置信水平下,误差在正负3个百分点之内。”这段话有什么含义?53

它告诉我们,每周都参加宗教活动的市民的真实比例在15%+-3%的范围内。换句话说,误差限是+3%,或简单地说成3%,此时置信区间(12%,18%)。误差限总是伴随一个置信水平,它表示置信区间的可靠程度。在这个例子中,置信水平是95%,它表示:如果调查重复进行,那么100次中将有95次,所得的置信区间覆盖总体的真值。-----误差限-----置信区间54

实际中,有个人类学家要了解某一个小岛的居民,除了其他研究内容外,想估计一下居民的血型为o型的人所占的比率。于是统计学家问,你要达到多少的精确度?他回答说,只要百分比有不到5%的出入就满意了。统计学家指出,除非你对每个人进行计量,不然我们不能绝对保证精确度是在5%以内的,无论去多大的样本,总有机会抽到一个倒霉的样本,它的误差比所需要的5%要大。于是,人类学家就冷淡的说,我知道的,我愿意有二十五分之一的机会遇到一个倒霉的样本。555657置信度的含义?58费用与精度一个好的抽样设计应尽量考虑到精度与费用两个因素。对于具体的抽样设计应做到

在固定费用的限制下使精度最高要求达到精度的条件下,使调查的总费用最省

这样的设计称为最优设计,最优设计的效率最高抽样调查的精度取决于误差的大小,主要是取决于抽样误差的大小。在对可用估计量,样本量较大的时候抽样误差取决于方差(或标准差)的大小。影响方差的最主要的因素就是样本量,样本量与调查费用直接相关。样本量越大,费用越高。另外一个影响费用和精度的因素就是抽样方法和估计方法。59

六、如何抽到好的样本

如何抽到一个“好”样本

关键:辅助信息(变量)的充分利用

用好的抽样方法

用好的抽样策略

用好的估计方法60抽样方法简介1、简单随机抽样(simplerandomsampling)

从总体中随机无放回地,等概率地抽取样本。特点:各组样本被抽到的可能性相等。最简单的抽样方式,抽样理论最完善,是抽样理论的基础。当总体相当大时,由于组织工作与具体技巧上的困难而很少直接采用,但它是其它随机抽样的基础。但实际当中直接采用该方法的并不多。612、分层抽样(stratifiedsampling)(STR)按一定原则,将总体分成若干明显不同的群体(子总体),每个子总体称为层,不同层之间是相互独立的,在每个层内进行抽样,将这些来自“子总体”的样本全部汇总起来成为总体的样本。抽样方法简介(2)特点:各层之间有明显不同,注意到明显不同特性的群体在样本中的反映优点:组织实施方便;样本散布均匀;精度较高;数据处理简单。分层技术是应用上最为普遍的抽样技术之一。623.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论