第八章-抽样调查_第1页
第八章-抽样调查_第2页
第八章-抽样调查_第3页
第八章-抽样调查_第4页
第八章-抽样调查_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

抽样调查与推断

普查全面报表抽样调查重点调查典型调查全面调查非全面调查统计调查知识点回顾最常用的是:抽样调查民意调查市场调查收视率调查……在这一章,我们将学习:什么是抽样调查?如何用抽样调查的样本数据推断总体?抽样调查的组织方式有哪些?第一节抽样调查概述

一、定义

抽样调查是一种非全面调查。它是按照随机原则从调查对象中抽取部分单位样本指标,并根据样本指标来推断总体指标的一种统计方法。抽样推断的过程:研究总体样本计算:样本平均数样本成数抽样误差在一定可靠程度下估计总体指标区间随机原则

确定样本容量二、特点用样本推断总体按照随机原则抽取样本抽样误差不可避免,但可以计算控制三、作用(1)对无法进行全面调查的,可采用抽样调查;(2)对没有必要或不合适的现象应采用抽样调查;(3)用于对普查结果进行检查和修正;(4)用于质量控制;(5)用于假设检验。四、基本概念

(一)总体和样本总体(全及总体):总体单位数用N表示。样本:样本单位数(样本容量)用n表示。n≥30大样本n<30小样本(二)总体指标和样本指标(一)总体指标总体指标:全及总体的那些指标,也称总体参数,其值唯一(二)样本指标抽样总体的那些指标,也称样本统计量,为随机变量。第七章抽样调查第二节抽样调查的组织形式和

抽样方法

四种组织形式:一、简单随机抽样从总体单位中不加任何分组、排队,完全随机地抽取调查单位。适用于总体各单位之间差异较小和数目较少时。抽样框:一份包含所有抽样单元的名单1.抽签法;2.摇号法;二、等距抽样(机械抽样)

先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。按某标志排序有两种:1.选择标志与抽样调查所研究内容无关,称无关标志排队。2.选择标志与抽样调查所研究的内容有关,称有关标志排队。研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工资额高低排队。例三、类型抽样(分层抽样)1、概念

先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。2、原则

层间差别越大越好,层内差别越小越好3、分类等比例抽样不等比例抽样四、整群抽样

定义:将总体分成若干个群,随机抽取部分群,然后对选中的群的所有单位全面调查。原则:群内方差越大越好,群间方差越小越好第一阶段:从总体的全部群中抽取若干个群;第二阶段:再从抽取的群中抽取部分单位进行调查。五、多阶段抽样例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)第七章抽样调查思考:天目学院学生上网情况调查,如何抽样?抽样方法1、重复抽样(重置抽样)2、不重复抽样(不重置抽样)收视率是指:收视人数除以整个市场电视人口数的百分比(如:收视率2%,意味着100个人中有2个人收看)收视率影响广告商愿意花多少钱来买某节目的广告,以及该节目播不播下去。案例:电视收视率调查收视率在中国央视-索福瑞CSMAGB尼尔森尼尔森2008春晚收视率调查总体:4.24亿收视人群样本:全国14省市14,000户家庭(装有个人收视记录仪)标志:某一时段是否在看春晚节目指标:全国家庭收视率71.8%央视-索福瑞调查结果春晚收视率为96.5%央视-索福瑞CSMCSM在全国建立了9个省网、67个单独城市调查站,样本总规模达到18,500户2008年春晚播出时,对全国406个区县进行了3个多小时的电话调查。共访问成功2063个家庭,其中1899个家庭收看了春晚,加权推算出全国有96.5%的家庭收看了央视春晚。第三节抽样调查的数理基础1.分布函数二、正态分布标准差决定密度函数曲线的陡缓程度

三、标准正态分布部分常用z值和相应概率值z11.6451.96230.68270.90000.95000.95450.9973一般的正态分布,如何转化成标准正态分布?四、t分布注:五、抽样分布抽样分布就是指样本统计量的概率分布。例如,设总体有3名学生A、B和C,他们的考试成绩分别为5分、4分和3分。现在采用抽样调查方法抽取其中的2名学生作为样本,了解这3名学生的平均成绩,求样本平均值的分布状态。样本统计量为:第七章抽样调查若采用重复抽样,样本构成情况如下表所示。样本均值第二次ABC第一次AAAABACBBABBBCCCACBCC重复抽样的样本统计量取值情况样本均值第二次543第一次554.5444.543.5343.53重复抽样的样本统计量分布表33.544.55合计1232191/92/93/92/91/91五、中心极限定理1、样本均值的抽样分布

(数学期望与方差)样本均值的数学期望样本均值的方差重复抽样不重复抽样2、样本成数的抽样分布

(数学期望与方差)样本成数的数学期望样本成数的方差重复抽样不重复抽样小结:一、误差的种类误差登记性误差:代表性误差系统性误差:抽样误差:抽样平均误差抽样极限误差主观原因造成,如登记、测量、计算错误等违反随机原则第四节抽样误差

二、抽样误差

抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。练习抽样误差是指()

A、调查中所产生的登记性误差B、调查中所产生的系统性误差C、随机性的代表性误差D、计算过程中产生的误差C抽样平均误差是衡量所有可能的样本指标与总体指标离差的平均水平的指标,用μ表示。抽样极限误差是在一定的概率保证程度(抽样推断的可靠程度)要求下,用样本指标对总体指标进行估计时的最大可能误差,用符号∆表示。三、抽样误差的分类(一)抽样平均误差指标抽样平均误差重复抽样不重复抽样√√注意:1、当样本足够多时,可用样本方差代替总体方差,即用2、简化起见,一般采用重复抽样公式计算。某高等院校为了了解该校12000名在校大学生开网上开店情况,现采用纯随机重复抽样方法,从中抽取1000名学生进行调查,得知有280名同学有过网上开店经历,平均开网店时间为1.2年,标准差为1.65年,若根据该样本资料对该校在校大学生平均开网店时间及开网店学生所占比例进行推断,则抽样平均误差分别是多少?例1抽样平均误差的影响因素1.总体方差——正比关系2.样本容量n——反比关系3.不同的抽样方法——重复抽样>不重复抽样4.不同的抽样组织形式。(二)抽样极限误差在一定的概率保证程度F(t)(推断的可靠程度)要求下,用样本指标对总体指标进行估计时的最大可能误差,用符号△表示。当F(t)=68.27%时,t=1当F(t)=95.45%时,t=2当F(t)=99.73%时,t=3可靠程度与精确性成反比概率保证程度概率度t极限误差∆精确性

大→大→大→小小→小→小→大例:某保险公司从10000名投保人中随机重复抽取200名调查,得出该200名投保人的平均年龄为36.5岁,年龄的标准差为8.2岁,若要求推断的可靠程度为99.73%,则在此条件下推断全部投保人平均年龄的最大可能误差是多少?推断出总体10000名投保人的平均年龄为36.5岁,且平均年龄最大误差不超过1.74岁的可靠程度是99.73%。一、点估计例第五节点估计和区间估计在一定的概率保证度(可靠程度)下用样本指标值推断总体的区间范围,也叫置信区间。

二、区间估计例:某保险公司从10000名投保人中随机重复抽取200名调查,得出该200名投保人的平均年龄为36.5岁,年龄的标准差为8.2岁,若要求推断的可靠程度为99.73%,求10000名投保人平均年龄的区间估计。以99.73%的概率保证总体平均年龄在岁之间某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率的范围。~

例6小结参数估计点估计区间估计抽样的误差抽样平均误差抽样极限误差第五节必要样本容量的确定一、必要样本容量的计算在最大允许误差和可靠程度的要求下,至少应该从总体中抽取的样本单位数。重复抽样下的必要样本容量:二、影响必要样本容量的因素总体方差最大允许误差推断的可靠性抽样方法抽样的组织方式三、注意的问题1、总体方差未知的解决方法:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论