旅游统计学(教学课件)第七章 抽样调查_第1页
旅游统计学(教学课件)第七章 抽样调查_第2页
旅游统计学(教学课件)第七章 抽样调查_第3页
旅游统计学(教学课件)第七章 抽样调查_第4页
旅游统计学(教学课件)第七章 抽样调查_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样调查了解国内旅游者的旅游花费?某景点要调查游客对景点各项服务的态度检查某种品牌的软包装鲜奶是否符合食品卫生标准飞机制造商检查所生产飞机的安全性第一节抽样调查的基本问题一、抽样调查的概念和特点(一)抽样调查的概念

抽样调查是非全面调查,它是按照随机原则从调查对象(即总体)中抽取部分单位进行调查,用调查所得指标数值对总体相应指标数值做出具有一定可靠性的估计和判断的一种统计调查方法。

随机原则:调查对象中每个调查单位都有同等机会被抽中。

(二)抽样调查的特点

1、以部分推断总体2、按随机原则抽取调查单位样本代表性计算抽样误差3、抽样推断是运用概率估计的方法4、抽样调查的误差可以事先计算并加以控制二、几个基本概念1、目标总体与抽样总体统计总体是具有某种共同属性的许多个别事物构成的整体。从抽样调查的角度看,统计总体就是能从中抽取样本或获得研究样本的那个集合体。

任务:了解某市居民家庭收看电视新闻的情况目标总体:是我们希望认识的总体抽样总体:样本直接来自的总体

两者可能一致,也可能不一致,如果不一致,样本推断的结果只适用与抽样总体而不适用于目标总体,必须借助一些辅助信息2、概率抽样和非概率抽样概率抽样通常称为随机抽样,严格按照确定的概率抽取样本特征:(1)从总体N个单位中抽取n个单位组成样本,每一个可能抽到的样本事先能够加以确认(2)每一个可能抽到的样本,都有一个已知的概率(3)从所有可能的样本集合中抽取一个样本,则该样本被抽到的概率等于已知的该样本发生的概率(4)任何一个被抽到的样本,由其调查结果只能得到唯一的估计值非概率抽样没有确切的定义,主要有以下几种情况:(1)从总体易取得的部分抽取部分观察单位(2)随便抽取观察单位(3)找出“典型”作进一步研究(4)有意识选取那些份量较重的单位概率抽样可用于对总体的估计,并可以计算估计误差,非概率抽样则做不到这一点3、抽样单位与抽样框抽样单位:抽样前将总体中的单位分成一个个组别,这一个个组别就是抽样单位

如居民家庭收支状况调查:可以街道或居住区为抽样单位抽样框:将总体中所有的抽样单位列举出来,并一一编号,得到一份有关抽样单位的名册或清单称之为抽样框抽样单位并不一定是总体的自然单位或最小单位4、重复抽样和不重复抽样重复抽样(回置抽样,重置抽样):从总体中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,把它看作一次试验,结果登记下来,又将其放回,重新参加下一次抽选。不重复抽样:每次从总体抽取一个单位,连续进行n次抽取构成一个样本,每次抽出一个单位不再放回参加下一次的抽选。每个单位中选或不中选的机会在每次都完全一样5、样本容量和样本个数样本容量:一个样本所包含的单位数样本个数(样本数目):指从一个总体中可能抽取的样本个数。样本个数受样本容量和抽样方法影响总体有多少个样本,样本统计量就有多少种取值,从而形成该统计量的分布6、全及指标和抽样指标全及指标(母体参数):根据全及总体各个单位的标志值或标志特征计算的反应总体某种属性的综合指标数量标志常用的总体参数:总体平均数总体方差品质标志常用的总体参数:成数p全及指标是唯一确定的抽样指标:根据样本总体各个标志值或标志特征计算的综合指标

抽样平均数抽样成数样本方差样本标准差

第二节抽样误差一、抽样误差的概念登记性误差:指在调查取得资料的过程中,由于各种主客观方面的原因,在观察、计量、记录、汇总等环节上产生的差错。代表性误差:

用抽样资料推断总体时产生的误差

偏差、偏误、系统误差:未遵守随机原则抽样误差、随机误差:遵守随机原则抽样误差:由于随机抽样的偶然因素,使样本各单位的结构不足以代表总体各单位的结构,而引起的抽样指标和全及指标的绝对离差。影响抽样误差大小的因素:

(1)抽样单位数目的多少(2)总体各单位标志值的差异程度(3)抽样方法:重置大于不重置(4)抽样组织形式:简单随机、分层、整群二、抽样平均误差1、概念、作用抽样平均误差是样本指标(样本平均数或样本成数)的标准差。

表示样本平均数的平均误差,

表示样本成数的平均误差,N表示全部可能的样本数目。则抽样平均误差的定义公式为:

2N2作用:(1)是衡量样本指标代表性大小的标准(2)是抽样法的基础利用平均误差确定推断的可靠性,控制误差范围计算抽样的单位数目2、抽样平均误差的计算(1)样本平均数的平均误差

在重复抽样条件下在不重复抽样条件下

N非常大时以简单随机抽样为例例1某村种植的水稻按不同的收获量分成5个地块,资料见表

从中随机抽取两个地块组成样本,试计算抽样平均误差某厂对一批电子元件10000只进行抽样耐用性能检查,不重复抽取1%,计算抽样平均误差耐用时数抽样数组中值900以下1875900-9502925950-100069751000-10503510251050-11004310751100-1150911251150-1200311751200以上11225合计100耐用时数抽样数f组中值xxff900以下187587532580.25900-9502925185034060.5950-10006975585038881.51000-10503510253587532558.751050-11004310754622516350.751100-1150911251012543472.251150-120031175352542840.751200以上11225122528730.25合计100105550269475(2)样本成数的平均误差

重置情况下:不重置情况下N很大时某玻璃厂生产一批印花玻璃杯,现按不重复方式,从中随机抽取150只进行质量检验,结果有3只不合格,其余都合格。试求这批印花玻璃杯合格品率的抽样平均误差。合格品率

抽样成数方差抽样成数的平均误差练习:电子元件耐用时数不到1000小时者为不合格品,计算合格品率的抽样平均误差。合格品率

抽样成数方差抽样成数的平均误差三、抽样极限误差(一)抽样极限误差的概念

抽样极限误差(误差范围、允许误差):就是变动的抽样指标数值与确定的全及指标数值之间离差的可能范围,它是用一定的概率来保证抽样误差不超过某个给定的最大可能范围。由于抽样实际误差可正可负,所以我们定义抽样极限误差是以绝对值表示的抽样误差的最大可能范围通常以符号“Δ”来表示。

从另一角度考虑抽样误差问题设

、ΔP分别表示抽样平均数的极限误差和抽样成数的极限误差,则有:

(二)抽样极限误差的计算

t是抽样误差的概率度,是测量估计可靠程度的一个参数

根据玻璃杯一例的资料和计算结果,要求以68.27%的概率估计该批印花玻璃的合格品率。

抽样误差的概率就是概率度t的函数电子元件一例,求概率为95.45%时的抽样极限误差

第三节抽样估计一、抽样估计的精度抽样极限误差对估计精度给出了评价的标准,但同一数值对不同现象可能具有完全不同的意义。职工平均工资

=20元人均工资超过1000元的地区人均工资不足200元的地区,合适吗?误差率=抽样极限误差/样本平均数估计精度=1-误差率二、抽样估计的置信度

表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。

抽样误差的概率度t抽样误差的概率就是概率度t的函数

例:样本平均工资为350元,抽样平均误差为6.25元,求总体工资在345-355元间的估计置信度三、抽样估计的优良标准

抽样指标估计参数的三个条件:(1)无偏性,即以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身。(2)一致性,以抽样指标估计总体指标要求当样本的单位数充分大时,抽样指标也充分地靠近总体指标。(3)有效性,抽样估计的方差应该比其他估计量的方差小。

四、总体参数的点估计

参数点估计:以样本指标的实际值直接作为总体指标的估计值。

如:以样本平均数

直接作为总体平均数

的估计值以样本成数p直接作为相应总体成数P的估计值

五、总体参数的区间估计区间估计就是根据抽样指标定出置信区间和置信度置信区间置信度:落在置信区间内的可靠程度,即概率(1)根据已经给定的抽样误差范围,求概率保证程度,进而对总体参数作区间估计例1某电话询问服务站在每次呼叫结束时作一份报告,记下每次电话的时间长度

n=9样本平均数=1.2分钟标准差=0.6分钟

=0.392

计算概率保证程度和置信区间例2为研究新式时装的销路,随机抽取一个900人的样本,其中540人喜欢这种新样式,抽样极限误差为0.0267,估计该市成年人喜欢该样式的比率(2)根据给定的置信度要求,来推算抽样误差的可能范围,进而对总体参数作区间估计

例1某城市居民家计调查,n=400户,旅游消费年平均支出850元,标准差为200元,以95%的概率保证程度估计该城市居民户年平均旅游消费支出。例2为了研究中央电视台春节联欢晚会的受欢迎程度,在全国各地随机对1000名成年人进行调查,结果有930名成年人表示喜欢,要求以90%的概率保证程度对晚会受欢迎程度进行区间估计。

解:(1)计算样本喜欢人数比率及抽样平均误差:

样本喜欢人数比率:

抽样平均误差

(2)由给定的置信度F(t)=90%,查正态分布概率表得

t=1.64(3)计算抽样极限误差:

我们可作如下估计:即以90%的概率保证程度,估计成年人喜欢春节联欢晚会人数比重在91.67%—94.33%之间

第四节抽样组织形式一、简单随机抽样(纯随机抽样)指从总体N个单位中抽取n个单位组成样本,每个样本抽到的可能性完全相等的一种随机抽样方法。抽取方法:抽签法、随机数表法、计算机生成法(Excel,SPSS)由简单随机抽样得到的样本,叫作简单随机样本或简单样本。简单随机抽样最符合抽样随机原则的要求,因此是各种抽样调查方法的基础,也是抽样推断的基础确定必要的抽样单位数目(重复简单随机抽样)必要的抽样单位数受允许的抽样极限误差制约,成反比关系二、分层抽样(分类抽样、类型抽样)组织方式:在正式抽取样本单位之前,将总体划分成若干个类型,然后从各个类型中抽取一定数目的单位组成样本,在这个基础上再进行调查和统计推断。

在分层抽样方式下得到的样本,被称为分层抽样随机样本,简称分层样本。分组法与抽样原理的结合1、分层抽样的意义(1)可以在不增加样本容量的情况下,减小抽样误差,提高抽样估计的精度

保证各层样本有较高程度的代表性每一层都进行了抽样(2)在既定的抽样估计精度要求下,可以减少样本单位,节约调查费用

层内可少抽取样本(层内差异小)(3)分层抽样的代表性比较好(4)分层抽样资料既可以用于总体的推断,也可用于对层的估计研究(5)分层抽样的组织管理很便利2、抽样比和相关指标的计算(等比例抽样)抽样比f各组的抽样平均数全部样本的抽样平均数各组内方差各组内方差的平均数样本平均数的抽样误差不考虑层间差异某市120家饭店,三星级30家,二星级60家,一星级30家,从中抽取16家调查,以95%的可靠性对标准客房盈利最大床位数进行估计Nn平均数方差三星30418050二星608400225一星30429050合计12016三、整群抽样(集团抽样、区域抽样)将总体划分成若干个互不交叉且又穷尽的群(组),然后以这些群为抽样单位进行抽样,对被抽中群的所有单位全部进行调查。由整群抽样得到的样本,称为整群随机样本,简称整群样本1、分层抽样与整群抽样的区别分层抽样从各层中抽取样本单位,抽样调查体现在层内样本的抽取上整群抽样直接抽取群,中选群的调查属全面调查,抽样体现在样本群的抽取上。分层抽样要求层内方差小,层间方差大整群抽样要求群内方差大,群间方差小2、整群抽样的作用(1)对抽样框的要求不那么严格(2)节约调查时间,提高资料搜集的工作效率(3)有助于减少

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论