《统计学原理与实务(第三版)》课件 第5章 抽样调查与估计_第1页
《统计学原理与实务(第三版)》课件 第5章 抽样调查与估计_第2页
《统计学原理与实务(第三版)》课件 第5章 抽样调查与估计_第3页
《统计学原理与实务(第三版)》课件 第5章 抽样调查与估计_第4页
《统计学原理与实务(第三版)》课件 第5章 抽样调查与估计_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Statistics第5章抽样调查与估计2抽样——抽取样本什么是样本怎么抽——抽样方式、方法从哪里抽——抽样框抽多少——

样本大小抽样估计——用所抽取样本去估计总体要估计什么——总体参数(总体特征)用什么来估计——样本估计量用什么估计方法估计结果的形式估计结果的可靠性和准确性3第一节抽样的基本概念一、总体和样本二、抽样调查抽样法用于搜集资料称之为抽样调查。与全面调查比较,它省时省力且调查内容可以更深入细致;与非全面调查比较,它主要具有三个特点:随即原则抽取样本估计总体存在可以控制的误差4三、抽样调查的适用情况:

不可能进行全面调查的情况不必要进行全面调查的情况对全面调查的资料进行验证和修正对于及时性要求很强的情况5四、抽样估计的一般步骤设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体参数重点掌握6五、总体参数和样本统计量(一)总体参数

——根据全部总体单位的标志值计算的,用以说明总体数量特征的综合指标。

常见的总体参数有:总体平均数总体标准差总体方差总体成数7(二)样本统计量

——根据样本单位的标志值计算的,用以估计和推断相应总体指标的综合指标。

常见的样本参数有:样本平均数样本标准差样本方差样本成数

总体参数与样本估计量的关系——对于特定的目的,总体是惟一的,所以参数也是惟一的;而由于样本是随机的,所以样本估计量是随机变量。8总体参数样本估计量及其计算公式总体平均数样本平均数总体成数P=N1/N样本成数

p=n1/n总体方差样本方差(若分母为n-1则称之为样本修正方差)总体标准差样本标准差(若分母为n-1则称之为样本修正方差)9

第二节抽样调查方案的设计

一、抽样方案设计的基本准则

(一)随机原则(二)抽样误差最小(三)费用最少10

二、抽样方案设计的主要内容除了一般调查方案的内容外,主要还包括:编制抽样框确定抽样方法确定抽样组织方式确定抽样数目111、什么是抽样框?

抽样框是包括全部抽样单位的名单框架,是实施抽样的基础,影响抽样的随机性和抽样效果。2、抽样框的主要形式:(1)名单抽样框(2)区域抽样框(3)时间表抽样框

3、抽样框的要求

一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复也不遗漏;尽可能利用与所研究变量相关的辅助变量的信息,而且容易实施。(一)编制抽样框

包含所有总体单位的名单框架。名单抽样框姓名身高体重(cm)(kg)丁一18270于峰17562马宁16050王一波17266王忠烈16962王洪宇18270刘可心16661李元元15248李煌18890李一民17363编号

001002003004005006007008009010STAT应当调查的对象(居民户)已购或未购微波炉的住户已购该公司微波炉的住户有购买微波炉意向的住户某外国公司在成都进行微波炉市场调查:微波炉普及情况居民的喜好特征居民购买力水平公司产品知名度公司产品信誉度抽样框在商场的大门口在微波炉柜台前在市区街道旁边在某个住宅小区青羊区…

武侯区浆洗街街道…蜀汉街街道…门牌号1…

门牌号2…

…STAT抽样框连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。STAT15(二)确定抽样方法重复抽样,也叫回置抽样抽出个体登记特征放回总体继续抽取抽出个体登记特征继续抽取不重复抽样,也叫不回置抽样,

同一总体单位有可能被重复抽中;每次都是从N个总体单位中抽取;n次抽取就是n次相互独立的随机试验。

同一总体单位不可能被重复抽中.

每次抽取是在不同数目的总体单位中进行的n次抽取可看作是n次互不独立的随机试验。

161、基本的抽样组织方式有四种:简单随机抽样(纯随机抽样)分层抽样(类型抽样)等距抽样(机械抽样、系统抽样)整群抽样(集团抽样)(三)确定抽样组织方式17简单随机抽样抽样方法:对总体单位逐一编号,然后按随机原则直接抽取若干单位构成样本。特点:最基本的组织方式,适用于总体规模不大,内部差异较小的情况。随机样本:与总体分布特征相同非随机样本:与总体分布特征不同18总体N样本n等额等比例······分层抽样抽样方法:将总体全部单位按照某个标志分成若干组(层),在从每一组中抽取样本特点:抽样误差小于简单随机抽样,抽样推但的效果好19等距抽样抽样方法:将总体各单位按某一标志顺序排列,然后按照一定的间隔抽取样本单位。特点:容易实施,但应避免抽样间隔和现象本身的周期性相同。(总体单位按某一标志排序)············20

整群抽样抽样方法:将总体划分为若干群,然后随机抽取某一或某些群构成样本,对抽中群的所有单位进行全面调查,未抽中群一律不查。特点:抽取单位集中,容易实施,但样本代表性可能较差。总体群数R=16样本群数r=4样本容量ABCDEFGHIJKLMNOPLHPD21例:在某省100多万农户抽取1000户调查农户生产性投资情况。多阶段抽样第一阶段:从省内部县中抽取5个县第二阶段:从抽中的5个县中各抽4个乡

第三阶段:从抽中的20个乡中各抽5个村

第四阶段:从抽中的100个村中各抽10户样本n=100×10=1000(户)222、抽样组织方式的选择应考虑以下几个方面:抽样误差的大小(参见第五节)调查对象的性质特点以及对调查对象的了解程度人力、财力、物力等方面的条件23大样本n≥30小样本n<30

对经济现象抽样调查常采用大样本。抽样数目往往根据误差要求来确定,其计算见第三节。(四)确定抽样数目24第三节

简单随机抽样的抽样估计一、抽样误差的概念

统计调查中的误差种类:登记性误差,可能存在于任何统计调查中代表性误差,存在于非全面统计调查中系统误差,存在于非随机抽样调查中

随机误差,存在于随机抽样调查中抽样误差25167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高=169.8CM平均身高=174.6CM总平均身高=168.6CM26二、抽样平均误差(一)抽样平均误差的定义

抽样平均误差指样本估计量的标准差。均值的抽样平均误差常常记为成数的抽样平均误差常常记为它反映所有可能样本估计值与中心(相应总体参数)的平均差异程度,衡量样本对总体的代表性大小。抽样平均误差的平方称为“抽样方差”。27

当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值

也服从正态分布,的数学期望为μ,方差为σ2/n。即:

~N(μ,σ2/n)。

中心极限定理(二)样本均值的抽样分布28

重复抽样下:

不重复抽样下:

(三)抽样平均误差的计算公式29

例1:设有A、B、C、D四个工人构成的总体,即总体单位数N=4。这四个工人的日产量分别为X1=22、X2=24、X3=26、X4=28。现从该总体中抽取n=2的简单随机样本,求其抽样平均误差。3、不重复抽样条件下:1、可计算出该总体的均值为25、方差为5。2、重复抽样条件下:30例2、欲估计某地区10000名适龄儿童的入学率,用不重复抽样方法从这个地区抽取400名儿童,检查有320名儿童入学。求本次估计的抽样平均误差。1、入学率为成数,总体成数未知,用样本成数代替2、样本成数=320/400=0.8=80%3、抽样平均误差:31

(四)总体方差的代替方法

用样本方差代替计算用过去(总体或样本)方差代替计算用同类现象(当前或过去、总体或样本)方差代替计算有若干个方差可选择时,选方差最大者(注意:对成数,选择最接近0.5的值所得的方差最大)

32总体方差(或总体标准差σ)。其它条件不变的条件下,总体单位的差异程度大,抽样平均误差大。抽样数目。其它条件不变的条件下,抽样数目多,抽样平均误差小,但样本单位数的增加与抽样误差的减少并不是等比例的。抽样方法。相同条件下,重复抽样的抽样平均误差大比不重复抽样的抽样平均误差大。抽样组织方式。由于不同抽样组织方式有不同的抽样误差,所以,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同。

(五)影响抽样平均误差的因素33三抽样极限误差(一)抽样极限误差的概念

抽样极限误差——指一定概率下抽样误差的可能范围,也称为允许误差。用△表示抽样极限误差,则这一概念可以表述为如下不等式:34(二)大样本条件下的抽样极限误差

根据样本均值的抽样分布定理,所以,有:给定估计的概率(1-α),查标准正态分布表得对应的临界点Zα/2后,抽样极限误差的计算公式为:

同理,可得比率的抽样极限误差公式为:35常用的z值及相应的概率把握程度为:

z把握程度(置信度)

10.68271.960.9520.95452.330.982.580.9930.997336

例3、对某县水稻产量进行重复的抽样调查,实测400亩得平均亩产为620公斤,标准差为90公斤。求置信度在95.45%的抽样极限误差。查表得所以

即有95.45%的把握程度推断,样本平均亩产与全县实际平均亩产之差不超过9公斤。解:

37(三)小样本条件下的抽样极限误差

所以,有:给定估计的概率(1-α),查t分布表得对应的临界点tα/2(n-1)后,抽样极限误差的计算公式为:38四、抽样估计(一)区间估计的原理

区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。

39计算样本统计量计算抽样平均误差计算抽样极限误差确定置信区间区间估计步骤40

例4、在2000名工人中采取重复抽样方式随机抽取144名工人的土方工程进行测算,测量结果为每人的平均工作量为5.32m,标准差1.5m。要求:(1)以95%的概率保证度来估计工人的平均工作量。41

例5、一所大学的保健医生想了解学生戴眼镜的比率,随机抽选100名学生,其中戴眼镜者有31名。试求全校学生戴眼镜的比率的置信度为95%的置信区间。42

例6、对一批产品按重复纯随机抽样调查方式进行调查,抽出100件产品作为样本,并测得样本中产品的次品率为8.24%,计算这批产品的次品率在2.74%--13.74%之间的把握程度有多大.n=100,p=8.24%=8.24%-2.74%=5.5%=243

前例4、在2000名工人中采取重复抽样方式随机抽取144名工人的土方工程进行测算,测量结果为每人的平均工作量为5.32m,标准差1.5m。要求:(1)以95%的概率保证度来估计工人的平均工作量。(2)估计2000名工人的总工作量。N(x-△x

)≦NX≦N(x+△x

N(p-△p

)≦NP≦N(p+△p)44

是直接以样本指标来估计总体指标,又称定值估计。

1、样本平均数及成数是总体平均数与成数的估计量。

2、样本修正的方差是总体方差的无偏估计量。

3、大样本条件下,样本方差是总体方差的渐进无偏估计量。点估计45样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量五确定样本容量找出在限定费用范围内的最大样本容量46∵在重复抽样条件下,抽样极限误差为△x=Zα/2μx=Zα/2(σ/√n)∴抽样数目n=(Zα/2)σ/(△x)222不重复抽样47练习:一家市场调查公司想估计某地区有彩色电视机的家庭所占的比重。公司调查人员根据同类调查估计实际的比重不可能大于20%。请问在估计误差不超过5%,置信度为95%情况下,应抽取多大容量的样本?48

1、总体的变异程度高低(总体方差的大小)其它条件不变的条件下,总体单位的差异程度大,则应多抽,反之可少抽一些。怎样估计总体方差呢?通常是用以前同类调查的资料代替,或用同类地区的资料代替,若有多个方差数值供参考时,应选其中最大的方差。影响样本容量的因素49

2、允许误差范围

允许误差增大,意味着推断的精度要求降低,在其他条件不变的情况下,必要的抽样数目可减少。反之,缩小允许误差,就要增加必要的抽样数目。50

3、置信度在其它条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目。51

4、抽样方法

相同条件下,采用重复抽样应比不重复抽样多抽一些样本单位。不过,总体单位数N很大时,二者差异很小。所以为简便起见,实际中当总体单位数很大时,一般都按重复抽样公式计算必要的抽样数目。

52

5、抽样组织方式

由于不同抽样组织方式有不同的抽样误差,所以,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同。

(上述公式是简单随机抽样下确定必要抽样数目的公式。其它抽样组织方式下必要抽样数目的计算也可根据相应的误差公式来推导。)

531、调查一批零件的合格率,根据以往资料合格率为95%。要求:如果极限不超过1%,推断的概率保证度为95%,问应抽取多少零件进行检查?2、从仓库中随机抽选了200个零件,经检查有40个零件是一级品,又知道抽样数是仓库零件总数的1%。要求:当把握程度为95.45%时,试估计该仓库这种零件一级品的区间范围。练习543、某茶叶公司销售一种名茶,规定每包规格重量不低于150克,现抽取1%检验,结果如下:重量(克)148—149149—150150—151151—152合计包数(包)10205020100

要求:试以99.73%的概率按重复抽样计算(1)估计这批茶叶平均每包重量的范围是否符合规格重量的要求;(2)估计这批茶叶的重量包装的合格率范围。554、某厂对新试制的一批产品使用寿命进测试,随机抽选100个零件,测得平均寿命为2000个小时,标准差为10小时。试计算(1)以0.6827的概率,推断其平均寿命的范围。(2)若抽样极限误差减少一半,概率不变,则应抽查多少个零件?(3)若抽样极限误差减少一半,概率提高到0.9545,则又该抽查多少个零件?通过上述条件变化与计算结果,如何理解样本单位数、抽样极限误差、概率度三者间的关系?56第四节其他抽样组织方式的抽样误差分层抽样等距抽样整群抽样57概念:首先将总体单位按某一个标志分层;然后在各层按随机抽样的方法分别抽出各层的样本。

样本容量在各层的分配:通常采用按比例分配法。即:一、分层抽样(类型抽样)58等比例分层抽样的误差公式(一)比例分层抽样的抽样误差测定

层内方差平均数59【例8】某厂甲乙两车间都生产保温瓶胆,乙车间技术先进,产量是甲车间的2倍,为调查该厂保温瓶胆的保温时间,按两车间产量比例共抽查60只瓶胆,资料如下:

试以95%的可靠程度推断该厂生产的全部瓶胆平均保温时间的可能范围。车间平均保温时间(小时)保温时间标准差(小时)甲乙25281.20.860解:∵n=60,n1=20,n2=40∴x=(25×20+28×4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论