统计学原理第5章:抽样估计_第1页
统计学原理第5章:抽样估计_第2页
统计学原理第5章:抽样估计_第3页
统计学原理第5章:抽样估计_第4页
统计学原理第5章:抽样估计_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章

抽样估计《统计学原理》(第3版)2/54第五章

抽样估计第一节

抽样与抽样分布第二节

参数估计的方法学习目标第三节

必要样本容量的确定

总体均值的区间估计总体比例的区间估计3/54

学习要点

第五章抽样估计第一节

抽样与抽样分布

1.抽样估计2.抽样方法3.抽样估计的基本概念

4.样本统计量的抽样分布4/541.抽样估计抽样估计是指在随机抽样的基础上,利用样本的实际资料计算样本统计量,并以样本统计量对总体相应参数作出具有一定可靠程度估计的一种统计分析方法。

抽样估计的概念抽样估计的特点①抽样估计是一种通过部分认识总体的统计分析方法;②以概率抽样为基础,按随机原则抽取样本;③用一定的概率来保证将估计误差控制在规定的范围之内。

第五章抽样估计5/54

抽样方法

概率抽样非概率抽样简单随机抽样等距抽样分类抽样整群抽样多阶段抽样偶遇抽样主观抽样定额抽样滚雪球抽样2.抽样方法

第五章抽样估计6/54

概率抽样

非概率抽样◆又称为等概率抽样或随机抽样

◆按随机原则抽取样本

◆可以从数量上推断总体

◆可以计算抽样误差

◆根据方便或主观判断抽取样本

◆又称为不等概率抽样或非随机抽样

◆不能从数量上推断总体

◆不能确定抽样误差

第五章抽样估计2.抽样方法7/54简单随机抽样

按随机原则直接从总体N个单位中抽取n个单位组成样本,总体中每个单位都有被抽中的机会(或抽中的概率)。适合于均匀分布的总体。

当N很大时,不易构造抽样框。

第五章抽样估计2.抽样方法8/54例不重复抽样:又称不放回抽样。例重复抽样:又称有放回抽样。简单随机抽样的做法:

两种抽样方法①直接抽取法②抽签法③随机数字表法

第五章抽样估计2.抽样方法9/54等距抽样

等距抽样又称为机械抽样、系统抽样

将总体各单位按一定标志或次序排列,然后按相等的距离或间隔抽取样本单位。有等概率系统抽样和不等概率系统抽样两种抽取方式。

第五章抽样估计2.抽样方法10/54分层抽样分层抽样也称类型抽样

先将总体按某种特征分成若干层,然后在各层中按随机原则抽取一定数量的单位构成样本。保证了样本的结构与总体的结构比较相近,因而,样本代表性高、估计的精度高。常用方法有两种,比例抽样法和加权比例抽样法。

第五章抽样估计2.抽样方法11/54整群抽样整群抽样是先将所有总体单位分割为若干小群组,然后从中随机抽取一部分群,对中选群中的所有单位实施全面调查。

简化了抽样的工作量,节省了调查费用,也方便了调查的实施。

不足之处是,与其它抽样方式相比抽样误差较大。分群的原则:群内差异尽可能大,群间差异尽可能小。

第五章抽样估计2.抽样方法12/54多阶段抽样多阶段抽样又称为多级抽样。

在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式。

多阶段抽样由于实行了再抽样,可以在更广的范围内获得调查单位。

缺点是,增加一个抽样阶段,意味着增加了一份估计误差,用样本对总体的估计也变得更加复杂。

第五章抽样估计2.抽样方法13/54总体个体

样本参数统计量

样本均值样本比例样本标准差总体均值总体比例总体标准差3.抽样估计的基本概念变量

第五章抽样估计14/54样本总体均

值根据未分组资料计算根据分组资料计算均值的标准差根据未分组资料计算根据分组资料计算比

例比例的标准差

第五章抽样估计3.抽样估计的几个基本概念15/54

是指一个样本所包含的样本单位数,通常用n表示。一般来说,样本单位数n≥30称为大样本,而n﹤30称为小样本。社会经济现象的抽样调查多取大样本。

样本容量是指从总体中可能抽取的样本的个数。对同一个总体,采用重复抽样和不重复抽样的方法可以获得不同数量的样本。样本个数

第五章抽样估计3.抽样估计的几个基本概念16/54【例】如果总体有1、2、3、4四个数,从中抽取两个数构成样本,以重复抽样和不重复抽样的方法分别可以构成几个样本?重复抽样:有个可能样本不重复抽样:有个可能样本

第五章抽样估计3.抽样估计的几个基本概念17/54抽样方法重复抽样不重复抽样所有可能的样本样本个数16个6个

第五章抽样估计3.抽样估计的几个基本概念18/54抽样分布,即样本统计量的概率分布,是指当随机抽取容量为的样本时,个样本统计量的可能取值的频率分布抽样分布是一种理论分布4.样本统计量的抽样分布

第五章抽样估计19/54假设总体=4,取值分别为,,总体均值为:

总体方差为:

总体分布总体的两个特征值总体均值总体方差(1)样本均值的抽样分布

第五章抽样估计4.样本统计量的抽样分布20/54抽样方法重复抽样样本个数16个所有可能的样本1,12,13,14,11,22,23,24,21,32,33,34,31,42,43,44,4样本均值11.522.51.522.5322.533.52.533.54样本均值的特征值样本均值的数学期望样本均值的方差

第五章抽样估计4.样本统计量的抽样分布21/54总体分布结论

第五章抽样估计4.样本统计量的抽样分布22/54当样本容量n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布样本均值的均值(数学期望)等于总体均值

样本均值的方差等于总体方差的1/n倍重复抽样不重复抽样即:

第五章抽样估计4.样本统计量的抽样分布23/54样本均值的标准差也称均值的抽样标准差或抽样平均误差重复抽样不重复抽样

第五章抽样估计4.样本统计量的抽样分布24/54(2)样本比例的抽样分布

当样本容量很大时,样本比例的抽样分布可用正态分布近似。对于一个样本比例,如果≥5和≥5,就可以认为样本容量足够大。样本比例的数学期望等于总体比例

样本比例的方差等于总体方差的1/n倍

第五章抽样估计4.样本统计量的抽样分布25/54样本比例的标准差也称比例的抽样标准差或抽样平均误差重复抽样不重复抽样

第五章抽样估计4.样本统计量的抽样分布26/54第二节

参数估计的方法

1.点估计2.区间估计及其原理

3.总体均值的区间估计

4.总体比例的区间估计

5.Excel操作重点

第五章抽样估计27/54参数估计是用样本资料来估计相应的总体指标的方法,即用样本统计量估计总体参数。总体参数的估计有点估计和区间估计两种方法。1点估计

第五章抽样估计28/54点估计用样本的统计量直接作为总体参数的估计值简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况

第五章抽样估计1点估计29/54

评价估计量的标准

无偏性

有效性

一致性

第五章抽样估计1点估计30/54P(

)BA无偏有偏无偏性:用抽样指标估计总体指标要求抽样指标的平均数等于被估计的总体指标。

第五章抽样估计1点估计31/54AB较小的样本容量较大的样本容量P(

)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数

第五章抽样估计1点估计32/54有效性:对同一总体参数的两个无偏点估计量,更小标准差的估计量更有效

AB

的抽样分布

的抽样分布P(

)

第五章抽样估计1点估计33/54区间估计是根据给定的概率保证程度的要求,利用实际抽样资料,推算出总体参数可能存在的区间范围。2.区间估计及其原理

第五章抽样估计34/54区间估计的原理点估计值边际误差

置信区间是指在一定置信水平下总体参数的估计区间。

(样本统计量)点估计值点估计值点估计值边际误差

点估计值

第五章抽样估计2.区间估计及其原理35/54将构建置信区间的步骤重复很多次,在所构建的置信区间中,包含总体参数真值的次数所占的比例称为置信水平,用表示。是事先确定的一个风险值,即置信区间不包含总体真值的概率。

置信水平

(或置信概率)常用的置信水平值有99%,95%,90%

相应的

为0.01,0.05,0.10

第五章抽样估计2.区间估计及其原理36/54

误差登记性误差代表性误差系统性误差随机性误差

第五章抽样估计2.区间估计及其原理37/54抽样误差的计算抽样标准差,或抽样平均误差边际误差抽样标准差×概率度正态分布分布

第五章抽样估计2.区间估计及其原理38/54

x95%的样本

-1.96

x

+1.96

x99.73%的样本

-3

+390%的样本

-1.65

x

+1.65

x正态分布条件下

第五章抽样估计2.区间估计及其原理39/54(1)正态总体,总体方差σ2已知或大样本条件下使用正态分布统计量z总体均值

在1-

置信水平下的置信区间为3.总体均值的区间估计

第五章抽样估计40/54例5-9(1)点估计值(2)样本均值的抽样标准差(3)样本均值的边际误差(4)95%的置信区间

第五章抽样估计3.总体均值的区间估计41/54例5-10该校学生月均支出90%的置信区间为:

第五章抽样估计3.总体均值的区间估计42/54(2)正态总体,方差(σ2)未知且小样本(n<30)使用t

分布统计量总体均值

在1-

置信水平下的置信区间为

第五章抽样估计3.总体均值的区间估计43/54

t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z

第五章抽样估计3.总体均值的区间估计44/54例5-11该批食品重量99%的置信区间为:

第五章抽样估计3.总体均值的区间估计45/54总体比例的区间估计假定条件:大样本条件下,样本比例的抽样分布可以由正态分布来近似使用正态分布统计量z总体比例

在1-

置信水平下的置信区间为4.总体比例的区间估计

第五章抽样估计46/54例5-12该比例95%的置信区间为:

第五章抽样估计4.总体比例的区间估计47/54

Excel操

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论