统计学第七章 w抽样推断yyx_免费下载.ppt_第1页
统计学第七章 w抽样推断yyx_免费下载.ppt_第2页
统计学第七章 w抽样推断yyx_免费下载.ppt_第3页
统计学第七章 w抽样推断yyx_免费下载.ppt_第4页
统计学第七章 w抽样推断yyx_免费下载.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 抽样推断,1、抽样的概念和方法 2、抽样误差 3、总体参数估计 4、抽样组织设计,抽样推断的概念: 抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。包括抽样调查和抽样推断 抽样调查着重调查,是指按照随机原则从调查对象的全部单位中抽取部分单位,进行调查,取得各项准确的数据 抽样推断是指运用数理统计原理,根据抽样调查资料,对研究对象全体的数量特征,做出具有可靠程度的估计和判断,以达到对现象总体正确认识的目的,抽样推断的特点: 1、抽样推断是由部分资料推算总体数量特征的一种认识方法。抽样调查是一种非全面调查,但调查的目的在于对总体数

2、量特征的认识,抽样调查资料如果不进行抽样推断,这种资料就不会有什么价值 2、抽样推断是建立在随机取样的基础上,调查单位完全排除了主观意识的作用 3、抽样推断是运用概率估计的方法,利用统计量来估计总体参数,在数学上运用的是不确定的概率统计法,而不是运用确定的函数分析法。 4、抽样推断的误差可以事先计算并加以控制。,抽样推断的内容: 参数估计:依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。 参数估计包括的内容:确定估计值、确定估计的优良标准并加以判别,求估计值和被估计参数之间的误差范围,计算在一定误差范围内多作推断的可靠程度等。,假设检验:,先对总体的状况作某种假

3、设,然后再根据抽样推断的原理,根据样本观察资料对所作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍。,抽样推断的几个基本概念,1、总体和样本 总体定义:总体也称为全及总体,指所要认识的研究对象全体。它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。 总体的单位数通常都是很大的,甚至无限的, 样本又称子样,它是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。 样本的单位数是有限的,数目较小. 作为推断对象的总体是确定的,而且是唯一的。,2、参数和统计量,参数(指标):根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标。 统计量:根据样本各单

4、位标志值或标志属性计算的综合指标,统计量和参数相类似,以小写字母表示: 设样本变量x:x1、x2、xn,3、样本容量和样本个数:,样本容量是指一个样本所包含的单位数。 、大样本:样本单位数不少于30个 、小样本:样本单位数不及30个 样本个数:又称样本可能数目,是指从一个总体中可能抽取的样本个数。 4、重复抽样和不重复抽样 重复抽样也称回置抽样,从N个单位中,抽取n个,共有Nn个样本 不重复抽样也称不回置抽样,从N个单位中,抽取n个,共有N(N-1)(N-2)(N-n+1)个,二、抽样误差,一、抽样误差的意义: 1、抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构

5、,而引起抽样指标和全及指标之间的绝对离差。 2、抽样误差和登记性误差: 登记性误差是所有统计调查都可能发生的,而抽样误差不是由于调查失误所引起的,它是随机抽样所持有的误差。,3、抽样误差是一种代表性误差,但不是所有代表性误差都是抽样误差。,系统偏误是由于违反抽样随机原则,有意地抽选较好或较差的单位进行调查,这种系统性原因造成的样本代表性不足所引起的误差。 系统偏误和登记误差都属于思想、作风、技术问题,可以防止和避免,而抽样误差则是不可避免,难于消灭,只能加以控制。,4、影响抽样误差大小的因素:,总体各单位标志值的差异程度。(差异程度越大,抽样误差越大) 样本的单位数(样本单位数越多,抽样误差越

6、小) 抽样方法(重复抽样的误差比不重复抽样的误差要大些) 抽样调查的组织形式(简单随机抽样、类型抽样、等距抽样、整群抽样),在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。,二、抽样平均误差,1、抽样平均误差是反映抽样误差的一般水平的指标。 2、用抽样平均数的标准差或抽样成数的标准差来作为衡量其抽样误差一般水平的尺度。,3、抽样平均数的平均误差,重复抽样的条件下:,不重复抽样条件下:,算抽样平均误差时,用样本标准差s代替总体标准差。,X-样本变量 -样本平均数 -样本变量自由度,抽样平均数的平均误差例题:,某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,

7、调查其工资水平资料如下:,计算样本平均数和抽样平均误差,解:先列表,计算平均数即平均工资:,4、抽样成数的平均误差,抽样成数的平均误差表明各样本成数和总体成数绝对离差的一般水平。,在重复抽样的条件下:,在不重复抽样的条件下:,抽样成数的平均误差例题:,某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。,解:已知p=60% 、n=100、N=500,3、抽样估计的方法,一、总体参数的点估计 1、参数点估计的特点:根据总体指标的结构形式设计样本指标(称统计量)作为总体参数的估计量,并以样本指标的实际值直接作为相

8、应总体参数的估计值。 2、公式:以样本的平均数 作为总体平均数 的估计值。 以样本的成数p作为总体成数P的估计值。,3、成为优良估计的标准,无偏性:即以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身。 抽样平均数的平均数等于总体平均数。 抽样成数的平均数等于总体成数。 一致性:要求当样本的单位数充分大时,抽样指标也充分地靠近总体指标。 有效性:以抽样指标估计总体指标要求作为优良估计量的方差比其他估计量的方差小。,4、总体参数点估计的特点:,优点:简便、易行、原理直观 缺点:这中估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。,四、总体参数的区间

9、估计,1、总体参数区间估计是根据给定的概率保证程度的需求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。 2、,3、进行总体参数区间估计应具备的要素:,估计值、抽样误差范围、概率保证程度 抽样误差范围决定估计的准确性,概率保证程度决定估计的可靠性。 抽样误差范围越大,准确性越低,反之就越高; 概率保证程度越大,可靠性越高,反之就越低。 在抽样估计时,希望准确性高些,可靠性大些,但两者同时实现是有矛盾的。,4、总体参数区间估计的方法:,根据已经给定的抽样误差范围,求概率保证程度。 步骤:抽取样本计算抽样指标(作为总体指标估计值)

10、计算标准差、抽样平均误差估计总体指标的上、下限求出t ,查表得Ft,根据给定的置信度要求,来推算抽样极限误差的可能范围:,步骤:抽取样本,计算抽样指标计算标准差,抽样平均误差根据Ft查出t值计算极限误差求出估计总体指标的上下限,作区间估计,4、抽样组织设计,一、抽样组织设计的基本原则: 1、抽样推断是根据实现规定的要求而设计的抽样调查组织,并以所获得的这一部分实际资料为基础,进行推理演算作出结论。 2、基本原则: 要保证随机原则的实现。 考虑样本容量和结构问题。 关于抽样的组织形式问题。 重视调查费用的基本因素。,二、简单随机抽样,1、简单随机抽样是按随机原则直接从总体N个单位中抽取n个单位作为样本。从理论上讲,简单随机抽样最符合随机原则。 2、特点:是抽样中最基本也是最简单的抽样组织形式,它适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分,使总体的各部分都是同分布的。 3、计算必要的样本单位数:,三、类型抽样,类型抽样又称分层抽样,它的特点是先对总体各单位按主要标志加以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论