第七章第一节抽样推断与抽样分布_第1页
第七章第一节抽样推断与抽样分布_第2页
第七章第一节抽样推断与抽样分布_第3页
第七章第一节抽样推断与抽样分布_第4页
第七章第一节抽样推断与抽样分布_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样与参数估计PowerPoint统计学参数估计在统计方法中的地位统计方法描述统计推断统计参数估计假设检验统计推断的过程样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差第七章抽样与参数估计第一节抽样推断与抽样分布第二节参数估计与抽样误差第三节抽样估计与推算第四节抽样组织与设计学习目标了解抽样推断和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样推断与抽样分布一、抽样推断的意义二、有关抽样的基本概念三、抽样分布一、抽样推断的意义随机原则总体样本总体参数统计量推断估计参数估计检验假设检验抽样分布一、抽样推断的意义(一)抽样推断的概念抽样推断是根据随机原则从总体中抽取部分总体单位,以这一部分总体单位的实际数据推算总体相应数量特征的一种统计分析方法。随机原则是指在抽样调查中,使每一个单位被抽中的概率都相等且不等于0。

随机抽样的目的是使样本与总体同分布。(二)抽样推断的特征是由部分推算整体的一种认识方法;按随机原则抽取样本;运用概率估计的方法;抽样推断的误差可以事先计算并加以控制。(三)抽样推断的作用1、可以解决无法进行全面调查或很难进行全面调查的问题。

例如,灯泡耐用时间试验,电视机抗震能力试验,罐头食品的卫生检查,人体白血球数量的化验等等,都是有破坏性的,不可能进行全面调查,只能使用抽样调查。2、可以补充和修正全面调查数据。3、可以节省调查费用和时间。(四)抽样推断的内容1、随机抽样:

按随即原则抽取部分单位组成样本的过程。2、抽样估计:

是通过以样本数据对总体某一未知数量特征进行估计的一种统计分方法。3、假设检验:是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。二、有关抽样的基本概念(一)总体、个体和样本(二)样本容量和样板个数(三)参数和统计量(四)抽样方法(一)总体、个体和样本总体(Population):它是指所要认识的,具有某种共同性质的许多单位的集合体,也就是研究对象的全体。总体单位数一般用“N”表示。个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体,样本单位数一般用“n”表示。(二)样本容量和样本个数样本容量(Samplesize):样本中所含个体的数量(所包含的单位数)。样本个数样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。

对于一次抽样调查,总体是唯一确定的,而样本却是不确定的,一个全及总体可能抽出很多个样本总体。(三)参数和统计量参数

根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。全及指标是总体变量的函数,其数值是确定的、惟一的,因此称为参数。

统计量

根据样本各单位标志值或标志属性计算的,反映样本数量特征的综合指标称为样本指标。样本指标是样本变量的函数,用来估计总体参数,因此也称统计量,其值随着样本的不同而不同,因此统计量是个机变量。常用参数常用统计量平均数方差平均数方差变量总体属性总体常用的参数和统计量(四)抽样方法1、重复抽样与不重复抽样重复抽样从N个单位中每次抽取1个,抽取后将其号码记下,再放回,一直抽取n个单位组成一个样本,这样的抽样方法称为重复抽样。不重复抽样从N个单位中每次抽取1个,抽取后不放回,一直抽取n个单位组成一个样本这样的抽样方法称为不重复抽样。2、概率抽样、非概率抽样概率抽样:根据已知的概率选取样本

简单随机抽样:完全随机地抽选样本

分层抽样:总体分成不同的“层”,然后在每一层内进行抽样

整群抽样:将一组被调查者(群)作为一个抽样单位

等距抽样:在样本框中每隔一定距离抽选一个被调查者非概率抽样:不是完全按随机原则选取样本

非随机抽样:由调查人员自由选取被调查者

判断抽样:通过某些条件过滤来选择被调查者配额抽样:选择一群特定数目、满足特定条件的被调查者三、抽样分布(一)抽样推断的理论基础1、大数定律2、中心极限定理(二)抽样分布1、抽样分布意义2、抽样分布的种类3、各种有关抽样分布抽样推断的理论依据主要是概率论的极限定理中的大数定律与中心极限定理。(一)抽样推断的理论基础1、大数定律

2、中心极限定理大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。

应用于抽样推断,就会有如下结论:随着样本容量n的增加,样本平均数将接近于总体平均数。从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。贝努里大数定律对于独立试验中事件A发生的次数,且事件A在每次试验中发生的概率为P,则当n足够大时,事件A出现的频率将几乎接近于其发生的概率,即频率的稳定性。抽样推断中,用样本成数去估计总体成数,其理论依据即在于此。1、大数定律

大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。

而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。中心极限定理也有若干个表现形式。下面介绍两个基本形式:

2、中心极限定理设随机变量x1,x2…,xn相互独立,服从同一分布且有有限的数学期望μ和方差σ2,则随机变量,在n无限增大时,服从参数为μ和的正态分布即n→∞时,推论:如果抽样总体的数学期望μ和方差σ2是有限的,无论总体服从什么分布,从中抽取容量为n的样本时,只要n(一般大于30)足够大,其样本平均数的分布就趋于数学期望为μ,方差为σ2/n的正态分布。(1)林德伯格—列维定理设随机变量X

的各单位只有两种取值A或非A(也叫是非标志),且当X取A的概率为p、取非A的概率为q=1-p,抽取n个单位组成样本,则A出现的次数k组成的随机变量服从二项分布,且其平均数为np,方差为npq,当样本容量n无限增大时,即n→∞时,则A出现的次数k的标准化变量u服从标准的正态分布

(2)梯莫弗—拉普拉斯定理

(二)抽样分布

1、抽样分布意义2、几种常用抽样分布1、抽样分布意义(1)抽样分布概念:某一统计量(如:样本均值、成数和方差)的所有可能样本的取值和与之相对应的概率所形成的分布。(2)性质是一种理论分布0≤P(Xi)1∑P(Xi)=1(3)数字特征均值E(X)方差E[x-E(x)]2(一个例子)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。第一步:计算总体的均值、方差及分布:均值和方差总体分布14230.1.2.3

(一个例子)第二步:抽样。从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)

(一个例子)第三步:计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第四步:计算所有样本均值的均值和方差式中:M为样本数目比较及结论:1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n,即抽样平均误差样本均值的分布与总体分布的比较抽样分布=2.5σ2=1.25

总体分布N(,σ2)14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x2、几种常用的抽样分布A、样本均值的抽样分布——正态分布——t分布B、样本方差的抽样分布——卡方分布C、两个样本方差比的抽样分布——F分布A、样本均值的抽样分布抽样总体样本均值X,(N)均值μ=∑Xi/Nx,(n)样本均值是样本的函数,是一个随机变量,它的概率分布称为样本均值的抽样分布。=50

=30X总体分布n=36抽样分布xn=144当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n(n≥30)的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)从非正态总体中抽样得到的均值的分布呢?大样本均值的抽样分布

-—来自正态分布总体

大样本均值的抽样分布

—来自任意分布的总体当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布根据中心极限定理:从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n(n

∠30,σ2已知)的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)小样本均值的抽样分布

—来自正态分布总体均值分布的数学期望和方差抽样方法 均值 方差 标准差 (1)从无限总体抽样和有限总体放回抽样(2)从有限总体不放回抽样抽样误差抽样误差小样本均值的抽样分布

—t分布设x1,x2,…,xn是从均值为,方差未知的正态总体中抽取的一个容量为n(n

∠30)的样本,称为统计量,它服从自由度为(n-1)的t分布Xt

分布与正态分布的比较正态分布t分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)Z样本成数(即比例)的抽样分布(简称成数的分布)抽样总体样本成数X,(N)成数P=Ni/Nx,(n)所有可能的样本的成数()所形成的分布,称为样本成数的抽样分布。40成数分布的数学期望和方差抽样方法 均值 方差 标准差 (1)从无限总体抽样和有限总体放回抽样(2)从有限总体不放回抽样根据中心极限定理,只要样本足够大,的分布就近似正态分布。(np和nq大于5时)抽样误差抽样误差41抽样总体样本若:从一个正态总体中抽样所得到的样本方差的分布n,S2则B、样本方差的抽样分布42B、样本方差的分布设总体服从正态分布N~(μ,σ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论