第六章统计量及其抽样分布_第1页
第六章统计量及其抽样分布_第2页
第六章统计量及其抽样分布_第3页
第六章统计量及其抽样分布_第4页
第六章统计量及其抽样分布_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章统计量及其抽样分布本章框架结构一、统计量二、关于分布的几个概念三、几种常见的分布四、总体分布、样本分布和抽样分布五、常见统计量的抽样分布一、统计量统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,它不依赖于任何未知参数。(第一章)设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量如:样本均值、样本比例、样本方差等都是统计量

【例】设是从总体X中抽取一个样本,下面哪一个不是统计量()次序统计量定义:设X1,X2,…,Xn是从总体X中抽取的一个样本,X称为第i个次序统计量,它是样本(X1,X2,…,Xn

)满足如下条件的函数:每当样本得到一组观值时,

其由小到大的排序中,

第i个值就作为次序统计量X(i)的观测值,而X(1),X(2),…,X(n)称为次序统计量中位数、分位数、四分位数等都是次序统计量【例】下列不是次序统计量的是()A.中位数B.均值C.四分位数D.极差二、抽样分布样本统计量的概率分布称为该统计量的抽样分布随机变量是样本统计量结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布的形成过程总体样本计算样本统计量如:样本均值、比例、方差统计量的渐近分布样本均值渐近正态分布。假设样本

X=X1,X2,…,Xn

随机地抽取具有均值和方差的总体,则当

时,样本均值的标准化随机变量渐近的服从标准正态分布.三、由正态分布导出的几个重要分布1、分布2、t分布3、F分布3、分布(distribution)(1)由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来。(2)定义:设随机变量相互独立,且服从标准正态分布,则他们的平方和服从自由度为n的分布。(3)图象:(如图)(4)性质和特点分布的变量值始终为正;分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称;常用于方差的估计和假设检验,以及列联分析中。期望为:E(2)=n,方差为:D(2)=2n(n为自由度);可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布;当自由度增加到足够大时,2分布的概率密度曲线趋于对称,当时,2分布的极限分布是正态分布。(5)分位数:设,若对于:0<<1,

存在满足

X

~2(n)则称为2(n)分布的上分位点

(6)实际应用:与分布有关的抽样分布:设,则,令,则X服从自由度为1的2分布,即。当总体,从中抽取容量为n的样本,则:4、t分布(tdistribution)(1)也称学生氏分布,是威廉·戈塞尔(W.S.Gosset)于1908年在一篇以“学生”为笔名的论文中首次提出的。(2)定义:设随机变量,,且与独立,则,其分布称为t分布,记为t(n),其中n为其自由度。(3)图象:(如右图)(4)性质和特点:①当时,t分布的数学期望;当时,t分布的方差。②自由度为1的t分布称为柯西分布。③随着自由度n的增加,t分布的密度函数愈来愈接近标准正态分布的密度函数。实际中,当时,t分布与标准正态分布就非常接近。④t分布的提出对于统计学中小样本理论和应用有着重要的促进作用。t分布图示xt

分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z分位点

设t~t(n),若对:0<<1,存在t(n)>0,满足P{t>t(n)}=,则称t(n)为t(n)的上分位点。

注:(5)实际应用:与t分布有关的抽样分布:①设来自正态分布的一个样本,,,则称为服从自由度为的t分布。5、F分布(Fdistribution)(1)由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名;(2)定义:设若U为服从自由度为m的2分布,即U~2(m),V为服从自由度为n的2分布,即V~2(n),且U和V相互独立,则,称F为服从自由度m和n的F分布, 记为。(3)图象:(如右图)(4)性质和特点:①F分布的数学期望;方差;②F分布的p分位数:;③F分布与t分布的关系:如果随机变量服从分布,则服从的F分布,则:④F分布的应用广泛,如在方差分析、回归方程的显著性检验中都有重要地位。二、总体分布、样本分布和抽样分布1、总体分布(populationdistribution)①定义:总体中各元素的观察值所形成的分布;②特点:分布通常是未知的;可以假定它服从某种分布。2、样本分布(sampledistribution)①定义:也称经验分布,是一个样本中各观察值的分布;②特点:当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。3、抽样分布(samplingdistribution)①定义:样本统计量的概率分布;②特点:A、是一种理论概率分布;B、随机变量是样本统计量;如:样本均值,样本比例,样本方差等;C、结果来自容量相同的所有可能样本;D、为我们提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。三、常见统计量的抽样分布1、样本均值的抽样分布2、样本比例的抽样分布3、样本方差的抽样分布1、样本均值的抽样分布1)当总体为正态分布时,样本均值的抽样分布仍为正态分布,服从均值为,方差为的正态分布,即:。【证明P143】2)当总体不是正态分布时,当样本量n比较大,且总体的方差有限时,样本均值仍近似服从正态分布,即:。【见“中心极限定理”】=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值

也服从正态分布,

的数学期望为μ,方差为σ2/n。即中心极限定理当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布推论:从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x

的分布趋于正态分布的过程

【注意】大样本,小样本之间的区别并不是以样本容量大小来区别的。小样本问题:在样本容量固定的条件下所进行的统计推断、问题分析,不管样本容量有多大,都成为小样本问题。大样本问题:在样本容量的条件下进行的推断、问题分析则成为大样本问题。

因此:一般地,统计学中将称为大样本,为小样本的说法只是一种经验的说法。例题:P144,例6.46.5解:设随机变量X表示从该批发动力中任取一件发动机的功率值.Xi表示抽取的第i台发动机的功率值(i=1,2…100).则显然X1…X100独立同分布,且与总体X具有相同的分布,且故由中心极限定理知【例】已知一批发动机的平均功率为220马力,标准差为15马力.一位购买商随机抽取100台.试问样本均值低于217马力的概率为多少?从而例1练习:1、从一个均值μ=10、标准差σ=0.6的总体中随机选取容量为n=36的样本,假定总体不是很偏(1)计算样本均值小于9.9的近似概率(2)计算样本均值超过9.9的近似概率(3)计算样本均值在总体均值μ=10附近0.1范围内的近似概率2、某汽车电瓶商声称其产品具有均值为60个月,标准差为6个月的寿命分布,为了判断该说法是否准确,随机抽取了50个该厂生产的电瓶进行寿命试验(1)假定厂商声称正确,描述50个样本电瓶平均寿命的抽样分布?(2)假定厂商声称正确,则50个样品组成的样本的平均寿命不超过57个月的概率为多少?例22、样本比例的抽样分布 设总体单位数,具有某种标志为1,不具有的某种标志为0,总体的单位数分别为和,样本的单位数分别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论