(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)_第1页
(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)_第2页
(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)_第3页
(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)_第4页
(概率论与数理统计茆诗松)第5章统计量及其分布(5.3)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

样本均值样本方差样本标准差样本偏度§5.3统计量及其分布样本峰度次序统计量样本分位数样本中位数5.3.1

统计量与抽样分布当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义5.3.1

设x1,x2,…,xn

为取自某总体的样本,若样本函数T=T(x1,x2,…,xn)中不含有

任何未知参数。则称T为统计量。

统计量的分布称为抽样分布。按照这一定义:若x1,x2,…,xn为样本,则以及经验分布函数Fn(x)都是统计量。而当,2

未知时,x1,x1/等均不是统计量。统计量是样本的一个函数统计量是统计推断的基础尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。5.3.2

样本均值及其抽样分布

定义5.3.2

设x1,x2,…,xn为取自某总体的样本,其算术平均值称为样本均值,一般用表示,即思考:在分组样本场合,样本均值如何计算?二者结果相同吗?

xx=

(x1+…+xn)/n定理5.3.2

数据观测值与均值的偏差平方和最小,即在形如

(xic)2的函数中,样本均值的基本性质:定理5.3.1

若把样本中的数据与样本均值之差称为偏差,则样本所有偏差之和为0,即

最小,其中c为任意给定常数。样本均值的抽样分布:定理5.3.3

设x1,x2,…,xn是来自某个总体的样本,x为样本均值。(1)若总体分布为N(,2),则xx的精确分布为N(,2/n)

;

若总体分布未知或不是正态分布,但E(x)=,Var(x)=2,则n较大时的渐近分布为N(,2/n)

。这里渐近分布是指n较大时的近似分布.中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布5.3.3样本方差与样本标准差称为样本标准差。s*=

s*2定义5.3.3称为样本方差,其算术平方根在n不大时,常用作为样本方差,其算术平方根也称为样本标准差。xi与样本均值的平均偏差平方和在这个定义中,

(

xix)2n1称为偏差平方和的自由度。其含义是:x在确定后,

n个偏差x1x,x2x,…,xnx能自由取值,因为只有n1个数据可以自由变动,而第n个则不

(xix)=0.称为偏差平方和,中样本偏差平方和有三个不同的表达式:(

xix)2=xi2–(xi)2/n=xi2–nx它们都可用来计算样本方差。思考:分组样本如何计算样本方差?样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。定理5.3.4

设总体X具有二阶矩,即

E(x)=

,Var(x)=2

,

x1,x2,…,xn为从该总体得到的样本,x和s2分别是样本均值和样本方差,则E(x)=,Var(x)=2/n,E(s2)=2习题5.3Q8Q3Q75.3统计量及其分布(续)样本矩次序统计量样本分位数箱线图5.3.4

样本矩及其函数

样本均值和样本方差的更一般的推广是样本矩,这是一类常见的统计量。定义5.3.4

ak=(xik)/n称为样本k阶原点矩,

特别,样本一阶原点矩就是样本均值。

称为样本k阶中心矩。

特别,样本二阶中心矩就是样本方差。

bk=

(xi

x)k/n当总体关于分布中心对称时,我们用x和s刻画样本特征很有代表性,而当其不对称时,只用

就显得很不够。为此,需要一些刻画分布形状的统计量,如样本偏度和样本峰度,它们都是样本中心矩的函数。样本偏度1反映了总体分布密度曲线的对称性信息。样本峰度2反映了总体分布密度曲线在其峰值附近的陡峭程度。定义:1=b3/b23/2称为样本偏度,

2=b4/b22称为样本峰度。x和s偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏度峰度数据分布偏斜程度的测度偏态系数=0为对称分布偏态系数>0为右偏分布偏态系数<0为左偏分布偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布5.3.5次序统计量及其分布

一、定义5.3.7

设x1,x2,…,xn是取自总体X的样本,x(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。其中,x(1)=minx1,x2,…,xn称为该样本的最小次序统计量,称x(n)=maxx1,x2,…,xn为该样本的最大次序统计量。例5.3.6

设总体X的分布为仅取0,1,2的离散

均匀分布,分布列为0

1

2

1/3

1/31/3在一个样本中,x1,x2,…,xn是独立同分布的,而次序统计量x(1),x(2),…,x(n)则既不独立,分布也不相同,看下例。现从中抽取容量为3的样本,其一切可能取值有33=27种,(表5.3.6)0

1

2

1/3

1/31/3P(x(1)=0)=?012

012可以清楚地看到这三个次序统计量的分布是不相同的。可给出的x(1),x(2),x(3)分布列如下:012进一步,我们可以给出两个次序统计量的联合分布,如,x(1)和x(2)的联合分布列为01207/279/273/27104/273/272001/27x(1)x(2)因为P(x(1)=0,x(2)=0)=7/27

,二者不等,由此可看出x(1)和x(2)是不独立的。而P(x(1)=0)*P(x(2)=0)=(19/27)*(7/27),二、单个次序统计量的分布定理5.3.5

设总体X的密度函数为p(x),分布函数为F(x),x1,x2,…,xn为样本,则第k个次序统计量x(k)的密度函数为例5.3.7

设总体密度函数为p(x)=3x2,0x1.

从该总体抽得一个容量为5的样本,

试计算P(x(2)1/2)。例5.3.8

设总体分布为U(0,1),x1,x2,…,xn为样本,试求第k个次序统计量的分布。三、多个次序统计量的联合分布对任意多个次序统计量可给出其联合分布,以两个为例说明:定理5.3.6

在定理5.3.5的记号下,次序统计量(x(i),x(j)),(ij)的联合分布密度函数为次序统计量的函数在实际中经常用到。如样本极差Rn

=x(n)

x(1)令

R

=x(n)

x(1)

,由R0,可以推出0

x(1)

=

x(n)R

1

R

,则例5.3.9

设总体分布为U(0,1),x1,x2,…,xn为样本,则(x(n),x(1))的联合密度函数为p1,n(y,z)=n(n1)(zy)n-2,0

yz1这正是参数为(n1,2)的贝塔分布。5.3.6

样本分位数与样本中位数样本中位数也是一个很常见的统计量,它也是次序统计量的函数,通常如下定义:更一般地,样本p分位数mp可如下定义:四分位数计算例:某数学补习小组11人年龄(岁)为:17,19,22,24,25,28,34,35,36,37,38(另一种方法)三个四分位数的位置分别为:

Q1所在的位置=(11+1)/4=3,Q2所在的位置=2(11+1)/4=6,Q3所在的位置=3(11+1)/4=9。

下四分位数、中位数和上四分位数,即:

Q1=22(岁)、Q2=28(岁)、Q3=36(岁)定理5.3.7

设总体密度函数为p(x),xp为其p分位数,p(x)在xp处连续且p(xp)0,则特别,对样本中位数,当n时近似地有当n时样本p分位数mp的渐近分布为例5.3.10

设总体为柯西分布,密度函数为p(x,)=1/[(1+(x)2)],x+不难看出是该总体的中位数,即x0.5=

。设x1,x2,…,xn是来自该总体的样本,当样本量n较大时,样本中位数m0.5的渐近分布为m0.5AN(,2/4n).Q30通常,样本均值在概括数据方面具有一定的优势。但当数据中含有极端值时,使用中位数比使用均值更好,中位数的这种抗干扰性在统计中称为具有稳健性。

5.3.7

五数概括与箱线图次序统计量的应用之一是五数概括与箱线图。在得到有序样本后,容易计算如下五个值:最小观测值

xmin=x(1),最大观测值xmax=x(n),中位数

m0.5,第一4分位数

Q1=m0.25,第三4分位数

Q3=m0.75.所谓五数概括就是指用这五个数:xmin,Q1,m0.5,Q3,xmax来大致描述一批数据的轮廓。单批数据箱线图

(箱线图的构成)中位数4681012QUQLX最大值X最小值Median/Quart./Range箱线图单批数据箱线图

(例题分析)最小值141最大值237中位数182下四分位数170.25上四分位数197140150160170180190200210220230240某电脑公司销售量数据的Median/Quart./Rang箱线图多批数据箱线图

(例题分析)【例】

从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论