




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章
统计量与抽样分布1第二章
统计量与抽样分布1§1.基本概念总体与个体抽样、简单随机抽样样本、简单随机样本与样本空间分布族、参数空间统计量与样本矩2§1.基本概念总体与个体2总体与个体在数理统计中,把研究对象的全体称为总体(Population),把组成总体的每一个单元称为个体在实际中,总体通常是某个随机变量取值的全体,其中每一个个体都是一个实数以后我们把总体和数量指标X可能取值的全体组成的集合等同起来。随机变量X的分布就是总体的分布3总体与个体在数理统计中,把研究对象的全体称为总体(Popul抽样与简单随机抽样从一总体X中随机抽取n个个体x1,x2,…,xn,其中每个xi是一次抽样观察结果,我们称x1,x2,…,xn为总体X的一组样本(观察)值。这里的xi具有二重性:1.对每一次抽样结果,它是完全确定的一组数;2.由于抽样的随机性,每一个xi都可以看作某一个随机变量Xi(i=1,2,…,n)所取的观察值。我们称X1,X2,…,Xn是容量为n的样本(Sample)。4抽样与简单随机抽样从一总体X中随机抽取n个个体x1,抽样与简单随机抽样
定义:设X1,X2,…,Xn为来自总体X的容量为n的样本,如果随机变量X1,X2,…,Xn相互独立且与总体有相同的分布,则称这样的样本为总体X的简单随机样本,简称样本。这样获得简单随机样本的方法称为简单随机抽样。抽样方式:随机抽样,分层抽样,等距抽样,整群抽样,多阶段抽样以后如不特别声明,所提到的样本都是简单随机样本。5抽样与简单随机抽样定义:设X1,X2,…,Xn为综上所述,所谓总体就是一个随机变量X
,所谓样本(指简单随机样本)就是n个相互独立且与总体X有相同的分布的随机变量X1,X2,…,Xn,并称X1,X2,…,Xn
为来自于总体X的样本.显然,若总体具有分布函数F(x),则X1,X2,…,Xn的联合分布函数(样本联合分布)为:6综上所述,所谓总体就是一个随机变量X,所谓样本(指简单随抽样与简单随机抽样以后对样本X1,X2,…,Xn
作两种理解:在理论推导中把其作为随机向量在用理论推导所得出的结论进行具体推断时,作为实数向量,代入具体的观察值进行计算。7抽样与简单随机抽样以后对样本X1,X2,…,Xn作两种样本空间
定义:样本X1,X2,…,Xn所有可能取值的全体称为样本空间(SampleSpace),或称为子样空间。样本空间为n维欧氏空间或它的一个子集。一个样本观察值(x1,x2,…,xn)是样本空间中的一个点。8样本空间定义:样本X1,X2,…,Xn所有可能取分布族与参数空间在概率论中,总假定所用随机变量的分布函数已知,而在数理统计中,认为其是未知的,但总假定其是某一个分布族的成员。一般可凭经验,直方图或经验分布函数来对总体给出假定。9分布族与参数空间在概率论中,总假定所用随机变量的分布函数已知分布族与参数空间如果对总体了解甚少,那么总体所在的分布族可设为{F(x):F(x)为分布函数,其它条件}如果知道总体的分布形式,只是不知道具体参数,那么总体所在的分布族可设为,这里为总体的分布函数中的未知参数(可以是向量),未知参数的全部可容许值组成的集合称为参数空间,记为称为统计模型(StatisticalModel)。10分布族与参数空间如果对总体了解甚少,那么总体所在的分布族可设分布族与参数空间
定义:若一个分布族中只含有有限个未知参数,或参数空间为欧氏空间的一部分,则称此分布族为参数分布族。凡不是参数分布族的分布族称为非参数分布族。由参数分布族出发所得到的统计方法称为参数统计方法;由非参数分布族出发所得到的统计方法称为非参数统计方法。这两类分布族在研究方法上有很大差异。11分布族与参数空间定义:若一个分布族中只含有有限个未知统计量与样本矩我们对某一个问题归纳出所在的分布族,并从总体中抽出了一个样本后,就要进行统计推断,即判断这个样本是来自总体分布族中哪一个基本的分布.虽然样本含有总体的信息,但仍比较分散。为了使统计推断成为可能,首先必须把分散在样本中的信息集中起来,用样本的某种函数表示,这种函数称为统计量(Statistic)。12统计量与样本矩我们对某一个问题归纳出所在的分布族,并从总体中统计量与样本矩定义:设X1,X2,…,Xn为总体X的一个样本,若样本的实值连续(可扩大为可测)函数T=T(X1,X2,…,Xn)不依赖于可能含于总体中的未知参数,则称T为此分布族的一个统计量(Statistic)。往往从直观或某些一般性原则考虑提出统计量,再考虑它是否在某种意义下较好地集中了样本中与所讨论问题有关的信息量。13统计量与样本矩定义:设X1,X2,…,Xn为总体X的一个 例如,X~N(,2),其中已知,2未知。而(X1,X2)是从X中抽取的一个样本,则X1+X2,是统计量,但(X1-)/就不是统计量了。14 例如,X~N(,2),其中已知,2未知。样本矩(SampleMoment)设X1,X2,…,Xn
是来自于总体X的一个样本样本均值(SampleMean):样本方差(SampleVariance):15样本矩(SampleMoment)设X1,X2,…,Xn样本标准差(SampleStandardDeviation):样本矩(SampleMoment)16样本标准差(SampleStandardDeviatio再设Y1,Y2,…,Yn是来自总体Y的样本。两个样本之间的协方差:两个样本之间的相关系数:17再设Y1,Y2,…,Yn是来自总体Y的样本。两个样本记E(X)=,D(X)=2,E(Xk)=ak
定理1若X的二阶矩存在,则有定理2若X的2k阶矩存在,则有18记E(X)=,D(X)=2,E(经验分布函数定义
设X1,X2,…,Xn为总体X的一个样本,x1,x2,…,xn是样本的观察值,把其从小到大重新排列得到 ,定义函数如下称其为总体X的经验分布函数。19经验分布函数定义设X1,X2,…,Xn为总体经验分布函数在点x的函数值其实就是观测值中小于或等于x的频率,它是一个右连续的非减函数,且,因而它具有分布函数的性质,可以将它看成是以等概率取的离散随机变量的分布函数。经验分布函数的图象是一个非减右连续的阶梯函数。20经验分布函数在点x对于的每一数值而言,经验分布函数为样本的函数,它是一统计量,即为一随机变量,其可能取值为。事件发生的概率,由于相互独立且有相同的分布函数,因而它等价于次独立重复试验的贝努里概型中事件发生k次而其余次不发生的概率,即有:其中,它是总体的分布函数。21对于的每一数值而言,经验分布函数定理
(格列汶科定理)设总体的分布函数为F(x),经验分布函数为Fn*(x),则对任何实数x有22定理(格列汶科定理)设总体的分布函数为F(x),经验分从上面定理知道,经验分布函数Fn*(x)依概率1收敛于(理论)分布函数F(x)。可以利用经验分布函数构造出非参数统计推断中许多常用的统计量。
23从上面定理知道,经验分布函数Fn*(x)依概率1收敛于(理论§2抽样分布统计量的分布称为抽样分布,求出统计量的分布函数是数理统计的基本问题之一。精确分布与小样本问题极限分布与大样本问题24§2抽样分布统计量的分布称为抽样分布,求出统计量的分布函数正态总体的抽样分布正态总体样本的线性函数的分布
-分布t-分布F-分布25正态总体的抽样分布正态总体样本的线性函数的分布25正态总体样本线性函数的分布
定理1设总体XN(,2),
X1,X2,…,Xn是总体X的容量为n的样本,令
U=a1X1+a2X2+…+anXn,其中a1,a2,…,an是已知常数,则U也是正态随机变量,其均值、方差分别为
E(U)=
,D(U)=226正态总体样本线性函数的分布定理1设总体XN(
定理2设总体XN(,2),(X1,X2,…,Xn)是总体的容量为n的样本,A=(aij)是pn阶矩阵。记Y=(Y1
,Y2
,…,Yp)’=A(X1
,X2,…,Xn)’,则Y1
,Y2
,…,Yp也是正态随机变量,其均值、方差、协方差分别为
E(Yi)=,D(Yi)=2
Cov(Yi,Yj)=2
当
=0,且A是-nn
阶正交矩阵时,Y1
,Y2
,…,Yp也相互独立,且服从于N(0,2
)
正态变换下的不变性27定理2设总体XN(,2),(X1,X2分布定义设随机变量X1,X2,…,Xn相互独立且服从N(0,1)分布,则称随机变量
服从自由度为n的分布,记为28分布定义设随机变量X1,定理1设随机变量,则的密度函数为:29定理1设随机变量定理2设
,则E(X)=n,D(X)=2n定理3设
,且X1与X2相互独立,则
定理4(Cochra)设随机变量X1,X2,…,Xn相互独立且服从N(0,1)分布,又设
Q1+Q2+…+Qk=其中Qj是秩为nj的X1,X2,…,Xn的非负定二次型。则Qj相互独立,且分别服从于自由度为nj的
分布的充要条件是:n1+n2+…+nk=n30定理2设,则E(X引理设
,则X的特征函数为(t)=(1-2it)-n/2.定理3的证明:根据引理及特征函数性质,我们有得E(X)=n,E(X2)=n2+2n,D(X)=2n31引理设,则
定理5(抽样分布基本定理)
设
X1,X2,…,Xn是来自总体N(,2)的一个样本,则注:1. 的独立性仅当总体分布为正态时才成立。当总体分布的三阶中心矩为零时,可以推出两者是不相关的。2.服从精确的正态分布也只有在总体为正态分布时才成立。(1)(2)与相互独立;32定理5(抽样分布基本定理)设X1,X2,…证令,则且,选取正交矩阵A:作为正交变换33证令则,且1.2.,且,则而仅是Z1的线性函数,与无关,故
与相互独立。34则t-分布定义设X~N(0,1),
,且X和Y相互独立,则称随机变量 所服从的分布是自由度为n的t分布,记为T~t(n).定理1
设T~t(n),则T的概率密度为35t-分布定义设X~N(0,1),此定理的证明也同前面类似。先写出X,Y的密度函数,然后利用随机变量的函数的分布的知识写出根号下Y/n的密度函数,再利用独立性写出(X,根号下Y/n)的联合密度函数,最后利用两个随机变量商的密度函数给出结果。36此定理的证明也同前面类似。先写出X,Y的密度函数,然后利用定理2
设X1,X2,…,Xn
是来自总体
的一个样本,则有 。定理3
设
X1,X2,…,Xm和Y1,Y2,…,Yn是分别来自总体
和的样本,且假定两总体相互独立,则有
37定理2设X1,X2,…,Xn是来自总体定理4设Tn~t(n),n=1,2,...,则Tn依分布收敛于N(0,1).38定理4设Tn~t(n),n=1,2,...,则Tn依定理5
设T~t(n),n>1,则对正整数r(r<n),ETr存在,且定理6
设T~t(n),若n>2,则E(T)=0,D(T)=n/(n-2).注:t分布只存在阶数小于n的矩.39定理5设T~t(n),n>1,则对正整数r(F-分布定义设随机变量X和Y是自由度分别为n1和n2的相互独立的
分布随机变量,则称随机变量
所服从的分布为自由度是(n1,n2)的F分布,记为F~F(n1,n2).其中n1称为第一自由度,n2称为第二自由度。40F-分布定义设随机变量X和Y是自由度分别为n定理1
设F~F(n1,n2),则F的概率密度为41定理1设F~F(n1,n2),则F的概率密度为定理2若X/2~,
Y/2~,且相互独立,则定理3若X~F(n1,n2),则1/X~F(n2,n1).定理4若X~t(n),则X2~F(1,n).定理5设X1,X2,…,Xm
和Y1,Y2,…,Yn是分别来自总体
和
的样本,且假定两总体相互独立,则有42定理2若X/2~,定理7
设随机变量X1,X2,…,Xn相互独立且服从,又设
Q1+Q2+…+Qk=其中Qj是秩为nj的X1,X2,…,Xn
的非负定二次型。若n1+n2+…+nk=n,则Qj相互独立,且定理6设Xn~F(m,n),
则当n时,43定理7设随机变量X1,X2,…,Xn相互独立且服从定理分位数(分位点)
定义1设随机变量X的分布函数为F(x),0<<1,若x使
P{X>x}=F(x)=,则称x为此概率分布的(上侧)分位点(或分位数)。44分位数(分位点)定义1设随机变量X的分布函数为分位数(分位点)当X~N(0,1),将其上侧分位数记为u当X~,将其上侧分位数记为当X~t(n),将其上侧分位数记为t(n).当X~F(m,n),将其上侧分位数记为F
(m,n).上面几类分位数的性质-u=
u1-,
-t(n)=
t1-(n)
F(m,n)=1/
F1-(n,m)45分位数(分位点)当X~N(0,1),将其上侧分位数记为u有时也需要上侧分位数和双侧分位数定义2设X为一随机变量,0<<1,若使
P{X}=,则称为此概率分布的下侧分位数。 易证为原分布的1-上侧分位数,即=x1-定义3
设X为一随机变量,0<<1,若1,2使
P{X1}=/2,P{X>2}=/2,则称1,2为此概率分布的双侧分位数。 易证1=x1-/2
,
2=x/2
46有时也需要上侧分位数和双侧分位数46非正态总体的抽样分布例1设总体,
X1,X2,…,Xn为来自总体X的样本,求样本均值的分布。例2设总体
,X1,X2,…,Xn为来自总体X的样本,求样本均值的分布。47非正态总体的抽样分布例1设总体当样本容量n趋于无穷时,若统计量的分布趋于一定的分布,则称后者为该统计量的极限分布。它提供了统计推断的一种近似解法。所谓大样本指样本容量n>30,最好大于50或100.统计量的渐近分布非正态总体大样本的抽样分布48当样本容量n趋于无穷时,若统计量的定义1对于统计量Tn,若存在常数序列使得则称Tn的渐近分布为49定义1对于统计量Tn,若存在常数序列使得则称Tn的渐近分定理1设总体X的分布函数为F(x),X1,X2,…,Xn为来自总体X的样本,则样本的均值的渐近分布为定理2设总体X的分布函数为F(x),X1,X2,…,Xn为来自总体X的样本,则50定理1设总体X的分布函数为F(x),X1,X2,…,X定理3
设X1,X2,…,Xm与Y1,Y2,…,Yn是来自
与
的两独立样本,则当n趋于无穷m趋于无穷时有51定理3设X1,X2,…,Xm与Y1,Y2,…,Yn是定义2设统计量Tn为某个待估函数
的估计量,则称Tn是
的渐近正态估计。若对于每个52定义2设统计量Tn为某个待估函数的§3充分统计量与完备统计量统计量既然是对样本的加工或压缩,在这个过程中可能有损失有关参数的一部分信息,现在问题是在这个过程中是否存在某些统计量,既起到压缩作用,又不损失参数的信息,这样的统计量称为充分统计量。53§3充分统计量与完备统计量统计量既然是对样本例的函数相同的T值,这样实际上是对样本起到了加工或压缩的作用。)分布,即正品和次品服从两点设总体(X是来自总体的样本,考虑样本,实际上表T数,对不同观察值可能对应示样本中所含的次品个54例的函数相同的T值,这样实际上是对样本起到了加工或压缩的作用5555定义充分统计量(SufficientStatistics)一般情况下,利用条件分布证明统计量的充分性是比较困难的。但存在证明充分性的一个充分必要准则,就是下面的因子分解定理(Factorizationtheorem)。56定义充分统计量(SufficientStatistics)定理57定理57
例设X~B(1,p),试证样本均值是参数p的充分统计量。
例
设X~N(,1),未知,试证样本均值是参数的充分统计量。5858注:在因子分解定理中,如果未知参数是向量,T是随机向量,且定理条件成立,则称T关于是联合充分的。但这时一般不能由T关于的充分性而推出T的第j个分量关于的第j个分量是充分的。定理
设T是的一个充分统计量,u=g(t)是单值可逆函数,则U=g(T)也是的充分统计量。59注:在因子分解定理中,如果未知参数是向量,T是随机向量,且例60例60定义的任一实值函数,完备的(Complete)。则称61定义的任一实值函数,完备的(Complete)。则称61例
证明样本,62例证明样本,62欲使上式恒成立,只有左边多项式的系数为零,63欲使上式恒成立,只有左边多项式的系数为零,63定理一个样本,其密度函数(分布率)可表示为其中,如果包含一个k维矩形,且的值域包含一个k维开集,则是充分完备统计量。
64定理一个样本,其密度函数(分布率)可表示为其中例解对数分布密度函数为65例解对数分布密度函数为65因此样本的联合密度为这样66因此样本的联合密度为这样66次序统计量及其分布
定义
设是取自总体X的一个样本,被称为该样本的第i个次序统计量,它是样本的满足如下条件的函数:每当样本得到一组观测值时,将它们从小到大排列为,第i个值是的观测值,称为该样本的次序统计量;称为最小次序统计量,称为最大次序统计量。67次序统计量及其分布定义设说明即68说明即68
定义样本最大次序统计量与样本最小次序统计量之差称为样本极差,常用表示。若样本容量为n,则样本极差为。它表示样本取值范围的大小,也反映了总体取值分散与集中的程度,而且计算方便。
定义
样本按大小次序排列后处于中间位置上的称为样本中位数,常用表示。设是来自某总体的一个样本,其次序统计量为,则69定义样本最大次序统计量与样本最小次序统计量之差
定义设是来自某总体的一个样本,其次序统计量为,样本的p分位数
是指由下式决定的统计量:式中的是不超过的最大整数。(若总体X的分布函数为F(x),我们称满足(0<p<1)的ap为的分位数。)70定义设定理(3)第i个次序统计量具有密度:71定理(3)第i个次序统计量具有密度:7172727373任意两个次序统计量,其联合密度为:74任意两个次序统计量,其联合密度为:若i=1,j=n,则得到最小次序统计量与最大次序统计量的联合密度函数:
由与的联合密度函数,可求出极差统计量的分布。75若i=1,j=n,则得到最小次序统计量与次序统计量的联合密度函数:76次序统计量第二章
统计量与抽样分布77第二章
统计量与抽样分布1§1.基本概念总体与个体抽样、简单随机抽样样本、简单随机样本与样本空间分布族、参数空间统计量与样本矩78§1.基本概念总体与个体2总体与个体在数理统计中,把研究对象的全体称为总体(Population),把组成总体的每一个单元称为个体在实际中,总体通常是某个随机变量取值的全体,其中每一个个体都是一个实数以后我们把总体和数量指标X可能取值的全体组成的集合等同起来。随机变量X的分布就是总体的分布79总体与个体在数理统计中,把研究对象的全体称为总体(Popul抽样与简单随机抽样从一总体X中随机抽取n个个体x1,x2,…,xn,其中每个xi是一次抽样观察结果,我们称x1,x2,…,xn为总体X的一组样本(观察)值。这里的xi具有二重性:1.对每一次抽样结果,它是完全确定的一组数;2.由于抽样的随机性,每一个xi都可以看作某一个随机变量Xi(i=1,2,…,n)所取的观察值。我们称X1,X2,…,Xn是容量为n的样本(Sample)。80抽样与简单随机抽样从一总体X中随机抽取n个个体x1,抽样与简单随机抽样
定义:设X1,X2,…,Xn为来自总体X的容量为n的样本,如果随机变量X1,X2,…,Xn相互独立且与总体有相同的分布,则称这样的样本为总体X的简单随机样本,简称样本。这样获得简单随机样本的方法称为简单随机抽样。抽样方式:随机抽样,分层抽样,等距抽样,整群抽样,多阶段抽样以后如不特别声明,所提到的样本都是简单随机样本。81抽样与简单随机抽样定义:设X1,X2,…,Xn为综上所述,所谓总体就是一个随机变量X
,所谓样本(指简单随机样本)就是n个相互独立且与总体X有相同的分布的随机变量X1,X2,…,Xn,并称X1,X2,…,Xn
为来自于总体X的样本.显然,若总体具有分布函数F(x),则X1,X2,…,Xn的联合分布函数(样本联合分布)为:82综上所述,所谓总体就是一个随机变量X,所谓样本(指简单随抽样与简单随机抽样以后对样本X1,X2,…,Xn
作两种理解:在理论推导中把其作为随机向量在用理论推导所得出的结论进行具体推断时,作为实数向量,代入具体的观察值进行计算。83抽样与简单随机抽样以后对样本X1,X2,…,Xn作两种样本空间
定义:样本X1,X2,…,Xn所有可能取值的全体称为样本空间(SampleSpace),或称为子样空间。样本空间为n维欧氏空间或它的一个子集。一个样本观察值(x1,x2,…,xn)是样本空间中的一个点。84样本空间定义:样本X1,X2,…,Xn所有可能取分布族与参数空间在概率论中,总假定所用随机变量的分布函数已知,而在数理统计中,认为其是未知的,但总假定其是某一个分布族的成员。一般可凭经验,直方图或经验分布函数来对总体给出假定。85分布族与参数空间在概率论中,总假定所用随机变量的分布函数已知分布族与参数空间如果对总体了解甚少,那么总体所在的分布族可设为{F(x):F(x)为分布函数,其它条件}如果知道总体的分布形式,只是不知道具体参数,那么总体所在的分布族可设为,这里为总体的分布函数中的未知参数(可以是向量),未知参数的全部可容许值组成的集合称为参数空间,记为称为统计模型(StatisticalModel)。86分布族与参数空间如果对总体了解甚少,那么总体所在的分布族可设分布族与参数空间
定义:若一个分布族中只含有有限个未知参数,或参数空间为欧氏空间的一部分,则称此分布族为参数分布族。凡不是参数分布族的分布族称为非参数分布族。由参数分布族出发所得到的统计方法称为参数统计方法;由非参数分布族出发所得到的统计方法称为非参数统计方法。这两类分布族在研究方法上有很大差异。87分布族与参数空间定义:若一个分布族中只含有有限个未知统计量与样本矩我们对某一个问题归纳出所在的分布族,并从总体中抽出了一个样本后,就要进行统计推断,即判断这个样本是来自总体分布族中哪一个基本的分布.虽然样本含有总体的信息,但仍比较分散。为了使统计推断成为可能,首先必须把分散在样本中的信息集中起来,用样本的某种函数表示,这种函数称为统计量(Statistic)。88统计量与样本矩我们对某一个问题归纳出所在的分布族,并从总体中统计量与样本矩定义:设X1,X2,…,Xn为总体X的一个样本,若样本的实值连续(可扩大为可测)函数T=T(X1,X2,…,Xn)不依赖于可能含于总体中的未知参数,则称T为此分布族的一个统计量(Statistic)。往往从直观或某些一般性原则考虑提出统计量,再考虑它是否在某种意义下较好地集中了样本中与所讨论问题有关的信息量。89统计量与样本矩定义:设X1,X2,…,Xn为总体X的一个 例如,X~N(,2),其中已知,2未知。而(X1,X2)是从X中抽取的一个样本,则X1+X2,是统计量,但(X1-)/就不是统计量了。90 例如,X~N(,2),其中已知,2未知。样本矩(SampleMoment)设X1,X2,…,Xn
是来自于总体X的一个样本样本均值(SampleMean):样本方差(SampleVariance):91样本矩(SampleMoment)设X1,X2,…,Xn样本标准差(SampleStandardDeviation):样本矩(SampleMoment)92样本标准差(SampleStandardDeviatio再设Y1,Y2,…,Yn是来自总体Y的样本。两个样本之间的协方差:两个样本之间的相关系数:93再设Y1,Y2,…,Yn是来自总体Y的样本。两个样本记E(X)=,D(X)=2,E(Xk)=ak
定理1若X的二阶矩存在,则有定理2若X的2k阶矩存在,则有94记E(X)=,D(X)=2,E(经验分布函数定义
设X1,X2,…,Xn为总体X的一个样本,x1,x2,…,xn是样本的观察值,把其从小到大重新排列得到 ,定义函数如下称其为总体X的经验分布函数。95经验分布函数定义设X1,X2,…,Xn为总体经验分布函数在点x的函数值其实就是观测值中小于或等于x的频率,它是一个右连续的非减函数,且,因而它具有分布函数的性质,可以将它看成是以等概率取的离散随机变量的分布函数。经验分布函数的图象是一个非减右连续的阶梯函数。96经验分布函数在点x对于的每一数值而言,经验分布函数为样本的函数,它是一统计量,即为一随机变量,其可能取值为。事件发生的概率,由于相互独立且有相同的分布函数,因而它等价于次独立重复试验的贝努里概型中事件发生k次而其余次不发生的概率,即有:其中,它是总体的分布函数。97对于的每一数值而言,经验分布函数定理
(格列汶科定理)设总体的分布函数为F(x),经验分布函数为Fn*(x),则对任何实数x有98定理(格列汶科定理)设总体的分布函数为F(x),经验分从上面定理知道,经验分布函数Fn*(x)依概率1收敛于(理论)分布函数F(x)。可以利用经验分布函数构造出非参数统计推断中许多常用的统计量。
99从上面定理知道,经验分布函数Fn*(x)依概率1收敛于(理论§2抽样分布统计量的分布称为抽样分布,求出统计量的分布函数是数理统计的基本问题之一。精确分布与小样本问题极限分布与大样本问题100§2抽样分布统计量的分布称为抽样分布,求出统计量的分布函数正态总体的抽样分布正态总体样本的线性函数的分布
-分布t-分布F-分布101正态总体的抽样分布正态总体样本的线性函数的分布25正态总体样本线性函数的分布
定理1设总体XN(,2),
X1,X2,…,Xn是总体X的容量为n的样本,令
U=a1X1+a2X2+…+anXn,其中a1,a2,…,an是已知常数,则U也是正态随机变量,其均值、方差分别为
E(U)=
,D(U)=2102正态总体样本线性函数的分布定理1设总体XN(
定理2设总体XN(,2),(X1,X2,…,Xn)是总体的容量为n的样本,A=(aij)是pn阶矩阵。记Y=(Y1
,Y2
,…,Yp)’=A(X1
,X2,…,Xn)’,则Y1
,Y2
,…,Yp也是正态随机变量,其均值、方差、协方差分别为
E(Yi)=,D(Yi)=2
Cov(Yi,Yj)=2
当
=0,且A是-nn
阶正交矩阵时,Y1
,Y2
,…,Yp也相互独立,且服从于N(0,2
)
正态变换下的不变性103定理2设总体XN(,2),(X1,X2分布定义设随机变量X1,X2,…,Xn相互独立且服从N(0,1)分布,则称随机变量
服从自由度为n的分布,记为104分布定义设随机变量X1,定理1设随机变量,则的密度函数为:105定理1设随机变量定理2设
,则E(X)=n,D(X)=2n定理3设
,且X1与X2相互独立,则
定理4(Cochra)设随机变量X1,X2,…,Xn相互独立且服从N(0,1)分布,又设
Q1+Q2+…+Qk=其中Qj是秩为nj的X1,X2,…,Xn的非负定二次型。则Qj相互独立,且分别服从于自由度为nj的
分布的充要条件是:n1+n2+…+nk=n106定理2设,则E(X引理设
,则X的特征函数为(t)=(1-2it)-n/2.定理3的证明:根据引理及特征函数性质,我们有得E(X)=n,E(X2)=n2+2n,D(X)=2n107引理设,则
定理5(抽样分布基本定理)
设
X1,X2,…,Xn是来自总体N(,2)的一个样本,则注:1. 的独立性仅当总体分布为正态时才成立。当总体分布的三阶中心矩为零时,可以推出两者是不相关的。2.服从精确的正态分布也只有在总体为正态分布时才成立。(1)(2)与相互独立;108定理5(抽样分布基本定理)设X1,X2,…证令,则且,选取正交矩阵A:作为正交变换109证令则,且1.2.,且,则而仅是Z1的线性函数,与无关,故
与相互独立。110则t-分布定义设X~N(0,1),
,且X和Y相互独立,则称随机变量 所服从的分布是自由度为n的t分布,记为T~t(n).定理1
设T~t(n),则T的概率密度为111t-分布定义设X~N(0,1),此定理的证明也同前面类似。先写出X,Y的密度函数,然后利用随机变量的函数的分布的知识写出根号下Y/n的密度函数,再利用独立性写出(X,根号下Y/n)的联合密度函数,最后利用两个随机变量商的密度函数给出结果。112此定理的证明也同前面类似。先写出X,Y的密度函数,然后利用定理2
设X1,X2,…,Xn
是来自总体
的一个样本,则有 。定理3
设
X1,X2,…,Xm和Y1,Y2,…,Yn是分别来自总体
和的样本,且假定两总体相互独立,则有
113定理2设X1,X2,…,Xn是来自总体定理4设Tn~t(n),n=1,2,...,则Tn依分布收敛于N(0,1).114定理4设Tn~t(n),n=1,2,...,则Tn依定理5
设T~t(n),n>1,则对正整数r(r<n),ETr存在,且定理6
设T~t(n),若n>2,则E(T)=0,D(T)=n/(n-2).注:t分布只存在阶数小于n的矩.115定理5设T~t(n),n>1,则对正整数r(F-分布定义设随机变量X和Y是自由度分别为n1和n2的相互独立的
分布随机变量,则称随机变量
所服从的分布为自由度是(n1,n2)的F分布,记为F~F(n1,n2).其中n1称为第一自由度,n2称为第二自由度。116F-分布定义设随机变量X和Y是自由度分别为n定理1
设F~F(n1,n2),则F的概率密度为117定理1设F~F(n1,n2),则F的概率密度为定理2若X/2~,
Y/2~,且相互独立,则定理3若X~F(n1,n2),则1/X~F(n2,n1).定理4若X~t(n),则X2~F(1,n).定理5设X1,X2,…,Xm
和Y1,Y2,…,Yn是分别来自总体
和
的样本,且假定两总体相互独立,则有118定理2若X/2~,定理7
设随机变量X1,X2,…,Xn相互独立且服从,又设
Q1+Q2+…+Qk=其中Qj是秩为nj的X1,X2,…,Xn
的非负定二次型。若n1+n2+…+nk=n,则Qj相互独立,且定理6设Xn~F(m,n),
则当n时,119定理7设随机变量X1,X2,…,Xn相互独立且服从定理分位数(分位点)
定义1设随机变量X的分布函数为F(x),0<<1,若x使
P{X>x}=F(x)=,则称x为此概率分布的(上侧)分位点(或分位数)。120分位数(分位点)定义1设随机变量X的分布函数为分位数(分位点)当X~N(0,1),将其上侧分位数记为u当X~,将其上侧分位数记为当X~t(n),将其上侧分位数记为t(n).当X~F(m,n),将其上侧分位数记为F
(m,n).上面几类分位数的性质-u=
u1-,
-t(n)=
t1-(n)
F(m,n)=1/
F1-(n,m)121分位数(分位点)当X~N(0,1),将其上侧分位数记为u有时也需要上侧分位数和双侧分位数定义2设X为一随机变量,0<<1,若使
P{X}=,则称为此概率分布的下侧分位数。 易证为原分布的1-上侧分位数,即=x1-定义3
设X为一随机变量,0<<1,若1,2使
P{X1}=/2,P{X>2}=/2,则称1,2为此概率分布的双侧分位数。 易证1=x1-/2
,
2=x/2
122有时也需要上侧分位数和双侧分位数46非正态总体的抽样分布例1设总体,
X1,X2,…,Xn为来自总体X的样本,求样本均值的分布。例2设总体
,X1,X2,…,Xn为来自总体X的样本,求样本均值的分布。123非正态总体的抽样分布例1设总体当样本容量n趋于无穷时,若统计量的分布趋于一定的分布,则称后者为该统计量的极限分布。它提供了统计推断的一种近似解法。所谓大样本指样本容量n>30,最好大于50或100.统计量的渐近分布非正态总体大样本的抽样分布124当样本容量n趋于无穷时,若统计量的定义1对于统计量Tn,若存在常数序列使得则称Tn的渐近分布为125定义1对于统计量Tn,若存在常数序列使得则称Tn的渐近分定理1设总体X的分布函数为F(x),X1,X2,…,Xn为来自总体X的样本,则样本的均值的渐近分布为定理2设总体X的分布函数为F(x),X1,X2,…,Xn为来自总体X的样本,则126定理1设总体X的分布函数为F(x),X1,X2,…,X定理3
设X1,X2,…,Xm与Y1,Y2,…,Yn是来自
与
的两独立样本,则当n趋于无穷m趋于无穷时有127定理3设X1,X2,…,Xm与Y1,Y2,…,Yn是定义2设统计量Tn为某个待估函数
的估计量,则称Tn是
的渐近正态估计。若对于每个128定义2设统计量Tn为某个待估函数的§3充分统计量与完备统计量统计量既然是对样本的加工或压缩,在这个过程中可能有损失有关参数的一部分信息,现在问题是在这个过程中是否存在某些统计量,既起
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 7 生命最宝贵(教学设计)-部编版道德与法治 三年级上册
- 上海市金山区九年级历史上册 第三单元 近代社会的发展与终结 第17课 电气时代的来临教学设计 北师大版
- 七年级生物下册 4.6.4《激素调节》教学设计2 (新版)新人教版
- 深龋护理查房
- 线上教学作业设计与管理
- 2023二年级数学上册 三 表内乘法(一)第4课时 乘加、乘减教学设计 苏教版
- Module 9 Unit 1 Are you going to run on sports day(教学设计)-2024-2025学年外研版(三起)英语四年级上册
- 论文摘要与答辩准备
- 2024年五年级数学下册 三 长方体和正方体单元概述与课时安排教学设计 冀教版
- 23 梅兰芳蓄须(教学设计)2024-2025学年部编版语文四年级上册
- 伽利略介绍-课件
- 04HXD1C机车电气系统介绍
- 初中化学人教九年级下册 酸和碱《如何证明无明显现象化学反应的发生》教学设计
- 英语阅读教学【讲座课件】
- 初中物理中考复习备考策略共53页课件
- DL∕T 5544-2018 架空输电线路锚杆基础设计规程
- 电机学同步电机-全套课件
- 框架涵施工工艺标准
- 华为双活数据中心解决方案
- 第2课时 小数点移动引起小数大小变化的规律(2)【教案】
- 病历书写奖惩实施办法
评论
0/150
提交评论