第3章 多元正态总体参数的假设检验_1.ppt_第1页
第3章 多元正态总体参数的假设检验_1.ppt_第2页
第3章 多元正态总体参数的假设检验_1.ppt_第3页
第3章 多元正态总体参数的假设检验_1.ppt_第4页
第3章 多元正态总体参数的假设检验_1.ppt_第5页
已阅读5页,还剩108页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章,多元正态分布参数的假设检验,主要内容,3.1 几个重要统计量的分布,一、正态变量二次型的分布,1. 分量独立的 n 维随机向量 X 的二次型,X 的二次型具有以下一些结论:,显然,则,当XNn( , In ),0,且 时,令,2. 一般 p 维正态随机向量 的二次型,p 维随机向量的二次型具有下述结论:,结论3 设 A 和 B 为 p 阶对称矩阵,则,3. 非中心 t 分布和非中心 F 分布,4. 非中心 、非中心 t 分布和非中心 F 分布的应用,当否定H0时,可能犯第一类错误,且,当H0相容时,可能犯第二类错误,且,二、威沙特(Wishart)分布,1. 威沙特分布的定义,一般地,

2、设X(a)Np( ,) (a=1,2,n)相互独立,记,则称 服从非中心参数为的非中心威沙特分布,记为 ,其中,当X(a)Np(a ,) (a=1,2,n)相互独立,非中心参数,或,这里,其中 p 为随机阵 W 的阶数,n 为自由度,一元统计中的 2对应 p 元统计中的协方差阵.,【注】随机阵 W 的密度函数是威沙特于1928年推导出来的,故此分布称为威沙特分布。,2. 威沙特分布的性质,性质1 设X(a)Np( , ) (a=1,2,n)相互独立,则样本离差阵A服从威沙特分布,即,性质3 设 p 阶随机阵 ,C 是mp常数矩阵,则 m 阶随机阵 也服从威沙特分布,即,性质4 分块威沙特矩阵的

3、分布(习题三中第3-4题):设,相互独立,其中,又已知随机阵,性质6 设随机阵 ,则,三、霍特林(Hotelling) T 2 分布,1. 霍特林 T 2 分布的定义,2. 霍特林 T 2 分布的性质,性质2 T 2与 F 分布的关系:设 T 2T 2( p , n),则,性质5 T 2 统计量对非退化变换保持不变.,四、威尔克斯(Wilks) 统计量及其分布,1. 威尔克斯(Wilks) 分布的定义,2. 统计量与 T 2 或 F 统计量的关系,结论2 当 n2=2 时,设 n1= n p , 则,结论3 当 p=1 时,则,结论4 当 p=2 时,则,结论5 当 n22 , p2 时,可用

4、 2 统计量或 F 统计量近似.,3. 两个重要结论,结论2 若 n2 p ,则,注 结论2 是一元统计中 的推广.,3.2 单总体均值向量的检验及置信域,一、均值向量的检验,1. 当0已知时均值向量的检验,因为,利用二次型分布的结论,知,其中检验统计量 ,非中心参数,2. 当 未知时均值向量的检验,考虑统计量,因为,样本离差阵为,由定义 3.1.5 可知,再利用 T 2 与 F 分布的关系,检验统计量取为,例3.2.1 人的出汗多少与人体内钠和钾的含量有一定的关系.今测量了20名健康成年女性的汗出量(X1)、钠的含量(X2)和钾的含量(X3)(数据见表3.1).试检验,(=0.05) .,表

5、3.1 成年女性的出汗量及其体内钠和钾含量的数据,解:,记随机向量 ,假定 X N3( , ).检验,取检验统计量为,由样本值计算得: 及,进一步计算可得,二、似然比统计量,设样本的似然函数为L( , ).检验均值向量0的似然比统计量为:,由习题二第215题知,上面比式的分子当,时达最大值,且最大值为,故,下面来推导似然比统计量 与 T 2 的关系:,利用分块矩阵行列式的性质有:,所以,其中,否定域:,其中,三、置信域与联立置信区间,1. 置信域,或者,任给置信度1 ,查 F 的分布临界值表得 F 满足,(3.2.1),则均值向量 的置信度为1 的置信域为,该置信域是一个中心在 的椭球.,当检

6、验假设H0: 0时,若0 落入上述置信域内,即,例3.2.1 人的出汗多少与人体内钠和钾的含量有一定的关系.今测量了20名健康成年女性的汗出量(X1)、钠的含量(X2)和钾的含量(X3)(数据见表3.1).,表3.1 成年女性的出汗量及其体内钠和钾含量的数据,例3.2.2 沿用例3.2.1的数据,试求 的置信度为95的置信椭球.,解:,由观测数据计算样本均值向量 和样本离差阵A及样本协方差阵S,S的特征值 和单位正交向量 l 分别为,记,由 S -1 的谱分解式,并令 则 的置信度为95%的置信椭球为,2. 联立置信区间,设XNp( , ),考虑 X 的线性组合,对任意的 a ,考虑 的置信区

7、间便能得到所要的联立置信区间.,得到.于是置信区间为,(3.2.2),其中 满足: (这里 tt(n-1) ).,下面给出构造所有 的联立置信区间估计的 Scheffe 方法.,定理3.2.2 假设X(t)(t=1,2,n)为来自p元正态总体Np( , )(0,未知)的随机样本,则对所有的 a ,区间,包含 的概率为1 (其中 F 满足(3.2.1)式).,由于置信概率由 T 2 分布确定,因此为方便起见,以后称定理3.2.2,给出的联立置信区间为 T 2 区间。在 T 2 区间中,若取a=ei=,(0,1,0),我们便同时得到 i (i=1,p)的置信度均为1,T 2 区间,其中sii 为样

8、本协方差阵 S 的第i 个对角元素.,(3.2.4),3.3 多总体均值向量的检验,一、两正态总体均值向量的检验,1. 两总体协方差阵相等(但未知)时均值向量的检验,由 T 2 统计量的定义3.1.5可知,利用 T 2 与 F 的关系,检验统计量取为,表3.2 日、美两国在华投资企业对中国经营环境的评价数据,解:,取检验统计量为,由样本值计算得:,进一步计算可得:,2. 两总体协方差阵不等时均值向量的检验,(1) 当n=m时,作为成对数据进行处理: 令,将两个总体化为单个 p 元总体 Z 的均值检验问题,可以证明:,二、多正态总体均值向量的检验多元方差分析,记,记,总偏差平方和 SST,组内偏

9、差平方和 SSE,组间偏差平方和 SSA,推广到 k 个 p元总体Np(i), )(假定 k 个总体的协方差阵相等,且记为 ),记第i个p元总体的数据阵为,对总离差阵 T 进行分解:,根据直观想法及用似然比原理得到检验 H0 的统计量为,根据 分布的定义,可知,给定显著性水平 ,查威尔克斯临界值表,可得 ,使,故否定域 W= .当手头没有威尔克斯临界值表时,可用 2分布,或 F 分布来近似,即由 的函数的近似分布进行检验(见参考文献,1或2).,例3.3.2 为了研究某种疾病,对一批人同时测量了4个指标: 脂蛋白(X1),甘油三脂(X2), 脂蛋白(X3),前 脂蛋白(X4) 。按不同年龄、不

10、同性别分为三组(20至35岁的女性、20至25岁的男性和35至50岁的男性),数据见表3.3。试问这三个组的4项指标间有无显著差异( = 0.01)?,表3.3 身体指标化验数据,由样本值计算得: ,以及,进一步计算可得,对给定0.01,利用统计软件(如SAS系统),首先计算p值(此时检验统计量 FF( 8 , 108 ) ):,因p0.003538 0.01 ,故否定H0,这表明三个组的指标之间有显著的差异.在这种情况下,可能犯第一类错误,且犯第一类错误的概率为0.01.,进一步地若还想了解三个组指标间的差异究竟是由哪几项指标引起的,可以对4项指标逐项用一元方差分析法进行检验,我们将发现三个

11、组指标间只有第一指标X1有显著差异.,事实上,用一元方差分析检验第一项指标X1在三个组中是否有显著差异时,因,其中t11和a11分别是 T 和 A 中的第一个对角元素,有,p1PF18.8780=0.0004401(检验统计量 F1F( 2 , 57 ) ),因p10.0004401显著地小于0.01,故第一项指标 X1 在三个组中有显著差异.,3.4 协方差阵的检验,一、单个 p 元正态总体协方差阵的检验,1. 当 0Ip 时检验 H0: =Ip , H1: Ip,利用似然比原理来导出似然比统计量1:,2. 当 0Ip 时检验 H0: =0 , H1: 0,检验,其中,当样本容量 n 很大时

12、,在 H0 成立时, -2ln2 的极限分布为,除此以外,在不同适用范围下还有其他近似分布可用来构造检验法(见参考文献1或2).,3. 检验 H0: = 20 ( 2未知),当0=Ip时此检验常称为球性检验.,以下利用似然比原理来导出似然比统计量3:,令,可得出 .,从而有,3表示式的分子 =,3表示式的分母 =,所以似然比统计量,或等价于,二、多总体协方差阵的检验,似然比统计量 4 为,上式的分母 =,上式的分子 =,则似然比统计量4为,当样本容量 n 很大时,在 H0 为真时 M 有以下近似分布:,其中,例3.4.1 对例3.3.2表3.3中给出的身体指标化验数据,试判断三个组(即三个总体

13、)的协方差阵是否相等?(=0.10),在H0成立时,取近似检验统计量为 2( f ) 统计量:,由样本计算三个总体的样本协方差阵:,进一步计算可得,因 p0.4374 0.10 ,故H0相容,这表明三个组的协方差阵之间没有显著的差异.,三、多个正态总体的均值和协方差阵同时检验,记,则检验以上假设 H0 的似然比统计量为,若用 表示当协方差阵均相同时检验 k 个总体均值向量是否相等的似然比统计量,将发现这里的似然比统计量 54 .在实际应用中我们采用类似的修正方法,在5中用 nt-1 替代 nt ,用 n-k 替代n .修正后的统计量记为5*:,当样本容量 n 很大时,在H0为真时 5* 有以下

14、近似分布:,其中,例3.4.2 对例3.3.2表3.3中给出的身体指标化验数据,试判断三个组(即三个总体)的均值向量和协方差阵是否全都相等?(=0.05),解: 这是三个4元正态总体的均值向量和协方差阵是否同时相等的检验问题.取近似检验统计量为近似 2 统计量:,由样本值计算这三个总体的样本协方差阵(见例3.4.1),以及所有样本的总离差阵 T (见例3.2.2).进一步计算可得:,因 p0.03373 0.05 ,故否定H0,这表明三个组的均值向量和协方差阵之间有显著的差异.在这种情况下,可能犯第一类错误,且犯第一类错误的概率为0.05.,3.5 独立性检验,在第二章中,我们已经介绍过若X(1),X(k)相互独立 ij = O(对一切ij ).因此检验X(1),X(k)是否相互独立的问题等价于检验对任意两个子向量,协方差阵 ij 是否等于O (对一切 ij ).,在正态总体下,独立性检验可化为检验:,相应的剖分为,应用似然比原理,在 H0 成立时, ( i=1,k ; a=1,n),且相互独立,故样本的似然函数为,当 时, Li(i),ii)达最大.所以似然比统计量表示式的分子为,似然比统计量为,博克斯(Box)证明了,在 H0 成立下当 n时,,其中,例3.5.1 试检验例3.2.1女性汗液数据中随机向量 X 的三个分量是否

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论