统计检验分析-第五章_第1页
统计检验分析-第五章_第2页
统计检验分析-第五章_第3页
统计检验分析-第五章_第4页
统计检验分析-第五章_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第5章章 关于均值向量的推断关于均值向量的推断o一、一、0作为正态总体均值的似真性作为正态总体均值的似真性o二、霍特林二、霍特林T2与似然比检验与似然比检验o三、置信域和均值分量的联合比较三、置信域和均值分量的联合比较o四、总体均值向量的大样本推断四、总体均值向量的大样本推断o五、多元质量控制图五、多元质量控制图o六、观测值缺损时均值向量的推断六、观测值缺损时均值向量的推断o七、多元观察中由时间相依性造成的困难七、多元观察中由时间相依性造成的困难一、一、0作为正态总体均值的似真性作为正态总体均值的似真性本章将讨论关于总体均值向量及其分量的本章将讨论关于总体均值向量及其分量的统计推断问题。统计

2、推断问题。o判断判断0是否为总体均值的似真值?是否为总体均值的似真值?o一元统计中:一元统计中:t分布分布这个统计分布为自由度这个统计分布为自由度为为n-1的学生的学生t分布分布o学生学生t-分布分布(Students t-distribution)应用在当对呈)应用在当对呈正态分正态分布布的母群体的的母群体的均值均值进行进行估计估计。它是。它是对对两个样本均值差异两个样本均值差异进行显著性测进行显著性测试的学生试的学生t测定的基础。测定的基础。如果计算的如果计算的t的绝对值较大,则拒绝零假设的绝对值较大,则拒绝零假设上式也等同于当上式也等同于当t的平方较大时,拒绝零假设,的平方较大时,拒绝零

3、假设,即即0不是总体均值的似真值。不是总体均值的似真值。t2为样本均值到为样本均值到0的距离的平方的距离的平方o多元统计中多元统计中 p*1的的0向量是否为多元正态分布均值的似向量是否为多元正态分布均值的似真值?真值?从一元推广到多元平方距离:从一元推广到多元平方距离:其中其中T2为样本均值到为样本均值到0的距的距离的平方,如果距离太离的平方,如果距离太远,则拒绝零假设;远,则拒绝零假设;T2以研究者霍特林命名,以研究者霍特林命名,称为称为霍特林统计量霍特林统计量T2分布的性质:分布的性质:设设X1,Xn是来自均值为是来自均值为,协方差矩阵为,协方差矩阵为的联合分布的一个随机样本,服从的联合分

4、布的一个随机样本,服从Np(, )分布,分布,即即T2分布与(系数分布与(系数*F)同分布)同分布在一定概率水平下,如果下式成立则拒绝零假设在一定概率水平下,如果下式成立则拒绝零假设二、二、霍特林霍特林T2与似然比检验与似然比检验1.构造似然比构造似然比2.T2和和分布的关系分布的关系多元正态似然函数的最大值为:多元正态似然函数的最大值为:极大似然估计量:极大似然估计量:1.构造似然比构造似然比在零假设条件下在零假设条件下(=0),最大正态似然值为:,最大正态似然值为:其中其中将两种最大似然值进行比较得到将两种最大似然值进行比较得到的比值为的比值为似然比统计量:似然比统计量:似然比统计量似然比

5、统计量的计算如下式,当该值太小时,拒绝零假设的计算如下式,当该值太小时,拒绝零假设2.T2和和分布的关系分布的关系设设X1,Xn是来自均值为是来自均值为,协方差矩阵为,协方差矩阵为的联的联合分布的一个随机样本,服从合分布的一个随机样本,服从Np(, )分布有分布有小的小的或大的或大的T2,拒绝零假设。拒绝零假设。三、三、置信域和均值分量的联合比较置信域和均值分量的联合比较o假设假设是未知的总体分布的参数向量,是未知的总体分布的参数向量,是所有可能的是所有可能的的集合,的集合,置信域置信域是可能的是可能的组成的集合,与一元的置信区间类似。组成的集合,与一元的置信区间类似。o置信域置信域由样本数据

6、决定,用由样本数据决定,用R(X)表示,如表示,如果样本被抽取前有下式成立,则称区域果样本被抽取前有下式成立,则称区域R(X)为为 的的100(1-)%的置信域。的置信域。1.一元统计中一元统计中2.多元统计中多元统计中1.一元统计中一元统计中例如,给定一个样本:样本均值和方例如,给定一个样本:样本均值和方差分别为差分别为10和和2,样本大小为,样本大小为11(自由(自由度为度为10)。)。 o则根据下式和查表则根据下式和查表2.多元统计中多元统计中p=2时置信域为一椭圆时置信域为一椭圆四、四、总体均值向量的大样本推断总体均值向量的大样本推断o当样本量很大时,不需要总体的当样本量很大时,不需要

7、总体的正态性假正态性假定定就可以构造均值的假设检验及置信域;就可以构造均值的假设检验及置信域;o当当n-p很大时,有下式成立:很大时,有下式成立:则在则在的置信水平下拒绝零假设的置信水平下拒绝零假设五、五、多元质量控制图多元质量控制图控制图的目的是为了识别是否出现了引控制图的目的是为了识别是否出现了引起变动的特殊原因,这些原因来自外部,起变动的特殊原因,这些原因来自外部,表明需要对数据进行修正或改进。表明需要对数据进行修正或改进。1.均值控制图(一元)均值控制图(一元)2.椭圆控制图(二元)椭圆控制图(二元)3.T2控制图(多元)控制图(多元)1.均值控制图(一元)均值控制图(一元)o按时间顺

8、序对各个观察值或样本均值作按时间顺序对各个观察值或样本均值作标绘标绘o画出所有观察值的样本均值的中心线画出所有观察值的样本均值的中心线o按照如下公式计算并画出控制限按照如下公式计算并画出控制限控制上限控制上限UCL:x+3*标准差标准差控制下限控制下限LCL:x-3*标准差标准差2.椭圆控制图(二元)椭圆控制图(二元)o按散布图进行标绘按散布图进行标绘o按照如下不等式计算按照如下不等式计算95%的置信椭圆,并的置信椭圆,并画出椭圆控制限(画出椭圆控制限(=0.05或或0.01,p=2).3.T2控制图(多元)控制图(多元)o对第对第j个点计算个点计算T2统计量统计量o把计算结果画在时间轴上,把

9、计算结果画在时间轴上,LCL为零,为零,UCL为为=0.05或或0.01的卡方值的卡方值.T299%限制限制95%限制限制学生学生t分布分布1221()2( )(1)(/ 2)tf t00(| |)2( )tP ttf t dt卡方分布卡方分布(2 distribution)(0,1)uN222212nuuu2/2 122/2()1()exp()2( /2)2f22222()(1)xxns222221snv F分布分布( F distribution, RA Fisher, 1923)2122sFs112121212/2/212()/21212()2( )(/2) (/2)()vFf FFv第

10、第5章章 关于均值向量的推断关于均值向量的推断o一、一、0作为正态总体均值的似真性作为正态总体均值的似真性o二、霍特林二、霍特林T2与似然比检验与似然比检验o三、置信域和均值分量的联合比较三、置信域和均值分量的联合比较o四、总体均值向量的大样本推断四、总体均值向量的大样本推断o五、多元质量控制图五、多元质量控制图o六、观测值缺损时均值向量的推断六、观测值缺损时均值向量的推断o七、多元观察中由时间相依性造成的困难七、多元观察中由时间相依性造成的困难六、六、观测值缺损时均值向量的推断观测值缺损时均值向量的推断o如何处理不完全观测值?如何处理不完全观测值?o登普斯特(登普斯特(Dempster)提出

11、一种从不完提出一种从不完全数据出发,计算其极大似然估计的一全数据出发,计算其极大似然估计的一般方法,称为般方法,称为EM算法。算法。oEM算法:算法:1.预测预测,预测任何缺损值对,预测任何缺损值对充分统计量充分统计量的的贡献;贡献;2.估计估计,计算修正后的极大似然估计值。,计算修正后的极大似然估计值。oEM算法具体步骤:算法具体步骤:1.利用不全数据利用不全数据X计算各个变量的均值,缺损计算各个变量的均值,缺损值不计入,用值不计入,用这些估计的均值代替缺损值这些估计的均值代替缺损值;2.利用估计的上述数据利用估计的上述数据估计协方差估计协方差;3.把有缺损的数据和正常数据进行把有缺损的数据

12、和正常数据进行分块处理分块处理,按照公式估计缺损值、缺损值的平方、缺损按照公式估计缺损值、缺损值的平方、缺损值与其它观测值的乘积;值与其它观测值的乘积;4.计算充分统计量计算充分统计量T1和和T2的估计值;的估计值;5.利用利用T1和和T2估计均值和协方差估计均值和协方差;o再再重复预测与估计重复预测与估计,直到估计出的均值和协,直到估计出的均值和协方差中的元素方差中的元素基本保持不变基本保持不变为止。为止。例题,用下面数据估计正态总体均例题,用下面数据估计正态总体均值与协方差矩阵,值与协方差矩阵,n=4,p=3,某些,某些值缺损。值缺损。521562730X1.对样本均值做初始估计:对样本均

13、值做初始估计:6257113120244526332.用样本均值代替缺损值用样本均值代替缺损值3. 估计协方差矩阵估计协方差矩阵516215627306X214)66()65()67()66(22221125,213322414) 11)(66() 11)(65() 12)(67() 10)(66(121,431323521562730X4164. 利用初始的均值和协方差估计值利用初始的均值和协方差估计值预测预测缺缺损值对充分统计量损值对充分统计量T1和和T2的贡献的贡献516215627306X22211211332313232212131211)2()1(321,73. 531321212

14、212111xxx254314321411412199.32211211221211211xx18.17, 03 , 073. 5,131211xxx同样估计缺损的另外两个数对统计量的影响,预测出同样估计缺损的另外两个数对统计量的影响,预测出T1和和T2:00.1630. 413.244333231342322212413121111xxxxxxxxxxxxT00.7450.2018.10150.2097. 607.2718.10127.2705.1482432332232134342333223221312434133312321131124223222221242413231222112112412312212112xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxT5. 求出修正求出修正估计估计00. 408. 103. 611Tn50. 283. 017. 183. 059. 033. 017. 133. 061. 012Tn521562730X416516215627306X2543143214114121预测与估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论