![多元正态总体均值向量和协差阵的假设检验_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/abde5e1d-867a-4f8c-9985-ea5f45483a2e/abde5e1d-867a-4f8c-9985-ea5f45483a2e1.gif)
![多元正态总体均值向量和协差阵的假设检验_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/abde5e1d-867a-4f8c-9985-ea5f45483a2e/abde5e1d-867a-4f8c-9985-ea5f45483a2e2.gif)
![多元正态总体均值向量和协差阵的假设检验_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/abde5e1d-867a-4f8c-9985-ea5f45483a2e/abde5e1d-867a-4f8c-9985-ea5f45483a2e3.gif)
![多元正态总体均值向量和协差阵的假设检验_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/abde5e1d-867a-4f8c-9985-ea5f45483a2e/abde5e1d-867a-4f8c-9985-ea5f45483a2e4.gif)
![多元正态总体均值向量和协差阵的假设检验_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/14/abde5e1d-867a-4f8c-9985-ea5f45483a2e/abde5e1d-867a-4f8c-9985-ea5f45483a2e5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、仅供个人参考第三章 多元正态总体均值向量和协差阵的假设检验什么是假设检验及基本思想、计算步骤,在初等数理统计中都己做过介绍。多元分析也涉及这方面 内容,在后面介绍的常用各种统计方法,有时要对总体的均值向量和协差阵做检验,比如,对两个总体 做判别分析时,事先就需要对两个总体的均值向量做检验,看看是否在统计上有显著差异,否则做判别 分析就毫无意义。本章类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协 差阵的检验。不论做上述任何检验,其基本步骤均可归纳为四步:第一步,提出待检验的假设和 第二步,给出检验的统计量及它服从的分布。第三步,给定检验水平4,查统计量的分布表,
2、确定临界 值人,从而得到否定域。第四步根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待 判假设检验做出决策(拒绝或接受)。由于各种检验的计算步骤类似,关键在于对不同的检验给出不同 的统计量,而有关统计量的给出人多用似然比方法得到。本章只侧重于解释选取统计量的合理性,而不 给出推导过程,最后给出几个实例。同时为了说明统计量的分布,自然地给出HotellingT,分布和AVilks 分布的定义,它们分别是一元统计中t分布和F分布的推广。§3.1均值向量的检验为了对多元正态总体均值向量作检验,首先需要给出Hotelling分布的定义。1 HotellingT2 分布定义 设XN
3、“(“Q),S%(”,)且X与S相互独立,心p,则称统计量TXT'X的分布为非中心HotellingT-分布,记为厂厂(阳,“)°当“ =0时,称尸服从(中心)HotellingT2分布, 记为T2(/?,/?),由于这一统计屋的分布首先由Harold Hotelling提出来的,故称为HotellmgT2分布,值 得指出的是,我国著名统计学家许宝碉先生在1938年用不同方法也导出卩分布的密度函数,因表达式很复杂,故略去。在一元统计中,若X",X”来自总体N(“,/)的样本,则统计量: L亦(X-“)心)分布 b其中1 91 2显然,讴二疔=讴_“),(卩尸(乂_“
4、)与上边给出的尸统计量形式类似,且戸-“no,+ 可见,厂分布是一元统计中f分布的推广。基本性质:在一元统计中,若统计量t - t(n -1)分布,则厂F(U)分布,即把/分布的统计量转化为F统 计量来处理,在多元统计分析中厂统计量也具有类似的性质。定理 若XNp(OQ),SWp®J)且X与S相互独立,令T2=nXfSX .则"_卩 + 1丁2 F(pji_p + 1)这个性质在后面经常用到。2均值向量的检验设p 元正态总体Np(“Q),从总体中抽取容量为11的样本 X,X“,X(”),X工X“S 二工(X-XXX(厂 X),。"mf=l(1)工已知时均值向量的检
5、验Ho :“ = “o("o为已知向量)H :检验统计量:宵F(壬-(壬-“。)才(p)(在H。成立时)给出检验水平d,查力'分布表使PAa=a,可确定出临界值九,再用样本值计算岀7?,若 7?血,则否定Ho,否则Ho相容。这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。二是说明它为什么服从 r(p)分布。一元统计中,当b,已知时,作均值检验所取的统计量为:U = X _"o N(o,l)b石显然,与上边给出的检验统计量卞形式相同。另外根据二次型分布定理:若XNp(OQ),则 XWX X2g 显然,7;'= (乂-“oRT(乂-“。)=亦(片-
6、“。)学厂叽 其中,丫 =乔(壬-从)竹(0,工),因此,當(壬-0)色7(壬_“0)才(卩)。(2)工未知时均值向量的检验Hq卩=山7:“工“0检验统计量:(_1)_ + 1严F(阳_仍(在Ho成立时)(“ -1)0其中尸=(”_1)丽馆(壬-心)给定检验水平e查尸分布表,使厂F= d,可确定出临界值心,再用样本值计算 出厂,若严 尸则否定否则H。相容。这里需要解释的是,当工未知时,自然想到要用样本协差阵丄S去代替工,因(n-1) S'1是工t的 /I 1无偏估计量,而样本离差阵s = £(Xg - x)(x(a) - xy 叫(H - 1,工)X=1侖(X-“o)Np(O
7、J)- T2 = (?7 - l)>/n(X -)'S_1Vn(X-/0)T2(p,n- p)再根据Hotelling厂分布性质,所以(n _ 1) 一 /? +1不得用于商业用途3协差阵相等时,两个正态总体均值向量的检验 设x(a)=,XQ N“(,)a = 1,n且两组样本相互独立,H : “1丰“三丫=(吆,打2,匕)'Np(2,E) a = l,,m(1)有共同己知协差阵时H Q . “ = “2检验统计量:Tj= d (片一巧工T(X 一力F(P)(在H。成立时) n + m给出检验水平a,查疋(卩)分布表使pt2 aJ=«,可确定出临界值血,再用样本
8、值计算出7?, 若7?血,则否定Ho,否则Ho相容。在一元统计中作均值相等检验所给出的统计量:7V(0J)显然,U2 =(x-yy = nm (Y_F)2 <7"(H +n mjj . im =(X - Yy e)T (X - 丫) z2(I) n + m此式恰为上边统计量当时的情况,不难看出这里给出的检验统计量是一元情况的推广。(2)有共同的未知协差阵工0时H 0 “1 = “2HI “ H “2检验统计量:( + ? 一 2) p + 12F = T F(pi + m 一 p _ 1)(n + m _ 2)p(在Ho成立时)其中:T = (/? 4- in - 2)/2L2
9、L(x-r)V n + 7V n + 7S = S + Sr,=f (Xg - 片)(Xg -片),X = (XX2, - JP) H=1s厂工(乙-刃(-刃,Y=(F1j2<-jyn=l给定检验水平a,查F分布表使PF>Fa=a,可确定出代,再用样本值计算出F,若尸化, 则否定Ho,否则Ho相容。当两个总体的协差阵未知时,自然想到用每个总体的样本协差阵丄二和丄S,去代替,而n -1m -1S严- 片)(Xg - 刃 (- 1, 2)a=ls厂工(丫- 丫)(匕-o %-1,幼n=l从而 S = SL + S2 Wp (/? + in _ 2,E)所以( + ? _ 2) _ +1
10、 f T.F(p、n + m 一 p 1)(h + m 一 2)卞述假设检验统计量的选取和前边统计量的选取思路是一样的,以下只提出待检验的假设,然后给 出统计量及其分布,为节省篇幅,不做重复的解释。4协差阵不等时,两个正态总体均值向量的检验设X) = (Xai,XW,X却丫 弘(“,纭)G = 1,11Y(a)=(打 1,打2,,gy Npgzja = 1,m且两组样本相互独立,5>0,工2>0丹0:“1=“2严皿分两种情况(1)n = m令= X(j - 岭)i = 1,nz=-Ezu)= x-yn 1=1S =乞(Z(刀- Z)(Z(刀一 Z)J=1=±(X(” -心
11、-戸+V)(G - r(0-x + yy;=1检验统计量:F =("-)和-吃F(pji- p)(在Ho成立时)P(2)总工码不妨假设non令检验统计量:F =(_) 刁S-吃 F(pji- p)P5多个正态总体均值向最的检验(多元方差分析)多元方差分析是一元方差分析的推广。为此先复习一下一元方差分析,之后为了对多个正态总体均 值向量作检验,自然地先给出Wilks分布的定义。(1)复习一元方差分析(单因素方差分析)设R个正态总体分别为NQg/),NUg/),从R个总体取山个独立样本如下:,號y () y (k) y (k)Hq:P= .= = H H1:至少存在&J 使“i
12、h/仃检验统计量:F= SSAjk- F(k_"_k)(在 Ho成立时)SSE/n _ k其中k _SSA =/"(£ -尢)2组间平方和/=1SSE=±±(X一乂),组内平方和f=l J=1SST=工丈(X-商总平方和/=1 J=1Hi ;=1_1 k坷 X = 一工工X,) = © + +心11 ,=! ;=1给定检验水平Q,查F分布表使pF>Fa=a,可确定出临界值代,再用样本值计算出F值, 若F > Fa则否定Ho,否则Ho相容o(2) Wilks 分布在一元统计中,方差是刻划随机变量分散程度的一个重要特征,而方差
13、概念在多变量情况下变为协差阵。如何用一个数量指标来反映协差阵所体现的分散程度呢?有的用行列式,有的用迹等方法,目前 使用最多的是行列式。定义1若X N则称协差阵的行列式国为X的广义方差。称为样本广义方差。其 中 s = Y(xa)-x)(xa)-xy.a=l定义2若A 叫(山,工),n必凡 (心,工),工 0,且A和A2相互独立,则称|a|/|A + 41 为Wilks统计量,A的分布称为Wilks分布,简记为A 八(,坷,心),其中心宀为自由度。在实际应用中,经常把A统计量化为F统计量进而化为F统#量,利用F佥计量来解决多元统计 分析中有关检验问题。当也=1时,用11代替山,可得到它们之间的
14、关系式如下:n>p 1+-Tpjr)n即严 _ m -1 一 A(p/,1)A(m,1)由前边定理知nP + iT2-F(p,n p + 1)lJp所以-p + 1 l-A(阳,1)F(i_p + 1) P当112=2时有如F关系:n-p 1-/F(2p25 P)当P=1时有:n2 A(l, w)当/尸2时有:©I 1 Ja(2,®化)-/ /厂 F-2(坷 一 1)n2/(2心宀)以上几个关系式说明对一些特殊的八统计量可以化为F统计量,而当心2,“2时,可用无统 计量或F统计量来近似表示,后面给出。(3)多个正态总体均值向量检验(多元方差分析)设有k个p元正态总体N
15、p(“,A),Np(/,A),从每个总体抽取独立样品个数分别为 nn2, - jik,ni+ - +nki ,每个样品观测p个指标得观测数据如下:第一个总体:"yd)A11XfXfX/X胃AX"nlXWX箫X壮此处 X# = (X屮,X屮,,), i = 1,口"y(2)yd).yU)'A11A 12A lpX严V<2)V<2>汨X卩第二个总体:丄Uz pAX? x9 x7n2nZnSX肚此处 xf) =(Xf,Xf,X;),i =1,、心第k个总体:YA11X辭X汀X舅AXk) ¥ x戒.Y此处 X,® = (X屮,
16、Xf,,X胆),1 = 1, - Mik全部样品的总均值向量:_ k %_盘=工工X辿区凤,石) H a=l z=l各总体样品的均值向量:(“) 1d («) («)(a)X =_yxA(Xi ,X2), a = l,lxp 心台 =此处秽=丄士 xy j = ,,p na翕类似一元方差分析办法,将诸平方和变成了离差阵有:a = 士心(乂一尢y(尢一乂)组间离差阵a=lE=±±(X-a)-尢y(xa)- X<a)组内离差阵a=L Z=1T = 土士(才"-戸)立丁 -文)总离差阵a=l /=!这里T=A+E欲检验假设HP =从= = /&
17、lt;.H:至少存在心厶使丰用似然比原则构成的检验统计量为:T A + £|给定检验水平a,查Wilks分布表,确定临界值,然后作出统计判断。当手头没有Wilks分布表时 可用如下Z2分布或F分布来近似。设 AA(/vm)令V = -(n + m (p + m + l)/2)ln A仅供个人参考1式中1-A< /L-22t = H + m - (” + m +1)/2pF 41/广+厂_5丿4则V近似服从r(pm), /?近似服从F(/muL-2A),这里tL-2A不一定为整数,可用与它最近的整数 来作为F的自由度,且min(p,m)>2 o§3.2协差阵的检验
18、1 一个正态总体协差阵检验设Xg=g,X”、XQ G = l,)来自"元正态总体NM,"的样本,工未知,且工>0。检验统计量其中(1) H。:工*检验统计量:a卞-扣sj悴er其中s = X(x(a)-xxxa)-xy a=l(2)工=工0工/卩:I*Z0 */p因为工。>0,所以存在D(|D|#O)使=令 Y = DXa)则a = 1,乙竹(d“, a”)字 a g)因此,检验工=工。等价于检验丈=I卩不得用于商业用途</=1给定检验水平a,因为直接由几分布计算临界值心很困难,所以通常采用几的近似分布。在Ho成立时,一 211U极限分布是 纽巴分布。因此
19、当川p ,由样本值计算出久值,若-2111/1 >仅供个人参考不得用于商业用途即2 e T,则拒绝Ho,否则Ho相容。2多个协差阵相等检验设R个正态总体分别为,的(从,纺),乙0且未知,i = l、从k个总体分别取心 个样本X舄=(X化,X常)丄=1,k;a = l,叫©,5)忑 0且未知,i = 从R个总 体分别取耳个样本X;?)= (X?,X 常 y i = l,-,k;a =i=lHo :E1 =%= = £H1 :£不全相等令 s = fs,1=1S产£(带一対)(咄一疋y1=1/=*/心 + 1)伙-1) 土丄6(p+ 1)(1)冶再-1
20、 (2"2+31)伙 + 1)6("+ 1)(灯2p2 +3p-li-,至少有一对ni n . n-k )z5=5=心1 坷r=l检验统计量:>'P kT / n k-y-f=l/=1在实际应用中,将心改为心一 1, h改为 必 得修正的统计量记为加,则-21n2;近似分布z;/(i-r),其中例1人的出汗多少与人体内钠和钾的含量有一定的关系。今测20名健康成年女性的出汗多少(X)、钠的含量(X和钾的含量(X3),其数据如下表。试检验i“ = “o =(4,50,10)',H“h“。序号X】X:X?13.748.59.325.765.18.033.84
21、7.210.943.253.212.053.155.59.764.636.17.972.424.814.087.233.17.696.747.48.5105.454.1113113.936.912.7124.558.812.3133.527.89.8144.540.28.4151.513.510.1168.556.47.1174.571.68.2186.552.810.9194.144.111.2205.640.99.4经计算X =(464、454,9965)X -= (0.64-4.6,0.035)r55.764177.59- 32.374177.593795.98一 32.374-107.
22、16-107.1668.9255为了计算(乂-“。)丫(元-=则 SY=(元-“。)于是得如下方程组,'55764儿 +17759儿 一32374儿=0.64< 177.59片 +3795.98儿 一107.16儿=-4.6一32374儿一10716儿+68.9255 y3 =0.035解得:比=0.0151,=0.0015/3 =-0.0020于是(X -ys-l(x - “。)=(戸- “。)丫'0.0151= (0.64-4.6.0.035) -0.0015一 0.0020=0.016494T' - 1)(X 一 “o)'ST(X -= 20xl9
23、x 0.016494 = 6.2677217F =x 6.26772 = 1.8719x3查 F 表得 F317 (0.05) = 3.2, F317 (0.01) = 5.18因此在Cl = 0.05或0.01时接受Ho假设。例2为了研究口、美两国在华投资企业对中国经营环境的评价是否存在差异,今从两国在华投资企业中各抽出10家,让其对中国的政治、经济、法律、文化等环境进行打分,其结果如下表:序号政治环境经济环境法律环境文化坏境165352560275503055360453565475404070570303050655413565760453060865402560960503070105
24、55535751155554065125060457013454535751450505070155550307516604045601765554575185060358019404530652045504570110号为美国在华投资企业代号,1020号为口本在华投资企业的代号。数据来源:国务院发展研 究中心APEC在华投资企业情况调查。设两组样本来自正态总体分别记为:xg NWQa = l,10丫 Na = ,10且两组样本相互独立,共同未知协差阵工0H。:耳=“)比.y检验统计量:F =( +川-2)-/宀1厂F(p,n + m-p-1)(/? + m _ 2) p经计算乂 = (64,
25、43,30.5,63),F = (50.5,5 L40,40.5)rioSl工(Xg-刃(X-丽4=1'410-170-808-1705103422-803332.584_ 84228451010a=l512.560165-560390140139165140475-52.5-5139-52.5252.5 _1 +S2922.5-110853 _-11090014356185143807.531.5356131.5762.5_-0.0002-0.00160.00020.0025F = 7.69130.00110.0003- 0.0002.0.00030.0022- 0.0004s_1
26、=-0.0002 -0.00040.0013-0.0002 -0.00160.0002代入统计量中得查 F 分布表得F001(4,15) = 4.89显然F>Foa(415)故否定Ho,即认为口、美两国在华投资企业对中国经营环境的评价存在显著差异。§3.3附注近年来很多人,使用国际上著名的SAS或SPSS软件进行统计分析,为便于和国际接轨,这里简单 介绍一卞现代国际统计学关于显著性检验的作法,它与国内多数统计教科书及期刊论文的处理方法不 同。为了便于直观说明这种作法的基本思想,卞面以一元正态总体U检验法、f检验法为例作介绍,对 其它检验法也类似处理。设样本来自正态总体Ng/),
27、/已知,“未知,要对"作显著性检验,统计假设 “ = “° 比:"H “°观测值的平均-已知期望值|检验统计量:标准方差该统计量在Ho成立时服从N(0,l)将给出的样本数据代入统计量中,算出统计量值,比如| = 3,说明观测的平均值与期望值之差为 标准差的3倍,由3<t2原则知:P(冈一“。卜3</) = 99.7% o因此可以计算出 P(|X-/0|>3o-*) = 0.3%,其中</=刃亦。从上图很直观看出,在正态曲线卞,-3与+3左右两尾部的面积非常小,或者说要取得一个样本平 均值与期望值之差的绝对值人于它的标准方差三倍或三
28、倍以上的概率是T分之三,此3/1000通常称为检 验的"值,这个"值是计算出来的。卩值越小,则否定原假设的证据越强。由于检验统计量(/值依赖于 样本数据,因而"值也如此,所以有的书又称“值为“观测”到的显著水平。那么把“观测”到的显著水平定得多小才可以拒绝原假设呢?许多统计工作者根据经验把界限定在 0.05或0.01处,若p低于0.05,认为这个检验结果是统计显著的,且以0.05的概率拒绝原假设,若p 低于0.01,认为这个检验结果是高度显著的,这里的0.05或0.01,在一般检验中通常称为检验水平,记 为它是控制犯第一类错误的概率。例如上例取67=0.01,而计算出的"值为0.003,比0.01小。因 此应该拒绝原假设,即认为检验是高度显著的,作出这个结论,冒犯错误的风险人约是百分之一。如果统计假设 Ho:“5“ocr?未知即作单尾检验。此时检验统计量为:比如计算出的统计量值是1.34,自由度是5,为了求"值,需要知道自由度为5的学生氏曲线下1.34 右方的面积。少匱另外的面枳 / “叭查表知,1.34右方的面积比10%略人一点,因1.48之右的面积恰好是10%,而1.34正好在1.48左 边,所以1.34之右的面积比10%稍微大一点。综上所述,显著性检验过程可概
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2031年中国雨淋撒砂机行业投资前景及策略咨询研究报告
- 2025年脑分块模型项目可行性研究报告
- 2025年移尘纸项目可行性研究报告
- 2025年特制手套项目可行性研究报告
- 2025年橡胶加工助剂项目可行性研究报告
- 2025至2031年中国摄像枪行业投资前景及策略咨询研究报告
- 2025年扬声器磁体项目可行性研究报告
- 2025年墙角柜项目可行性研究报告
- 2025至2031年中国低温冲击试验机行业投资前景及策略咨询研究报告
- 2025年人造粘胶长丝绣花线项目可行性研究报告
- 消防设施操作员报名承诺书
- 小学二年级部编人教版上册语文期末整理复习题
- 东华医院麻醉科QoR-40随访表
- 2022年全国新高考Ⅰ卷:冯至《江上》
- DB51∕T 2767-2021 安全生产风险分级管控体系通则
- 反兴奋剂考试试题与解析
- 建筑工程材料取样及收费标准
- 堤坝工程施工组织设计
- CPIM BSCM__v3_0_VC(课堂PPT)
- 常用的螺纹底孔及公差规定
- 会议审批表模板
评论
0/150
提交评论