多元正态均值向量和协方差矩阵的检验PPT学习教案_第1页
多元正态均值向量和协方差矩阵的检验PPT学习教案_第2页
多元正态均值向量和协方差矩阵的检验PPT学习教案_第3页
多元正态均值向量和协方差矩阵的检验PPT学习教案_第4页
多元正态均值向量和协方差矩阵的检验PPT学习教案_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1多元正态均值向量和协方差矩阵的检验多元正态均值向量和协方差矩阵的检验2021-12-132第1页/共94页2021-12-133一、均值向量的检验一、均值向量的检验 设 是取自多元正态总体 的一个样本, ,现欲检验n21xxx,),(pN00:0H0:1H 由于总体的协方差矩阵可能未知或已知,所以在检验时必须采用有不同的的统计量,所以我们分成两种情况来讨论。第一节第一节 单个总体均值向量的推断单个总体均值向量的推断第2页/共94页2021-12-134 由于 是来自多元正态总体的简单随机样本n21xxx,),(12111pxxx1x),(222122pxxxx),(21pnnnnxxx

2、x),(21p1、总体协方差矩阵已知时、总体协方差矩阵已知时第3页/共94页2021-12-135)var(),cov(),cov(),cov()var(),cov(),cov(),cov()var()(2122121211pppppxxxxxxxxxxxxxxxVarx第4页/共94页2021-12-136 由于样本均值 ,所以有 )1,(npNx)(1)(0120 xx0nT )()(01xx0n 服从自由度为p的卡方分布。 当原假设为真时, 服从自由度为p的中心卡方分布。所以,我们用作为检验的统计量,对显著性水平,检验的规则为: )()(0120 xx0nT )()(0120 xx0nT

3、第5页/共94页2021-12-137时,接受原假设;当)(220pT时,拒绝原假设。当)(220pT则接受原假设。值所计算出的样本统计量,)(2pPp则拒绝原假设;值所计算出的样本统计量,)(2pPp第6页/共94页2021-12-138 2、总体协方差矩阵未知时、总体协方差矩阵未知时 总体的协方差矩阵未知,用样本的协方差矩阵11()()(1)niiinSxx xx 替代 中的总体协方差,得霍特林(Hotelling) 统计量 )()(0120 xx0 nT2T 120()()Tn0 xSx第7页/共94页2021-12-139 在原假设为真时 对显著性水平 ,检验的规则为:当 ,拒绝原假设

4、;当 ,接受原假设。),() 1(2pnpFTnppn),() 1(2pnpFTnppn),() 1(2pnpFTnppn第8页/共94页2021-12-131010504:00H第9页/共94页2021-12-1311第10页/共94页2021-12-1312(20.928.0611.781.090)x0.260.081.6390.1560.081.5130.2220.0191.6390.22226.6262.2330.1560.0192.2331.346第11页/共94页2021-12-1313( , )f x 其中 是未知参数, 参数空间。第12页/共94页2021-12-131410:

5、H00:H现在从总体中抽出容量为n的样本12n.xxx( )( )( ),样本的联合密度函数为(1)(2)( )( )1,.,; )(; )nniiLfxxxx(第13页/共94页2021-12-13150(1)(2)( )(1)(2)( )max,.,; )max,.,; )nnLLxxxxxx(由于 ,所以统计量取值在0到1之间。 0 第14页/共94页2021-12-13160(1)(2)( )(1)(2)( )max,.,; )-2ln-2lnmax,.,; )nnLLxxxxxx( 近似服从自由度为f的卡方分布,其中自由度为的维数减0的维数。第15页/共94页2021-12-1317

6、0010: =:HH ; 的似然比检验。/222,0max ( ,)(2 )nnpnpLen A 其中1()()niiiAX -X X -X第16页/共94页2021-12-1318/202200max (, )(2 )nnpnpLenA 其中0001()()niAX-X-22002nnnAAAA第17页/共94页2021-12-13190001()()niiiAXXXXXX001()()()()niiinXX XXXX00()()nAXX第18页/共94页2021-12-1320000()()nAAXX1001()()nAXAX00()()nnAXXI012001111()()11nTnAA

7、XAX第19页/共94页2021-12-132122TTFF第20页/共94页2021-12-1322 例 设x1,x2, ,xn取自该总体Np(,)的样本,=(1, 2 , p),检验H0: 1= 2 = = p= H1: 至少存在一对i和j,使i j第二节第二节 单个总体均值分量间结构关系的检验单个总体均值分量间结构关系的检验 第21页/共94页2021-12-1323100101010011C令 则与上面的原假设等价的假设为 0:0CH0:1CH 例 假定人类的体形有这样的一般规律:身高、胸围和上臂围平均尺寸比例为6:4:1。检验身高、胸围和上臂围平均尺寸比例是否符合这一规律。第22页/

8、共94页2021-12-132432104161:H至少有两个不相等。3211,41,61:H601032C则上面的假设可以表达为 ;0C:0H0C:1H第23页/共94页2021-12-1325 设 取自多元正态总体 的一个样本。前面,我们已经利用样本,检验均值向量是否等于一个指定的向量。在实际问题中,我们也需要检验均值向量的分量之间是否存在某一指定的结构关系,即检验 n21xxx,),(pNC:0HC:1H 其中C为一已知的kp阶矩阵,kp),是成对的试验数据,总体X和y均服从p维正态分布,且协方差相等。令di=xi-yi,则di=xi-yi服从正态分布 , 。),(dpNid21 检验假

9、设210:H211:H0:0H0:1H第35页/共94页2021-12-1337dSd1dnT2检验的统计量 其中yxdniiin1)(11ddddSd 当原假设 为真时,统计量服从自由度为 和 的 分布。 02) 1(TnppnppnF 检验规则为: 当时 ,拒绝原假设,否则接受原假设。 2) 1(Tnppn),(pnpF第36页/共94页2021-12-1338 中小企业的破产模型中小企业的破产模型 为了研究中小企业的破产模型,首先选定了X1总负债率(现金收益/总负债),X2收益性指标(纯收入/总财产),X3短期支付能力(流动资产/流动负债)和X4生产效率性指标(流动资产/纯销售额)4个经

10、济指标,对17个破产企业为“1”和正常运行企业“2”进行了调查,得资料如下。如果这些指标是用来做判别分析和聚类分析的变量,他们之间没有显著性差异是不恰当的,所以检验所选择的指标在不同类型企业之间是否有显著的差异。 第37页/共94页2021-12-1339Classification Resultsb,c152175162144888.211.8100.023.876.2100.050.050.0100.0152176152188.211.8100.028.671.4100.0破产企业为1,正常运行企业为212Ungrouped cases12Ungrouped cases1212Count%

11、Count%OriginalCross-validateda12Predicted GroupMembershipTotalCross validation is done only for those cases in the analysis. In cross validation,each case is classified by the functions derived from all cases other than thatcase.a. 81.6% of original grouped cases correctly classified.b. 78.9% of cro

12、ss-validated grouped cases correctly classified.c. x1,x2,x3,x4均为判别变量第38页/共94页2021-12-1340Classification Resultsb,c152174172144888.211.8100.019.081.0100.050.050.0100.0152175162188.211.8100.023.876.2100.0破产企业为1,正常运行企业为212Ungrouped cases12Ungrouped cases1212Count%Count%OriginalCross-validateda12Predict

13、ed GroupMembershipTotalCross validation is done only for those cases in the analysis. In cross validation,each case is classified by the functions derived from all cases other than thatcase.a. 84.2% of original grouped cases correctly classified.b. 81.6% of cross-validated grouped cases correctly cl

14、assified.c. x1, x3为判别变量第39页/共94页2021-12-1341 Dependent Variable: x1 (对(对X1进行的检验)进行的检验) Sum of Source DF Squares Mean Square F Value Pr F Corrected Total 37 2.73767632 X1在类间有显著性差异。 Dependent Variable: x2 (对X2进行的检验) Sum of Source DF Squares Mean Square F Value Pr FX2在类间没有显著性差异。第40页/共94页2021-12-1342Dep

15、endent Variable: x3(对X3进行的检验) Sum of Source DF Squares Mean Square F Value Pr F Model 1 16.46958443 16.46958443 21.45 F X4在类间没有显著性差异。第41页/共94页2021-12-1343 多元假设检验 Statistic Value F Value Num DF Den DF Pr F 从从SAS的输出可以看出应该拒绝原假的输出可以看出应该拒绝原假设,即类间的有显著性差异。设,即类间的有显著性差异。第42页/共94页2021-12-1344 设从总体 ,中各自独立地抽取样本

16、 和 , 。他们的均值向量差为:1(, )pN 和2(, )pN112( ,)nx xxx212(,)ny yyy011211222212pp1第43页/共94页2021-12-1345第44页/共94页2021-12-1346丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4235544555544455545554455434445553355445533453344344443544455345545554454443334444455455555445555第45页/共94页2021-12-1347第46页/共94页2021-12-1348 检验0

17、12:()HC 112:()HC 在原假设为真的条件下,检验的统计量为:121212(pn nTnnC xy)CS CC xy)2121212(1)( ,1)(2)nnkFTF k nnkk nn第47页/共94页2021-12-1349data a;input x1 x2 x3 x4 class;cards;数据行省略;run;proc anova;class class;model x1-x4=class;manova h=class m=(1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1);run;第48页/共94页2021-12-1350 H = Anova SSCP Ma

18、trix for class E = Error SSCP Matrix S=1 M=0.5 N=27 Statistic Value F Value Num DF Den DF Pr F第49页/共94页2021-12-1351 例例 某种产品有甲乙两个品牌,其质量指标有某种产品有甲乙两个品牌,其质量指标有5个,个,从两种品牌的产品中分别抽出从两种品牌的产品中分别抽出5个,有如下的数据,个,有如下的数据, 序号序号X1X2X3X4X5111181518152332731211732028272319418261818952223221610第50页/共94页2021-12-1352序号序号X

19、1X2X3X4X51181720181823124312620314161720174252431261853628242629检验两种品牌的质量指标差异有显著不同。检验两种品牌的质量指标差异有显著不同。第51页/共94页2021-12-1353s1= 63.70 21.35 46.40 7.55 8.00, 21.35 16.30 19.95 7.15 4.25, 46.40 19.95 42.30 12.10 16.25, 7.55 7.15 12.10 7.70 10.50, 8.00 4.25 16.25 10.50 19.00;s2=81.70 44.70 36.90 29.80 3

20、6.60,44.70 26.20 22.65 18.30 19.60,36.90 22.65 40.30 20.60 3.45,29.80 18.30 20.60 15.20 9.90,36.60 19.60 3.45 9.90 24.30;第52页/共94页2021-12-1354mu1= 20.80, 24.40, 22.60, 19.20, 14.00;mu2=24.80,21.80,24.60,23.20,20.40;第53页/共94页2021-12-1355sp=(4#s1+4#s2)/8;C=1 -1 0 0 0, 0 1 -1 0 0, 0 0 1 -1 0, 0 0 0 1 -

21、1;T=5#(t(mu1-mu2)*t(C)*inv(C*sp*t(c)*C*(mu1-mu2)/2; 第54页/共94页2021-12-135621212(1)104 135.65=5.57(2)4(102)nnkFTk nn第55页/共94页2021-12-1357第56页/共94页2021-12-1358第五节第五节 多个总体均值的比较检验(多元方差分析)多个总体均值的比较检验(多元方差分析) 前面我们已经对单个总体和两个总体的均值向量进行了检验。但常常还需要检验三个或三个以上总体的均值向量是否相等。 一、方差分析的回顾 某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动

22、效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。 ,。第57页/共94页2021-12-1359早班中班晚班344939374740355142334839335041355142365140第58页/共94页2021-12-1360 为什么各值 会有差异?可能的原因有两个。 一是,各个班次工人的劳动效率可能有差异,从而导致了不同水平下的观察值之间差异,即存在条件误差。 二是,随机误差的存在。 如何衡量两种原因所引起的观察值的差异?总平均劳动效率为:kinijijnyyi1/ )(571.41214042373

23、4第59页/共94页2021-12-1361三个班次工人的平均劳动效率分别为:714.341y571.492y429.403y总离差平方和sskinjijiyy112)(222)571.4140()571.4137)571.4134(1429.835201211n自由度:组间离差平方和(条件误差)ssAkiiiyyn12)(22)571.41571.49(7)571.41714.34(72)571.41429.40(7286.786第60页/共94页2021-12-1362组内离差平方和(随机误差)ssekinjiijiyy112)(22)714.3436()714.3434(22)571.4

24、151()571.4149(857.38)429.4040()429.4039(2218321kn自由度 统计量FknSSkSSeA1118.18218857.382286.786第61页/共94页2021-12-1363查F分布表得临界值因为 故应拒绝原假设,即不同班次工人的劳动效率有显著的差异。554. 3)18, 2(05. 0F013. 6)18, 2(01. 0F013. 6)18, 2(118.18201. 0FF 方差分析:比较3个或3个以上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机

25、误差)。第62页/共94页2021-12-1364 方差分析的任务是:寻找适当的统计量,检验诸效应是否相等。亦即检验 原假设H o:a1=a2=ak ,即诸效应均为零; 备择假设H0:诸ai不全相等.总离差平方和kinjijiyyss112)(反映了全部观察值相对于总平均数的离散程度。随机波动所引起的离差平方和kinjiijeiyyss112)(反映了各相同水平下观察值之间的分散程度,称为误差平方和或组内平方和。第63页/共94页2021-12-1365由各水平的效应不同引起的离差平方和kiiiAyynss12)( 可以证明可以证明 eASSSSSSknSSkSSFeA1在原假设成立的条件下,

26、统计量F服从第一自由度为k-1,第二自由度为n-k的F分布,对于给定的显著性水平,可以查表确定临界值满足 PFF(k-1,n-k) =。第64页/共94页2021-12-1366把计算的F值与临界值比较,当F F时,拒绝原假设,不同水平下的效应有显著性差异;当F FWilks Lambda0.66413.0781080.0038Pillais Trace0.36273.0581100.0039 Hotelling-Lawley Trace0.46543.11874.8560.0044Roys Greatest Root0.34994.814550.0021从SAS的输出可以看出应该拒绝原假设,

27、即类间的有显著性差异。第73页/共94页2021-12-13750( , ,|)( , ,|)LHLX X 该比如越大越接受原假设,反之比如越小越不能接受原假设。第74页/共94页2021-12-13762ln 渐近到自由度为p(p+1)/2的卡方分布。00:H10:H第75页/共94页2021-12-1377211()exp()()()2npn2trnAX- X-12( ,)()()()nLf Xf Xf X 为样本联合密度函数。1 22( )( )11(2 )exp2npiii1(x) (x)1 22( )( )11(2 )exp2npiii1(x) (x)第76页/共94页2021-12

28、-137821000(|)()exp()2npnLH2trnAX 全空间似然函数为21(|)()exp()2npnL2trnnnAAAX 2()exp2npnp2nA第77页/共94页2021-12-1379210002()exp()2(|)(|)()exp( )2npnpn2trnLHLn2trnAXX AI/2/211001( )exp()2nnpetrnAA22ln( ) ( (1)/2)p p第78页/共94页2021-12-1380第79页/共94页2021-12-1381第80页/共94页2021-12-1382生产方法15.38.310.25.44.57.05.44.44.75.

29、54.44.712.117.718.810.915.916.318.611.012.715.917.912.69.49.49.910.414.818.015.212.19.911.314.213.517.718.720.318.1第81页/共94页2021-12-1383生产方法210.49.116.414.28.211.514.312.67.47.210.79.617.81723.120.112.713.718.220.217.817.827.523.91317.723.922.59.910.514.211.65.96.610.79.85.99.517.711.9第82页/共94页2021-12-1384生产方法310.813.511.312.520.520.924.522.418.121.118.421.217.821.320.722.21922.920.924.65.912.111.611.715.622.111.721.620.123.724.423.711.318.117.417.28.610.9910.0第83页/共94页2021-12-138524.28 24.09 23.98 25.14 24.09 28.55 25.20 26.89

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论