




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元正态分布的假设检验多元正态分布的假设检验 4.1 单个总体均值向量的推断单个总体均值向量的推断 proc iml; n=20; p=3; x=3.7 48.5 9.3 ,5.7 65.1 8.0 ,3.8 47.2 10.9 , 3.2 53.2 12.0 ,3.1 55.5 9.7 ,4.6 36.1 7.9 , 2.4 24.8 14.0 ,7.2 33.1 7.6 ,6.7 47.4 8.5 , 5.4 54.1 11.3 ,3.9 36.9 12.7 ,4.5 58.8 12.3 , 3.5 27.8 9.8 ,4.5 40.2 8.4 ,1.5 13.5 10.1 , 8.5 5
2、6.4 7.1 ,4.5 71.6 8.2 ,6.5 52.8 10.9 , 4.1 44.1 11.2 ,5.5 40.9 9.4 ; m0=4 50 10; ln=20 1 ; x0=(ln*x)/n; print x0; xm=x0-m0; print xm; mm=i(20)-j(20,20,1)/n; a=x*mm*x; print a; ai=inv(a); print ai; dd=xm*ai*xm; d2=(n-1)*dd; t2=n*d2; f=(n-p)*t2/(n-1)*p); print dd d2 t2 f; p0=1-probf(f,p,n-p); print p0
3、; fa=finv(0.95,p,n-p); beta=probf(fa,p,n-p,t2); print fa beta; quit; The SAS System 08:48 Wednesday, March 10, 2008 4 X0 4.64 45.4 9.965 XM 0.64 -4.6 -0.035 A 54.708 190.19 -34.372 190.19 3795.98 -107.16 -34.372 -107.16 68.9255 AI 0.0308503 -0.001162 0.0135773 -0.001162 0.0003193 -0.000083 0.0135773
4、 -0.000083 0.0211498 DD D2 T2 F 0.0256283 0.4869386 9.7387729 2.9045463 P0 0.0649283 FA BETA 3.1967768 0.3616381 二二 单个总体均值分量间结构关系的检验单个总体均值分量间结构关系的检验 是取自该总体的样本。检验: ( , ) p Nx 1,2 (,) p , 12n x xx 01 : p H 1 : ij H至少有一对 1、问题引入 例 设 与上面的假设等价的是,寻找常数矩阵 1100 1010 1001 C 0 :HC0 1 :HC0 注:矩阵C不是唯一的, 1100 0110
5、0001 C 在例4.2.1中,假定人类的体形有这样一个一 般规律的身高、胸围和上臂围平均尺寸比例为 6:4:1。检验比例是否符合这一规律。检验: 0123 11 : 64 H 1123 11 :, 64 H 至少有两个不等 230 106 C求 则上面的假设可以表达为 0 :HC0 1 :HC0 2、统计量及方法 其 中 C 为 一 已 知 的 k p 阶 矩 阵 , k F(2,6-2)=6.9443,. 0.05 nk FT k n 查表 所以拒绝原假设 犯第一类错误 的概率为 2 () ( ,1)TnT k n 1 Cx) CSC(Cx proc iml; s= 31.600 8.04
6、0 0.500, 8.040 3.172 1.310, 0.500 1.310 1.900; mu=82.00 60.20 14.50; c=2 -3 0, 1 0 -6; a=c*t(mu); d=c*s*t(c); g=inv(d); T=6#(t(a)*g*a); f=(6-2)/(2*(6-1)*T; Print T, f ; p0=1-probf(f,2,6-2); print p0; fa=finv(0.95,2,6-2); print fa; Quit; T47.143 The SAS System 08:48 Wednesday, March 10, 2008 18 T 47.
7、143404 F 18.857362 P0 0.0091948 FA 6.9442719 4.2 两个总体均值的检验两个总体均值的检验 一、两个独立样本的情形一、两个独立样本的情形 与一元随机变量的情形相同,常常我们需要检验两个 总体的均值是否相等。 设从总体 ,中各自独立地抽取样 本 和 , 。 1 (, ) p N 和 2 (, ) p N 1 12 ( ,) n x xxx 2 12 (,) n y yyy 0 考虑假设 012 :H 112 :H 根据两个样本可得1和2的无偏估计量为 1 1 1 1 n i n i xx 2 1 2 1 n i n i yy 22 11 ,() p N
8、 nn XY0 12112212 2(1)(1)(2, ) p nnnnW nn p SSS又 12 12 , p nn N nn XY0 其中 1 1 1 (1)()() n i i n 1i Sxx xx 2 22 1 (1)()() n i i n i Syy yy 2 12 12 ()() n n T nn 1 p xy Sxy统计量 当原假设为真的条件下, 2 12 12 12 1 ( ,1) (2) nnp FTF p nnp p nn 检验的规则为: 2 12 12 12 1 ( ,1), (2) nnp TFp nnp p nn 拒绝原假设; 2 12 12 12 1 ( ,1
9、), (2) nnp TFp nnp p nn 接受原假设; data d331; input type x1-x4; cards; 1 65 35 25 60 1 75 50 20 55 1 60 45 35 65 1 75 40 40 70 1 70 30 30 50 1 55 40 35 65 1 60 45 30 60 1 65 40 25 60 1 60 50 30 70 1 55 55 35 75 2 55 55 40 65 2 50 60 45 70 2 45 45 35 75 2 50 50 50 70 2 55 50 30 75 2 60 40 45 60 2 65 55 4
10、5 75 2 50 60 35 80 2 40 45 30 65 2 45 50 45 70 ; proc iml; n=10;m=10; p=4; use d331(obs=10); xx=x1 x2 x3 x4; read all var xx into x; print x; ln=10 1 ; x0=(ln*x)/n; print x0; mx=i(n)-j(n,n,1)/n; a1=x*mx*x; print a1; use d331(firstobs=11); read all var xx into y; print y; lm=10 1 ; y0=(lm*y)/m; print
11、 y0; my=i(m)-j(m,m,1)/m; a2=y*my*y; print a2; a=a1+a2; xy=x0-y0; ai=inv(a); print a ai; dd=xy*ai*xy; d2=(m+n-2)*dd; t2=n*m*d2/(n+m) ; f=(n+m-1-p)*t2/(n+m-2)*p); print d2 t2 f; pp=1-probf(f,p,m+n-p-1); print pp; quit; The SAS System 08:48 Wednesday, March 10, 2008 20 X 65 35 25 60 75 50 20 55 60 45 3
12、5 65 75 40 40 70 70 30 30 50 55 40 35 65 60 45 30 60 65 40 25 60 60 50 30 70 55 55 35 75 X0 64 43 30.5 63 A1 490 -170 -120 -245 -170 510 10 310 -120 10 322.5 260 -245 310 260 510 Y 55 55 40 65 50 60 45 70 45 45 35 75 50 50 50 70 55 50 30 75 60 40 45 60 65 55 45 75 50 60 35 80 40 45 30 65 45 50 45 70
13、 Y0 51.5 51 40 70.5 A2 502.5 60 175 -7.5 60 390 50 195 175 50 450 -100 -7.5 195 -100 322.5 A AI 992.5 -110 55 -252.5 0.0011142 -0.000091 -0.00016 0.0004239 -110 900 60 505 -0.000091 0.0016972 0.0000975 -0.001076 55 60 772.5 160 -0.00016 0.0000975 0.0013754 -0.000372 -252.5 505 160 832.5 0.0004239 -0
14、.001076 -0.000372 0.0020539 D2 T2 F 5.9724991 29.862495 6.2213532 PP 0.0037058 二、成对试验的T2统计量 前面我们讨论的是两个独立样本的检验问题,但 是不少的实际问题中,两个样本的数据是成对出现 的。例如当讨论男女职工的工资收入是否存在差异; 一种新药的疗效等。 思考:两独立样本和成对样本的观测值有何不同。 设(xi,yi),),i=1,2,3,n,时成对的试验数据, 由于总体X X和Y Y均服从p维正态分布,且协方差 相等。 12 ,( ,), iiipd N i dxyd令则。 假设检验 012112 :,:HH
15、 01 :0,:0HH 检验的统计量为 2 d Tn 1 d S d 其中 dxy 1 1 ()() 1 n ii i n d Sdd dd 当原假设为真时 2 ( ,) (1) np FTF p np p n 2 ( ,), (1) np TFp np p n 拒绝原假设 2 ( ,), (1) np TFp np p n 接受原假设 例1 一组学生共5人,采用两种不同的方式进行教学, 然后对5个学生进行测验,得如下得分数: 学生序号 教学方式 AB 数学物理数学物理 189908285 298888083 375696170 476706766 590766365 分析不同的教学方式是否有
16、差异。 data a; input x1 x2 y1 y2; cards; 89 90 82 85 98 88 80 83 75 69 61 70 76 70 67 66 90 76 63 65 ; data d; set a; x12=x1-y1; y12=x2-y2; proc corr cov; var x12 y12; run; proc iml; s= 63.50 21.000, 21.00 18.200; mu= 15.00, 4.800; g=inv(s); r=t(mu)*g*mu; print r; run; 4.3 两个总体均值分量间结构关系的检验两个总体均值分量间结构关系
17、的检验 一、问题提出 设从总体 ,中各自独立地抽 取样本 和 , 。他 们的均值向量差为: 1 (, ) p N 和 2 (, ) p N 1 12 ( ,) n x xxx 2 12 (,) n y yyy 0 1121 1222 2 12pp 1 例 在爱情和婚姻的调查中,对一个由若干名 丈夫和妻子组成的样本进行了问卷调查,请他们 回答以下几个问题: (1)你对伴侣的爱情的“热度”感觉如何? (2)伴侣对你的爱情的“热度”感觉如何? (3)你对伴侣的爱情的“可结伴”水平感觉如何? (4)伴侣对你的爱情的“可结伴”水平感觉如何? 回答采用没有、很小、有些、很大和非常大5个 等级,得到结果如表
18、。 丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4 23554455 55444555 45554455 43444555 33554455 33453344 34444354 44553455 45554454 44333444 44554555 55445555 现在我们关心均值分量间的差异是否满足某种结 构关系。比如每个指标均值间的差异是否相等。 1、丈夫对妻子以及妻子对丈夫的回答在0.05 显著水平上没有差异。 2、在四个指标上他们是否会有相同的分数。即检 验四个分数的平均值是否相等。 二、统计量与检验 检验 012 :()HC 112 :()
19、HC 在原假设为真的条件下,检验的统计量为: 1 2 12 12 ( p n n T nn C xy)CS CC xy) 2 12 12 12 (1) ( ,1) (2) nnk FTF k nnk k nn data a; input x1 x2 x3 x4 class; cards; 数据行省略 ; run; proc anova; class class; model x1-x4=class; manova h=class m=(1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1); run; H = Anova SSCP Matrix for class E = Error
20、SSCP Matrix S=1 M=0.5 N=27 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0.87857261 2.58 3 56 0.0626 Pillais Trace 0.12142739 2.58 3 56 0.0626 Hotelling-Lawley Trace 0.13820985 2.58 3 56 0.0626 Roys Greatest Root 0.13820985 2.58 3 56 0.0626 proc iml; sigma1=0.5758620690 0.3758620690 -.1034
21、482759 -.1655172414, 0.3758620690 0.5850574713 -.0919540230 -.1586206897, -.1034482759 -.0919540230 0.4367816092 0.4137931034, -.1655172414 -.1586206897 0.4137931034 0.4551724138; mu1= 3.90000, 3.96667, 4.33333, 4.40000; sigma2= 0.4885057471 -.0172413793 0.0402298851 0.0229885057, -.0172413793 0.437
22、9310345 0.0724137931 0.1172413793, 0.0402298851 0.0724137931 0.2402298851 0.2022988506, 0.0229885057 0.1172413793 0.2022988506 0.2574712644; mu2= 3.83333, 4.10000, 4.63333, 4.53333; c=1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1; mu=(mu1+mu2)/2; a=c*mu; sigma=29#(sigma1+sigma2)/58; t2=60#t(a)*inv(c*sigma*t(c)*a;
23、print t2; 2 25.441254T 2 12 12 57 25.448.192946 (1)3 59 nnk FT k nn 第一节 单因素方差分析 问题的提出 统计的模型及检验方法 多重比较检验 问题的提出 某工厂实行早、中、晚三班工作制。工厂管理部门 想了解不同班次工人劳动效率是否存在明显的差异。每个 班次随机抽出了7个工人,得工人的劳动效率(件/班)资 料如表。分析不同班次工人的劳动效率是否有显著性差异。 a=0.05,0.01。 早班中班晚班 344939 374740 355142 334839 335041 355142 365140 为什么各值 会有差异?可能的原因有两
24、个。 一是,各个班次工人的劳动效率可能有差异, 从而导致了不同水平下的观察值之间差异,即存 在条件误差。 二是,随机误差的存在。 如何衡量两种原因所引起的观察值的差异? 总平均劳动效率为: k i n ij ij nyy i 1 / )( 571.41 21 40423734 三个班次工人的平均劳动效率分别为: 714.34 1 y571.49 2 y429.40 3 y 总离差平方和ss k i n j ij i yy 11 2 )( 222 )571.4140()571.4137)571.4134( 1429.835201211n自由度: 组间离差平方和(条件误差)ssA k i ii y
25、yn 1 2 )( 22 )571.41571.49(7)571.41714.34(7 2 )571.41429.40(7286.786 组内离差平方和(随机误差)sse k i n j iij i yy 11 2 )( 22 )714.3436()714.3434( 22 )571.4151()571.4149( 857.38)429.4040()429.4039( 22 18321kn自由度 统计量F kn SS k SS eA 1 118.182 18 857.38 2 286.786 把计算的F值与临界值比较, 当F F时,拒绝原假设,不同水平下的效应有 显著性差异;当F F 时,接受
26、原假设。 k i ii yyn 1 2 )( 1k 1k SS A kn SS k SS eA 1 k i n j iij i yy 11 2 )(kn kn SSe k i n j ij i yy 11 2 )( 1n 方 差 来 源 离差平方和自由度方差F值 组间A 组内E 总和 NEXT 查F分布表得临界值 因为 故应拒绝原 假设,即不同班次工人的劳动效率有显著的差异。 554. 3)18, 2( 05. 0 F013. 6)18, 2( 01. 0 F 013. 6)18, 2(118.182 01. 0 FF 方差分析:比较3个或3个以上的总体均值是 否有显著性差异。用组间的方差与组
27、内方差相比 ,据以判别误差主要源于组间的方差(不同组工 人的产量,条件误差),还是源于组内方差(随 机误差)。 NEXT 50家上市公司,按行业计算其1999年底的资产负 债情况,如下: 序号制造业商业运输业公用事业房地产业 16590502570 25595653075 35090584560 44593635080 54092644065 65890602570 76085583072 87588563076 98090603568 106092552566 平均58.890.558.933.570.2 ANOVA X1 17108.6844277.17072.437.000 2657.1
28、004559.047 19765.7849 Between Groups Within Groups Total Sum of SquaresdfMean SquareFSig. 多重比较检验 1、多重比较检验 前面的F检验只能说明在单一因素的影响下, 不同水平是否存在显著性的差异,但不能断言哪些 总体之间存在差异,在方差分析中否定了原假设, 并不意味着接受了假设: ), 2 , 1,(kjiji ji 因而还应该进一步讨论到底是哪些总体之间存在差异。 Scheffe检验 ), 2 , 1,(: 0 kjijiH ji )某些jiH ji (: 1 ), 1() 1)( 11 ( 21 knk
29、Fk nnkn S S e ij 定义: jiij xxD定义: 检验的结论: 。个水平间有显著性差异水平与第即第,则拒绝jiHSD ijij , 0 第二节 多元方差分析 一、假设 012 : k H 1 :1,2, i Hak不完全相同 二、多元方差分析的离差平方和的分解 总离差平方和 ( )( ) 11 ()() a n k aa ii ai SSTxxxx ( )( )( )( )( )( ) 11 ()() a n k aaaaaa ii ai xxxxxxxx ( )( )( )( )( )( ) 111 ()()()() a n kk aaaaaa iia aia xxxxn xxxx ( )( )( )( )( ) 1111 ()()()() aa nn kk aaaaa iii aiai xxxxxxxx 由于交叉乘积项为零,故 组间叉积矩阵组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 17365-2025微束分析金属与合金电子探针定量分析试样的制备方法
- 宠物救生与急救操作考核试卷
- 模具超声波无损检测技术考核试卷
- 核电站设计与建设中的质量监督与验收标准考核试卷
- 漆器工艺品目标消费群体研究考核试卷
- 竹材采运信息化与大数据分析考核试卷
- 电磁场扫描与探测教具考核试卷
- 租赁店铺的社区关系维护考核试卷
- 煤炭行业人才培养与引进考核试卷
- 科尔沁艺术职业学院《文化产业管理概论》2023-2024学年第二学期期末试卷
- 苯乙酸安全技术说明书(msds)
- 2022-2023学年统编版选择性必修三 逻辑与思维 10-2 体会认识发展的历程 教案-
- 万邦特种材料股份有限公司年产18000吨特种纸迁建项目环境影响报告书
- 【建模教程】-建模-数学建模夏令营
- 高中英语高频词汇拓展延伸
- 诚信友善教学反思(十篇)
- 2023版思想道德与法治专题6遵守道德规范锤炼道德品格PPT
- 部编本六年级下册语文课件古诗词诵读
- 销售立项申请表
- 装饰装修挂靠工程合同协议书范本
- 一案八制方案
评论
0/150
提交评论