




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元正态分布的假设检验多元正态分布的假设检验 4.1 单个总体均值向量的推断单个总体均值向量的推断 proc iml; n=20; p=3; x=3.7 48.5 9.3 ,5.7 65.1 8.0 ,3.8 47.2 10.9 , 3.2 53.2 12.0 ,3.1 55.5 9.7 ,4.6 36.1 7.9 , 2.4 24.8 14.0 ,7.2 33.1 7.6 ,6.7 47.4 8.5 , 5.4 54.1 11.3 ,3.9 36.9 12.7 ,4.5 58.8 12.3 , 3.5 27.8 9.8 ,4.5 40.2 8.4 ,1.5 13.5 10.1 , 8.5 5
2、6.4 7.1 ,4.5 71.6 8.2 ,6.5 52.8 10.9 , 4.1 44.1 11.2 ,5.5 40.9 9.4 ; m0=4 50 10; ln=20 1 ; x0=(ln*x)/n; print x0; xm=x0-m0; print xm; mm=i(20)-j(20,20,1)/n; a=x*mm*x; print a; ai=inv(a); print ai; dd=xm*ai*xm; d2=(n-1)*dd; t2=n*d2; f=(n-p)*t2/(n-1)*p); print dd d2 t2 f; p0=1-probf(f,p,n-p); print p0
3、; fa=finv(0.95,p,n-p); beta=probf(fa,p,n-p,t2); print fa beta;quit; the sas system 08:48 wednesday, march 10, 2008 4 x0 4.64 45.4 9.965 xm 0.64 -4.6 -0.035 a 54.708 190.19 -34.372 190.19 3795.98 -107.16 -34.372 -107.16 68.9255 ai 0.0308503 -0.001162 0.0135773 -0.001162 0.0003193 -0.000083 0.0135773
4、-0.000083 0.0211498 dd d2 t2 f 0.0256283 0.4869386 9.7387729 2.9045463 p0 0.0649283 fa beta 3.1967768 0.3616381二二 单个总体均值分量间结构关系的检验单个总体均值分量间结构关系的检验是取自该总体的样本。检验: ( , )pnx1,2(,)p ,12nx xx01:ph1:ijh至少有一对1、问题引入例 设与上面的假设等价的是,寻找常数矩阵110010101001c0:hc01:hc0 注:矩阵c不是唯一的, 110001100001c 在例4.2.1中,假定人类的体形有这样一个一般规律
5、的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验: 012311:64h112311:,64h 至少有两个不等230106c求则上面的假设可以表达为 0:hc01:hc02、统计量及方法 其 中 c 为 一 已 知 的 k p 阶 矩 阵 , k f(2,6-2)=6.9443,.0.05nkftk n查表所以拒绝原假设 犯第一类错误的概率为2() ( ,1)tnt k n1cx) csc(cxproc iml;s= 31.600 8.040 0.500, 8.040 3.172 1.310, 0.500 1.310 1.900;mu=82.00 60.20 14.
6、50;c=2 -3 0, 1 0 -6;a=c*t(mu);d=c*s*t(c);g=inv(d);t=6#(t(a)*g*a);f=(6-2)/(2*(6-1)*t;print t, f ; p0=1-probf(f,2,6-2); print p0;fa=finv(0.95,2,6-2); print fa;quit;t47.143the sas system 08:48 wednesday, march 10, 2008 18 t 47.143404 f 18.857362 p0 0.0091948 fa 6.94427194.2 两个总体均值的检验两个总体均值的检验一、两个独立样本的情
7、形一、两个独立样本的情形 与一元随机变量的情形相同,常常我们需要检验两个总体的均值是否相等。 设从总体 ,中各自独立地抽取样本 和 , 。1(, )pn 和2(, )pn112( ,)nx xxx212(,)ny yyy 0 考虑假设 012:h112:h 根据两个样本可得1和2的无偏估计量为1111ninixx2121niniyy2211,()pnnnxy0121122122(1)(1)(2, )pnnnnw nnpsss又1212,pnnnnnxy0其中111(1)()()niin1isxx xx2221(1)()()niinisyy yy21212()()n ntnn1pxy sxy统计
8、量当原假设为真的条件下,21212121( ,1)(2)nnpftf p nnpp nn检验的规则为: 21212121( ,1),(2)nnptfp nnpp nn拒绝原假设;21212121( ,1),(2)nnptfp nnpp nn接受原假设;data d331; input type x1-x4; cards; 1 65 35 25 60 1 75 50 20 55 1 60 45 35 65 1 75 40 40 70 1 70 30 30 50 1 55 40 35 65 1 60 45 30 60 1 65 40 25 60 1 60 50 30 70 1 55 55 35 7
9、5 2 55 55 40 65 2 50 60 45 70 2 45 45 35 75 2 50 50 50 70 2 55 50 30 75 2 60 40 45 60 2 65 55 45 75 2 50 60 35 80 2 40 45 30 65 2 45 50 45 70 ; proc iml; n=10;m=10; p=4; use d331(obs=10); xx=x1 x2 x3 x4; read all var xx into x; print x; ln=10 1 ; x0=(ln*x)/n; print x0; mx=i(n)-j(n,n,1)/n; a1=x*mx*x;
10、 print a1; use d331(firstobs=11); read all var xx into y; print y; lm=10 1 ; y0=(lm*y)/m; print y0; my=i(m)-j(m,m,1)/m; a2=y*my*y; print a2; a=a1+a2; xy=x0-y0; ai=inv(a); print a ai; dd=xy*ai*xy; d2=(m+n-2)*dd; t2=n*m*d2/(n+m) ; f=(n+m-1-p)*t2/(n+m-2)*p); print d2 t2 f; pp=1-probf(f,p,m+n-p-1); prin
11、t pp; quit; the sas system 08:48 wednesday, march 10, 2008 20 x 65 35 25 60 75 50 20 55 60 45 35 65 75 40 40 70 70 30 30 50 55 40 35 65 60 45 30 60 65 40 25 60 60 50 30 70 55 55 35 75 x0 64 43 30.5 63 a1 490 -170 -120 -245 -170 510 10 310 -120 10 322.5 260 -245 310 260 510 y 55 55 40 65 50 60 45 70
12、45 45 35 75 50 50 50 70 55 50 30 75 60 40 45 60 65 55 45 75 50 60 35 80 40 45 30 65 45 50 45 70 y0 51.5 51 40 70.5 a2 502.5 60 175 -7.5 60 390 50 195 175 50 450 -100 -7.5 195 -100 322.5 a ai 992.5 -110 55 -252.5 0.0011142 -0.000091 -0.00016 0.0004239 -110 900 60 505 -0.000091 0.0016972 0.0000975 -0.
13、001076 55 60 772.5 160 -0.00016 0.0000975 0.0013754 -0.000372-252.5 505 160 832.5 0.0004239 -0.001076 -0.000372 0.0020539 d2 t2 f 5.9724991 29.862495 6.2213532 pp 0.0037058二、成对试验的t2统计量 前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。 思考:两独立样本和成对样本的观测值有何不同。 设(xi,yi),),i=1,2
14、,3,n,时成对的试验数据,由于总体x x和y y均服从p维正态分布,且协方差相等。12,( ,),iiipdnidxyd令则。 假设检验 012112:,:hh01:0,:0hh 检验的统计量为 2dtn1d s d 其中 dxy11()()1niiindsdd dd 当原假设为真时2( ,)(1)npftf p npp n2( ,),(1)nptfp npp n拒绝原假设2( ,),(1)nptfp npp n接受原假设例1 一组学生共5人,采用两种不同的方式进行教学, 然后对5个学生进行测验,得如下得分数:学生序号 教学方式ab数学物理数学物理1899082852988880833756
15、96170476706766590766365分析不同的教学方式是否有差异。data a;input x1 x2 y1 y2;cards;89 90 82 85 98 88 80 83 75 69 61 70 76 70 6766 90 76 63 65;data d;set a;x12=x1-y1;y12=x2-y2;proc corr cov;var x12 y12;run;proc iml;s= 63.50 21.000, 21.00 18.200;mu= 15.00, 4.800;g=inv(s);r=t(mu)*g*mu;print r;run;4.3 两个总体均值分量间结构关系的检
16、验两个总体均值分量间结构关系的检验 一、问题提出 设从总体 ,中各自独立地抽取样本 和 , 。他们的均值向量差为:1(, )pn 和2(, )pn112( ,)nx xxx212(,)ny yyy 011211222212pp1 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何? 回答采用没有、很小、有些、很大和非常大5个等级,得到结果如表。 丈夫对妻子丈夫对妻子妻子对丈夫妻
17、子对丈夫 x1 x2 x3 x4 x1 x2 x3 x4235544555544455545554455434445553355445533453344344443544455345545554454443334444455455555445555 现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。 1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。 2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。 二、统计量与检验 检验012:()hc 112:()hc 在原假设为真的条件下,检验的统计量为:121212(pn ntnn
18、c xy)cs cc xy)2121212(1)( ,1)(2)nnkftf k nnkk nndata a;input x1 x2 x3 x4 class;cards;数据行省略;run;proc anova;class class;model x1-x4=class;manova h=class m=(1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1);run; h = anova sscp matrix for class e = error sscp matrix s=1 m=0.5 n=27 statistic value f value num df den df pr
19、 f wilks lambda 0.87857261 2.58 3 56 0.0626 pillais trace 0.12142739 2.58 3 56 0.0626 hotelling-lawley trace 0.13820985 2.58 3 56 0.0626 roys greatest root 0.13820985 2.58 3 56 0.0626proc iml;sigma1=0.5758620690 0.3758620690 -.1034482759 -.1655172414, 0.3758620690 0.5850574713 -.0919540230 -.1586206
20、897, -.1034482759 -.0919540230 0.4367816092 0.4137931034, -.1655172414 -.1586206897 0.4137931034 0.4551724138;mu1= 3.90000, 3.96667, 4.33333, 4.40000; sigma2= 0.4885057471 -.0172413793 0.0402298851 0.0229885057, -.0172413793 0.4379310345 0.0724137931 0.1172413793, 0.0402298851 0.0724137931 0.2402298
21、851 0.2022988506, 0.0229885057 0.1172413793 0.2022988506 0.2574712644; mu2= 3.83333, 4.10000, 4.63333, 4.53333;c=1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1;mu=(mu1+mu2)/2;a=c*mu;sigma=29#(sigma1+sigma2)/58;t2=60#t(a)*inv(c*sigma*t(c)*a;print t2;225.441254t 212125725.448.192946(1)3 59nnkftk nn第一节 单因素方差分析问题的提出统计的
22、模型及检验方法多重比较检验问题的提出 某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。 a=0.05,0.01。早班中班晚班344939374740355142334839335041355142365140 为什么各值 会有差异?可能的原因有两个。 一是,各个班次工人的劳动效率可能有差异,从而导致了不同水平下的观察值之间差异,即存在条件误差。 二是,随机误差的存在。 如何衡量两种原因所引起的观察值的差异?总平均劳动效率为:kinijijnyyi
23、1/ )(571.412140423734三个班次工人的平均劳动效率分别为:714.341y571.492y429.403y总离差平方和sskinjijiyy112)(222)571.4140()571.4137)571.4134(1429.835201211n自由度:组间离差平方和(条件误差)ssakiiiyyn12)(22)571.41571.49(7)571.41714.34(72)571.41429.40(7286.786组内离差平方和(随机误差)ssekinjiijiyy112)(22)714.3436()714.3434(22)571.4151()571.4149(857.38)4
24、29.4040()429.4039(2218321kn自由度 统计量fknsskssea1118.18218857.382286.786把计算的f值与临界值比较,当f f时,拒绝原假设,不同水平下的效应有显著性差异;当f f 时,接受原假设。kiiiyyn12)(1k1kssaknsskssea1 kinjiijiyy112)(knknsse kinjijiyy112)(1n方 差 来 源离差平方和自由度方差f值 组间a 组内e 总和 next查f分布表得临界值因为 故应拒绝原假设,即不同班次工人的劳动效率有显著的差异。554. 3)18, 2(05. 0f013. 6)18, 2(01. 0
25、f013. 6)18, 2(118.18201. 0ff 方差分析:比较3个或3个以上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。next 50家上市公司,按行业计算其1999年底的资产负债情况,如下:序号制造业商业运输业公用事业房地产业165905025702559565307535090584560445936350805409264406565890602570760855830728758856307698090603568106092552566平均58.890.558.933.5
26、70.2 anovax117108.6844277.17072.437.0002657.1004559.04719765.7849between groupswithin groupstotalsum ofsquaresdfmean squarefsig.多重比较检验 1、多重比较检验 前面的f检验只能说明在单一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设: ), 2 , 1,(kjijiji因而还应该进一步讨论到底是哪些总体之间存在差异。 scheffe检验), 2 , 1,(:0kjijihji)某些jihji(
27、:1), 1() 1)(11(21knkfknnknsseij定义:jiijxxd定义:检验的结论:。个水平间有显著性差异水平与第即第,则拒绝jihsdijij,0第二节 多元方差分析一、假设012:kh1:1,2,ihak不完全相同二、多元方差分析的离差平方和的分解总离差平方和 ( )( )11()()ankaaiiaisstxxxx( )( )( )( )( )( )11()()ankaaaaaaiiaixxxxxxxx( )( )( )( )( )( )111()()()()ankkaaaaaaiiaaiaxxxxn xxxx( )( )( )( )( )1111()()()()aannkkaaaaaiiiaiaixxxxxxxx由于交叉乘积项为零,故组间叉积矩阵组内叉积矩阵总叉积矩阵 ( )( )( )(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025某餐饮品牌特许加盟合同协议书范本
- 2025年二月份跨境独立站运营借款协议GMV增长对赌协议
- 胸腔镜手术病人的护理
- 超市员工管理规章制度
- 基于过盈联接的机油泵衬套压装质量监控设计与应用
- 二零二五版收购企业合同范例
- 基金投资组合基金池
- 有关车位租赁合同范例
- 二零二五池塘承包合同范例
- 内务管理制度500字
- 多联机施工组织方案
- 电子商务师中级题库
- 个人信息保护法试题
- 汽车租赁公司应急救援预案
- 矫形器装配工(四级)职业技能鉴定考试题库(含答案)
- 砌石头清包协议书
- 浙江省宁波市2025届高三数学适应性考试二模试题
- 中职计算机选修课程设计
- 胸腔闭式引流护理-中华护理学会团体标准
- QBT 5243-2018 手包行业标准
- 内科学课件:胰腺炎修改版
评论
0/150
提交评论