北大《多元统计分析》答案78_第1页
北大《多元统计分析》答案78_第2页
北大《多元统计分析》答案78_第3页
北大《多元统计分析》答案78_第4页
北大《多元统计分析》答案78_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 多元正态分布及参数的估计2-1 解:利用性质 2, 得二维随机向量 YN2(y,y),其中:31132,() .yyAdIA2-2 (1)证明:记 Y1 X1 +X2 (1,1) X, Y2 X1X 2 (1,1) X,利用性质 2 可知 Y1 , Y2 为正态随机变量 . 又212 1110Cov(,)故 X1 +X2 和 X1X 2 相互独立.另证:记 ,则1212 2YXC 2(,),YNC因 22 2111021()()YC故由定理 2.3.1 可得 X1 +X2 和 X1X 2 相互独立.(2)解:因为 1221 2 021(), ()YN 所以 212 112(,(),(,.XN2-3 (1)证明:令 ,则 . 12 2() )() (pIXXY C 2(,)pYNC因为1212121212D()()()()p ppIIYCXIO由定理 2.3.1 可知 X(1) +X(2)和 X(1) -X(2) 相互独立.(2)解:因为,1212122 12()()()() ),()p OYNX 所以 1212121212 12()()()() ()()()(),).p pNXN2-6 解:(1)记 B=(3,-1,1), 由性质 2 得, .,YBXB1231213(3,),(3,)291(,9).BBYXN :(2)令 , 显然 均服从正态分布, 故要使它们相互独立,只132a31XY需 即可 . 又因31,0COVY3123123212(, )(,(,)XVaXCOVXaCOVXa ,故当 时满足条件.12a(,05)2-9 解: (1)1/4/1/4/1/4/21/6/1220/6/2/6/0/113/12431201A :A 是正交矩阵.(2)由 Y=AX 知, ,且1/4/1/4/2X ,4 42 21 1()i ii iYAXAX 所以 4442222114 4422 21 114218().ii iii ii i ii i iiiYYXXX由 ,Y= AX 知: .244(,)XNI: 244(,)YNAI1:而 ,故由定理 2.3.1 的推论 2 知 相互独立.224AI 1234,Y由知 均服从正态分布,且方差均为 ,1234,Y又 41/1/4/2010/6/2/6113/2A 所以 221(,)(0,),34).iYNYNi2-11 解: 设 21211212,exp( 465)fxxx 652142 221211 212112211 211221 比较上下式相应的系数,可得: 2/121214224132122 2211212122112exp()()()()xxx 比较上下式相应的系数,可得:2121211221112465解得: ,所以 .1212/431 1122 24 1,3 2-13 解: (1) ()()()()EXEXEX).(2) ()trtrtrEXAAAAtr ()()()tr()tr(). (3)22 21t=t =trppppAI I1,2 2 22222trtrtrtr (1)ppppI I p又 2 11() )()ppppppAaIa ,2 =()=0pp1 .2()()(1)EXAtrAp2-18 解: (1) () ()1111.nnnni iiiii i iiZEcXcEXcc(2)Z 为 p 维正态随机向量的线性组合,故 Z 也为正态随机向量, 又 ,22() ()111()( nnni iiii i iDccDc结合(1) 知 ,.pZN(3) ,且 为非负定矩阵222121()nnccc 对任意 p 维向量 ,有0x 21111() 0,nnn ixc-xc-xc-xc-xnn即 时,Z 的协方差阵在非负定意义下达到极小.1n第三章 多元正态总体参数的假设检验3-1 解:因为 对称幂等阵,而对称幂等阵的特征值非 0 即 1,且只有 个非 0A r特征值,即存在正交阵 (其列向量 为相应特征向量) ,使 ,ir tIA记 ,令 (即 ) ,),(1nrXYn1Y则 ,),(),(22 nn ININY,tit YIAX12222 0111因为 ,且相互独立,),)(,(rirYii 所以 ,tiXY1222 ,(1其中非中心参数为121 12 21(),tti t ti rrrr ( AIt 2203-2 解:记 .()rankr 若 ,由 ,知 ,于是 与 相互独立;OABnAXB 若 时,则 ,则两个二次型也是独立的.0r0以下设 .因 为 阶对称阵,存在正交阵 ,使得n 100 ,rrrDA=其中 为 A 的特征值 .于是01(,)ir,,r r=ABB00:令 其中 为 r 阶方阵, 122,nH=B:1H由于 ,121122r rrDDHA 0 00故 . 又因 为满秩阵,故有 .112,rrr 112(),rrn由于 为对称阵,所以 .H21()0nrH于是 2,=B令 ,则 ,X(,)nnYNI且 ,21()rriDXAYAYY 0,1220(,) rrnBHH由于 相互独立,故 与 相互独立11,rnYY AXB3-11 解:这是两总体均值向量的检验问题. 检验统计量取为( p=3,n=6,m=9):021,1)()HmpFTFpnmn下其中 2 112(2)()()()TnXYAXYnm故检验统计量为 1121()()()npFYYn用观测数据代入计算可得: 25.37,.498,TF显著性概率值 0.690p故 H0 相容.第五章 判别分析5-1 解:由题意,其错判概率为1121P()*()*(|)12121 11 1() ()( (( ) ( ) ( ) ( ) (1)(2)(2)(1),()( 21()12() )()()|1( 1(*1(*P)()( 2)2(1122)2(121 )()()()()()( 21()12()()(1 21()12() ).()( 12()21()5-2 解:由题意(1)样品 与三个总体 和 的马氏距离分别为x21,G3,15.0)()()22121 xd,65.)()()222,.01)35.()()22323 xd显然, ,则 ,即样品 应判归总体)()(,(min321 xd3G5.2x.3G(2)样品 与三个总体 和 的贝叶斯距离分别为x21,G3,386.0).1()ln()(121 xdD942ln56)222,50)l()(333x显然, ,则 ,即样品 应)()(,),(min2123221 xDxD1G5.2x判归总体 .G5-4 解: (1)可取 (组内)128207385357A(组间)(1)(2)(1)(2)101,5B类似于例 5.3.1 的解法, A -1B 的特征根就等于2(1)(2)1()(2) 3751065010,) 4.768381d 取 ,则 ,1()(2) 3658aA aA且 a 满足: 2().Bad判别效率: ,()4.706AFisher 线性判别函数为: 12()(3)8975uXaX 判别准则为 ,*12()Gu判 当判 当阈值为 ,其中(1)()*224.96u2111823786243, 0.7598759a22 012, .17539686(1)(1) 1(3,)2.708595ua (2)(2) 2046(,).899768故 .(1)(2)u当 时,(1)0X(1)20(3,)4.39089765uX因 ,判 .*(1)4.39u(1)2G当 时,(1)520(2)3,3.80589765uX因 ,判*()3.8uX(2)1.(2) )(075)|()( 12)1(212)1( XfLXfqhW(2) (2) ()1(1)() () ()2()5exp X )250(3218)250(1.7 1 ,192.75)10()0(1 )(75)1|2()()( 21)12212 XfLXfqhXW() () ()1(1)()2() () (2)15exp )2501(3218)2501(25.7 ,15.7)10()0(1 故 .,2)1(GX)2()(3) 122 111201820182()()ln|()()ln5353Dxd122 2020720207()()ln|()()ln5555Dxd , 21221exp(.()(1|) .36(0.5)0.()DxP .2221(.()(2|) 0.94exp(.)exp.5()x5-5 解: ()adadS(1)(2)(1)(2)def1XXaBaSS .1 1,SB其 中 为 的 最 大 特 征 值 且 仅 当 对 应 的 特 征 向 量 时 等 号 成 立又 1()(2)(1)(2)12(1)(2)1()(2)XXD ,与有相同的特征值. 故 ;1D以下验证 a 就是 D2 对应的一个特征向量:11()(2)(1)(2)1()(2)12.SBXXSXSDa 1()(2) 2,().aSX故 当 取 时 比 值 达 最 大 值5-6 解:记 是 X 的线性函数,()(),Wa211,),GN当 时 且 (1) (1)(2)1()(2)22(1)(2)1()(2)( EXadd 其 中21(1)(2)11()(2)2()DWaXaDXad :111 0(2|)()0|WPGP2111/()().22PUddd其中 1()(0,).WXUN2(2) 22212 1,()(,) ,Gad当 时 且 2222()0(|)()0|11/().WXPXGPUdd其中 2()(0,).WXUN第六章 聚类分析6-2 证明:设变量 Xi 和 Xj 是二值变量,它们的 n 次观测值记为 xti, xtj (t=1,n). xti, xtj 的值为 0 or 1.由二值变量的列联表(表 6.5)可知:变量 Xi 取值 1 的观测次数为 a+b,取值 0 的观测次数为 c+d;变量 Xi 和 Xj 取值均为 1 的观测次数为 a,取值均为 0 的观测次数为 d .利用两定量变量相关系数的公式: 1221()(ntiitjjtij ntiitjjt txxr又 1 1()()()()n ntiitjjtijijt t abcxxxnabacabcdnndc 22211()()()nntiitiit t abxxnabababcdnn 22211()()()ntjjtjjt t acxxnacacacbdnn 故二值变量的相关系数为: 1221()(7) ()()()ntitjjtij nti tjjt txxadbcC d利用两定量变量夹角余弦的公式: 12211cosntijtijnntitjttx其中 1,ntijtxa2211,nnti tjt txbxac故有 .(9)cos()()ij ijabc6-3 解:用最长距离法: 合并X (1),X(4)=CL4,并类距离 D1=1. 合并X (2),X(5)=CL3,并类距离 D2=3. (2)(3)(2) (5)093571084XCL(3)(3)9X 合并CL3,CL4=CL2,并类距离 D3=8. 所有样品合并为一类 CL1,并类距离 D4=10.最长距离法的谱系聚类图如下:用类平均聚类法: 合并X (1),X(4)=CL4,并类距离 D1=1. 合并X (2),X(5)=CL3,并类距离 D2=3. 合并CL3,CL4=CL2,并类距离 D3=(165/4)1/2. 所有样品合并为一类 CL1,并类距离 D4=(121/2)1/2.类平均法的谱系聚类图如下:(3)(4)012XCL(2)2 3(2) 2(5)09350614XCL(3)(3)201654X(3)(4)2102XCL6-6 解: 按中间距离法, 取 =-1/4, 将 B 和 C 合并为一类后,并类距离 D1=1,而 A与新类 Gr=B,C的类间平方距离为222211()0.5(1.)0.251.025.84ArABCBCDD当把 A 与B,C并为一类时,并类距离 2 1.8.9D故中间距离法不具有单调性。按重心法, 将 B 和 C 合并为一类后,并类距离 D1=1,而 A 与新类 Gr=B,C的类间平方距离为: 22220.51.10.25.8BCBCArAArrrnnDD当把 A 与B,C并为一类时,并类距离 2 10.85.92D故重心法法不具有单调性。并类过程如下: (1) (2) (3)0.1. 0.850 0rAADBDDGC6-7 解:因样品间的距离定义为欧氏距离,利用 ()()()1rpqrXnX2()()()()()()()()()()()()()2()()()()2()()112krkrrkpqrpqkkpkqr rppqqqrDXnXnXXnX 利用 2 2()()()()()()1 11();();q pkkkpq qr prpqr rr rrnnXnXnX n 2()()()()()()()()()()()()()()()()()()22pkkppkkqrkr rpqppqqrD XXnnXX 故有 2()()()()()()()()()()()()22 2p qkpkpkqkqrkr rpqpqpqrpqpqkkrrrn nDXXXXnnDDn 6-9 解: 计算样品间的欧氏平方距离阵 合并 1,2 CL4,并类距离 D1=(0.5)1/2 =0.707 ,并利用递推公式计算新类与其它类的平方距离得 (2)04496512078.51CL合并 5,7 CL3,并类距离 D2=(2)1/2 =1.414 ,并利用递推公式计算新类与其它类的平方距离得 (3)0381442901CL 合并 CL3,10=5,7,10 CL2,并类距离 D3=(32/3)1/2 =3.266 ,并利用递推公式计算新类与其它类的平方距离得 (4)022564CLD 合并 CL4,CL2=1,2,5,7,10 CL1,并类距离 D4 =(245/6)1/2 = 6.39 ,并利用递推公式计算新类与其它类的平方距离得 (5)01L 分类法 bk 及相应的总离差平方和 W(k):k=5 1,2,5,7,10 W(5)=0(1)00.56984.0235412820.3.54Dk =4 1,2, 5,7,10 W(4)=0.5k =3 1,2, 5,7,10 W(3)=2.5k =2 1,2, 5,7,10 W(2)=13.666k =1 1,2,5,7,10 W(1)=54第七章 主成分分析7-1 解: 从协方差阵出发:由题意得, 的特征值为 , 。相应的单位正交特征向量为164.0836.02, .9.31a4.9a故主成分为,2119.043.XZ.243从相关阵出发:由题意知, 的相关阵为X,104.R其特征值为 , . 相应的单位正交特征向量为*1.4*206, .17.a270a故主成分为,*1120.7.7ZX。20两者比较: 由 或 R 出发所得主成分不同; 由 出发时,第一主成分 Z1 解释的总方差比例为 100.1614/101=0.9917,由 R 出发时,第一主成分 Z1*解释的总方差比例为 1.4/2=0.7; 由于 X2 的方差大,故 Z1 完全由 X2 控制,而原变量标准化后,结论正好相反; 原始变量 X1,X 2 与第一主成分 Z1 的相关系数不相等,标准化后的变量X1*,X 2*与第一主成分 Z1*相关系数相等.7-3 解:(1)因 的最大特征值 ,而21(1)p.且最大特征值 对应的单位特征向量为223()p 1,故第一主成分为:1(,1)a.112()ZXXpp(2)第一主成分的贡献率为: . 212(1)pp7-4 解:等密度椭球为: 1()()XC设 的特征值为 ,相应的单位特征向量为 ,则120p 12,pa的谱分解式为: ,故1 1kka21 1221()()()()p pk kk kpkkXXXaZZCZ 即 .2221 1pZZCC因此椭球的第 i 个主轴方向在 X 的第 i 个主成分的方向上,且其半长轴与 成i比例,系数为 C. 7-5 解:由题意得, 的特征值为 , , . 相应的单位正交特征41223向量为, , .01a1203a故主成分为, .1XZ23XZ7-6 解:由题意得, 的特征值为 , , 。相)(2)21(3应的单位正交特征向量为, , 。21a20a213a故主成分为,其解释的方差比例为 ;321XXZ 32121,其解释的方差比例为 ;312 321,其解释的方差比例为 .3213XXZ 213217-7 解:见课本 P406.第八章 因子分析8-1 解: 容易验证, 0.90.197.5.5.50.7R AD因而因子载荷矩阵 A 和特殊因子的协方差阵 D 分别为:, 5.079.190.57即 的正交因子模型为1m31322115.079.FX误差为 .190.57D8-2 解: (1) 取 1m得 = =mll1A 507.9326.9.1.182.5误差为0.230D.91.43即 m=1 的因子模型主成分分解为 31322117.085.FX1() 0.970.1270.63.4510.729.67. 4. . 512.45.6.ERAD 则 2221(097.17041)0.9.Q(2) 取 m=2 得 mll1A=0.625-0.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论