北大多元统计分析答案_第1页
北大多元统计分析答案_第2页
北大多元统计分析答案_第3页
北大多元统计分析答案_第4页
北大多元统计分析答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 多元正态分布及参数的估计2-1 解:利用性质2, 得二维随机向量YN2(my,Sy),其中:2-2 (1)证明:记Y1 X1 +X2 (1,1) X, Y2 X1X2 (1,1) X,利用性质2可知Y1 , Y2 为正态随机变量. 又故X1 +X2和X1X2相互独立.另证:记,则因故由定理可得X1 +X2和X1X2相互独立.(2)解:因为所以2-3 (1)证明:令,则. 因为由定理可知X(1) +X(2)和X(1) -X(2) 相互独立.(2)解:因为,所以2-6 解:(1)记B=(3,-1,1), 由性质2得,.(2)令 , 显然 均服从正态分布, 故要使它们相互独立,只需即可. 又

2、因,故当时满足条件.2-9 解:(1)A是正交矩阵.(2)由Y=AX知, ,且,所以由 ,Y=AX知:. 而,故由定理的推论2知相互独立.由知均服从正态分布,且方差均为 ,又 所以 2-11解:比较上下式相应的系数,可得:设比较上下式相应的系数,可得:解得:,所以.2-13解:(1)(2) (3),又,.2-18解:(1) (2)Z为p维正态随机向量的线性组合,故Z也为正态随机向量, 又 ,结合(1)知 (3),且为非负定矩阵对任意p维向量,有即 时,Z的协方差阵在非负定意义下达到极小.第三章 多元正态总体参数的假设检验3-1解:因为对称幂等阵,而对称幂等阵的特征值非0即1,且只有个非0特征值

3、,即存在正交阵(其列向量为相应特征向量),使,记,令(即),则,因为,且相互独立,所以,其中非中心参数为3-2解:记. 若,由,知,于是与相互独立; 若时,则,则两个二次型也是独立的.以下设.因为阶对称阵,存在正交阵,使得其中为A的特征值.于是,令其中 为r阶方阵, 由于,故. 又因为满秩阵,故有.由于为对称阵,所以.于是 令,则,且,由于相互独立,故与相互独立.3-11解:这是两总体均值向量的检验问题. 检验统计量取为(p=3,n=6,m=9):其中故检验统计量为用观测数据代入计算可得: 显著性概率值 故H0相容.第五章 判别分析5-1 解:由题意,其错判概率为5-2 解:由题意(1)样品与

4、三个总体和的马氏距离分别为显然,则,即样品应判归总体.(2)样品与三个总体和的贝叶斯距离分别为显然,则,即样品应判归总体.5-4解:(1)可取(组内)(组间)类似于例的解法, A-1B的特征根就等于 取,则,且a满足:判别效率:,Fisher线性判别函数为: 判别准则为,阈值为,其中故.当时,因,判.当时,因,判(2) 故 .(3) , .5-5 解:.又有相同的特征值. 故; 以下验证a就是D2对应的一个特征向量:5-6 解:记是X的线性函数,其中其中第六章 聚类分析6-2证明:设变量Xi和Xj是二值变量,它们的n次观测值记为xti, xtj (t=1,n). xti, xtj 的值为0 o

5、r 1.由二值变量的列联表(表6.5)可知:变量Xi取值1的观测次数为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的观测次数为a,取值均为0的观测次数为d .利用两定量变量相关系数的公式:又故二值变量的相关系数为:利用两定量变量夹角余弦的公式:其中故有 .6-3解:用最长距离法: 合并X(1),X(4)=CL4,并类距离 D1=1. 合并X(2),X(5)=CL3,并类距离 D2=3. 合并CL3,CL4=CL2,并类距离 D3=8. 所有样品合并为一类CL1,并类距离 D4=10.最长距离法的谱系聚类图如下:用类平均聚类法: 合并X(1),X(4)=CL4,并类距离 D1=1.

6、 合并X(2),X(5)=CL3,并类距离 D2=3. 合并CL3,CL4=CL2,并类距离 D3=(165/4)1/2. 所有样品合并为一类CL1,并类距离 D4=(121/2)1/2.类平均法的谱系聚类图如下:6-6解:按中间距离法, 取=-1/4,将B和C合并为一类后,并类距离D1=1,而A与新类Gr=B,C的类间平方距离为当把A与B,C并为一类时,并类距离故中间距离法不具有单调性。 按重心法, 将B和C合并为一类后,并类距离D1=1,而A与新类Gr=B,C的类间平方距离为:当把A与B,C并为一类时,并类距离故重心法法不具有单调性。并类过程如下: 6-7解:因样品间的距离定义为欧氏距离,

7、利用利用故有6-9解:计算样品间的欧氏平方距离阵 合并 1,2 CL4,并类距离D1=(0.5)1/2 =0.707 ,并利用递推公式计算新类与其它类的平方距离得合并 5,7 CL3,并类距离D2=(2)1/2 =1.414 ,并利用递推公式计算新类与其它类的平方距离得 合并 CL3,10=5,7,10 CL2,并类距离D3=(32/3)1/2 =3.266 ,并利用递推公式计算新类与其它类的平方距离得 合并 CL4,CL2=1,2,5,7,10 CL1,并类距离D4 =(245/6)1/2 = 6.39 ,并利用递推公式计算新类与其它类的平方距离得 分类法bk及相应的总离差平方和W(k):k

8、=51,2,5,7,10W(5)=0k =41,2, 5,7,10W(4)=0.5k =31,2, 5,7,10W(3)=2.5k =21,2, 5,7,10W(2)=13.666k =11,2,5,7,10W(1)=54第七章 主成分分析7-1解:从协方差阵出发:由题意得,的特征值为,。相应的单位正交特征向量为 , .故主成分为,.从相关阵出发:由题意知,的相关阵为 ,其特征值为,. 相应的单位正交特征向量为, .故主成分为,。两者比较: 由或R出发所得主成分不同; 由出发时,第一主成分Z1解释的总方差比例为100.1614/101=0.9917,由R出发时,第一主成分Z1*解释的总方差比例

9、为1.4/2=0.7; 由于X2的方差大,故Z1完全由X2控制,而原变量标准化后,结论正好相反; 原始变量X1,X2与第一主成分Z1的相关系数不相等,标准化后的变量X1*,X2*与第一主成分Z1*相关系数相等.7-3 解:(1)因的最大特征值,而.且最大特征值 对应的单位特征向量为 ,故第一主成分为:.(2)第一主成分的贡献率为:. 7-4 解:等密度椭球为: 设的特征值为,相应的单位特征向量为,则的谱分解式为:,故即 .因此椭球的第i个主轴方向在X的第i个主成分的方向上,且其半长轴与成比例,系数为C. 7-5 解:由题意得,的特征值为,. 相应的单位正交特征向量为 ,.故主成分为,.7-6解

10、:由题意得,的特征值为,。相应的单位正交特征向量为 , ,。故主成分为,其解释的方差比例为;,其解释的方差比例为;,其解释的方差比例为.7-7 解:见课本P406.第八章 因子分析8-1解: 容易验证,因而因子载荷矩阵A和特殊因子的协方差阵D分别为:, 即的正交因子模型为误差为8-2解:(1) 取得=误差为即m=1的因子模型主成分分解为 则(2) 取m=2得=误差为 即m=2的因子模型主成分分解为 (3)因,所以的主成分分解符合要求.8-3证明:利用分块矩阵求逆公式求以下分块矩阵的逆:记利用附录中分块求逆的二个公式(4.1)和(4.2)有:由逆矩阵的对应块相等,即得:把B22·1和B11·2式代入以上各式,可得:由第三式和第二式即得8-5 答:因子分析与主成分分析的不同点有: (1) 主成分分析不能作为一个模型来描述,它只是通常的变量变换,而因子分析需要构造因子模型; (2) 主成分分析中主成分的个数和变量个数p相同,它是将一组具有相关关系的变量变换为一组互不相关的变量(注意应用主成分分析解决实际问题时,一般只选取前m(m<p)个主成分),而因子分析的目的是要用尽可能少的公共因子,以便构造一个结构简单的因子模型; (3) 主成分分析是将主成分表示为原变量的线性组合,而因子分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论