多元统计分析期末试题及答案_第1页
多元统计分析期末试题及答案_第2页
多元统计分析期末试题及答案_第3页
多元统计分析期末试题及答案_第4页
多元统计分析期末试题及答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1、设 X N2(, ),其中X (X1,X2), (1,2), 2 1 1 , 则 Cov( X1 X2, X1 X2)= 2、设 X i 3(, ),i 1,L ,10,则 W = 10 =(Xi)( Xi i 1 ) 服从 。 4 4 3 3、设随机向量 Xx1x2x3 ,且协方差矩阵 4 9 2 3 2 16 则它的相关矩阵R 4 设X=Xi X2 X3,的相关系数矩阵通过因子分析分解为 1 1 2 3 3 0.934 0 0.934 0.417 0.835 0.128 R1 1 0 0.417 0.894 0.027 3 0 0.894 0.447 2 0.835 0.447 0.1

2、03 0 1 3 Xi的共性方差hi2 勺方差 11 公因子匚对X的贡献g1 。 5、设Xi,i 1,L ,16是来自多元正态总体Np( 的样本均值和样本离差矩阵,则 T2154( X ),X和A分别为正态总体Np(,) 1642 441 )A 14( X ) 。 1、设X (X1,X2,X3)N3(,),其中 (1,0, 2), 试判断x1 2x3与X2 X3是否独立? X1 2、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量, 得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的 均值 0(90,58,16),现欲在多元正态性的假定下检验该地区农村男婴是 否与城市男

3、婴有相同的均值。 82.0 4.3107 14.6210 8.9464 其中 X 60.2,(5 S) 1( 115.6924) 114.6210 3.172 37. 3760 14.5 8.9464 37.3760 35.5936 ( 0.01, F0.01 (3, 2) 99.2, F0.01 (3,3) 29.5, F0.01 (3, 4) 16.7) 3、设已知有两正态总体 G与G,且1 而其先验概率分别为q q2 0.5,误判的代价C(2|1) e4,C(1|2) e; 3 试用Bayes判别法确定样本X属于哪一个总体? 1 4、设X (X1,X2,X3,X4)T N4(0,),协方

4、差阵 1 1,0 1 (1)试从工出发求X的第一总体主成分; (2)试问当取多大时才能使第一主成分的贡献率达95%以上 ,且其协方差阵 5、设X (X1,X2)t,Y (y,x2)t为标准化向量,令Z V(Z) 100 0 0 0 11 12 0 1 0.95 0 21 22 0 0.95 1 0 0 0 0 100 求其第一对典型相关变量和它们的典型相关系数? 1、设随机向量X的均值向量、协方差矩阵分别为 试证:E(XX ) 2、设随机向量XNP(,),又设Y=ApX+br1, 试证:丫 Nr(A b,A A)。 1、0 2 、W (10,E) 2 3 1 4 1 4 1 6 4、0.872

5、 1.743 5、T2 (15, 卩)或(15p/(16-p) F( p, 1、令y X2 X3 2x3,则 X1 X2 X3 0 1 -1 X y1 1 0 0 y2 X1 X2 X12X3 1 0 2 X3 E % 0 1 - 1 1 2 1 0 0 0 1 y2 1 0 2 2 3 0 1 - 1 16 4 2 0 1 -1 V y1 1 0 1 04 4 1 1 0 0 y2 1 0 : 2 2 1 4 1 0 2 10 6 16 6 16 20 16 i 2040 2 10 6 16 故y1, y2的联合分布为2( 1 , 6 16 20 ) 3 16 20 40 故不独立。 n-p

6、) 2、假设检验问题:H。: 0, Hi : X 8.0 经计算可得:X 02.2 1.5 4.3107 14.6210 8.9464 S 1(23.13848) 1 14.6210 3.172 37.3760 8.9464 37.3760 35.5936 构造检验统计量: T2 n(X 0)S1(X 0) 6 70.0741 420.445 由题目已知F.01(3,3) 29.5,由是 Td.01 3 5 -.01 (3,3) 147.5 H0 所以在显著性水平0.01下,拒绝原设 即认为农村和城市的2周岁男婴上述三个 指标的均值有显著性差异 3、由Bayes判别知 W(x) f1(X) f

7、2(x) exp( x 1( 2) exp(4 x1 2x2 4) 其中,一 i( 1 1 ,(% %) qC1_2 qC(2|1) 3 e ,W(x 3 5) exp(2) G2 1 1 0得特征根为1 X X2 X3 X4 4、(1)由 2341 解1所对应的方程 得!所对应的单位特征向量为 1 - 1 1 2 2 2 2 1111 故得第一主成分Z 丄乂!丄乂2丄乂3 2 2 2 2 (2)第一个主成分的贡献率为 95% 0.95 4 1 3 0.933 由题得 1 0.1 0 -1 5、 2 一 11 一 2一 ,22一 0 1 1 1 TT t2 11 1 12 22 21 2 11

8、 0.1 0 0 0 1 0 0 010.95 00 0.010 求E的特征值得00 1 0 0 0.1 0.95 0.1 0 0 0 0 0 1 0 0.9025 0 2 0.9025 120.9025, :010.95 ttt的单位正交化特征向量 0 0 0 0.9025 e 0.9025e1, 1 11 e 0.100 0 11 1 1 1 1 22 21 1 11000.9501 0.95 00.10010 V1X2,W 0.54第 为第一典型相关变量,且( v1 ,w)0.95为一对典型相关系数。 1、证明:二V(X) E(X EX)(X E(XX ) (EX )(EX) E(XX

9、) 故E(XX ) 2、证明:由题可知Y服从正态分布, EX)E(Y) E(AX b) AE(X) b A b V(Y) V(AX b) AV(X)A A A 故 YNr(A b,AA)。 一、填空题: 1、多元统计分析是运用 数理统计方法来研究解决多指标问题的理论 和方法 2、 回归参数显著性检验是检验解释变量 对 被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分 析分为Q型聚类和R型聚类。 4、 相应分析的主要目的是寻求列联表行因素A和 列因素B的基本分析特 征和它们的最优联立表示。 5、 因子分析把每个原始变量分解为两部分因素:一部分为公共

10、因子,另一 部分为特殊因子 。 6若x( ) : Np( , ), =1,2,3.n且相互独立,则样本均值向量x服从的分布为 _xN(卩,工 /n)_ o 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关 系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取 相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选 出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素

11、A和B,其 中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查, 得到一个rc的二维列联表,记为 。要寻求列联表列因素 A和行因素B的基 本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A和 因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。 把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而 得到因素A、B的联系。 3、简述费希尔判别法的基本思想从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造 个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样 品的p个指标值代入

12、线性判别函数式中求出 值,然后根据判别一定的规则,就 可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定 域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判 假设做出决策(拒绝或接受) 协差阵的检验 检验艺艺0 Ho:艺 I p exp 1trS n/2 e np/2 Ip exp -trS 2 * n/2 np/2 统计量 n p/2 n Si i 1 n i/2 Sn/2 k pni/2 口 i 1 6在进

13、行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明 设dj表示样品X与X之间距离,用D表示类G与G之间的距离。 (1).最短距离法 Dj Xi mXj d. Gjdj Dkr Xi m. G % min Dkp, Dkq k j r (2) 最长距离法 Dpq 卷max Gq% (3) Dkr Xi max Gk,Xj Gr % maxgpDq 中间距离法 2 1 2 1 2 Dkr 2% 2D D:q (4)重心法 2 Dkr 匹Dkp n; nq n; 2 Dkq 即氏D2 2 Dpq n; (5) 类平均法 Diq 1 d2 ij Gj d2; npnq Xi G pXj Dp

14、q (Xp Xq)(Xp Xq)Xr W(npXp 风) 1 nknr Xi Gk Xj d: Gr np 2 p D2 kp nr 上D nr 2 kq (6)可变类平均法 Djr (1)(匹 Dkp 出 Djq) D;q nrnr 其中是可变的且1 (7)可变法 Dk;+(DkpDjq) D;q其中是可变的且1 nt_ (8)离差平方和法St(Xit Xt) (Xit Xt) t 1 2 nk np 2nknq2“k2 krDkpDkqDpq n;mn;mn;m 7、比较主成分分析与因子分析的异同点。相同点:两种分析方法都是一种降维、简化数 据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、 特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步 便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是 将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。主要区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论