多元统计分析期末试题及答案_第1页
多元统计分析期末试题及答案_第2页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1、设XN(P,Z),其中X二(x,x),P=(P,P),221212则Cov(x+x,x121-x)=2r1<pp'1丿2、设XiN(卩,Z),i=I,.。,则W3服从3、设随机向量X=(xx12x)',且协方差矩阵3-49-23、-216J则它的相关矩阵R=X的共性方差h2二11X的方差c1,1112、_33r0.9340r0.934-0.4170.835、r0.128'10=-0.4170.894,00.8940.447丿+0.027j0.8350.447丿丿j0.103丿01丿4、设X二(xxx)的相关系数矩阵通过因子分析分解为123rr11_323试判断

2、x+2x与13rx-x、23是否独立?公因子f对X的贡献g2=115、设X,i=1,16是来自多元正态总体N(P,Z),X和A分别为正态总体N(P,Z)iP_P的样本均值和样本离差矩阵,则T2=154(X-P)丫A-14(X-P)。r16-42、1、设X二(x,x,x)N(P,Z),其中P=(1,0,-2);Z=-44-112332、对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值卩=(90,58,16);现欲在多元正态性的假定下检验该地区农村男婴是0否与城市男婴有相同的均值。r82.0、r4.3107-14.62

3、108.9464、其中X=60.2,(5S)-1=(115.6924)-114.62103.17237.3760J4.5丿、8.9464-37.376035.5936丿(a=0.01,F(3,2)=99.2,F(3,3)=29.5,F(3,4)=16.7)0.010.010.01(2、r4、r11、3、设已知有两正态总体G与G,且卩=121<6丿,P=2<2丿,工=工=S=12J9/而其先验概率分别为q=q=0.5,误判的代价C(2|1)=e4,C(1|2)=e;试用Bayes判别法确定样本X=r3、<5丿属于哪一个总体?r1PPP、4、设X=(X,X,X,X)tN(0,幼,

4、协方差阵丫=P1Pp,0<P<112344PP1pIpPP1丿(1) 试从工出发求X的第一总体主成分;(2) 试问当取多大时才能使第一主成分的贡献率达95以上,且其协方差阵5、设X=(X,X)t,Y=(Y,X)t为标准化向量,1212(100000工11工21工12工22010.95000.9510求其第一对典型相关变量和它们的典型相关系数?1、设随机向量X的均值向量、协方差矩阵分别为小E,试证:E(XX')二Y+呼。2、设随机向量XN(卩,E),又设Y=AX+b,Prxprx1试证:YN(Ap+b,AEA')Or1、02、W(10,E)3、3(121、一34R二2

5、11一3一6111l4一6丿4、0.87211.7435、T2(15,戸)或(15p/(16p)F(p,np)、23,y2(x一x1、令y1y1y2x+2x,则131-1、(x、100x202丿lx丿311(01、(2、0=12丿l-3丿-1Y(y、(01-01、f16-42、(01-1、V1=100I-44-1II100ly2丿l102丿l2-14丿Il102丿100丿102y1y2(10-6-16、=-61620、-162040丿(2、故y,y_的联合分布为N_(1,-6l-1612l-3丿-6-16、1620)2040丿(10故不独立。2、假设检验问题:H:卩=卩,H:卩北卩0经计算可得

6、:X-卩=0S-1=(23.13848)-100"-8.0'2.2,J-1*5丿"4.310714.6210.8.946414.62103.17237.37608.9464、37.376035.5936丿构造检验统计量:T2二n(X-卩)S-1(X-卩)00二6x70.0741二420.445由题目已知F(3,3)二29.5,由是0.013x5T2二F(3,3)二147.50.0130.01所以在显著性水平a=0.01下,拒绝原设H0即认为农村和城市的2周岁男婴上述三个指标的均值有显著性差异3、由Bayes判别知(31"911"41"2

7、1,Z-1二-,(口一口)二J4丿8J11丿12J丿J2丿J4丿=exp(x一圧)tZ1(卩一卩)沁exp(4x+2x+4)12)=exp(2)<d=e312W(x)=4f(x)21其中,n=(卩+卩)=212九一14、(1)由-P-P-P-P九一1-P-P-P-P九一1-P-P-P-P九一1=0得特征根为九=1+3p,1九=九=九=1P234(k-1-P-P-P-Pk-1-P-P-P-Pk-1-P1-P-P-Pk-1解九所对应的方程1得1所对应的单位特征向量为&1x2X3X丿4111故得第一主成分Z=1X+丄X+1X2122(2)第一个主成分的贡献率为九1+3pT厂二n95%入

8、+入+入+入41234得pn0.95;4-1沁0.933+-X324-(0.10、-(10、5、由题得工2=,工211101J22、00.1丿-TTt=工_2工工-1工工_21112222111(0.10、(00、(10、(00.95、(0.10、(00、101J110.950J1100.01J1100J1101J1100.9025J求TTt的特征值,得0=:=九20.9025九0.9025九n九2=0.9025,九2=0nk=0.95121ttT的单位正交化特征向量-(0.10、(0、(0、a=工-2e=1101J111J111J1111(00)100.9025Je1二0.902叫P=九t工

9、t工a11222111(10)(00.95100.1J100.950(1V=X,W=0.54Y1211为第一典型相关变量,且p(V,W)=0.95为一对典型相关系数。11-EX)1、证明:S=V(X)二E(X-EX)(X二E(XXJ-(EX)(EXy二E(XX')-中'故E(XX')=+中,2、证明:由题可知Y服从正态分布,E(Y)=E(AX+b)=AE(X)+b=Ap+bV(Y)=V(AX+b)=AV(X)A=ASA'故YN(Ap+b,ASA')。一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法2、回归参数显著性检验是检验

10、解释变量对被解释变量的影响是否著3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。4、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示。5、因子分析把每个原始变量分解为两部分因素:一部分为公共因直,另一部分为J特殊因6、若xN(卩,2),a=1,2,3-n且相互独立,则样本均值向量x服从的分布为©)p_xN(u,/n)_。、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线

11、性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。2、简述相应分析的基本思想。相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因詡和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因A素和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、

12、B的联系。3、简述费希尔判别法的基本思想。从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的P个指标值代入线性判别函数式中求出直,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受。)协差阵的检验检验£=

13、£0H:£=I0p=exp<-trS2n/2Anp/2H:£=£丰I00p检验£=£=£H:£12k01=exp<-trS*>S*2n/2厂eAnp/2<n丿统计量九=nnp/2kFI|sih/2sinpni/2ii=16、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。设d表示样品X与X之间距离,用D表示类G与G之间的距离。(1)最短距离法jiJ1jD=mindjX.eG,X,eGjiijjD=mind=minD,DkrXeG,XeGijkpkqikjr2)最长距离法D=

14、maxdpqXeG,XeGijipjqD=maxd=maxD,DkrXeG,XeGijkpkqikjr3)中间距离法D2=D2+D2+pD2kr2kp2kqpq其中-一=注/(4)重心法=丄(nX+nX)nppD2=(X-X)(X-X)pqpqpqnnnnD2二亠D2+_qD2-pqD2krnkpnkqpq(5)类平均法D2=-LpqnnD2krpqX-叫Xj巴(6)可变类平均法nnkrXieGkXj尹d2ijnn=pD2+qD2nkprnkqrcnD2=(1-0)(D2+krnrkpnkqpq其中0是可变的邱1(7)可变法10D2=(D2+D2)+0D2kr2kpkqpq其中0是可变的邱1(8)离差平方和法St-X)f(X-X)ittittt=1nrn+nn+nnD2=kpD2+kqD2kD2krn+nkpn+nkqn+npqrkrkrk7、比较主成分分析与因子分析的异同点。相同点:两种分析方法都是一种降维、简化数据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。主要区别是:主成分分析本质上是一种线性变换

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论