多元统计分析模拟考题及答案_第1页
多元统计分析模拟考题及答案_第2页
多元统计分析模拟考题及答案_第3页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(对)1X=(X-X 一,X丿的协差阵一定是对称的半正定阵(对)2标准化随机向量的协差阵与原变量的相关系数阵相同。( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。(对)4多维标度法是以空间分布的形式在低维空间中再现研究对彖间关系的数据 分析方法。( 错)5X = (X”X一,X丿竹(“),ES分别是样本均值和样本离_ £差阵,则乂,一分别是“上的无偏估计。n( 对)6%=(/,兀,X丿竹(“门),文作为样本均值“的估计,是 无偏的、有效的、一致的。( 错)7因子载荷经正交旋转后,各变量的

2、共性方差和各因子的贡献都 发生了变化( 对)8因子载荷阵4 = (6/,)中的知表示第i个变量在第j个公因子上的相对重要性。(对 )9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特定的要求。填空1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵.2、设工是总体X=(X“、X鳥的协方差阵,工的特征根&心=1,丿?)与相应的单位正交化特征向量a,则第一主成分的表达式是yl=liXl + al2X2+-+almXm ,方差为右。3设是总体X =(X”X2

3、,X3,XJ的协方差阵,为的特征根和标准正交特征向量分别为:人=2920 4 = (01485,-05735厂05577,0.5814)人=1.024 U; = (0.9544,0.0984,0.2695,0.0824)厶=0.049 U; = (0.2516.0.7733,-0.5589,-0.1624) 人= 0.007/= (0.0612,0.2519,0.5513,0.7930),则其第二个主成分的表达式是儿=0.9544/ - 0.0984X, + 0.2695X3 + 0.0824X4,方差为 1.0244. 若XgN”(“,E), (a = l,2,/ )且相互独立,则样本均值向

4、量片服 从的分布是7V/A-).n5. 设X,Np(“,DJ = l,2,16,戸和4分别是正态总体的样本均值和样本离差阵,则T2 =154(X-/)M-14(X-/)服从_T2(15,p)或典-尸(卩/ 卩) 16- p106 设 X,.N、(“,= 12 ,1 o,则 W =工(乙一 )(X, -2 服从淹(10, L)i=L4-43、7. 设随机向量X = (X1,X2,X3y ,且协差阵艺=_492,则其相关矩阵< 3-2 16,R二 / A362 1I 86 丿Jl p8. 设 X=(X“XJ ,其中 p = b :,则p 1 丿Cov(X1 + X2,X1-X2) = 0_9

5、设X,Y是来自均值向量为“,协差阵为工的总体G的两个样品,则X, Y间的马氏平方距离 d“X,Y)=(X-丫)'厂(X-丫)10设X,Y是来自均值向量为“,协差阵为工的总体G的两个样品,则X与总体G的马氏平方距离d (X G)二(X - )工t(X - )11设随机向量x =(xrx2,x3 y的相关系数矩阵通过因子分析分解为_1_32< 313100.9340 、'0.934-0.4170.835、P.128、-0.4170.8940.8940.447;+0.027、0.8350.447 丿、0.103,则乙的共性方差/?;= 0. 9340. 872,其统计意义是:描

6、述了全部公因子对变量XI的总方差所作的贡献,称为变量XI的共同度,反映了公共因子对变量XI的影响程度。 标准化变量XI的方差为1,公因子fl对X的贡献g; = 0. 934'+0.417+0. 835二1. 74312.对应分析是将Q型因子分析和R型因子分析结合起来进行的统计分析方法13典型相关分析是研究两组变量间相关关系 的一种多元统计方法14.聚类分析中,Q型聚类是指对 样本进行聚类,R型聚类是指对指标进行聚类。15 Spss for windows 中主成 分分析 由 Data Reduction->Factor Analysis 过程实现。16设Uk9Vk是第k对典型变量

7、则D(匕)= 1, D(vk) = l伙= 1,2,")Cov(ut,匕)=0, Cov(Vt,匕)=0 (/ 丰 j)2工0 (f=j,z = l,2,.= < 0(心 J)0(J > r)17.在多维标度分析中,当D是欧几里得距离阵时,X是D的一个构图三、简答题(答案见平时习题)1简述多元统计的主要内容与方法(10分)可对比一元统计列出多元统计的主要内容与方法(从随机变量及其分布、数字特征、四大分布(正态分布密度(1分)、r(n) 与威沙特分布(1分)、t分布与HotelingT2分布(1分)、F分布 与威尔克斯分布M1Wi2) (1分)、抽样分布定理、参数估计和假设

8、检验、 统计方法(2分)2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法,比较其异同3请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法,比较其异同4请阐述主成分分析和因子分析的基本思想、方法步骤和应用,比较其异同5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应 用四、计算题1 设三维随机向量X他(“,2/J(T/= 0(1人=0【000.51-0.5-100.50.5 丿,d =求Y = AX+ d的分布+1丿 /lbDY = D(,AX +d) = ADXA! =】-20-11解:正态分布的线性组合仍为正态,故只需求E(Y) = E(

9、AX +d) = AEX + d =所以 YN,(Ea),D(Y)另解: f (0.5X.-X. + 0.5X. + 1 Y=AX+d= 1-3(-0.5X1-0.5X3 + 2 )E(0.5X X2+0.5禺+ 1) = 2E(-0.5X -O.5X3 + 2) = 1故丫M(E(Y),D(Y)P(0.5X1-X2 + 0.5X3 + l) = 3D(0.5X_ 0.5禺+ 2) = 1COV(0.5Xi-X2+ O% +1? 0.5X - 0.5X3 + 2) = 12.设三维随机向量X他(门),< 2、"111、己知“=-3,2=1 3 2,求1丿/J 2 2丿Y = 3

10、Xl-2X2 + X5 的分布 解:正态分布的任意线性组合仍正态,故Y的分布是一维正态分布,只需求E(Y) = 3E(X J - 2E(X2) + E(X J = 13D(Y) = 32E(Xl) + 22E(X2)+E(Xz)-2Cov(3Xr2X2)+2Cov(3Xl,Xi)-2Cov(Xi,2X2) = 9故 Y 2(13,9)3设有两个二元总体Gi和G2 ,从中分别抽取样本计算得到18 15.Z / I=SP16Z7.假设Z' =Z2,试用距离判别法建立判别函数和判别规则。样品X二(6, 0)'应属于哪个总体?解:也刃M:),心浙)=(為,諾学二(爲Wp = (x -

11、p) = (x - p)*"- M2)(x.p)=(6,0)-(4A5) = (2A5)-i_1 ( 7.6_21、=3967k-15.8 丿1/76WP = (2A5)(_2-1-2.1p24.45 8 丿(3丿= 39.67- X EG即样品x属于总体G设已知有两个正态总体且“=<4>t丿,皿=z(1 1)=Z =工=U 9丿而其先验概率分别为ql = q2= 0.5,误判的代价L(2 |1)=八厶(l|2) = e,试用贝叶斯判别法确定样本x=:属于哪个总体?解:由g判别知,叫)=鶴沁(一叱(/)"3、其中W(x) = W81-1X(-24(3故乂 = 属

12、于G2总体5表1是根据某超市对不同品牌同类产品按畅销(1)、平销(2)和滞销(3)的数据, 利用SPSS得到的Bayes判别函数系数表,请据此建立贝叶斯判别函数,并说明如何判 断新样品(xl,x2, x3)属于哪类?Classification Function Coefficientsgroup123X1-11.689-10. 707-2. 194x212. 29713. 3614. 960x316. 76117. 0866. 447(Constant)-81. 843-94.536-17. 449Fisher's linear discriminant functions表1Bay

13、es判别函数系数解:根据判别分析的结呆建立Bayes判别函数:Bayes判别函数的系数见表4. 1。表中每一列表示样本判入相应类的Bayes判别函数系 数。由此可建立判别函数如下:Group 1: = 81.84311.689X1 + 12.297X2+16.761X3Group2:Y2 = 94.53610.707X1+13.361X2 + 17.086X3Group3:Y3 = 17.4492.194X1 + 4.960X2 + 6.447X3将新样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函 数值,哪个函数值比较人就可以判断该样品判入哪一类。6.对某数据资料进

14、行因子分析,因子分析是从相关系数阵出发进行的,前两个特征根 和 对 应 的 标 准 正 交 特 征 向 量 为 人=2.920 U; = (0.1485,0.5735,0.5577,0.5814),A = 2.920 (/; = (0.1485,0.5735,0.5577,0.5814)(1) 取公因子个数为2,求因子载荷阵(2) 用F1F2表示选取的公因子,勺,为特殊因子,写出因子模型,说明因子载荷 阵中元素®的统计意义7在一项对杨树的形状研究中,测定了 20株杨树树叶,每个叶片测定了四个变量X15X2,X3,X4分别代表叶长,叶子2/3处宽,1/3处宽,1/2处宽,这四个变量的相

15、 关系数矩阵的特征根和标准正交特征向量分别为:人=2.920 U'、= (0.1485,0.5735,0.5577,0.5814)入=1.024 U; =(0.9544,0.0984,0.2695、0.0824)血=0.049 U; = (0.2516,0.7733,0.5589,0.1624)人=0.007 U'4 = (0.0612,0.2519,0.5513,0.7930)若按一般性原则选取主成分个数,请写出主成分表达式,并计算每个主成分的方差贡献率解:选取主成分的一般原则是特征值人于1或累枳贡献率达到80%以上。据题选取两个 主成分,其表达式和贡献率分别是:y1 = 0

16、.1485X1-0.5735X2-0.5577X3-0.5814X4,贡献率为人=2.920儿=0.9544X】0.0984X2 +0.2695禺 + 0.0824/,贡献率为人=1.0248卜表是进行因子分析的结呆,试根据表中信息写出每个原始变量的因子表达式,并分析是否需要对因子载荷旋转。Component MatrixComp on ent123X1.969-1.084E-02.205X29X.321-.102X3.847-.120.323X4.941.281-2.693E-02X5.899.215-1.963E-02X6-.313.839.305X7-.6666.280E-02.679X8.575-.580.367Extract! on Method: Principal Comp on ent Analysis, a 3 components extracted.解:由表F1F2F3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论