(完整版)应用多元统计分析课后答案_朱建平版_第1页
(完整版)应用多元统计分析课后答案_朱建平版_第2页
(完整版)应用多元统计分析课后答案_朱建平版_第3页
(完整版)应用多元统计分析课后答案_朱建平版_第4页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X( X1, X 2,LX p ) 的联合分布密度函数是一个 p 维的函数,而边际分布讨论是X( X1, X 2 ,L X p ) 的子向量的概率分布,其概率密度函数的维数小于 p。2.2 设二维随机向量 ( X1X 2 ) 服从二元正态分布,写出其联合分布。2解:设 ( X1X 2 ) 的均值向量为 12,协方差矩阵为112,则其联合分布密2212度函数为1221/2121f (x)112exp( x)112(x) 。22222122122.3 已知随机向量 (X1X 2 ) 的联合密度

2、函数为f (x1, x2 )2(dc)( x1a) (ba)( x2c)2( x1 a)( x2 c)(b a)2 (d c)2其中 a x1b , c x2d 。求( 1)随机变量 X1 和 X2 的边缘密度函数、均值和方差;( 2)随机变量 X1 和 X2 的协方差和相关系数;( 3)判断 X1 和 X2 是否相互独立。( 1)解:随机变量 X1 和 X2 的边缘密度函数、均值和方差;d 2( d c)( x1a)(ba)( x2c)2( x1a)( x2c)dxf x ( x1 )221c(ba) (dc)2( dc)( x1dd 2( ba)( x2c)2( x1a)( x2c)a)x

3、2(b a)2(d c)2cc(b a)2(d c)2dx22( dc)( x1a)x2ddc 2(ba)t2( x1a)tdt22022(b a) (d c)c(b a) (d c)da)t 2a)t 2d c2( dc)( x1a)x2(b2( x11(b a)2 (d c)2c(b a)2 (d c) 20b ab2所以由于 X1 服从均匀分布,则均值为ba ,方差为a。1221同理,由于X 2服从均匀分布 fx2( x )dx1 c, d,则均值为 dc ,方差2c20其它2dc为。12( 2)解:随机变量X1 和 X2 的协方差和相关系数;cov( x1, x2 )dx1a bx2d

4、 c 2( dc)( x1 a) (ba)( x2c)2( x1 a)( x2 c)dx1dx2bca22(ba)2(dc)2(c d )(ba)36cov( x1, x2 )1x1x23( 3)解:判断 X1 和 X2 是否相互独立。X1和 X2由于 f ( x1 , x2 )f x1 ( x1 ) fx2 (x2 ) ,所以不独立。2.4设 X( X1, X 2,LX p ) 服从正态分布,已知其协方差矩阵为对角阵,证明其分量是相互独立的随机变量。解:因为X(X1,X2,LX p ) 的密度函数为pf (x1,., xp )11/21 (x ) 1( x ) exp22212又由于 2O2

5、p22212 Lp1211 12则 f ( x1 ,., xp )2O12p1211p1/21122L2) 12(x )212pexp(x22O12p1p11 ( x11 )21 ( x23 ) 21 (xpp )2L21 2pexp222.22122pp1( xii)2expf ( x1 ). f ( xp )则其分量是相互独立。i 122i2i2.6渐近无偏性、有效性和一致性;2.7设总体服从正态分布,XNp(, )X 1 , X 2 ,., X n。由于X是相互独立的正态分布随 ,有样本机向量之和,所以X 也服从正态分布。又nnnE(X )EX inEX in ni 1i 1i 1D(X

6、) DnX in1nD X i1nn2n2n所以 X N p (,) 。i 1i 1i 1?1n1n2.8( X iX )( X iX )X i X inXX方法1: n1 i 1n1 i1?1n1nE X iX i nE XXE(X i X inXX )E( )n 1n1 i 1i11n1ni 1 n 1(n 1) 。nn1nn方法2:S( X i- X)(X i - X )X i- (X)X i - ( X)i1i1nn(X i - )(X i- )2(X i - )(X - )n( X)(X X )i 1i 1n(X i- )( X i - )2n(X)(X )n(X)(X)i1n(X

7、i- )( X i - )n(X)(X)i1S1n)E( X i - )( X i - )n( X )(X )E (n1n 1i 11nE(X i - )( X i - )nE( X)(X)S故为 的无偏估计。1。ni 1n12.9.设 X (1) , X(2) ,., X (n) 是从多元正态分布 X N p (, ) 抽出的一个简单随机样本,试求S 的分布。*L*L*证明: 设*L*(ij) 为一正交矩阵,即 I 。11L1nnn令=(12L n ) = X 1X 2L X n ,由于 X i(i1,2,3, 4,Ln)独立同正态分布 , 且 为正交矩阵所以(12Ln ) 独立同正态分布

8、。且有1n1ni,E (n )E( i ),Var (Z n )。nn in1n i 1nE (a )E(raj j )(a1,2,3, L, n 1)j1nnnr aj1 n raj rnj0j1ni 1nVar (a )Var (raj j )j1nnraj2Varjraj2j 1j 1n所以 L独立同N (0, ) 分布。又因为S(X jX )(X jX )12n 1i 1nj 1X j X jnXX1n1n因为 nXXnnX inX iZ nZ nn i 1n i1X1X 1nX 2X 2X j X jX1X 2X nX 1X 2L又因为X n j1MX nX nZ 1Z 1Z 2LZ

9、 nZ 2MZ nnn所以原式X j X jZ nZ nZ j Z jZ n Z nZ1Z1Z2Z2.Z n Z n - n nj1j 1n1Sjj,由于Z1, Z2 ,L, Zn 1Np (0,) ,所以故独立同正态分布j1n1Sj1jj W p ( n1,)2.10.设Xi (nip)是来自Npiii1,2,3, L, k,(,) 的简单随机样本,( 1)已知 12.k且 12.k,求 和 的估计。( 2)已知 .求 ,., 和的估计。12k1,2kknaxiax xiax?1knaa?a1 i 1解:( 1),xi xn1n2 .nkn1n2.nka 1i 1pn 21kna(x a-

10、) -1(x a(2)ln L(1,L,k , )ln(2)exp- )2 a1 i 1iaialn L(, )1pn ln( 2 )n ln 1222kna(x a - ) -1 (x a - )iaiaa 1 i 1ln L(,)n11knaa1 2aa )22 a( X ia )( X i01 i1ln L(j , )n j 1( X ijj) 0( j1,2,.,k )解之,得ji 11nj, ?x jxijjnj i 1knjxijx j x ij x jj1 i 1n1n2.nk第三章3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为:第

11、一,提出待检验的假设和 H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。均值向量的检验:统计量拒绝域均值向量的检验:在单一变量中当2 已知z( X0 ) n| z| z / 2当2 未知t( X0 )n| t | t /2 (n 1)S1n( S2( Xi X )2 作为2 的估计量)n1 i 1一个正态总体H 0: 0协差阵已知2n( X1( X0 ) 2( p)22T00 ) T0协差阵 未知(n1)p1T 2 F ( p, n

12、p)npT 2F(n1) p( n1) p( T 2(n 1) n ( X 0) S 1 n( X0) )两个正态总体 H 0: 12有共同已知协差阵T02n m ( XY) 1(XY ) 2 ( p)T022nm有共同未知协差阵F(nm2)p1T 2 F ( p, nm p1)F F( nm 2) p(其中 T2( nm2)n m (XY )S 1n m ( XY ) )n mn m协差阵不等协差阵不等n mF( n p)n Z S-1Z F ( p, n p)F Fpn mF(n p) n Z S-1Z F ( p,n p)F Fp多个正态总体H0: 12k单因素方差FSSA (k1) F

13、 (k1,nk)F FSSE (n k)多因素方差EE( p, nk, k1)TA E协差阵的检验检验 0H 0: I pexp1 tr SSnp /2en /22n1* n / 2 enp/ 2H 0: 0 I pexp*2tr SSn检验 12 L k H 0: 12L kkk统计量knnp / 2Sini / 2S n / 2ni pni /2i 1i13.2试述多元统计中霍特林分布和威尔克斯分布分别与一元统计中t 分布和 F 分布的关系。答:(!)霍特林分布是 t 分布对于多元变量的推广。t 2n( X) 2n( X) (S2 ) 1 ( X) 而若设 X N p (, ) , S W

14、p (n, ) 且 X 与SS2相互独立, np ,则称统计量的分布为非中心霍特林T2 分布。若XN p 0 S Wp (n, )S21且X与相互独立,令TnX S X, 则(, ),n p 1T 2 F ( p, n p 1) 。np( 2)威尔克斯分布在实际应用中经常把统计量化为 T 2 统计量进而化为F 统计量,利用 F 统计量来解决多元统计分析中有关检验问题。与 F 统计量的关系pn1n2任意任意1任意任意21任意任意2任意任意F 统计量及分别n1p1 1( p, n1 ,1)1)p F ( p, n1 p( p, n1,1)n1p1( p,n1, 2)p)p F (2 p, 2( n

15、1( p, n1, 2)n1 1(1,n1, n2 ) F (n2 , n1 )n2(1,n1, n2 )n111(2, n1 , n2 )n2 F (2 n2, 2( n1 1)(2, n1 , n2 )3.3试述威尔克斯统计量在多元方差分析中的重要意义。答:威尔克斯统计量在多元方差分析中是用于检验均值的统计量。H 0: 1 2 L kH :至少存在 ij 使 1ijEE( p, n k, k 1) 给定检验水平用似然比原则构成的检验统计量为TA,查EWilks 分布表,确定临界值,然后作出统计判断。第四章4.1简述欧几里得距离与马氏距离的区别和联系。答:设 p 维欧几里得空间中的两点X=和

16、 Y=。则欧几里得距离为。欧几里得距离的局限有在多元数据分析中,其度量不合理。会受到实际问题中量纲的影响。设X,Y是 来 自 均 值 向 量 为, 协 方 差 为的 总 体G 中 的p维 样 本 。 则 马 氏 距 离 为D(X,Y)=。当即单位阵时, D(X,Y)=即欧几里得距离。因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2, , Rk 是 p 维空间 R p 的 k 个子集,如果它

17、们互不相交,且它们的和集为,则称为的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间构造一个“划分” ,这个“划分”就构成了一个判别规则。4.3简述距离判别法的基本思想和方法。答:距离判别问题分为两个总体的距离判别问题和多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。两个总体的距离判别问题设有协方差矩阵相等的两个总体1 和2,其均值分别是1 和2 ,对于一个新的样品,要判断它来自GGX哪个总体。计算新样品X到两个总体的马氏距离2(1)和2(2),则DX,GDX,GX,2(X G1)2DD(X, G),222,X, D(X,

18、G1 )>D(X,G2具体分析,D2(X,G1) D2(X,G2)( X 1) 1 (X 1) ( X 2 ) 1 (X 2 )X 1X 2X 11 111(X 1X 2X 12212 )2X 1(21) 1112122X 1( ) ( ) 1( )211212 1122X (12 )22(X) 2( X)记W(X)(X)则判别规则为X,W(X)X, W(X)<0多个总体的判别问题。设有 k 个总体 G1 , G2 ,G k ,其均值和协方差矩阵分别是1, 2 , ,k和 1,2 , k ,且。计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。12k具体分析, D2

19、(X,G )( X ) 1 (X )X 1X 2 1X 1X 1X2(IXC )取 I 1 , C1 1 ,1,2, k 。2可以取线性判别函数为W (X)IXC,1,2, k相应的判别规则为XGi若 Wi (X )max( IXC )1k4.4简述贝叶斯判别法的基本思想和方法。基本思想:设 k 个总体 G1 ,G2,G k ,其各自的分布密度函数f1 ( x), f 2 (x ), f k (x) ,假设 k 个总体各k总体的样品错判到总体 G j 时自出现的概率分别为q1,q2 ,q k , qi0 ,qi1 。设将本来属于 Gii1造成的损失为 C ( j | i ) , i , j1,

20、2, k 。设 k 个总体 G1 , G2 ,G k 相应的 p 维样本空间为R(R1 , R2 , , Rk ) 。在规则 R 下,将属于 Gi 的样品错判为 G j 的概率为P( j | i , R)fi (x)dxi , j1,2, k ijR j则这种判别规则下样品错判后所造成的平均损失为kr (i | R) C ( j | i )P( j | i, R)i 1,2, kj1则用规则 R 来进行判别所造成的总平均损失为kkkg( R)qi r (i, R)qiC ( j | i ) P( j | i, R)i1i 1j1贝叶斯判别法则,就是要选择一种划分R1, R2, Rk ,使总平均

21、损失 g( R) 达到极小。kkkk基本方法: g( R)qiC ( j | i )P( j | i, R)qiC ( j | i)f i ( x)dxi 1j1i 1Rjj 1kkkkRj(qi C ( j | i) fi ( x) dx 令qiC ( j | i) fi (x )hj (x) ,则 g( R)h j (x)dxi1i 1jRjj 11k若有另一划分 R*( R1* , R2* , , Rk* ) , g( R* )* h j (x)dxjR j1kk则在两种划分下的总平均损失之差为g( R)g(R* )RR* hi ( x) h j ( x)dxi 1j 1ij因为在 Ri

22、 上 hi ( x)hj ( x) 对一切 j成立,故上式小于或等于零,是贝叶斯判别的解。R (R1 , R2 , , Rk )Ri x | hi( x)min hj(x)i 1,2,k从而得到的划分为1 j k4.5 简述费希尔判别法的基本思想和方法。答:基本思想:从 k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数U (X ) u1 X1 u2 X 2 L up X p u X系数 u (u1 , u2 , u p ) 可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出U( X) 值,然后根据判别一定的规则

23、,就可以判别新的样品属于哪个总体。4.6试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答: 费希尔判别与距离判别对判别变量的分布类型无要求。 二者只是要求有各类母体的两阶矩存在。 而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当 k=2 时,若则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。 当时,费希尔判别用作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是X,W(X)X,W(X)<lnd距离判别的判别规则是X,W(X)X, W(X)<0二者的区别在于阈值点。当 q1q2 , C (1| 2)C (2 |1) 时, d 1, ln d 0 。二者完全相同。4.7设有两个二元总体和,从中分别抽取样本计算得到,假设,试用距离判别法建立判别函数和判别规则。样品 X=(6,0)应属于哪个总体?解:=,=,=,即样品 X 属于总体第五章5.1判别分析和聚类分析有何区别?答:即根据一定的判别准则,判定一个样本归属于哪一类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论