应用多元统计(朱建平)课后答案解析_第1页
应用多元统计(朱建平)课后答案解析_第2页
应用多元统计(朱建平)课后答案解析_第3页
应用多元统计(朱建平)课后答案解析_第4页
应用多元统计(朱建平)课后答案解析_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

_第二章2.1.试叙述多元联合分布和边际分布之间的关系。解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X(X,X, X)的联合分布密度函数是一精品文档放心下载1 2 p个p维的函数,而边际分布讨论是X(X,X, X)的子向量的概率分布,其概率密度函数的维数小于p。精品文档放心下载1 2 p2.2设二维随机向量(X X)服从二元正态分布,写出其联合分布。谢谢阅读1 2解:设(X1f(x)

X)的均值向量为μ2,则其联合分布密度函数为,协方差矩阵为11221222121221/2121112exp2(xμ)112(xμ)。2222122122.3已知随机向量(XX)的联合密度函数为12f(x,x)2[(dc)(xa)(ba)(xc)2(xa)(xc)]121212(ba)2(dc)2其中axb,cxd。求谢谢阅读1 2(1)随机变量X和X的边缘密度函数、均值和方差;谢谢阅读1 2(2)随机变量X和X的协方差和相关系数;1 2(3)判断X和X是否相互独立。1 2(1)解:随机变量X和X1 2(x)d2[(dc)(x1a)感谢阅读x1 1 c2(dc)(xa)x 1 2(ba)2(dc)22(dc)(xa)x 1 2(ba)2(dc)22(dc)(xa)x12(ba)2(dc)2

的边缘密度函数、均值和方差;(ba)(xc)2(xa)(xc)]dx212(ba)2(dc)2d2[(ba)(x2c)2(x1a)(x2c)]dx谢谢阅读c(ba)2(dc)22cdc2[(ba)t2(x1a)t]dt感谢阅读0(ba)2(dc)2cd[(ba)t22(xa)t2]dc1(ba)2(d1c)2bac0所以_2由于X服从均匀分布,则均值为ba,方差为ba。12121xc,ddcdc服从均匀分布f(x)dc2同理,由于X1,则均值为,方差为。2x22其它2120(2)解:随机变量X和X的协方差和相关系数;12abdc2[(dc)(xa)(ba)(xc)2(xa)(xc)]cov(x,x)dbxx1212dxdx12ca1222(ba)2(dc)212(cd)(ba)36cov(x,x)1123x1x2(3)解:判断X和X是否相互独立。12X和X由于f(x,x)f(x)f(x),所以不独立。1212x11x222.4设X(X,X, X)服从正态分布,已知其协方差矩阵为对角阵,证明其分量是相互独立的随机变量。谢谢阅读1 2 p解:因为X(X,X,X)的密度函数为12pf(x,...,x)1p1(xμ)ΣΣ1/2211p2212又由于2Σp2Σ22212p1211Σ1221p2则f(x,...,x)p_12111pΣ12p1/21(xμ)Σ22222121p21p11(x)21(x)21(x)2exppp1123...212p22222212pp1(x)2expiif(x)...f(x)2221pi1ii则其分量是相互独立。2.5由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为ˆnXnμXii1ˆn(XX)(XX)nΣii135650.00ˆ12.33μX17325.00152.50201588000.0038900.0083722500.00-736800.00ˆ38900.0013.06716710.00-35.80Σ83722500.0016710.0036573750.00-199875.00-736800.00-35.800-199875.0016695.10110注:利用X1其中IX1,SX(I11)Xp1nnnnnnn012.6渐近无偏性、有效性和一致性;2.7设总体服从正态分布,X~N(μ,Σ),有样本X,X,...,X。由于X是相互独立的正态分布随机向量之和,p12n所以X也服从正态分布。又nnnnnμE(X)EXnEXμi1iii1i1_n1n1nΣD(X)DXnDXΣin2in2ni1i1i1所以X~N(μ,Σ)。pˆ1n2.8方法1:(XX)(XX)Σn1iii11nn1ii1ˆ1nE(XXnXX)E(Σ)1niii11nEXXnEXXn1iii11nΣ11)ΣΣ。Σnn(nn1i1n1方法2:Sn(X-X)(X-X)谢谢阅读i i1nX-μ(Xμ)X-μ(Xμ)感谢阅读i i1n(X-μ)(X-μ)2n(X-μ)(X-μ)n(Xμ)(XμXμ)精品文档放心下载i

i

ii1

i1n(X-μ)(X-μ)2n(Xμ)(Xμ)n(Xμ)(Xμ)谢谢阅读i1n(X-μ)(X-μ)n(Xμ)(Xμ)感谢阅读i1E(S)1n(X-μ)(X-μ)n(Xμ)(Xμ)n1n1ii1nΣ。1E(X-μ)(X-μ)nE(Xμ)(Xμ)niii1故 S 为Σ的无偏估计。12.9.设X(1),X(2),...,X(n)是从多元正态分布X~Np(μ,Σ)抽出的一个简单随机样本,试求S的分布。证明:设精品文档放心下载****Γ**11nn

_**()为一正交矩阵,即ΓΓI。*1ijn令Ζ=(ΖΖΖ)=XXXΓ,12n12n由于X(i1,2,3,4,n)独立同正态分布,且Γ为正交矩阵i所以()独立同正态分布。且有12nnΧ,E(Ζ)1nnμ,Var(Z)Σ。Ζ1E(Χ)nni1innini1n(a1,2,3,,n1)E(Ζ)E(rΧ)aajj1nnr1μajnj1 nμnrr 0ajnj1Var(Ζ)Var(nrΧ)a aj j1nr2VarΧΣnr2Σaj j ajj1 j1所以ΖΖΖ独立同N(0,Σ)分布。12n1n又因为S(XX)(XX)jj1nXXnXXj j1因为nXXnn1Xnnnii1nXXXX又因为jj121

1nXnii1X 1XXn2Xn

ZZn n_X1XXX212nXnZZZ1ZZ212nZnnn所以原式XXZZZZZZjjnnjjnnj1j1ZZZZ...ZZ-ΖΖ精品文档放心下载1122nnnnn1,Z独立同正态分布N(0,Σ),所以故S,由于Z,Z,jj12n1pj1n1S~W(n1,)jjpj12.10.设X(np)是来自N(μ,Σ)的简单随机样本,i1,2,3,,k,iipii(1)已知μμ...μμ且ΣΣ...ΣΣ,求μ和Σ的估计。12k12k(2)已知ΣΣ...ΣΣ求μ,μ,...,,μ和Σ的估计。12k12k解:(1)ˆ1knaa,nn...nxi12ka1i1xaxxaxknaˆiii1Σa1nn...n12k(2)lnL(μ,,μ,Σ)kln(2)pΣn2exp[1a(xaμ)Σ-1(xaμ)]kn2iaiaa1i11nlnΣ1kn(xa-μ)Σ-1(xa-μ)a222a1i1iaialnL(μ,Σ)n2Σ112kna(Xaμ)(Xaμ)Σ120Σiiaa谢谢阅读a1i1lnL(μ,Σ)njjΣ1(Xμ)0(j1,2,...,k)μijjj i1_njxxxxk解之,得ˆx1njxˆj1i1ijjijjnn...njjni1ijj12k第三章3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。精品文档放心下载其基本思想和步骤均可归纳为:0第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;感谢阅读第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。感谢阅读均值向量的检验:统计量 拒绝域均值向量的检验:在单一变量中当2已知(X)n|z|zz0当2未知t0)n/2(X|t|t(n1)S/2(S21n(XX)2作为2的估计量)n1ii1一个正态总体H:μμ0 0协差阵Σ已知T2n(Xμ)Σ1(Xμ)~2(p)000协差阵Σ未知(n1)p1T2~F(p,np)(n1)p(T2(n1)[n(Xμ)S1n(Xμ)])00两个正态总体H:μμ012有共同已知协差阵T2nm(XY)Σ1(XY)~2(p)0nm有共同未知协差阵F(nm2)p1T2~F(p,nmp1)(nm2)p

T22npT2F(n1)pT22F_(其中T2(nmnmnm2)nm(XY)S1nm(XY))协差阵不等nmF(np)n-1FFp协差阵不等nmF(np)n-1Z~F(p,np)FFp多个正态总体H:012k单因素方差SSA(k1)FFFSSE(nk)~F(k1,nk)多因素方差EE~(p,nk,k1)TAE协差阵的检验检验ΣΣ0:ΣIpH:ΣΣI0 0 p检验ΣΣ Σ H:Σ

1Sn/2enp/2exp2trSn1S*enp/2exptrS*n/22nΣ Σ12k012kkk统计量nnp/2Sni/2Sn/2npni/2kiii1i1第四章4.2试述判别分析的实质。答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于精品文档放心下载不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk是p维空间Rp的k个子集,如果它们互不相交,且它精品文档放心下载们的和集为Rp,则称R1,R2⋯Rp为Rp的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维精品文档放心下载空间R构造一个“划分”,这个“划分”就构成了一个判别规则。精品文档放心下载4.3简述距离判别法的基本思想和方法。答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个精品文档放心下载_总体的距离(马氏距离),将距离近的判别为一类。4.4简述贝叶斯判别法的基本思想和方法。基本思想:设k个总体G,G, ,G ,其各自的分布密度函数f(x),f(x), ,f (x),假设k个总体各自出现的概率谢谢阅读1 2 k 1 2 k分别为q,q,,q,q0,kq1。设将本来属于G总体的样品错判到总体G时造成的损失为C(j|i),12kiiiji,j1,2,,k。i1设k个总体G,G,,G相应的p维样本空间为R(R,R,,R)。12k12k在规则R下,将属于G的样品错判为G的概率为ijP(j|i,R)f(x)dxi,j1,2,,kijRji则这种判别规则下样品错判后所造成的平均损失为k,kr(i|R)[C(j|i)P(j|i,R)]i1,2,j1则用规则R来进行判别所造成的总平均损失为g(R)kqr(i,R)i1kqkC(j|i)P(j|i,R)感谢阅读ii1 j1贝叶斯判别法则,就是要选择一种划分R,R, ,R ,使总平均损失g(R)达到极小。谢谢阅读1 2 k4.5简述费希尔判别法的基本思想和方法。答:基本思想:从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数精品文档放心下载U(X)uXuX uX uX谢谢阅读1122pp系数u(u,u,,u)可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p个指标值代入线12p性判别函数式中求出U(X)值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.7设有两个二元总体G和G,从中分别抽取样本计算得到̅5̅3),=(5.82.1假设=2,试用距离判别法建立判别函数和判别规则。样品X=(6,0)’应属于哪个总体?谢谢阅读̅5̂̅=(3)̂==(4),,W=’(̅)=(̅)′Σ1()(̅)′=(6,0)(4,0.5)=(2,0.5)Σ1=1(7.62.1)()=(2,3)′W=(2,0.5)1(7.62.1)(2)=24.4>0_∴∈即样品X属于总体第五章5.2 试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每谢谢阅读个样品(或变量)总能聚到合适的类中。5.5试述K均值法与系统聚类法的异同。答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。谢谢阅读不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数谢谢阅读的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值精品文档放心下载法确定类数的参考。5.7 检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距感谢阅读离法,重心法进行聚类分析。(1)用最短距离法进行聚类分析。采用绝对值距离,计算样品间距离阵DGGGGGGG10G210G3210G45430G587630G61098520由上表易知D中最小元素是D=D=1于是将G,G,G聚为一类,记为G_计算距离阵DGGGGG70G430G5630G68520D中最小元素是D=2于是将G,G聚为一类,记为G计算样本距离阵DG G G G7 0G4 3 0G8630D中最小元素是D47=D=3于是将G,G,G聚为一类,记为G9因此,(2)用重心法进行聚类分析计算样品间平方距离阵D2GGGGGGG10G210G3410G4251690_G564493690G610081642540易知D2中最小元素是D2=D223=1于是将G,G,G聚为一类,记为G7计算距离阵D2GGGGG70G4160G54990G6812540注:计算方法D2=[6−1(1+2+1)]2,其他以此类推。D2中最小元素是D2=4于是将G,G聚为一类,记为G8计算样本距离阵D2(2)G7GGG70G4160G864160D2中最小元素是D247=D2=16于是将G,G,G聚为一类,记为G9因此,第六章6.1 试述主成分分析的基本思想。_答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性感谢阅读组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续精品文档放心下载这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。谢谢阅读6.2 主成分分析的作用体现在何处?答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得感谢阅读到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。谢谢阅读已知X=(X1,X2,X311√3/23/26.6)’的协差阵为√3/221/45√3/4试进行主成分分析。3/25√3/431/411−λ√3/23/2解:|Σ−λE|=|√3/2−λ5√3/4=0计算得−64(λ−4)(λ−8)(λ−12)=0∴λ=12,λ=8,λ=4∴D(Y1)=λ=12,D(Y2)=λ=8,D(3)=λ=4当λ=12时,√−275√3)⟶(12−54√330)⟶(0−√3165√3−171210√3−34000000000∴α=(2√3,1,√3)′同理,计算得=8时,α=(−2,√3,3)′ =4时,α=(0,−√3,1)′ 易知α,α,α相互正交 单位化向量得,=α√3,1,√3′‖α‖4_α=(1,√3,3)′=α=(0,√3,1)′∴=′,=′,=′综上所述,第一主成分为=√3X1+1X2+√3X3D()=1212441第二主成分为=1X1+X2+3X3D()=822442第三主成分为=X2+1X3D()=432236.7设X=(X,⋯,X)’的协方差阵(p×p)为1p1ρ⋯ρΣ=σ21⋯ρ,0<p<1⋮⋮⋱⋮[ρρ⋯1]证明:λ=σ2[1ρ(1ρ)]为最大特征根,其对应的主成分为Y=∑x。11√ρi=1iσ2λρσ2⋯ρσ2证明:Σλσ2λ⋯E|=||⋮⋮⋱⋮|ρσ2ρσ2⋯σ2λ(pρσ2+σ2λρσ⋯ρσ2|1)|(p+=|⋮⋮⋱ρσ2⋮|(p+λλ1)(p22λρσ2|1)+|=0σ2(1ρ)λ⋯ρσ2|⋮⋮⋱σ2(1⋮|0⋯0ρ)λ∵0<<1,λ=[(p1)ρ+1]σ2,λ=σ2(1p)12λλ=pρ>0 _∴λ=[(p−1)ρ+1]σ2为最大特征根当λ=[(p−1)ρ+1]σ2时,σ2ρ(1−p)ρσ2⋯ρσ2Σλ=ρσ2σ2ρ(1−p)⋯σ2ρ(1−p)⋮⋮⋱⋮(ρσ2ρσ2⋯σ2ρ(1−p))⟶(=(1,1,1,⋯)′=(1,1,⋯1)′√p√p√p1pi

ρ(1−ρ)ρ⋯ρ0ρ⋯001⋯00ρ(1−ρ)⋯ρ⟶ρ⋯0⟶(00⋯)⋮⋮⋱⋮⋮⋮⋱⋮00⋯0ρρ⋯ρ(1−ρ))(00⋯−ρρ)第七章7.1 试述因子分析与主成分分析的联系与区别。答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是谢谢阅读类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成感谢阅读分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标感谢阅读综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。感谢阅读因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方谢谢阅读向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分精品文档放心下载分析不需要构造分析模型而因子分析要构造因子模型。7.3 简述因子模型 = +中载荷矩阵A的统计意义。精品文档放心下载答:对于因子模型XaFaF aF aF i1,2, ,p谢谢阅读i i1 1 i2 2 ij j im m i_aaa11121m因子载荷阵为Aa21a22a2m(A,A,,A)12map1ap2apm与F的协方差为:jmaF,F)Cov(X,F)Cov(ijikkij1maF,F)Cov(,F)=Cov(ikkjijk1=aij若对Xi作标准化处理,rXi,Fj=aij,因此aij一方面表示Xi对Fj的依赖程度;另一方面也反映了变量Xi对公共因子Fj的相对重要性。ma2i1,2,,p变量共同度h2ijj1D(X)a2D(F)a2D(F) a2D(F)D()h22说明变量X的方差由两部分组成:第一部分为精品文档放心下载i i1 1 i2 2 im m i i i i共同度h2,它描述了全部公共因子对变量X的总方差所作的贡献,反映了公共因子对变量X的影响程度。第二部谢谢阅读iii分为特殊因子对变量X的方差的贡献,通常称为个性方差。ii而公共因子F对X的贡献g2pa2j1,2,,mjjij1表示同一公共因子F对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。谢谢阅读j7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?精品文档放心下载答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量谢谢阅读求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很精品文档放心下载难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载感谢阅读荷,而在其余的公共因子上的载荷比较小。最大方差旋转法是一种正交旋转的方法,其基本思路为:①Ad11d12⋯d1mdp1dp2⋯dpm其中令A*AΓ(a*),da*/hd1pd2ijpmijijijpij1*1A的第j列元素平方的相对方差可定义为Vp(d2d)2pjijj1②VVV V1 2 m_最大方差旋转法就是选择正交矩阵Γ,使得矩阵A*所有m个列元素平方的相对方差之和达到最大。谢谢阅读7.5 试分析因子分析模型与线性回归模型的区别与联系。谢谢阅读答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用函数关系式表达出来。感谢阅读因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即精品文档放心下载XaFaFaF,(i1,2,,p)该模型可用矩阵表示为:XAFε而回归分析模型中多ii11i22immi元线性回归方程模型为:yb+bx+bx+⋯+bx+ei其中b是常数项,b,b…b是偏回归系数,e是残差。因子模型满足:(1)mp; (2)Cov(F,ε)0,即公共因子与特殊因子是不相关的;精品文档放心下载10(3)D1I,即各个公共因子不相关且方差为1;D(F)Fm01201(4)DD(ε)2,即各个特殊因子不相关,方差不要求相等。02p而回归分析模型满足(1)正态性:随机误差(即残差)e服从均值为0,方差为2的正态分布;(2)等方差:精品文档放心下载对于所有的自变量x,残差e的条件方差为2,且为常数;(3)独立性:在给定自变量x的条件下,残差e的感谢阅读条件期望值为0(本假设又称零均值假设);(4)无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论