应用多元统计(朱建平)课后答案解析_第1页
应用多元统计(朱建平)课后答案解析_第2页
应用多元统计(朱建平)课后答案解析_第3页
应用多元统计(朱建平)课后答案解析_第4页
应用多元统计(朱建平)课后答案解析_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章

2.1.试叙述多元联合分布和边际分布之间的关系。

解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X=(X”X2,…XQ'的联合分布密度函数是一

个p维的函数,而边际分布讨论是X=(X”X2,…XQ'的子向量的概率分布,其概率密度函数的维数小于p。

2.2设二维随机向量(X1X2)'服从二元正态分布,写出其联合分布。

解:设(X|X2)'的均值向量为N=(4〃2)',协方差矩阵为巧5;,则其联合分布密度函数为

%7

[(2V1

--(X-MX0b;>o

2I%(r2

2.3已知随机向量(X1X2)'的联合密度函数为

2[(d-c)(Xj-a)+(b-a)(x2一c)一2(%—a)(x2-c)]

(b—a)~(d—c)2

其中。<用<〃,c<x2<do求

(1)随机变量X,和X2的边缘密度函数、均值和方差;

(2)随机变量X,和X2的协方差和相关系数;

(3)判断X1和X?是否相互独立。

(1)解:随机变量X]和X2的边缘密度函数、均值和方差;

¥_2Kd-C)(M—a)+(/?-Q)@2—c)-2(玉一a)(x-c)]

"J_L(b-a)\d-cf2

2(J-c)(x1-a)x22[(b-a)(x2-c)-2(x,-a)(x2-c)]

3-a)2(d-3—〃)2(d—c)2

d

2(d—c)(X]-a)x2+ed-c2[(b—a)t-2(%—a)t\出

S-a)2(d-c)2—(h-a)\d-c)2"

_2(d-c)(Xj-d)x2[(人一。)广一2(西一。)厂[1

(b-a)2(d-c)2(b-a)2(d—c)~0b—u

所以

h+a,方差为自二£1

由于X|服从均匀分布,则均值为

212

1

X©,'典,则均值为三,方差为巴立

同理,由于X?服从均匀分布/r,(X2)=1d-C

212

0其它

(2)解:随机变量X,和X2的协方差和相关系数;

(玉,:a+bd+c]2[(J-c)(x-a)+(/?-a)(x-c)-2(x-tz)(x-c)]

COV9)=£'Jx,---------12t2-dxdx

122(b-a)2(d-c)2}2

(c—d)(b—ci)

36

cov(xpx2)1

---------=7

p=crcr3

Xv|以v

(3)解:判断X1和X?是否相互独立。

X]和X2由于/(%,工2)力匕。)九(%2),所以不独立。

2.4设X=(X「X2,…X。)'服从正态分布,已知其协方差矩阵Z为对角阵,证明其分量是相互独立的随机变量。

解:因为X=(X1,X2,…X,,)'的密度函数为

-1/2exp卜((x一四)£|(x-N)

2

国=…b;

1

I

2

CT;

1

则y(X1,

J_(W-〃3)2__1(无、-//J

-一…一耳可

p]exp(-。厂>

=/G).../(%)

端]

/■=!CT12兀I2

则其分量是相互独立。

2.5由于多元正态分布的数学期望向量和均方差矩阵的极大似然分别为A=4=Zx,/〃

(=1/

t=^(X,.-X)(X,.-

1=1

35650.00、

12.33

17325.00

152.50)

<201588000.0038900.0083722500.00-736800.00、

38900.0013.06716710.00-35.80

s=

83722500.0016710.0036573750.00-199875.00

、-736800.00-35.800-199875.0016695.10,

-10一

_1

注:利用X⑻=—X]“,S=J1(]“』工)X其中/,,=

nn

01

2.6渐近无偏性、有效性和一致性;

2.7设总体服从正态分布,X~N,,3,E),有样本X],X2,...,X,,。由于又是相互独立的正态分布随机向量之和,

所以及也服从正态分布。又

所以4~M,(内X)。

2.8方法1:£=-6(%-又)区一支)'

1«____

=——>X,X;—〃又又'

1n____

E(力=--5(^X,.X;-»XXJ)

〃-1普

1^E(X,.X;)-nE(XXf)

n-\i=l

—!—五-〃三=—(n-l)E=Eo

方法2:S=t(X/&(X「N)'

;=1

i=l

=Z(X,.-N(x,r)'-2Z(x,.-n)(x-N'+«(X-H)(X|1-如)'

「Nz

=£(X|i)(X;-|i)'-2n(X-g)(X-)'+n(X-n)(X-g)

/=1

=£(X「N)(Xfy-〃(又一H)(又一>

/=l

,l

Q\(__

风口不£沁川区冲)〜(…(…,

=fE(X「M)(X,.-M'—〃E(又一⑴(又一")']=E。

«-H,=i7

故二一为£的无偏估计。

n-\

2.9.设X“),X⑵是从多元正态分布X~N/H,E)抽出的一个简单随机样本,试求S的分布。

证明:设

***、

***

***=(%)为一正交矩阵,即rr=i。

111

Vrtyjn

令Z=(Z|z2...zn)=(x1x2...xjr,

由于Xi(i=1,2,3,4,…〃)独立同正态分布,且r为正交矩阵

所以Z'=(Z|Z2•••Z“)独立同正态分布。且有

j=l

二1,I

j=i7n

=〃屯4%=。

1=1

Var(Z(l)=Var(traJXj)

j=l

-Zr(Xj)=Et寸*

j=ij=i

所以Z1Z2Z,I独立同N(0,E)分布。

又因为S=£(X,—及)(Xj—及)'

i=l

=£XjX]-底父

;=l

因为点T==Z“Z:

Vvni=i八5/〃i=i7

X、

/、,x;2

=(X.X2...xn)rr:

%

2、

2

=(Z]Z2•••Zn),

_,1

所以原式£X,X',「Z“Z:=£Z£-z“z;

j=lj=l

ZW+Z2Z;+...+Z“Z;-ZnZ:

n-\

故5=22,2;,由于ZiZ,…,Z,i独立同正态分布M,(0,£),所以

J=1

s=£M-lzz~%(〃T2)

J=1

2.10.设Xj(%xp)是来自N〃(内的简单随机样本,i=l,2,3,…次,

(1)已知“=Ji?=…=出=N且Ei=22=…=工衣=X,求Ji和X的估计。

(2)已知%=E2=...=XA=X求出,人,…,,氏和X的估计。

1k»a

解:(1)g=x=-------------------,

/+%+...+nkM,=1

i±(x:-)(x:-刘

E_"=1i=l_______________________

勺+%+…+%

(2)InL(内,・・・,4,£)

=叩2万)1町’2exp[-比W(x:2”px…

L<7=1/=1

1〃]N〃“

In2)=-3P〃皿2万)—不皿国—JZ£*-儿)》“H-儿)

L乙,a=lZ=1

SinL(ji,E)M]"""/」2

=一不+zz(X;—4)(x:—4)'()=0

也z/a=\i=l

31nL(',E)年E-1(X厂均)=0(1/=1,2,.../)

讯/=1

i±x尸川

:U_X.

解之,得再1力打

』=」=1i=l

勺+%+…+%

第三章

3.1试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。

其基本思想和步骤均可归纳为:

答:第一,提出待检验的假设Ho和H1;

第二,给出检验的统计量及其服从的分布;

第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;

第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受卜

均值向量的检验:

统计量拒绝域_______________

均值向量的检验:

在单一变量中

当b?已知z=$26以>%,2

(7

当,未知t=史上册

1〃_

(S2=——Z(X,-又)2作为人的估计量)

一个正态总体“0:=(10

协差阵21已知窗=〃(床一百—〃o)~/(p)

协差阵£未知(”1)—〃+172~F(p,n_p)

(n-l)p

2

(T=(n-l)[^(X-jioyS-'^(X-no)])

两个正态总体“0:出=卜2

"2=2121x-Y)-L-'(X-Y)~2(p)

有共同已知协差阵(Z窗>片

n+m

(n+m—2)—p+1右/,八

有共同未知协差阵F=-----------------------T2〜jF(p,〃+初一p_1)F>F

(n+m-2)/?a

n-m——n-m

(其中T2=(n+m-2)-------(X-Y)(X-Y)

n+mn+m

协差阵不等n=inF△〃-P)32sl2~F(p,n-p)

P

协差阵不等尸=(〃-')〃~1(p,〃—p)

F>Fa

P

多个正态总体Ho:M=〃2=…=d

SSA/(I)

单因素方差~F(k-l,n-k)F>F

SSE/(n-k)a

|E||E|

多因素方差

协差阵的检验

检验£=

A=expj-|rrs[|S|

H。:

”。:£=H,谷

检验月=4,..=%%G=%=••="

统计量2,=*2由s02/|S『2立产2

第四章

4.2试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于

不同类别的样本点尽可能地区别开来。设R1,R2....Rk是p维空间Rp的k个子集,如果它们互不相交,且

它们的和集为RP,则称%,Rz-Rp为Rp的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p

维空间Rp构造一个“划分”,这个'划分”就构成了一个判别规贝上

4.3简述距离判别法的基本思想和方法。

答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个

总体的距离(马氏距离),将距离近的判别为一类。

4.4简述贝叶斯判别法的基本思想和方法。

基本思想:设k个总体G,G?,…,G*,其各自的分布密度函数/;(X),/2(X)「、_A(X),假设k个总体各自出现的概率

分别为名,以,…,以,/NO,之%=1。设将本来属于G,.总体的样品错判到总体G,时造成的损失为C(/|i),

/=!

设k个总体G,,G2,--,Gk相应的p维样本空间为A=(与,&,…,&)。

在规则A下,将属于G,的样品错判为G,的概率为

P(jTi,R)=k〃x)dxi,j=\,2,--,ki^j

则这种判别规则下样品错判后所造成的平均损失为

《|R)=£[COIi)P(/1i,R)]i=1,2,…水

j=l

则用规则R来进行判别所造成的总平均损失为

g(R)=£qN,R)

i=l

=fq£c(jii)p(jii,R)

i=]j=l

贝叶斯判别法则,就是要选择一种划分鸟,6,,使总平均损失g(R)达到极小。

4.5简述费希尔判别法的基本思想和方法。

答:基本思想:从左个总体中抽取具有〃个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数

U(X)=%X]+u2X3-\----F%Xp=u'X

系数U=(%,…,勺)'可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的P个指标值代入线

性判别函数式中求出u<x)值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

4.7设有两个二元总体Gi和G2,从中分别抽取样本计算得到邓1)=(:),近2)=G),Sp=噌第假设心=

工2,试用距离判别法建立判别函数和判别规则。样品X=(6,0)'应属于哪个总体?

解:再4⑴=©,再或⑵=C),解咿=(嘘)

Wp=a'(x-p)=(x-口),NIm-g2)

(x-p)'=(6,0)-(4,0.5)=(2,0.5)

1(7.6-2.1\

2-3967(-2.15.8)

仙-%)=(2,3),

Wp3)盛(总献◎受。

XEG】即样品X属于总体Gi

第五章

5.2试述系统聚类的基本思想。

答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每

个样品(或变量)总能聚到合适的类中。

5.5试述K均值法与系统聚类法的异同。

答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。

不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数

的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值

法确定类数的参考。

5.7检测某类产品的重量,抽了六个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距

离法,重心法进行聚类分析。

(1)用最短距离法进行聚类分析。

采用绝对值距离,计算样品间距离阵D(°)

GiG2G3G4G5G6

GI0

G210

G3210

G45430

G587630

G61098520

由上表易知D(o)中最小元素是D12=D23=1于是将Gi,G2,G3聚为一类,记为G?

计算距离阵D㈠)

G73—Gs—_________________

G70

G430

G5630

8520

G6

D(1)中最小元素是D56=2于是将G5,G6聚为一类,记为G8

计算样本距离阵D,、

(2)

G7G4G&

G70

G430

G8630

口。)中最小元素是D47=D48=3于是将G4,G7,Gg聚为一类,记为Gg

123,

(2)用重心法进行聚类分析

计算样品间平方距离阵D2(。)

G

GIG2G3G45G6

Gi0

10

G2

G3410

251690

G4

64493690

G5

10081642540

G6

2

易知D2(O)中最小元素是D2]2=D23=1于是将Gi,G2,G3聚为一类,记为G7

计算距离阵D2(1)

G7G4G5G6

G70

G4160

G54990

G6812540

注:计算方法D247=[6-|(1+2+1)]2,其他以此类推。

D2j)中最小元素是D?56=4于是将G5,G6聚为一类,记为G8

计算样本距离阵D2,、

(2)

G7G4G8

G70

G4160

G864160

22

D(2)中最小元素是D247=D48=16于是将G4,G7,G8聚为一类,记为Gg

因此,

G60

14侬

第八早

6.1试述主成分分析的基本思想。

答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在着一定程度的相关性,人们希望能通过线性

组合的方式从这些指标中尽可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个线性组合。继续

这个过程,直到提取的信息与原指标差不多时为止。这就是主成分分析的基本思想。

6.2主成分分析的作用体现在何处?

答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得

到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。

11V3/23/2

6.6已知X=(Xi,X2,X3)'的协差阵为V1/221/45V3/4试进行主成分分析。

3/25V3/431/4

J>>

11-AV3/23/2

解:,-网=V3/2与一八5V3/4=0

3/25V3/4y-A

计算得一64(入一4)(入-8)(八一12)=0

A=12,A=8,A=4

L23

・・・D(YJ=A=12,D(Y)=A=:8,D(Y3)=A=4

i223

-42V36\(T26V318\/-2V33

当入=12时(ZRE)2V3-275V3一12-54V3301--V3

1♦0

65V3-17/\1210V3-34/\o0

-20-2\/I0-2\

0V3-1->0V3-1

000/\000/

0]=(2遍,1,V3p

同理,计算得

入2=8时,。2=(-2,8,3),

\=4时,a2"。,-存1)’

易啊,。?出相互正交

单位化向量得,T1=:\=Wi

211124

T2一扃一='Z'Z)扃_(0「>5)

..Yi=T]X,Y2=T2X,Y3=T3X

综上所述,

第一主成分为Yi=1X"X+^X

23D(Y0=12

第二主成分为丫2=晟Xi+fx2+^X3

D(Y2)=8

第三主成分为丫3=—当X2+1x3

D(Y3)=4

6.7设X=(Xi,…,Xp),的协方差阵(pxp)为

1PP

2

Z=oP1P0<p<1

PP1

2

证明:入i=o[1-p(1-p)]为最大特征根,其对应的主成分为Yi=十毙J。

p

222

0-入p。P。

222

证明:-入E|=poo-AP。

222

pop°o-A

2222

(p-l)po+o-APCTP。

2222

(p—l)po+o-Ao-A・po

222

(p-l)po4-O-A…o-A

2222

(p一l)po4-o-Ap°・••per

22

0o(1-p)-AP。

2

0…0o(1-p)-A

•・•0VpV1,

22

入i=[(P-1)P+1]\=o(1-P)

入]—入2=PP>0

2

:•\=[(P-1)P+1]O为最大特征根

2

当,=[(p_l)p+l]o时,

222

OP(1-P)P。per

222

Z_~E卜P。OP(1-P)。P(1-p)

222

perP0。P(1-p)

P(l-P)pp0p0

0p(l-p)p—>0—pP0

ppP(1-p)/00-PP

010

—>00

00

第七章

7.1试述因子分析与主成分分析的联系与区别。

答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是

类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成

分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标

综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。

因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方

向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分

分析不需要构造分析模型而因子分析要构造因子模型。

7.3简述因子模型X=AY+E中载荷矩阵A的统计意义。

答:对于因子模型

aF+£

Xj=%耳+«,2^2+…+%鸟+…+i,nmij=1,2,…,.

«.2…'

因子载荷阵为二"=(A,&,...,4)

aa

_piP2•1•a*

X,.与写的协方差为:

Cov(X,.,F)=Cov(ZajkFk+%,F)

k=\

=Cov(Z,丹)+Cov(与,F)

k=\

二%

若对X,作标准化处理,rxi,Fj=%,因此%一方面表示Xj对工.的依赖程度;另一方面也反映了变量七对公共因子

与的相对重要性。

变量共同度i=l,2,…,p

j=l

D(XJ=a:D(FJ+aMD(FJ+…+*D(F“J+D(j)说明变量X;的方差由两部分组成:第一部分为

共同度月,它描述了全部公共因子对变量X,的总方差所作的贡献,反映了公共因子对变量X:的影响程度。第二部

分为特殊因子£,对变量X,的方差的贡献,通常称为个性方差。

而公共因子与对X的贡献g;=£片/=1,2,…,加

i=l

表示同一公共因子弓对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。

7.4在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?

答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量

求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很

难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载

荷,而在其余的公共因子上的载荷比较小。

最大方差旋转法是一种正交旋转的方法,其基本思路为:

(dn由2dim

①A-A*T;:::

\dpidp2dpm

其中令A=AT=(阳)“3◎.二%./“

pH

iP

A”的第./列元素平方的相对方差可定义为匕=%@-7/

P1=1

②^二匕+匕+…+%

最大方差旋转法就是选择正交矩阵「,使得矩阵A,所有m个列元素平方的相对方差之和达到最大。

7.5试分析因子分析模型与线性回归模型的区别与联系。

答:因子分析模型是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法的模型。而

线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用函数关系式表达出来。

因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即

Xi=ai[Fi+ai2F2+---+aimFm+£i,(/=1,2,)该模型可用矩阵表示为:X=AF+£而回归分析模型中多

元线性回归方程模型为:y1=b0+b1x1+b2x2HFbnxn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论