43-第四章第三节(概率统计)_第1页
43-第四章第三节(概率统计)_第2页
43-第四章第三节(概率统计)_第3页
43-第四章第三节(概率统计)_第4页
43-第四章第三节(概率统计)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章随机变量的数字特征4.3协方差及相关系数第四章随机变量的数字特征内容摘要:对于二维随机变量(X,Y),我们除了讨论X与Y的数学期望和方差以外,还需研究描述X与Y之间相互关系的数字特征.有关这方面的数字特征有协方差、相关系数和各阶矩.4.3协方差及相关系数4.3.1提出问题

1.

如何分析两个随机变量之间的相互关系呢?

2.如何刻画两个随机变量之间线性相关的程度呢?4.3.2预备知识

1.数学期望,方差,标准差;

2.

线性函数,矩阵及对称矩阵.

定义1量E{[X-E(X)][Y-E(Y)]}称为随机变量X与Y的协方差.记为Cov(X,Y),即Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}.(4.3.1)而

称为随机变量X与Y的相关系数.注意:

ρXY是一个无量纲的量.

4.3.3

提出概念证证明:(1)ρX*Y*=Cov(X*,Y*);(2)ρX*Y*=ρXY.例4.3.1

设X*,Y*为X与Y的标准化随机变量,即由对称性得到E(Y*)=0,D(Y*)=1.

先证(1):再证(2):

=E{[X*-E(X*)][Y*-E(Y*)]}=E(X*Y*)

=ρXY.

4.3.4

分析性质

定理1

对于任意两个随机变量X和Y,下列等式成立(设协方差存在):(1)Cov(X,X)=D(X).(2)Cov(X,Y)=Cov(Y,X).(3)若X与Y相互独立,则Cov(X,Y)=0.(4)Cov(X,a)=0,a为常数.利用数学期望的性质知,结论(1),(2),(3)和结论(4)成立.1.

协方差的性质

(8)D(X±Y)=D(X)+D(Y)±2Cov(X,Y).(4.3.4)(5)Cov(X,Y)=E(XY)-E(X)E(Y).(4.3.3)(6)Cov(aX,bY)=abCov(X,Y),a,b是常数.(7)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z).

证明(5):Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E[XY-YE(X)-XE(Y)+E(X)E(Y)]=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y).

利用协方差和数学期望的性质,易证结论(6),结论(7)和结论(8)成立.

定理2

设随机变量X与Y的相关系数ρXY存在,则有(1)ρXY=ρYX

;(2)|ρXY|≤1;(3)|ρXY|=1的充分必要条件是:存在常数a(a≠0),b,使P{Y=aX+b}=1.2.相关系数的性质及实际意义

讲评

我们常利用结论(5)计算协方差.证

结论(1)可由协方差的性质(2)推知.

现证结论(2).设X*,Y*为X与Y的标准化随机变量,由例4.3.1和定理1中性质(8)得到

0≤D(X*±Y*)=D(X*)+D(Y*)±2Cov(X*,Y*)=D(X*)+D(Y*)±2ρX*Y*=

1+1±2ρXY

=2(1±ρXY).由此可得

由(2)可知D(X*±Y*)=2(1±ρXY),可见,ρXY

=±1的充分必要条件是取可知上式又等价于

P{Y=aX+b}=1.再由

质(5)知,上式等价于及方差的性再证结论(3).

(1)

从这个证明我们还知道,若a>0,有ρXY

=1,这时称X与Y正线性相关;若a<0,有ρXY

=-1,这时称X与Y负线性相关.一般地,若ρXY

>0,则称X与Y正相关;若ρXY

<0,则称X与Y负相关.当ρXY

=0时,我们称X与Y不相关.显然,它等价于X与Y的协方差为零.讲评

相关系数的实际意义是:|ρXY|的

大小反映了X与Y的线性相关程度.当

|ρXY|

较大时,则X与Y的线性相关程度

较好;当|ρXY|较小时,则X与Y的线性相关程度较差.

(2)对于标准化随机变量和有相关系数等于协方差,即

ρXY=ρX*Y*=Cov(X*,Y*).

(5)对于正态分布,若(X,Y)服从正态分布,那么X和Y相互独立的充要条件是相关系数

ρXY

=0.

(4)当X与Y相互独立时,X与Y不相关.但是,若X与Y不相关,X与Y不一定相互独立.

(3)相关系数ρXY刻划的是X与Y之间的线性关系的强弱.

例4.3.2再继续解读例3.3.1和例4.2.2:设二维随机变量(X,Y)的分布律为

XY01p.j12pi.1(1)

计算X与Y的协方差以及相关系数;(2)

问随机变量X与Y是否独立,是否不相关呢?(1)

已知X的数学期望为

解而于是,随机变量X与Y的协方差为随机变量X与Y的相关系数为(2)

由例3.3.1知,随机变量X与Y相互独立.

随机变量X与Y的相关系数ρXY=0,即随机变量X与Y不相关.

应注意:随机变量X与Y“不相关”与“独立”并不等价.参见下例.

由例4.1.2知,随机变量X和Y的数学期望E(X)=0和E(Y)=0.

例4.3.3再继续解读例3.3.2和例4.1.2:设二维随机变量(X,Y)的概率密度为解已知随机变量X与Y不相互独立,再问连续型随机变量X与Y是否不相关?从而得到Cov(X,Y)=0,即有=0.这表明随机变量X和Y是不相关的,虽然随机变量X与Y不相互独立.分析上述例题,得到如下的两个问题:

问题1是,为什么随机变量X与Y不相互独立呢?感性上可以这样来理解:随机点(X,Y)落入单位圆x2+y2≤1内,X与Y之间存在着制约关系X2+Y2≤1.

因此随机变量X与Y不相互独立.

问题2是,既然随机变量X与Y不相互独立,也就是存在着制约关系,为什么它们又不相关呢?要注意,现在的制约关系是X2+Y2≤1,而不是说“存在线性关系”.

X和Y不相关只是说明二者之间没有线性关系,是否有其他(如平方关系)关系并没有回答.

例4.3.4设二维随机变量

(X,Y)服从二维正态分布,即(X,Y)~N(μ1,μ2,σ12,σ22,ρ).试分析各个参数的意义.

结果是:E(X)=μ1,E(Y)=μ2,

D(X)=σ12,D(Y)=σ22,

ρXY=ρ.定理3若(X,Y)服从二维正态分布,那么X与Y相互独立的充要条件是X与Y不相关.4.3.3′矩的概念

这里再介绍随机变量的另外的几个数字特征,它们在后面的数理统计学习中经常用到.

定义2

设X和Y是随机变量,若E(Xk)(k=1,2,…)存在,称它为X的k阶原点矩,简称k阶矩.

若E{[X-E(X)]k}(k=2,3,…)存在,称它为X的k阶中心矩.

若E(XkYl)(k,l=1,2,…)存在,称它为X和Y的k+l阶混合矩.

若E{[X-E(X)]k[Y-E(Y)]l

}(k,l=1,2,…)存在,称它为X和Y的k+l阶混合中心矩.

显然,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩,协方差Cov(X,Y)是X和Y的二阶混合中心矩.

下面介绍n维随机变量的协方差矩阵.

cij=Cov(Xi,Xj)

=E{[Xi-E(Xi)][Xj-E(Xj)]},

i,

j=1,2,…,

n都存在,则称矩阵为n维随机变量(X1,X2,…,Xn

)的协方差矩阵.由于cij=cji(i≠j,i,j=1,2,…,n),因而上述矩阵是一个对称矩阵.

讲评

一般情况下,n维随机变量的分布是不知道的,或者是太复杂,以致在数学上不容易处理,因此在实际应用中协方差矩阵就显得重要了.4.3.6内容小结

方差D(X)=E{[X-E(X)]2}描述随机变量X与它的数学期望E(X)的偏离程度,我们常用公式

D(X)=E(X2)-[E(X)]2

计算方差,注意E(X2)和[E(X)]2的区别.计算协方差常用公式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论