(2021年整理)方差与协方差理解_第1页
(2021年整理)方差与协方差理解_第2页
(2021年整理)方差与协方差理解_第3页
(2021年整理)方差与协方差理解_第4页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、方差与协方差理解方差与协方差理解 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(方差与协方差理解)的内容能够给您的工作和学习带来便利。同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快 业绩进步,以下为方差与协方差理解的全部内容。13 / 132 方差、协方差与相关系数2。1方差例1 比较甲乙两人的射击技术,已知两人每次击中环数分布为::.问哪一个技术较好?首先看两人平均击中环

2、数,此时,从均值来看无法分辩孰优孰劣。 但从直观上看,甲基本上稳定在8环左右,而乙却一会儿击中10环,一会儿击中6环,较不稳定。因此从直观上可以讲甲的射击技术较好。上例说明:对一随机变量,除考虑它的平均取值外,还要考虑它取值的离散程度。称-为随机变量对于均值的离差(deviation),它是一随机变量. 为了给出一个描述离散程度的数值,考虑用,但由于=0对一切随机变量均成立,即的离差正负相消,因此用是不恰当的。 我们改用描述取值的离散程度,这就是方差.定义1 若存在,为有限值,就称它是随机变量的方差(variance),记作var,var= (1)但var的量纲与不同,为了统一量纲,有时用,称

3、为的标准差(standard deviation).方差是随机变量函数的数学期望,由1的(5)式,即可写出方差的计算公式var= (2)进一步,注意到=即有var=. (3)许多情况,用(3)式计算方差较方便些.例1(续) 计算例1中的方差var与var.解 利用(3)式=0.1+0。8+0.1=64。2,var=64。2=0。2.同理, var= 65.2-64 = 1.2 var, 所以取值较分散。 这说明甲的射击技术较好。例2 试计算泊松分布p()的方差.解 所以var。例3 设服从 a, b 上的均匀分布u a, b,求var。解 , var。例4 设服从正态分布,求var.解 此时用

4、公式(2),由于,var 。可见正态分布中参数就是它的方差, 就是标准差.方差也有若干简单而重要的性质。 先介绍一个不等式.切贝雪夫(chebyshev)不等式 若随机变量的方差存在,则对任意给定的正数,恒有. (4)证 设的分布函数为,则= =/。这就得(4)式.切贝雪夫不等式无论从证明方法上还是从结论上都有一定意义. 事实上,该式断言落在与内的概率小于等于/,或者说,落在区间内的概率大于1/,从而只用数学期望和方差就可对上述概率进行估计。 例如,取=3,则0.89。当然这个估计还是比较粗糙的(当时,在第二章曾经指出, p(|3)=p(|-|3)0。997 ).性质1 =0的充要条件是p(=

5、c) =1,其中c是常数。证 显然条件充分. 反之,如果= 0,记= c, 由切贝雪夫不等式,p(|- )=0对一切正数成立. 从而 。性质2 设c,b都是常数,则var(+b)=. (5) 证 var(+b)=e(+b-e(+b)=e(+b-cb =。性质3 若, 则。证 因 =e-, 而e(-c=e2c+,两边相减得。这说明随机变量对数学期望的离散度最小。性质4 =+2 (6)特别若两两独立,则 =. (7) 证 var(=e(-e(=e = e =+2,得证(6)式成立。 当两两独立时,对任何有,故e=e(=e=0,这就得证(7)式成立.利用这些性质,可简化某些随机变量方差的计算。例5

6、设服从二项分布b(n, p), 求。解 如1例12构造, 它们相互独立同分布,此时var=pq。由于相互独立必是两两独立的,由性质4 .例6 设随机变量相互独立同分布, , var=,(). 记=, 求,.解 由1性质2和本节性质2和4有 , .这说明在独立同分布时,作为各的算术平均,它的数学期望与各的数学期望相同,但方差只有的1/ n倍。 这一事实在数理统计中有重要意义。例7 设随机变量的期望与方差都存在,。 令,称它为随机变量的标准化. 求与var.解 由均值与方差的性质可知, .2。2协方差数学期望和方差反映了随机变量的分布特征. 对于随机向量, 除去各分量的期望和方差外,还有表示各分量

7、间相互关系的数字特征协方差。定义2 记和的联合分布函数为. 若,就称 (8)为的协方差( covariance),记作cov()。显然, 。公式(6)可改写为var()+2。 容易验证,协方差有如下性质:性质1 cov() = cov(). 性质2 设是常数,则. 性质3 。 对于n维随机向量=,可写出它的协方差阵,(9)其中。由性质1可知b是一个对称阵,且对任何实数,, 二次型,即随机向量的协方差阵b是非负定的。性质4 设= ,c =,则的协方差阵为,其中b是的协方差阵.因为,所以的第元素就是的第i元素与第j元素的协方差.2.3相关系数协方差虽在某种意义上表示了两个随机变量间的关系,但的取值

8、大小与,的量纲有关. 为避免这一点,用,的标准化随机变量(见例7)来讨论.定义3 称 (10)为, 的相关系数(correlation coefficient)。为了讨论相关系数的意义,先看一个重要的不等式.柯西许瓦茨(cauchyschwarz)不等式 对任意随机变量, 有 。 (11)等式成立当且仅当存在常数使. (12)证 对任意实数是的二次非负多项式,所以它的判别式 ,证得(11)式成立。 (11)式中等式成立当且仅当多项式有重根,即 。又由(3),故得,同时有。 所以由方差的性质1就证得,此即 (12)式。由此即可得相关系数的一个重要性质.性质1 对相关系数有. (13)=1当且仅当

9、 ; =-1当且仅当. (14)证 由(11)式得,证得(13)式成立。 证明第二个结论. 由定义. 由柯西-许瓦兹不等式的证明可知, 等价于=有重根=因此由(12)式得当且仅当;当且仅当。注 性质1表明相关系数时,与以概率1存在着线性关系. 另一个极端是= 0,此时我们称与不相关(uncorrected).性质2 对随机变量和, 下列事实等价:(1) cov(,)=0;(2) 与不相关;(3) ; (4) 。证 显然(1)与(2)等价。 又由协方差的性质1得(1)与(3)等价。 再由式,得(1)与(4)等价.性质3 若与独立,则与不相关.显然, 由与独立知(3)成立,从而与不相关。 但其逆不

10、真.例8 设随机变量服从均匀分布u 0, ,=,显然, 故与不独立。 但,,故,即与不相关.注 性质2不能推广到个随机变量情形. 事实上从个随机变量两两不相关只能推得,不能推得. 反之,从这两个等式也不能推得两两不相关. 具体例子不列出了. 对于性质3, 在正态分布情形,独立与不相关是一致的,这将在下面进行讨论。例9 设(,)服从二元正态分布, 试求和。解 ,令, , 则,,于是 = += 0+r。故得 .这就是说二元正态分布中参数r就是,的相关系数。 所以对二元正态分布,、不相关等价于r = 0。 但在第二章已证与相互独立等价于r = 0. 这样我们有性质4 对二元正态分布,两个分量不相关与相互独立是等价的.2.4矩矩(moment)是最广泛的一种数字特征,常用的矩有两种,一种是原点矩, 对正整数,称为的阶原点矩. 数学期望就是一阶原点矩。另一种是中心矩, 对正整数,称为的阶中心矩。 方差是二阶中心矩。除此以外,三阶与四阶中心矩也是常用的,它们分别表示随机变量的性状。 往往用他们的相对值. 称为偏态系数,当它大于0时为正偏态,小于0时则为负偏态。 称为峰态系数,当它大于0时表明该分布密度比正态分布更为尖峭。例10 设为服从正态分布n ()的随机变量,此时,且 特别 。故不论为多少,正态分布的偏态系数与峰态系数都为0.我们可以用原点矩来表示中心矩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论