概率论与数理统计第四章_第1页
概率论与数理统计第四章_第2页
概率论与数理统计第四章_第3页
概率论与数理统计第四章_第4页
概率论与数理统计第四章_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学期望方差矩和协方差矩阵第四章变量的数字特征协方差和相关系数

第一节数学期望在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了。然而,在实际问题中,概率分布一般是较难确定的。而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了。因此,在对随机变量的研究中,确定某些数字特征是重要的。在这些数字特征中,最常用的是数学期望、方差、协方差和相关系数起源:法国数学家帕斯卡(Pascal,1623—1662)

法国数学家费马(Fermat,1601—1665)法国军人德.梅勒(DeMere,1607—1684)一、离散型随机变量的数学期望帕斯卡德.梅勒约定先赢5局,获全部赌金A:4B:3分赌金写信费马假设再赌一局A赢获全赌金:1A输获赌金:1/2A最后获赌金:1/2×1+1/2×1/2=3/4B最后获赌金:1/2×0+1/2×1/2=1/4期望(提前分钱)朋友引例1

某车间对工人的生产情况进行考察。车工小张每天生产的次品数X是一个随机变量。如何确定小张每天生产的次品数的平均值呢?我们先观察小张100天的生产情况(假定小张每天至多出现三件次品)若统计100天,

32天没有出次品;30天每天出一件次品;17天每天出两件次品;21天每天出三件次品;可以得到这100天中每天的平均次品数为这个数能否作为X的平均值吗?可以想象,若另外统计100天,车工小张不出次品,出一件、二件、三件次品的天数与前面的100天一般不会完全相同,这另外100天每天的平均次品数也不一定是1.27。n0天没有出次品;n1天每天出一件次品;n2天每天出两件才品;n3天每天出三件次品.可以得到n天中每天的平均次品数为一般来说,若统计n天,(假定小张每天至多出三件废品)以频率为权的加权平均

当n很大时,频率接近于概率,所以我们在求次品数X的平均值时,用概率代替频率,得平均值为以概率为权的加权平均这是一个确定的数。我们就用这个数作为随机变量X的平均值。注:离散型随机变量的数学期望是一个绝对收敛的级数的和。数学期望是随机变量的平均值,与X的取值x

k的顺序无关(唯一性),所以要求级数绝对收敛。若级数绝对收敛,则称此级数的和为X

的数学期望。设离散型随机变量X

的分布律为定义4.1简称期望或均值,记为E(X)。即例4.1甲乙两人射击,他们的射击水平由下表给出试问哪个人的射击水平较高?解

甲乙的平均环数可求得:因此,从平均环数上看,甲的射击水平要比乙的好。X:甲击中的环数Y:乙击中的环数解

设试开次数为X,于是某人的一串钥匙上有n把钥匙,其中只有一把能打开自己的家门,他随意地试用这串钥匙中的某一把去开门。若每把钥匙试开一次后除去,求打开门时试开次数的数学期望。例4.2一旅客8:20到车站,求他候车时间的数学期望。按规定,某车站每天8:00~9:00,9:00~10:00都恰有一辆客车到站,但到站时刻是随机的,且两者到站的时间相互独立。其规律为:

例4.3解:设旅客的候车时间为X(以分计,其分布率为)设A为事件“第一班车8:10到站”,B为事件“第二班车9:30到站”。候车时间X的数学期望为二、连续型随机变量的数学期望设X是连续型随机变量,其密度函数为f(x),在数轴上取很密的分点x0<x1<x2<…,则X落在小区间[xi,xi+1)的概率是这正是的渐近和式。因此X与以概率f(xi)Δxi,取值xi的离散型r.v.近似,该离散型r.v

的数学期望是由此启发我们引进如下定义。定义4.2

设X是连续型随机变量,其密度函数为f(x),如果积分绝对收敛,则称此积分值为X的数学期望,即注:

连续型随机变量的数学期望是一个绝对收敛的积分。例4.4若将这两个电子装置串联连接组成整机,求整机寿命(以小时计)N

的数学期望。例4.5有2个相互独立工作的电子装置,它们的寿命Xk(k=1,2)服从同一指数分布,其概率密度为的分布函数为三、随机变量函数的数学期望

问题的提出:设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望。那么应该如何计算呢?一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来。一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来。解已知X的分布律为求X2及的数学期望。同理例4.6那么是否可以不先求g(X)的分布而只根据X的分布求得E[g(X)]呢?下面的定理指出,答案是肯定的。

使用这种方法必须先求出随机变量函数g(X)的分布,一般是比较复杂的。(1)当X为离散型时,它的分布率为P(X=xk)=pk;(2)当X为连续型时,它的密度函数为f(x)。若定理4.3

设Y是随机变量X的函数:Y=g(X)(g是连续函数)该公式的重要性在于:当我们求E[g(X)]时,不必知道g(X)的分布,只需知道X的分布就可以了。设随机变量X的概率密度为求E(1/X)。解例4.7某公司按季度销售某商品的量X服从[2000,4000]上的均匀分布,销售1公斤获利3元,屯仓1公斤亏损1元,为获利最大,该公司应进货多少公斤?(最佳决策问题)解

设S为进货量,则2000≤S≤4000,获得利润为由题意可得则平均利润为例4.8求S使E(Y)最大可得S=3500(公斤)定理4.4

设(X,Y)是二维随机变量,g(X,Y)是二元连续函数Z=g(X,Y)⑴设(X,Y)为离散型随机变量,其联合分布律为若级数绝对收敛,则Z

的数学期望为⑵设X为连续型随机变量,其概率密度为f(x,y),若绝对收敛,则Z的数学期望为已知(X,Y)的概率密度求E(X),E(Y),E(XY)解同理例4.9一般来说,E(XY)≠E(X)E(Y),那么何时相等?1.设C是常数,则E(C)=C;2.若C是常数,则E(CX)=CE(X);3.E(X+Y)=E(X)+E(Y);四、数学期望的性质4.设X、Y相互独立,则E(XY)=E(X)E(Y)。注意:由E(XY)=E(X)E(Y)不一定能推出X,Y独立五、几种重要分布的数学期望Ⅰ.X为离散型随机变量⑴(0—1)分布⑵泊松分布⑶二项分布任何一个服从二项分布的随机变量X都可表示n个服从(0-1)分布的独立的随机变量Xi相加的形式:X=X1+X2+…+XnⅡ.X为连续型随机变量⑴均匀分布X~U(a,b),则⑵指数分布X~E(λ)则分部积分法⑶正态分布已知X~N(2,4),Y服从参数为3的指数分布,X,Y相互独立,U=3X-6Y+9,V=XY+2X-3Y。求E(U),E(V)。解

由随机变量的性质可知例4.10EU=3EX-6EY+9=3*2-6*(1/3)+9=13EV=E(X)E(Y)+2E(X)-3E(Y)=2/3+4-1=11/3六、数学期望性质的应用求二项分布的数学期望。解:若X~B(n,p),则X表示n重贝努里试验中的“成功”次数。现在我们来求X的数学期望。例4.11若设i=1,2,…,n则X=X1+X2+…+Xn因为P(Xi=1)=p,P(Xi=0)=1-p=np所以E(X)=E(Xi)=1*p+0*(1-p)=p

把数字1,2,…,n任意地排成一列,如果数字k恰好出现在第k个位置上,则称为一个巧合,求巧合个数的数学期望。由于E(Xk)=P(Xk=1)解:设巧合个数为X,引入

k=1,2,…,n则故例4.12

一民航送客车载有20位旅客自机场开出,旅客有10个车站可以下车,如到达一个车站没有旅客下车就不停车。以X表示停车的次数,求E(X)。(设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立)例4.13按题意

第二节方差

上一节我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征。但是在一些场合,仅仅知道平均值是不够的。

引例:

甲、乙两个合唱队都由5名成员组成,身高如下:甲:1.60、1.62、1.59、1.60、1.59乙:1.80、1.60、1.50、1.50、1.60那个合唱队演出效果好?分析:易见,甲乙两队的平均身高都为1.60,但显然甲队比乙队整齐,身高相对集中在1.60米左右,演出效果好。又如,甲、乙两门炮同时向一目标射击10发炮弹,其落点距目标的位置如图:你认为哪门炮射击效果好一些呢?甲炮射击结果乙炮射击结果乙炮因为乙炮的弹着点较集中在中心附近

中心中心由此可见,研究随机变量与其均值的偏离程度是十分必要的。那么,用怎样的量去度量这个偏离程度呢?容易看到(1)能度量随机变量与其均值E(X)的偏离程度。但由于上式带有绝对值,运算不方便,通常用量(2)来度量随机变量X与其均值E(X)的偏离程度。这个数字特征就是我们这一讲要介绍的方差。(1)(2)一、方差的定义定义4.5

设X是一个随机变量,若E[(X-E(X)]2存在,称E[(X-E(X)]2为X的方差。记为D(X)或Var(X),即D(X)=Var(X)=E[X-E(X)]2方差的算术平方根称为均方差或标准差。方差刻划了随机变量的取值对于其数学期望的离散程度。若X的取值比较集中,则方差D(X)较小;若X的取值比较分散,则方差D(X)较大。因此,D(X)是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。由定义知,方差是随机变量X的函数

g(X)=[X-E(X)]2的数学期望。二、方差的计算计算方差的一个简化公式

D(X)=E(X2)-[E(X)]2

证:D(X)=E[X-E(X)]2=E{X2-2XE(X)+[E(X)]2}=E(X2)-2[E(X)]2+[E(X)]2=E(X2)-[E(X)]2解由公式因此,0-1分布设随机变量X具有(0-1)分布,其分布率为求D(X)。例4.14解X的分布率为例4.15因此,泊松分布解因此,均匀分布例4.16解由此可知,指数分布设随机变量X服从指数分布,其概率密度为例4.17三、方差的性质1.设C是常数,则D(C)=0;2.若C是常数,则D(CX)=C2

D(X);3.设X与Y是两个随机变量,则

D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}4.

D(X)=0,就是指P{X=C}=1,这里C=E(X)下面我们证明性质3证明若X,Y相互独立,由数学期望的性质4得此性质可以推广到有限多个相互独立的随机变量之和的情况。设X~B(n,p),求E(X)和D(X)。若设i=1,2,…,n解X~B(n,p),则X表示n重努里试验中的“成功”次数。例4.18由于X1,X2,…,Xn相互独立i=1,2,…,nE(Xi)=p,D(Xi)=

p(1-p),

则是n次试验中“成功”的次数于是=np(1-p)解于是例4.19设X,Y是两个相互独立的且服从正态分布的随机变量,且X~N(-3,1),Y~N(2,1),则求随机变量Z=X-2Y+7服从什么分布?解

Z为正态随机变量的线性组合,所以仍然服从正态分布,且其参数为故Z~N(0,5)例4.20设X,Y是两个相互独立的且均服从正态分布N(0,1/2)的随机变量,则求随机变量|X-Y|的数学期望。解

记Z=X-Y,则E(X-Y)=E(X)-E(Y)=0。故Z~N(0,1)例4.21D(X-Y)=D(X)+D(Y)=1设X的可能取值为x1=-1,x2=0,x3=1,且E(X)=0.1,D(X)=0.89,求X的分布律。所以例4.21解设

X的分布律为解

由题意可知已知的次数,求对X独立观察4次,Y表示X

的观察值大于例4.22设U~[-2,2],且⑴求X和

Y的分布律;⑵求X+Y的方差。解

X,Y的取值都为-1和1,则例4.23⑵X+Y

的分布律为

第三节协方差和相关系数问题对于二维随机变量(X,Y):已知联合分布边缘分布对二维随机变量,除每个随机变量各自的概率特性外,相互之间可能还有某种联系,问题是用一个怎样的数去反映这种联系?反映了随机变量X,Y之间的某种关系⑶Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)⑴Cov(X,Y)=Cov(Y,X)一、协方差性质⑵Cov(aX,bY)=abCov(X,Y)a,b是常数定义4.6量E{[X-E(X)][Y-E(Y)]}称为随机变量X和Y的协方差,记为Cov(X,Y),即Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}特别地

Cov(X,Y)=E(XY)-E(X)E(Y)可见,若X与Y独立,Cov(X,Y)=0。计算协方差的一个简单公式由协方差的定义及期望的性质,可得Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)即特别地D(X+Y)=D(X)+D(Y)+2Cov(X,Y)随机变量和的方差与协方差的关系协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响。例如:Cov(kX,kY)=k2Cov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了相关系数

。二、相关系数为随机变量X和Y的相关系数。定义4.7

设D(X)>0,D(Y)>0,称在不致引起混淆时,记

为。1)2)的充要条件是X与Y以概率1呈线性关系。即其中a,b(a≠0)为常数定理4.8

设随机变量X和Y的相关系数存在,则证⑴则Cauchy-Schwarz不等式所以证⑵仅有一个重根t0说明相关系数只是X与Y之间线性关系的一种度量。,X与Y的线性关系越显著;,X与Y的线性关系越不显著;四个等价命题2)3)4)1)相关系数则称X与Y不相关;

设随机变量Y是X的线性函数Y=aX+b,则求X和

Y的相关系数。解法一

由已知可得所以解法二

由已知可得所以例4.24不相关:

X与Y之间没有线性关系,并不表示它们之间没有任何关系。所以,当X和Y独立时,Cov(X,Y)=0。故但由并不一定能推出X和Y独立。请看下例独立:

X与Y之间没有任何函数关系。设随机变量(X,Y)的概率密度为问X和

Y是否相互独立,是否不相关?解

先求关于X和Y的边缘概率密度

例4.25因为所以X和

Y不相互独立。⑵

求X和Y的相关系数

所以故X和

Y不相关。独立不相关若(X,Y)服从二维正态分布,则X与Y独立X与Y不相关特例若(X,Y)服从二维正态分布。是Y与X的相关系数。以下画出取几个不同值时(X,Y)的密度函数图。132页例292页推广(n维正态分布的几条重要性质)136页1.

X=(X1,X2,…,Xn)服从n元正态分布,对一切不全为0的实数a1,a2,…,an,a1X1+a2

X2+…+anXn均服从正态分布。2.

X=(X1,X2,…,Xn)服从n元正态分布,Y1,Y2,…,Yk是Xj(j=1,2,…,n)的线性函数,则(Y1,Y2,…,Yk

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论