第五章随机变量的数字特征及极限定理【哈工大版】_第1页
第五章随机变量的数字特征及极限定理【哈工大版】_第2页
第五章随机变量的数字特征及极限定理【哈工大版】_第3页
第五章随机变量的数字特征及极限定理【哈工大版】_第4页
第五章随机变量的数字特征及极限定理【哈工大版】_第5页
已阅读5页,还剩275页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章随机变量的数字特征与极限定理

在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.

然而,在实际问题中,概率分布一般是较难确定的.而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.

因此,在对随机变量的研究中,确定某些数字特征是非常重要的.在这些数字特征中,最常用的是数学期望和方差4例如,考察某种大批生产的元件的寿命,道寿命在任一指定的界限内的元件的百分率有多如果知道了它的概率分布,就可以知少,这对该种元件的寿命状况提供了一幅完整的图景.下面我们将看到,根据这一分布我们可以算出元件的平均寿命值m,且往往是人们最为关心的一个方面,在应用上有极重要的意义.类似的情况很多,比如我们在了解某一个行业的经济状况时,我们首先关心的是其平均收入,这给了我们一个总的印象5另一类重要的数字特征方差,是衡量一个随机变量(或其分布)取值的散布程度.例如,两个行业工人的平均收入大体相近,但一个行业中工人收入的分配较平均,即大多数工人的收入都在平均值上下不远处,其“散布”小;另一个行业则相反,其收入远离平均值者很多,“散布”较大,这二者的实际意义当然很不同.又如生产同一种产品的两个工厂,各自的产品平均说来都能达到规格要求,但一个工厂的波动小,较为稳定,另一个工厂则波动大,有时质量超标准,有时则低于标准不少,这二者的实际后果当然也不同.6考试的平均成绩问题假设有n名同学参加了某种考试,考试后的成绩是:第一个同学得了a1分,第二个同学得了a2分,…,第n个同学得了an分,那么他们这种考试的平均成绩7考试的平均成绩问题假设有n名同学参加了某种考试,考试后的成绩是:第一个同学得了a1分,第二个同学得了a2分,…,第n个同学得了an分.将他们的成绩进行了汇总,发觉得x1分的人有n1个,得x2分的人有n2个,…,得xk分的人有nk个,其中n1+n2+…+nk=n,那么他们这种考试的平均成绩8

例设某班40名学生的概率统计成绩及得分人数如下表所示:分数4060708090100

人数1691572则学生的平均成绩是总分÷总人数(分)。即105.1.1离散型随机变量的数学期望5.1.2连续型随机变量的数学期望5.1.3随机变量函数的数学期望5.1.4数学期望的性质5.1随机变量的数学期望

1、概念的引入:

某车间对工人的生产情况进行考察.车工小张每天生产的废品数X是一个随机变量.如何定义X的平均值呢?

某电话交换台每天8:00-9:00收到的呼叫数X是一个随机变量.如何定义X的平均值即该交换台每天8:00-9:00收到的平均呼叫数呢?我们来看第一个问题.若统计100天,例1

某车间对工人的生产情况进行考察.车工小张每天生产的废品数X是一个随机变量.如何定义X的平均值呢?32天没有出废品;30天每天出一件废品;17天每天出两件废品;21天每天出三件废品;可以得到这100天中每天的平均废品数为这个数能否作为X的平均值呢?可以想象,若另外统计100天,车工小张不出废品,出一件、二件、三件废品的天数与前面的100天一般不会完全相同,这另外100天每天的平均废品数也不一定是1.27.n0天没有出废品;n1天每天出一件废品;n2天每天出两件废品;n3天每天出三件废品.可以得到n天中每天的平均废品数为(假定小张每天至多出三件废品)一般来说,若统计n天,这是以频率为权的加权平均由频率和概率的关系

不难想到,在求废品数X的平均值时,用概率代替频率,得平均值为这是以概率为权的加权平均这样得到一个确定的数.我们就用这个数作为随机变量X的平均值.这样做是否合理呢?我们采用计算机模拟.

不妨把小张生产中出废品的情形用一个球箱模型来描述:22300031112200033111

有一个箱子,里面装有10个大小,形状完全相同的球,号码如图.

规定从箱中任意取出一个球,记下球上的号码,然后把球放回箱中为一次试验.

记X为所取出的球的号码(对应废品数).X为随机变量,X的概率分布列为

下面我们用计算机进行模拟试验.2230003111X0123P0.30.30.20.2输入试验次数(即天数)n,计算机对小张的生产情况进行模拟,统计他不出废品,出一件、二件、三件废品的天数n0,n1,n2,n3,并计算与进行比较.下面我们一起来看计算机模拟的结果.2230003111则对X作一系列观察(试验),所得X的试验值的平均值也是随机的.由此引入X的数学期望的定义如下:

对于一个随机变量,若它可能取的值是X1,X2,…,相应的概率为p1,p2,

…,

但是,如果试验次数很大,出现Xk的频率会接近于pk,于是可期望试验值的平均值接近19定义5.1设离散型随机变量X的分布列为P(X=xk)=pk,k=1,2,…

若级数绝对收敛,即

则称该级数为离散型随机变量X的数学期望或均值,记为EX或E(X),即20当发散时,则称X的数学期望不存在.定义中的绝对收敛条件是为了保证式不受求和的次序的改变而影响其和的值.21如果把x1,x2,…,xk,…看成是x轴上质点的坐标,而把p1,p2,…,pk,…看成是相应质点的质量,质量总和为则式

表示质点系的重心坐标.

例甲乙两射手在相同条件下进行射击,其中命中环数为X,Y,其分布列为:X8910Y8910Pk0.30.10.6Pk0.20.40.4试问如何评价甲乙两射手射击水平优劣。解:甲乙的平均环数分别为例

某人的一串钥匙上有n把钥匙,其中只有一把能打开自己的家门,他随意地试用这串钥匙中的某一把去开门.若每把钥匙试开一次后除去,求打开门时试开次数的数学期望.解:

设试开次数为X,P(X=k)=1/n,k=1,2,…,nE(X)于是24常用的离散型随机变量的数学期望

例1(0—1分布)设随机变量X的分布列为X01P1−pp求EX.解

EX=0×(1−p)+1×p=p.25由前面可知,事件A的示性函数IA服从0—1分布:

IA01P1−P(A)P(A)故EIA=P(A),即任意事件的概率等于它的示性函数的数学期望.26例2(二项分布)设随机变量X的分布列为

求EX.2728方法二解:设第i次试验事件A发生第i次试验事件A不发生则30例3(泊松分布)设随机变量X的分布列为

求EX.解31由此看出,泊松分布的参数λ就是相应随机变量X的数学期望.

5.1.2连续型随机变量的数学期望

设X是连续型随机变量,其密度函数为f(x),在数轴上取很密的分点x0<x1<x2<…,则X落在小区间[xi,xi+1)的概率是小区间[xi,xi+1)阴影面积近似为小区间[Xi,Xi+1)

由于xi与xi+1很接近,所以区间[xi,xi+1)中的值可以用xi来近似代替.这正是的渐近和式.阴影面积近似为近似,该离散型随机变量的数学期望是因此X与以概率取值xi的离散型随机变量由此启发我们引进如下定义.定义2

设X是连续型随机变量,其密度函数为f(x),如果有限,定义X的数学期望为也就是说,连续型随机变量的数学期望是一个绝对收敛的积分.EX物理意义:以f(x)为密度的一维连续质点系的重心坐标。35可以看出,对以f(x)为概率密度的连续型随机变量X而言,值x和f(x)dx分别相当于离散型随机变量情况下的“xk”和“pk”,故由离散型随机变量的数学期望的定义可知,连续型随机变量的数学期望可定义如下:36常用的连续型随机变量的数学期望

例4(均匀分布)设连续型随机变量X的概率密度为求EX.37解这个结果是可以预料的,因为X在[a,b]上服从均匀分布,它取值的平均值当然应该是[a,b]的中点.

例5(指数分布)

设连续型随机变量X的概率密度为其中λ是正常数,求EX.解40例6(正态分布)设连续型随机变量X~N(μ,σ2),求EX.4243例7(柯西分布)设连续型随机变量X的概率密度为求EX.解由于

故X的数学期望不存在.

若X~U[a,b],即X服从[a,b]上的均匀分布,则若X服从若X服从参数为常见随机变量分布的期望:若X~B(1,P)则

EX=P

若X~E(λ)则若X服从几何分布,则

这意味着,若从该地区抽查很多个成年男子,分别测量他们的身高,那么,这些身高的平均值近似是1.68.

已知某地区成年男子身高X~5.1.3随机变量函数的数学期望

1.问题的提出:

设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望.那么应该如何计算呢?如何计算随机变量函数的数学期望?

一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来.一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来.

使用这种方法必须先求出随机变量函数g(X)的分布,一般是比较复杂的.

那么是否可以不先求g(X)的分布而只根据X的分布求得[g(X)]呢?下面的定理指出,答案是肯定的.495.1.3

随机变量函数的数学期望定理

设Y=g(X),g(x)是连续函数.

(ⅰ)若X是离散型随机变量,分布列为P(X=xk)=pk,k=1,2,…,且

则有50(ⅱ)若X是连续型的随机变量,概率密度为fX(x),且

则有

该公式的重要性在于:当我们求E[g(X)]时,不必知道g(X)的分布,而只需知道X的分布就可以了.这给求随机变量函数的期望带来很大方便.例1.设X的分布列为X0123P求解:例2.设公共汽车起点站在每小时的10分,30分,50分发车,一位不知发车时间的乘客,每小时内到达车站的时间是随机的,求该乘客在车站等车的数学期望。解:设每小时内乘客到达车站的时间为X,等车时间为Y.X~U[0,60]

则例3:设随机变量X的分布律为解:求随机变量Y=X2的数学期望XPk-10156例4设随机变量X的概率密度为

求E(sinX).

57解

58例5设在国际市场上每年对我国某种出口商品的需求量是随机变量X(单位为吨),它在[2000,4000]上服从均匀分布的,又设每售出这种商品一吨,可为国家挣得外汇3万元,但假如销售不出去而囤积于仓库,则每吨需要浪费保养费1万元,问需要组织多少货源,才能使国家的收益最大.用Z表示国家的收益(单位为万元),则由题设可得

解设y为预备出口的该种商品的数量,由已知条件X在[2000,4000]上服从均匀分布可知,这个数量y可以只考虑介于2000与4000之间的情况.60下面求EZ,并求使EZ达到最大的y值.

61故当y=3500时,EZ达到最大值8250.因此,组织3500吨这种商品是最佳的决策.62定理5.2设Z=g(X,Y),g(x,y)是连续函数

(ⅰ)若(X,Y)是二维离散型随机变量分布列为pij=P(X=xi

,Y=yj),i,j=1,2,…且则有

63(ⅱ)若(X,Y)是二维连续型随机变量,概率密度为f(x,y),且则有

从式可以得到由(X,Y)的概率密度f(x,y)求X与Y的数学期望的公式:65例10设随机变量X、Y相互独立,且都服从N(0,σ2)分布,求解由二维随机变量函数的数学期望的公式,有6667686970例1设(X,Y)在区域A上服从均匀分布,其中A为x轴、y轴和直线x+y+1=0所围的区域,求EX,E(−3X+2Y),E(XY).

xyOx+y+1=0A图5.171解(X,Y)的概率密度为于是

72731.E(c)=c,c为常数;2。E(cX)=cE(X),c为常数;5.1.4.数学期望的性质证明:设X~f(x),则3.E(X+Y)=E(X)+E(Y);证明:设(X,Y)~f(x,y)4.若X与Y独立,则E(XY)=E(X)E(Y).证明:设(X,Y)~f(x,y)注意:由E(XY)=E(X)E(Y)不一定能推出X,Y独立77例1设X~B(n,p),求EX.解在前面的例2中,我们已经直接用数学期望的定义求得了EX=np.现在利用数学期望的的性质(ⅲ)来作.设在n重伯努利试验中,成功的次数为Y,而在每次试验成功的概率为p,则Y与X有相同的分布,从而有相同的数学期望.若设Xi表示在第i次试验成功的次数,i=1,2,…,n,则Xi的分布列为

Xi01P1−pp78且

由Xi的分布列得,EXi=p,于是由数学期望的的性质(ⅲ)得到

与例2的作法比较可见,本例的作法要简单得多.例2

把数字1,2,…,n任意地排成一列,如果数字k恰好出现在第k个位置上,则称为一个巧合,求巧合个数的数学期望.由于E(Xk)=P(Xk=1)解:

设巧合个数为X,

k=1,2,…,n则故引入80例3设r个人在楼的底层进入电梯,楼上有n层,每个乘客在楼的任一层下电梯的概率是相同的.如果到楼的某一层无乘客下电梯,电梯就不停,求直到乘客都下完时电梯停的次数X的数学期望.解设Xi表示在第i层电梯停的次数,i=1,2,…,n,则

易见81下面求Xi的分布列(i=1,2,…,n)由于每个人在楼的任一层下电梯的概率均为1/n,故他不在楼的某一层下电梯的概率均为故r个人同时不在第i层下电梯的概率为即82从而于是83因此

在这个例子中,若r=10,n=10,则EX=6.5,即电梯平均停6.5次.在上面的例子中,把一个比较复杂的随机变量X拆成n个比较简单的随机变量Xi的和,然后通过这些比较简单的随机变量的数学期望,根据数学期望的性质(ⅲ)求得了X的数学期望,这样的方法是概率论中常采用的方法.

84例同时掷四颗匀质的骰子,求所得点数之和的数学期望?解设X表示四颗骰子的点数之和,则X是一个离散型的随机变量,它的取值是4,5,…,24.设Xi表示第i颗骰子的点数,i=1,2,3,4,,则

85例13设N个人进行验血,有两种方案:(1)对每个人的血液逐个化验,共需进行N次化验;(2)将采集的每个人的血液分成两份,按k个人一组混合后进行化验(设N为k的倍数),若呈阴性反应,则认为k个人的血都是阴性反应;如果混合后血液呈阳性反应,则需要对k个人的另一份血液逐个进行化验,这时k个人的血总共要化验k+1次.假设所有人的血液呈阳性反应的概率都是p,且各次的化验结果是相互独立的,试说明适当选取k可使第二个方案减少化验次数.解设X表示第二个方案下的总化验次数86解设X表示第二个方案下的总化验次数,Xi为第i个分组的化验次数(i=1,2,…,N/k),则EX表示第二个方案下的总的平均化验次数,EXi表示第i个分组的平均化验次数(i=1,2,…,N/k).下面先求EXi.按照第二个方案的规定,Xi可能取两个值:混合血液呈阴性时,Xi=1;血液呈阳性,Xi=k+1.87因为“Xi=1”表示“组内k个人的血都是阴性”这个事件,又由于各次的化验结果是相互独立的,所以于是

88因此

这就是第二个方案下的总的平均化验次数,由此可知,只要选k使即

89就可以使第二个方案减少化验次数.当q已知时,若选k使取最小值,就可以使化验次数最少.例如,当q=0.9时,可以证明,选k=4可以使f(k)最小,这时故当q=0.9,k=4时,第二个方案的化验次数比第一个方案平均减少40%.90例6

设X~N(4,9),Y~U[0,4],Z=2XY−5,求EZ?解EZ=E(2XY−5)=2EXY−5.若X,Y相互独立,则EZ=E(2XY−5)=2EXY−5=2EXEY−5.由于X~N(4,9),Y~U[0,4],故EZ=E(2XY−5)=2EXY−5=2EXEY−5=11.91引例考试的平均成绩问题yOEXEYx

这一讲,我们介绍了随机变量的数学期望,它反映了随机变量取值的平均水平,是随机变量的一个重要的数字特征.

接下来的一讲中,我们将向大家介绍随机变量另一个重要的数字特征:方差

上一讲我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征.

但是在一些场合,仅仅知道平均值是不够的.5.2方差

例如,某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图:

若让你就上述结果评价一下两台仪器的优劣,你认为哪台仪器好一些呢?

甲仪器测量结果乙仪器测量结果较好测量结果的均值都是a因为乙仪器的测量结果集中在均值附近又如,甲、乙两门炮同时向一目标射击10发炮弹,其落点距目标的位置如图:你认为哪门炮射击效果好一些呢?甲炮射击结果乙炮射击结果乙炮因为乙炮的弹着点较集中在中心附近.

中心中心96研究灯泡的质量时,人们不仅要知道灯泡寿命X的平均值EX的大小,而且还要知道这些灯泡的寿命X离开EX的平均偏离程度如何.如果平均偏离较小,那么说明这批灯泡的寿命大部分接近它的均值,这也说明灯泡厂的生产是稳定的;这时,如果EX比较大,那么灯泡的质量就是比较好的.相反,如果X离开EX的平均偏离较大,那么即使均值较大,生产质量也是有问题的.97在打靶比赛中,不但要求射击准确,而且还要求稳定.如果某射手射击10次,虽然有7次正中靶心,但是另外3次却打歪了,弹孔离靶心很远,甚至子弹射到了靶外打伤了人,这也说明此人的射击技术是成问题的.98那么,用什么量来衡量这种平均偏离程度呢?人们自然会想到采用|X−EX|的平均值E|X−EX|.但是式E|X−EX|带有绝对值号,运算不便,故采用(X−EX)2的平均值E(X−EX)2来代替E|X−EX|.显然,E(X−EX)2的大小完全能够反映X离开EX的平均偏离大小的,这个值就称为X的方差.定义如下:99根据一维随机变量函数的数学期望公式,对于离散型和连续型随机变量的方差可以分别得到如下的表达式:

(ⅰ)离散型随机变量的情况其中P(X=xk)=pk,k=1,2,….

(ⅱ)连续型随机变量的情况

其中fX(x)为随机变量X的概率密度.一、方差的定义采用平方是为了保证一切差值X-E(X)都起正面的作用

由于它与X具有相同的度量单位,在实际问题中经常使用.

方差的算术平方根

称为标准差设X是一个随机变量,若E[X-E(X)]2<∞,则称D(X)=E[X-E(X)]2

(1)为X的方差.若X的取值比较分散,则方差较大.若方差D(X)=0,则

X

以概率1取常数值.

方差刻划了随机变量的取值对于其数学期望的离散程度.若X的取值比较集中,则方差较小;D(X)=E[X-E(X)]2X为离散型,P(X=xk)=pk

由定义知,方差是随机变量X的函数g(X)=[X-E(X)]2的数学期望.X为连续型,X~f(x)103关于方差的计算,常利用如下的公式

DX=EX2−(EX)2.证

104例1(0—1分布)设随机变量X的分布列为(q=1−p)X01P1−pp求DX.解

EX=0×(1−p)+1×p=pEX2=02×(1−p)+12×p=pDX=p2−p=p(1−p)=pq.105例2(二项分布)设随机变量X的分布列为

求DX.解106解

107108109例3(泊松分布)设随机变量的分布列为

求DX.解110111112由此看出,泊松分布的参数λ既是相应随机变量X的数学期望又是它的方差.

例4设

X服从几何分布,概率函数为P(X=k)=p(1-p)k-1,k=1,2,…,n其中0<p<1,求D(X)解:记q=1-p求和与求导交换次序无穷递缩等比级数求和公式

故D(X)=E(X2)-[E(X)]2

+E(X)例5:设随机变量X的概率密度为1)求E(X),2)求117例4(均匀分布)设X~U[a,b],求DX.解

EX=(a+b)/2

,而

118故由此看出,在[a,b]上服从均匀分布的随机变量的方差与区间长度的平方成正比.119例5(指数分布)设X~E(λ),即连续型随机变量X的概率密度为其中λ是正常数,求DX.解EX=1/λ,而120121122例6(正态分布)设连续型随机变量X~N(μ,σ2),求EX.解EX=μ,DX=σ2.正态分布N(μ,σ2)中的参数μ和σ2分别表示相应随机变量X的数学期望和方差.123若X~B(1,P)则DX=pq若X~P(λ)则DX=λ若X~U[a,b]则若X~N(μ,σ2)则DX=σ2若X~E(λ)则1255.2.2

随机变量的方差的性质(ⅰ)DC=0,C为常数;(ⅱ)D(CX)=C2DX,C为常数;(ⅲ)若X1,X2,…,Xn相互独立,则D(X1+X2…+Xn)=DX1+DX2+…+DXn;(ⅳ)DX=0的充要条件是X取某一常数值a的概率为1,即

P(X=a)=1,a=EX.在上面的性质中,均假设方差是存在的.126证

(ⅰ)DC=E(C−EC)2=E(C−C)2.(ⅱ)D(CX)=E(CX)2−[E(CX)]2

=C2EX2−C2(EX)2

=C2[EX2−C2(EX)2]=C2DX127又

(ⅲ)对n=2的情况给出证明,一般的情况,证法相同

128因为X与Y相互独立,故于是

从而

129应用方差的性质计算方差,常常能使运算简化,见下例例6设

X~B(n,p),求DX.解

设在n重伯努利试验中,成功的次数为Y,而在每次试验成功的概率为p,则Y与X有相同的分布,从而有相同的方差(0<p<1,q=1−p).设Xi表示在第i次试验成功的次数,i=1,2,…,n,则Xi的分布列为

Xi01P1−pp130显然,Y可以用Xi(i=1,2,…,n)表示为:由Xi的分布列可知,DXi=pq,i=1,2,…,n.由于

X1,X2,…,Xn相互独立,故由方差的性质(ⅲ)得到

与前面的作法比较可见,本例的作法要简单得多.XXX132例设随机变量X1,X2,X3,X4相互独立,均服从(0,1)上的均匀分布,而求DY?解133这一讲,我们介绍了随机变量的方差.

它是刻划随机变量取值在其中心附近离散程度的一个数字特征.下一讲,我们将介绍刻划两r.v间线性相关程度的一个重要的数字特征:相关系数1355.3

协方差和相关系数、矩对二维随机变量(X,Y)来说,数字特征EX、EY只反映了X与Y各自的平均值,而DX、DY只反映了X与Y各自离开平均值的偏离程度,它们对X与Y之间的相互联系没有提供任何信息.自然,我们也希望有一个数字特征能够在一定程度上反映这种相互联系.136又

137在证明方差的性质(ⅲ)若X与Y相互独立,则D(X+Y)=DX+DY,D(X−Y)=DX+DY时,我们曾得到E(X−EX)(Y−EY)=0.这说明当E(X−EX)(Y−EY)≠0时,X与Y肯定不独立.进一步的研究表明E(X−EX)(Y−EY)的数值,在一定程度上反映了X与Y之间的相互联系,因而引入如下的定义.138定义5.4设(X,Y)是一个二维随机变量,如果E(X−EX)(Y−EY)存在,则称它为X与Y的协方差,记作Cov(X,Y)Cov(X,Y)=E(X−EX)(Y−EY).139由协方差的定义5.4及上节的两个等式D(X+Y)=E(X−EX)2+E(Y−EY)2+2E(X−EX)(Y−EY)与E(X−EX)(Y−EY)=E(XY)−EXEY可知,对任意的两个随机变量X与Y,下面的两个式子成立D(X±Y)=DX+DY±2Cov(X,Y)Cov(X,Y)=E(XY)−EXEY.协方差性质

(1)COV(X,Y)=COV(Y,X);(2)COV(X,X)=D(X);COV(X,c)=0(3)COV(aX,bY)=abCOV(X,Y),a,b常数;

(4)COV(X+Y,Z)=COV(X,Z)+COV(Y,Z);(5)D(XY)=D(X)+D(Y)2COV(X,Y).141两个缺点:(1)从性质Cov(aX,bY)=abCov(X,Y)可见,它的大小依赖于计量单位;(2)从定义Cov(X,Y)=E(X−EX)(Y−EY)

可见,它的数值不仅与X、Y本身的取值有关,而且还与各随机变量关于它们的偏差有关.如果随机变量X或Y中的任何一个与其数学期望的偏差很小,那么无论X与Y之间的联系如何密切,它们的协方差也会很小.142为了克服以上两个缺点,引入以下的定义.定义5.5设(X,Y)是一个二维随机变量,如果X与Y的协方差Cov(X,Y)存在,且DX>0、DY>0

,则称为X与Y的相关系数,记作ρXY,即143下面研究相关系数ρXY到底表示X与Y之间的什么联系?定理5.3设ρ是X与Y的相关系数,则(ⅰ)|ρ|≤1;(ⅱ)|ρ|=1的充分必要条件是P(Y=a+bX)=1,其中a、b为常数.证:

由方差的性质和协方差的定义知,对任意实数b,有0≤D(Y-bX)=b2D(X)+D(Y)-2b

Cov(X,Y)令,则上式为

D(Y-bX)=

由于方差D(Y)是正的,故必有1-≥0,所以||≤1。2.X和Y独立时,

=0,但其逆不真.由于当X和Y独立时,Cov(X,Y)=0.故=0但由并不一定能推出X和Y独立.请看下例.例1

设X服从(-1/2,1/2)内的均匀分布,而Y=cosX,(请课下自行验证)因而=0,即X和Y不相关.但Y与X有严格的函数关系,即X和Y不独立.不难求得,Cov(X,Y)=0,例2.设随机变量X的概率密度为试证

X与不相关,但不独立.证明:对任意常数a有:

从而X与不独立.存在常数a,b(b≠0),使P{Y=a+bX}=1,(详细证明自看,见教材.)即X和Y以概率1线性相关.考虑以X的线性函数a+bX来近似表示Y,以均方误差e=E{[Y-(a+bX)]2}来衡量以a+bX近似表示Y的好坏程度,e值越小表示a+bX与Y的近似程度越好.

用微积分中求极值的方法,求出使e

达到最小时的a,b.相关系数刻划了X和Y间“线性相关”的程度.=E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)e=E{[Y-(a+bX)]2}解得这样求出的最佳逼近为L(X)=a0+b0X

这样求出的最佳逼近为L(X)=a0+b0X这一逼近的剩余是若

=0,Y与X无线性关系;Y与X有严格线性关系;若可见,若0<|

|<1,|

|的值越接近于1,Y与X的线性相关程度越高;|

|的值越接近于0,Y与X的线性相关程度越弱.E[(Y-L(X))2]=D(Y)(1-

)下面四个是等价的:但对下述情形,独立与不相关等价若(X,Y)服从二维正态分布,则X与Y独立X与Y不相关前面,我们已经看到:若X与Y独立,则X与Y不相关,但由X与Y不相关,不一定能推出X与Y独立.例2

设随机变量X和Y相互独立且X~N(1,2),Y~N(0,1).试求Z=2X-Y+3的概率密度.

故X和Y的联合分布为正态分布,X和Y的任意线性组合是正态分布.解:

X~N(1,2),Y~N(0,1),且X与Y独立,D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即Z~N(E(Z),D(Z))Z~N(5,32)故Z的概率密度是Z~N(5,32)这一讲我们介绍了协方差和相关系数相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.注意独立与不相关并不是等价的.当(X,Y)服从二维正态分布时,有X与Y独立X与Y不相关15835.设X与Y为具有二阶矩的随机变量,且设求a,b使Q(a,b)达到最小值Qmin,并证明159解160解方程组得此时161162下面研究相关系数ρXY到底表示X与Y之间的什么联系?定理5.3设ρ是X与Y的相关系数,则(ⅰ)|ρ|≤1;(ⅱ)|ρ|=1的充分必要条件是P(Y=a+bX)=1,其中a、b为常数.163证

(ⅰ)为了证明|ρ|≤1,只需证明[2Cov(X,Y)]2≤4DXDY.利用初等代数中的典型方法,只要说明以DX、2Cov(X,Y)、DY为系数的二次三项式非负即可.

事实上,对任意的实数t,有t2DX−2Cov(X,Y)t+DY=D(tX−Y)≥0.可见,上式左端的二次三项式没有两个相异的实数根,故判别式非正,即

[2Cov(X,Y)]2≤4DXDY[Cov(X,Y)]2≤DXDY从而(ⅰ)得证.

164(ⅱ)|ρ|=1,即式[2Cov(X,Y)]2≤4DXDY

中等号成立的充分必要条件是式t2DX−2Cov(X,Y)t+DY=D(tX−Y)≥0左端的二次三项式有重根t=b,即存在实数b,使D(bX−Y)=0.由方差的性质(ⅳ)知式D(bX−Y)=0成立的充分必要条件是P(Y−bX=a)=1,其中a为常数.从而(ⅱ)得证.

165由定理5.3可知,当|ρ|=1时,Y与X之间存在着线性关系,这个事件的概率为1.ρ的绝对值越接近于1,Y与X之间越近似的有线性关系.Y与X之间的相关系数ρ是刻画X与Y之间线性相关程度的一个数字特征.定义5.6若X与Y的相关系数ρ=0,则称X与Y不相关.定理5.4

随机变量X与Y不相关与下面的每一个结论都是等价的.(ⅰ)Cov(X,Y)=0;(ⅱ)D(X±Y)=DX+DY;(ⅲ)E(XY)=EXEY.证明

(ⅰ)因为

故ρ=0与Cov(X,Y)=0等价.167(ⅱ)由D(X±Y)=DX+DY±2Cov(X,Y)可知Cov(X,Y)=0与D(X±Y)=DX+DY

是等价的.(ⅲ)由Cov(X,Y)=E(XY)−EXEY可知Cov(X,Y)=0与E(XY)=EXEY

是等价的.168注意,随机变量X与Y的不相关和X与Y相互独立是两个不相同的概念.X与Y的不相关是指X与Y之间不存在线性关系,不是说它们之间不存在其它关系.即由X与Y的不相关,推不出X与Y相互独立.但是反过来,若X与Y相互独立,则X与Y一定不相关,这是因为由Cov(X,Y)=E(XY)−EXEY

可以看出,若X与Y相互独立,则Cov(X,Y)=0

必然成立.169例1设连续型随机变量X~N(0,1),Y=X2,求X与Y的相关系数ρXY.

解因X~N(0,1),故EX=0,于是由Cov(X,Y)=E(XY)−EXEY得Cov(X,Y)=E(XY)=EX3而EX3=0.故Cov(X,Y)=0即ρXY=0.170171172173在例1中,虽然X与Y是不相关的,但是X与Y并不独立.事实上,因{X2≤1}∩{X≤−2}=Φ且0<P(X2≤1)<10<P(X≤−2)<1故

P(X≤−2,Y≤1)≠P(X≤−2)P(Y≤1)可见,X与Y不相互独立.

1.K阶原点矩

ak=E(Xk),k=1,2,…

而E(|X|k)称为X的K阶绝对原点矩;2.K阶中心矩

uk=E[X-E(X)]k,k=1,2,…

而E|X-E(X)|k称为X的K阶绝对中心矩;本节的最后介绍一下矩的概念,它将在数理统计的矩估计法中得到应用.将g(X)特殊化,可得到各种数字特征:其中

k是正整数.176由矩的定义可知,数学期望为一阶原点矩,方差是二阶中心矩.一阶中心矩恒为0.矩的计算可以利用随机变量函数的数学期望公式进行.

例设(X,Y)服从区域D:0<x<1,0<y<x上的均匀分布,求X与Y的相关系数D1x=y解例1设二维随机变量(X,Y)的概率密度为试验证X和Y不相关,但X和Y不是相互独立的。证如图单位圆上同理E(Y)=0所以COV(X,Y)=E(XY)-E(X)E(Y)=0即六种常用随机变量的期望与方差小结185第五章

随机变量的数字特征与极限定理

5.4

大数定律在前面概率的统计定义中曾经讲过,一个事件A发生的频率具有稳定性,即当试验次数n增大时,频率接近于某个常数(A的概率).在5.1节随机变量的数学期望中又讲过,随机变量X在n次试验中所取的n个值的平均值也具有稳定性,且被稳定的那个值就是X的数学期望.186这里所谓的“稳定性”,或当n很大时“接近一个常数”等等,都是不确切的说法,只是一种直观的描述而已.初学者常常把它理解为微积分中的变量与极限的关系,这是错误的.因为事件的频率以及随机变量取的n个值的平均值是随着试验的结果而变的,是随机变量,不是微积分中所描述的变量.那么究竟如何用确切的数学语言来描述频率与概率、平均值与数学期望之间的关系呢?大数定律回答了这个问题.为了讲述大数定律,下面先讲一个重要的不等式,它在实际上和理论上都有重要的应用.187切比雪夫(Tchebysheff)不等式定理

对任意随机变量X,若它的方差DX存在,则对任意的ε>0有成立.188证设X是一个连续型随机变量,概率密度为f(x),则189当X是离散型随机变量时,只需在上述的证明中把概率密度换成分布列,把积分好换成求和号即可.由于

等价.190式

和式

都称为切比雪夫不等式.切比雪夫不等式给出了在随机变量X的分布未知的情况下,利用EX、DX对X的概率分布进行估计的一种方法.191例如,由式

可以断言,不管X的分布是什么,对于任意的正整数k都有

当k=3时,有192比较上面的两个式子可知,切比雪夫不等式给出的估计比较粗糙;但要注意,切比雪夫不等式只利用了数学期望和方差.

193例1设EX=2,DX=0.4,试用切比雪夫不等式估计P(1<X<3)?解194例2设随机变量X、Y的数学期望都是2,方差分别为1和4,而相关系数为0.5,则根据切比雪夫不等式估计解195196大数定律定理(伯努利大数定律)

设在n重伯努利试验中,成功的次数为Yn,而在每次试验中成功的概率为p(0<p<1),则对任意的ε>0有证由于Yn~B(n,p)

故EYn=np,DYn=npq(q=1−p)由此得

197代入切比雪夫不等式

198故利用式

显然可得式

的等价形式

199在式中,Yn/n是在n重伯努利试验中成功的频率,而p是成功的概率.因此伯努利大数定律告诉我们:当试验次数n足够大时,成功的频率与成功的概率之差的绝对值不小于任一指定的正数ε的概率可以小于任何预先指定的正数,这就是频率稳定性的一种较确切的解释.

利用式

可以得到相应的等价解释.200根据伯努利大数定律,在实际应用中,当试验次数n很大时,可以用事件的频率来近似代替事件的概率.定义5.8

称随机变量序列X1,X2,…,Xn,…(或简记为{Xn})是相互独立的,如果对任意的n≥2,X1,X2,…,Xn是相互独立的.此时,若所有Xi又有相同的分布函数,则称X1,X2,…,Xn,…是独立同分布的随机变量序列.201定理5.7(切比雪夫大数定律)设X1,X2,…,Xn,…是相互独立的随机变量序列,若有常数C,使DXi≤C,i=1,2,…,则对任意的ε>0有或

202证因为

由切比雪夫不等式

203令n∞,则得若利用式

则可以推得式

204在概率论中我们称满足式或式

的随机变量序列X1,X2,…,Xn,…服从大数定律.205推论设X1,X2,…,Xn,…是独立同分布的随机变量序列,具有有限的数学期望和方差,EXi=μ,DXi=σ2,i=1,2,…,则对任意的ε>0有或

这是因为故由切比雪夫大数定律立即可得上面的两个式子.206容易验证伯努利大数定律的结论可以由此推论得出.在上述的推论中,假设所讨论的随机变量的方差是存在的,但实际上,方差存在这个条件并不是必要的,现不加证明地介绍下面的定理.定理5.8(辛钦Khintchine大数定律)设X1,X2,…,Xn,…是独立同分布的随机变量序列,具有有限的数学期望,EXi=μ,i=1,2,…,则对任意的ε>0有或

207在式

中可以被看作随机变量X在n次重复独立试验中n个观察值的算术平均值,而μ=EX.因此,辛钦大数定律告诉我们:当试验次数n足够大时,

208因此,辛钦大数定律告诉我们:当试验次数n足够大时,平均值与数学期望μ之差的绝对值不小于任一指定的正数ε的概率可以小于任何预先指定的正数,这就是算术平均值稳定性的一种较确切的解释.所以,在测量中常用多次重复测得的值的算术平均值来作为被测量的近似值.209一般地,设Z1,Z2,…,Zn,…是一个随机变量序列,a是一个常数,若对任意的ε>0有则称随机变量序列Z1,Z2,…,Zn,…依概率收敛于a.记为210按照依概率收敛的定义,伯努利大数定律表明了频率Yn/n依概率收敛于p,即

式所表示的关系为

211式所表示的关系为

212第五章

随机变量的数字特征与极限定理

5.5

中心极限定理大数定律中,我们讨论了独立随机变量的平均值序列的依概率收敛问题,现在我们来讨论独立随机变量和

213在随机变量的各种分布中,正态分布占有特殊重要的地位.早在19世纪,德国数学家高斯(Gauss)在研究测量误差时,就引进了正态分布.其后,人们又发现在实际问题中,许多随机变量都近似服从正态分布.为什么正态分布如此广泛地存在,从而在概率论中占有如此重要的地位?数学家从关于独立随机变量和的极限分布的研究中找到了答案.21420世纪前半期,概率论研究的中心课题之一,就是寻求独立随机变量和的极限分布是正态分布的条件.因此,把这一方面的定理统称为中心极限定理.较一般的中心极限定理表明:如果被研究的随机变量是大量的独立随机变量的和,其中每一个别随机变量对于总和只起微小作用,则可以认为这个随机变量近似服从正态分布.这就揭示了正态分布的重要性.因为现实中许多随机变量都具有上述的性质,例如测量误差、射击弹着点的横坐标或纵坐标、人的身高或体重等都是由大量的随机因素综合影响的结果,因而是近似服从正态分布的.215以下叙述一个常用的中心极限定理定理(独立同分布的中心极限定理)

如果随机变量序列X1,X2,…,Xn,…独立同分布,并且具有有限的数学期望和方差,EXi=μ,DXi=σ2>0,i=1,2,…,则对一切x,有证明需要用到随机变量的特征函数,略.216从式可以看出,不管Xi(i=1,2,…)服从什么分布,只要n充分大,随机变量

就近似地服从N(0,1),而217随机变量近似地服从N(nμ,nσ2).此时,我们称渐近地服从N(0,1).定理5.9又被称为列维—林德伯格(Levy—Lindeberg)中心极限定理.

218例1

计算机在进行加法时,对每个被加数取整(取为最接近于它的整数),设所有的取整误差是相互独立的,且它们均在(−0.5,0.5)上服从均匀分布.若将1500个数相加,问误差总和的绝对值不超过15的概率是多少?解

设Xi表示第i个被加数的取整误差,i=1,2,…,1500,则Xi~U(−0.5,0.5)且X1,X2,…,X1500相互独立,故μ=

EXi=0

σ2

=

DXi=1/12.219令Z=X1+X2…+X1500,由列维—林德伯格中心极限定理得

220于是,所求的概率为221222定理[德莫弗—拉普拉斯(DeMoivre−Laplace)定理]设在n重伯努利试验中,成功的次数为Yn,而在每次试验中成功的概率为p(0<p<1),q=1−p,则对一切x,有223证明

设Xi表示在第i次试验成功的次数,i=1,2,…,n,则Xi的分布列为Xi01Pqp且由于X1,X2,…,Xn是独立同分布的随机变量序列分布列,且EXi=p,DXi=pq(i=1,2,…,n)有限,故满足定理5.9(独立同分布的中心极限定理)的条件,224于是由式得225定理5.10表明二项分布以正态分布为极限分布

推论对定理5.10中的n重伯努利试验,n充分大时,有证从

由定理5.10(德莫弗—拉普拉斯定理)即得结论.226由推论可知,当n很大时,二项分布的概率计算问题,可以转化为正态分布来计算,这将使计算量大大减小.例如,当n很大时,若要计算工作量是惊人的.但是,用式

只要查一下正态分布函数表就可以轻松地求出它的相当精确的近似值.227例2重复投掷硬币100次,设每次出现正面的概率均为0.5,问“出现正面次数大于50,小于61”的概率是多少?解设出现正面的次数为Yn,现在由式

228229应该指出:定理5.10及其推论中的Yn是仅取非负整数值0,1,2,…,n的随机变量,注意到正态分布是连续型的分布,所以在求概率P(Yn≤m)(m为正整数)时,为了得到较好的近似值,可以用下面的近似公式230例3

以X表示将一枚匀称的硬币重复投掷40次中出现正面次数,试用正态分布求P(X=20)的近似值,再与精确值比较.解这里n=40,p=1/2,q=1/2,故231而精确解为当然,求例3这样的概率还有德莫弗—拉普拉斯局部极限定理可用,这里就不予以论述了.232由前面的讨论可见,对二项分布,当n充分大,以致npq较大时,正态近似是相当好的近似.进一步的分析表明,当接近于0或1时,用正态近似效果不好,这时就要用到泊松近似了.由定理2.10(二项概率的泊松逼近定理),当p(或q)很小,而np(或nq)大小适中时,泊松近似是较好的.在实际中,一般当0.1<p<0.9且npq>9时,用正态近似;当p≤0.1(或p≥0.9)且n≥10时,用泊松近似.233例1

一生产线生产的产品成箱包装,每箱的重量是随机的.假设每箱的平均重量为50千克,标准差为5千克.若用最大载重量为5吨的汽车承运,试利用中心极限定理说明,每辆车最多可以装多少箱,才能保证不超载的概率大于0.977.(Φ(2)=0.977,其中Φ(x)是标准正态分布函数.)解

设Xi(i=1,2,…,n)是装运的第i箱的重量(单位:千克),n是所求的箱数.由条件可以把X1,X2,…,Xn视为独立同分布的随机变量,而n箱的总重量Tn=X1+X2…+Xn是独立同分布随机变量之和.234由条件知根据列维—林德伯格(独立同分布的)中心极限定理,Tn近似服从正态分布N(50n,25n).箱数n决定于条件235由此可见236从而n<98.02,即每辆车最多可以装98箱,才能保证不超载的概率大于0.977.23748.某保险公司多年的资料表明,在索赔户中,被盗索赔户占20%,以表示在随机抽查100个索赔户中因被盗而向保险公司索赔的户数,求解

23848.某保险公司多年的资料表明,在索赔户中,被盗索赔户占20%,以表示在随机抽查100个索赔户中因被盗而向保险公司索赔的户数,求解

概率论与数理统计是研究随机现象统计规律性的学科.随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来.也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.第五讲大数定律

研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究.极限定理的内容很广泛,其中最重要的有两种:

与大数定律中心极限定理下面我们先介绍大数定律切比雪夫不等式

设随机变量X有期望E(X)和方差D(X),则对于任给>0,有或

由切比雪夫不等式可以看出,若D(X)越小,则事件{|X-E(X)|<}的概率越大,即随机变量X集中在期望附近的可能性越大.由此可体会方差的概率意义:它刻划了随机变量取值的离散程度.当方差已知时,切比雪夫不等式给出了r.v

X与它的期望的偏差不小于的概率的估计式.如取

可见,对任给的分布,只要期望和方差存在,则r.vX取值偏离E(X)超过3的概率小于0.111.例1.

已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700.利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解:设每毫升白细胞数为X依题意,E(X)=7300,D(X)=7002所求为

P(5200X9400)P(5200X9400)=P(5200-7300

X-7300

9400-7300)=P(-2100X-E(X)2100)=P{|X-E(X)|2100}由切比雪夫不等式

P{|X-E(X)|2100}即估计每毫升白细胞数在5200~9400之间的概率不小于8/9.

例2.

在每次试验中,事件A发生的概率为0.75,利用切比雪夫不等式求:n需要多么大时,才能使得在n次独立重复试验中,事件A出现的频率在0.74~0.76之间的概率至少为0.90?解:设X为n

次试验中,事件A出现的次数,E(X)=0.75n,的最小的n.则X~B(n,0.75)所求为满足D(X)=0.75*0.25n=0.1875n=P(-0.01n<X-0.75n<0.01n)=P{|X-E(X)|<0.01n}

P(0.74n<X<0.76n)可改写为在切比雪夫不等式中取n,则=P{|X-E(X)|<0.01n}解得依题意,取

即n取18750时,可以使得在n次独立重复试验中,事件A出现的频率在0.74~0.76之间的概率至少为0.90.

大量的随机现象中平均结果的稳定性

大数定律的客观背景大量抛掷硬币正面出现频率字母使用频率生产过程中的废品率……几个常见的大数定律定理1(切比雪夫大数定律)

设X1,X2,…是相互独立的随机变量序列,它们都有有限的方差,并且方差有共同的上界,即D(Xi)≤C,i=1,2,…,切比雪夫则对任意的ε>0,

证明切比雪夫大数定律主要的数学工具是切比雪夫不等式.

设随机变量X有期望E(X)和方差D(X),则对于任给>0,

切比雪夫大数定律表明,独立随机变量序列{Xn},如果方差有共同的上界,则与其数学期望

偏差很小的

概率接近于1.随机的了,取值接近于其数学期望的概率接近于1.即当n充分大时,差不多不再是切比雪夫大数定律给出了平均值稳定性的科学描述

作为切比雪夫大数定律的特殊情况,有下面的定理.定理2(独立同分布下的大数定律)

设X1,X2,…是独立同分布的随机变量序列,且E(Xi)=,D(Xi)=,i=1,2,…,则对任给

>0,

下面给出的贝努里大数定律,是定理2的一种特例.贝努里

设Yn是n重贝努里试验中事件A发生的次数,p是事件A发生的概率,引入i=1,2,…,n则是事件A发生的频率

于是有下面的定理:

设Yn是n重贝努里试验中事件A发生的次数,p是事件A发生的概率,则对任给的ε>0,定理3(贝努里大数定律)或贝努里

贝努里大数定律表明,当重复试验次数n充分大时,事件A发生的频率Yn/n与事件A的概率p有较大偏差的概率很小.

贝努里大数定律提供了通过试验来确定事件概率的方法.任给ε>0,蒲丰投针问题中解法的理论依据就是大数定律

当投针次数n很大时,用针与线相交的频率m/n近似针与线相交的概率p,从而求得π的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论