随机变量的数字特征详解演示文稿_第1页
随机变量的数字特征详解演示文稿_第2页
随机变量的数字特征详解演示文稿_第3页
随机变量的数字特征详解演示文稿_第4页
随机变量的数字特征详解演示文稿_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

随机变量的数字特征详解演示文稿当前第1页\共有100页\编于星期二\15点优选随机变量的数字特征当前第2页\共有100页\编于星期二\15点第四章随机变量的数字特征4.1随机变量的数学期望(一)4.2随机变量的数学期望(二)4.3随机变量的方差(一)4.4随机变量的方差(二)4.5协方差与相关系数4.6其它特征数当前第3页\共有100页\编于星期二\15点4.1随机变量的数学期望(一)

(Mathematicalexpectationofrandomvariable)

4.1.1数学期望的概念“期望”在我们日常生活中常指有根据的希望,在概率论中,它源于历史上一个著名的分赌本问题:

例4.1.1(分赌本问题)17世纪中叶,一位赌徒向法国数学家帕斯卡(1623-1662)提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注50法郎,每局中无平局.他们约定,谁先赢三局则得到全部100法郎的赌本.当甲赢了两局,乙赢了一局时,因故要中止赌博,现问这100法郎如何分才算公平?当前第4页\共有100页\编于星期二\15点分析第一种分法:甲得1001/2=50(法郎)乙得1001/2=50(法郎)第二种分法:甲得1002/367(法郎)乙得1001/333(法郎)这两种方法都没有考虑到如果继续比下去会出现什么样的结果,没有照顾到两人在现有基础下对比赛结果的一种期待,双方均不满意.首席数学家帕斯卡,帕斯卡认为甲的最终所得可能为:0或100再赌两局比赛必定结束,其结果不外乎以下四种:(甲赢甲赢)(甲赢乙赢)(乙赢甲赢)(乙赢乙赢)于是,他们去求助法国的当前第5页\共有100页\编于星期二\15点于是甲赢得法郎数X的分布列为帕斯卡认为甲的“期望”所得应为01/4+1003/4=75(法郎)乙的“期望”所得应为100-75=25法郎.这种方法照顾到了已赌局数,又包括了再赌下去的一种“期望”,它比前两种方法都更为合理.这就是数学期望这个名称的由来,其实这个名称称为“均值”更形象易懂一些,对上例而言,也就是再赌下去的话,甲“平均”可以赢75法郎.X0100P1/43/4当前第6页\共有100页\编于星期二\15点

引例(射击问题)设某射击手在同样的条件下,相继射击90了次,击中情况如下(命中的环数是一个随机变量).试问:该射手每次射击平均命中靶多少环?命中环数k

命中次数nk

012345

21315102030

当前第7页\共有100页\编于星期二\15点解平均击中环数当前第8页\共有100页\编于星期二\15点平均击中环数频率随机波动随机波动随机波动稳定值“平均射中环数”的稳定值“平均击中环数”趋向于“击中环数的可能值与其概率之积的累加”

当前第9页\共有100页\编于星期二\15点设离散随机变量X的分布列为如果那么称为随机变量X的数学期望(mathematicalexpectation)或该分布的数学期望,简称期望或均值.若级数不收敛,则称X的期望不存在.当前第10页\共有100页\编于星期二\15点设连续随机变量X的密度函数为

f(x),如果则称为X的数学期望,或该分布的数学期望,简称期望或均值.若不收敛,则称X的期望不存在.当前第11页\共有100页\编于星期二\15点某车站每天8:009:00,9:0010:00都恰好有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立.其规律是一旅客8:20到车站,求他的平均候车时间.1/6

3/6

2/68:108:308:509:109:309:50概率到站时刻当前第12页\共有100页\编于星期二\15点

解设X=“该旅客的候车时间”(以分钟计)则于是该旅客的平均候车时间为1/6

3/6

2/68:108:308:509:109:309:50概率到站时刻

1030507090XP当前第13页\共有100页\编于星期二\15点若Xb(n,p),则E(X)=np.

证明因为Xb(n,p),所以于是当前第14页\共有100页\编于星期二\15点当前第15页\共有100页\编于星期二\15点

例4.1.4若XP(),则E(X)=.

证明因为XP(),所以于是当前第16页\共有100页\编于星期二\15点在一个人数为N的人群中普查某种疾病,为此要抽验N个人的血。如果将每个人的血分别检验,则共需检验N次,为了能减少工作量,一位统计学家提出一种方法:按k个人一组进行分组,把同组人的血样混合后检验,如果这种混合血样呈现阴性反应,说明这k个人只需要检验一次就够了;如果这种混合血样呈现阳性反应,说明这k个人中至少有一个人的血呈现阳性反应,则再对此k个分别进行检验.假设该疾病的的发病率为p,且每人是否得此疾病相互独立.试问这种方法能否实现减少平均检验次数?当前第17页\共有100页\编于星期二\15点

解令X=“该人群中每个人需要验血的次数”,则所以每人的平均验血次数为X1/k1+1/kP(1-p)k1-(1-p)k当前第18页\共有100页\编于星期二\15点只要适当选择k,就可使验血次数达到最小.譬如,当p=0.1时,有对不同的发病率p,计算出最佳得分组人数k,见下表0.6900.6040.5940.6100.6950.7510.9910.9941.001623458103033340.6970.5940.5340.4660.3840.2740.205344568110.140.100.080.060.040.020.01当前第19页\共有100页\编于星期二\15点有两个相互独立工作的电子装置,它们的寿命X1,X2服从同一指数分布,其密度函数如下

若将这两个电子装置串联组成一个整机,求整机寿命Y的数学期望.当前第20页\共有100页\编于星期二\15点解因为XiExp()(i=1,2),所以Xi的分布函数为于是Y=min{X1,X2}的分布函数为故Y=min{X1,X2}的密度函数为当前第21页\共有100页\编于星期二\15点所以当前第22页\共有100页\编于星期二\15点作业当前第23页\共有100页\编于星期二\15点4.2随机变量的数学期望(二)设XU(a,b),求E(X).

解因为XU(a,b),所以当前第24页\共有100页\编于星期二\15点设XN(,2),则E(X)=.证明因为XN(,2),所以当前第25页\共有100页\编于星期二\15点设X(,),则E(X)=/.证明因为X(,),所以于是当前第26页\共有100页\编于星期二\15点若随机变量X的分布用分布列p(xi)或用密度函数f(x)表示,则X的某一函数g(X)的数学期望为推广:当前第27页\共有100页\编于星期二\15点已知随机变量的分布列如下求Y=X2的数学期望.

Y=X2的分布列为X-2-1012P0.20.10.10.30.3X-2-1012Y=X241014P0.20.10.10.30.3当前第28页\共有100页\编于星期二\15点对相同的值合并,并把对应的概率相加,可得所以E(Y)=E(X2)=00.1+10.4+40.5=2.4或

E(Y)=E(X2)

=(-2)20.2+(-1)20.1+020.1+120.3+220.3=2.4Y014P0.10.40.5当前第29页\共有100页\编于星期二\15点数学期望的常用性质(1)若c是常数,则E(c)=c;(2)对任意的常数a,有E(aX)=aE(X);(3)对任意的两个变量X,Y,有

E(XY)=E(X)E(Y)推广:对任意的随机变量X,Y,有E[g1(X)

g2(Y)]=E[g1(X)

]E[g2(Y)](4)若随机变量X,Y相互独立,则E(XY)=E(X)E(Y)当前第30页\共有100页\编于星期二\15点某公司经销某种原料,历史资料表明:该原料的市场需求量X(单位:吨)服从(300,500)上的均匀分布.每出售一顿该原料,公司可获利润1.5(万元);若积压1吨,则公司损失0.5(万元).问公司应该组织多少货源,可使平均收益最大?

一、模型假设:市场需求量XU(300,500).二、模型建立:公司收益Y(万元)与市场需求量X和组织的货源a吨有关,即当前第31页\共有100页\编于星期二\15点公司收益Y=g(X)也是随机变量,其数学期望为则故公司组织450吨货源,可使平均收益最大.令f(a)三、模型求解:当前第32页\共有100页\编于星期二\15点

一民航客车载有20位旅客自机场开出旅客有10车站可以下车,如到达一个车站没有旅客下车就不停车.以X表示停车的次数,求该客车的平均停车次数.(假设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立)解令Xi=“第i个车站停车的次数”,i=1,2,…,10.则Xib(1,

1-0.920),(i=1,2,…,10),且

X=X1+X2+…+X10.于是E(X)=E(X1+X2+…+X10)=E(X1)

+E(X2)

+…+E(X10)=(1-0.920)

+(1-0.920)

+…+(1-0.920)

=10(1-0.920)8.784当前第33页\共有100页\编于星期二\15点作业当前第34页\共有100页\编于星期二\15点4.3随机变量的方差(一)

随机变量X的数学期望E(X)是一种位置特征数,它反应了X取值的集中位置,但它无法反映出X取值的“波动”程度.譬如,已知X与Y的分布列分别为则E(X)=0=E(Y).但显然Y的取值要比X的取值波动大。为了用数值来反映出随机变量取值的“波动”大小,引入了方差与标准差这两个特征数。X-101P1/31/31/3Y-1000100P1/31/31/3当前第35页\共有100页\编于星期二\15点设X为随机变量,若E[X-E(X)]2存在,则称其随机变量X的方差(Variance)或该分布的方差,记为D(X)或Var(X).即称为X的标准差,记为(X)或X.方差和标准差的取值都是非负数,它们都是用来描述随机变量取值集中(或分散)程度的特征数.由于标准差与所讨论的随机变量、数学期望有相同的量纲,所以在实际中,人们比较乐意选用标准差.当前第36页\共有100页\编于星期二\15点某人有一笔资金,可投入房地产和商业,其收益都与市场状态有关.若把未来市场分为好、中、差三个等级,其发生的概率分别为0.2,0.7,0.1.通过调查该投资者认为投资于房地产的收益X(万元)和投资于商业的收益Y(万元)的分布分别为试问该投资者投资哪个项目为好?X113-3P0.20.70.1Y64-1P0.20.70.1当前第37页\共有100页\编于星期二\15点解

E(X)=110.2+30.7+(-3)0.1=4.0(万元)E(Y)=60.2+40.7+(-1)0.1=3.9(万元)从平均收益看,投资房地产比投资商业更划算.所以因为标准差越大收益的波动就越大,从而风险也越大.若综合权衡收益和风险,选择投资房地产的平均收益相对投资商业多了0.1万元,仅仅多出1/39,但风险却提高了一倍还多,故投资商业比较划算.由于当前第38页\共有100页\编于星期二\15点方差的常用性质(1)D(X)=E(X2)-E2(X);(2)对任意的常数c,有D(c)=0;(3)若a,b为常数,则D(aX+b)=a2D(X);(4)若随机变量X,Y相互独立,则

D(X+Y)=

D(X)+D(Y)(5)D(X)=0P(X=c)=1.当前第39页\共有100页\编于星期二\15点随机变量的标准化设随机变量X具有数学期望E(X)=,方差D(X)=20,令则于是称X*为X的标准化随机变量.当前第40页\共有100页\编于星期二\15点常见分布的方差(1)两点分布设Xb(1,p),则E(X)=p,D(X)=pq=p(1-p).证明因为Xb(1,p),所以P(X=1)=p,P(X=0)=1-p=q.故E(X)=pE(X2)=12p+02q=p所以D(X)=E(X2)-E2(X)=p-p2=p(1-p)=pq.当前第41页\共有100页\编于星期二\15点(2)二项分布若Xb(n,p),则E(X)=np,D(X)=npq.证明令Xib(1,p)

(i=1,2,…

,n),且相互独立.则D(Xi)=pq(i=1,2,…

,n),X=X1+X2+…+Xn.所以当前第42页\共有100页\编于星期二\15点(3)泊松分布若XP(),则E(X)=

,D(X)=.证明因为XP(),所以故D(X)=E(X2)-E2(X)=2+-2=.当前第43页\共有100页\编于星期二\15点(4)几何分布(Geometrydistribution)若XGe(p),则E(X)=1/p

,D(X)=q/p2

.证明

(5)超几何分布若Xh(n,N,M),则证明

(6)巴斯卡(Pascal)分布若XNb(r,p),则E(X)=r/p

,D(X)=rq/p2.证明

略当前第44页\共有100页\编于星期二\15点

(1)均匀分布若XU(a,b),则

证明因为XU(a,b),所以故D(X)=E(X2)-E2(X)当前第45页\共有100页\编于星期二\15点(2)伽玛分布若X(,),则E(X)=/

,D(X)=/2

.证明因为X(,),所以于是D(X)=E(X2)-E2(X)当前第46页\共有100页\编于星期二\15点(3)正态分布若XN(,2),则E(X)=

,D(X)=2.

证明因为XN(,2),所以当前第47页\共有100页\编于星期二\15点推广若XiN(i,i2),i=1,2,…,n,且相互独立,则存在不全为零的常数k1,k2,…,kn,使得常用分布表当前第48页\共有100页\编于星期二\15点若XN(1,3),YN(2,4),且X,Y相互独立求证Z=2X-3YN(-4,48).证明因为XN(1,3),YN(2,4),且X,Y相互独立所以Z=2X-3Y服从正态分布,且E(X)=1,D(X)=3,E(Y)=2,D(Y)=4于是E(Z)=E(2X-3Y)=2E(X)-3E(Y)=21-32=-4D(Z)=D(2X-3Y)=4D(X)+9D(Y)=43+94=48故Z=2X-3YN(-4,48).当前第49页\共有100页\编于星期二\15点设活塞的直径XN(22.4,0.032),气缸的直径YN(22.5,0.042),且X,Y相互独立,任取一只活塞,一只气缸,求活塞能装入气缸的概率.

解因为XN(22.4,0.032)

,YN(22.5,0.042)且X,Y相互独立.所以X-YN(-0.1,0.0025)

故当前第50页\共有100页\编于星期二\15点

定理4.4.1(Chebyshev不等式)设随机变量X满足E(X)=,方差D(X)=2,则对于任意正数,有证明(1)因为E(X)=,D(X)=2,所以当前第51页\共有100页\编于星期二\15点(2)因为E(X)=,D(X)=2,所以当前第52页\共有100页\编于星期二\15点作业当前第53页\共有100页\编于星期二\15点4.5协方差与相关系数

二维联合分布中除含有各分量的边际分布外,还含有两个分量间相互关联的信息,协方差就是描述这种关联程度的一个特征数,其定义如下:设(X,Y)是二维随机变量,如果数学期望E[X-E(X)][Y-E(Y)]存在,则称此期望为X与Y的协方差(Covariance),记为Cov(X,Y),即

特别地,Cov(X,X)=D(X).当前第54页\共有100页\编于星期二\15点从协方差的定义可以看出,它是X的偏差[X-E(X)]与Y的偏差[Y-E(Y)]乘积的数学期望.由于偏差可正可负也可以为零,故协方差可正可负,也可以为零,其具体表现如下:(1)当Cov(X,Y)0时,称X与Y正相关.此时两个偏差[X-E(X)]与[Y-E(Y)]同时增大或减小,而两个数学期望E(X)与E(Y)都是常数,所以X与Y同时增加或同时减少.当前第55页\共有100页\编于星期二\15点(2)当Cov(X,Y)0时,称X与Y负相关.此时两个偏差[X-E(X)]与[Y-E(Y)]一个增大,另一个减小;而两个数学期望E(X)与E(Y)都是常数,所以X与Y一个增大,另一个减小.(3)当Cov(X,Y)=0时,称X与Y不(线性)相关.当前第56页\共有100页\编于星期二\15点协方差的性质(1)Cov(X,Y)=E(XY)-E(X)E(Y).(2)对任意的常数c,有Cov(X,c)=0.(3)若有X,Y相互独立,则Cov(X,Y)=0;反之不然.(4)Cov(X,Y)=Cov(Y,X).(5)a,bR,有Cov(aX,bY)=abCov(X,Y).(6)Cov(XY,Z)=Cov(X,Z)Cov(Y,Z).(7)a,b,c,dR,有Cov(aX+b,cY+d)=acCov(X,Y).(8)D(XY)=D(X)D(Y)2Cov(X,Y).当前第57页\共有100页\编于星期二\15点相关系数(Correlation)

协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则协方差Cov(X,Y)带有量纲(mkg).为了消除量纲的影响,现对协方差除以相同量纲的量,就得到一个新的概念——相关系数.设(X,Y)是二维随机变量,且D(X)0

D(Y)0,则称为X与Y的(线性)相关系数(Correlation).当前第58页\共有100页\编于星期二\15点(1)X与Y的相关系数(X,Y)是个无量纲的量.(2)Cov(X,Y)与(X,Y)同符号,故从它的取值也可反应出X与Y的正相关,负相关和不相关.(3)相关系数(X,Y)的另一个解释是:它是X与Y相应标准化变量X*与Y*的协方差Cov(X*,Y*).当前第59页\共有100页\编于星期二\15点定理4.5.1(相关系数的性质)(1)|XY|1;(2)|XY|=1常数a,b,使得

P(Y=aX+b)=1.

X,Y几乎处处线性相关.当前第60页\共有100页\编于星期二\15点说明(1)若XY=0,称X与Y不(线性)相关,但它们之间可能有其他的关系.譬如:平方关系,对数关系等.(2)若XY=1,则称X与Y完全正相关;若XY=-1,则称X与Y完全负相关.(3)若0

<|XY|<1,则称X与Y有“一定程度”的线性关系

|XY|越接近于1,则X与Y的线性相关程度越高;

|XY|越接近于0,X与Y的线性相关程度越低.但协方差看不出这一点.若协方差很小,而其两个标准差X,Y也很小,则其比值就不一定很小.当前第61页\共有100页\编于星期二\15点设(X,Y)的联合密度函数为试求X与Y的相关系数XY.当前第62页\共有100页\编于星期二\15点解当前第63页\共有100页\编于星期二\15点于是当前第64页\共有100页\编于星期二\15点本题的协方差很小,可是相关系数并不小.从相关系数XY

=0.8243看,X与Y有相当程度的正相关;当从相应的协方差Cov(X,Y)=0.0471看,X与Y的相关性很微弱,几乎可以忽略不计.造成这种错觉的原因在于是没有考虑标准差.若两个标准差都很小,即使是协方差小一些,相关系数也能显示一定程度的相关性.由此可见,在协方差的基础上加工形成的相关系数是更为重要的相关性的特征数.当前第65页\共有100页\编于星期二\15点若(X,Y)N(1,2,12,

22,),求证XY=.证明一

当前第66页\共有100页\编于星期二\15点故当前第67页\共有100页\编于星期二\15点证明二令

当前第68页\共有100页\编于星期二\15点则于是故当前第69页\共有100页\编于星期二\15点一般场合,独立必然导致不相关,不相关推不出独立.但也有例外,如下面的例子.若(X,Y)N(1,12,

2,22,),则X与Y相互独立X与Y不相关=0.证明由以前的结论知XY=

,故只需证明X与Y不相关=0(1)必要性因为XN(1,12,

2,22,0),所以当前第70页\共有100页\编于星期二\15点且XN(1,12),XN(2,22),于是故所以X与Y相互独立.当前第71页\共有100页\编于星期二\15点(2)充分性因为X与Y相互独立,所以f(x,y)=fX(x)fY(y)即所以=0.当前第72页\共有100页\编于星期二\15点作业当前第73页\共有100页\编于星期二\15点4.6分布的其它特征数(FigureCharacteristic)数学期望和方差是随机变量最重要的两个特征数,此外,随机变量还有一些其他的特征数。4.6.1K阶矩设X为随机变量,k为正整数.如果以下的数学期望都成存在,则(1)X的k阶原点矩:(2)X的k阶中心矩:当前第74页\共有100页\编于星期二\15点(3)X与Y的k+l阶混合原点矩:(4)X与Y的k+l阶混合中心矩:

由于|X|k-1

|X|k+1,所以若X的k阶矩存在,则X的k-1阶矩也存在,进而低于k阶的各阶矩都存在.当前第75页\共有100页\编于星期二\15点

4.6.3协方差矩阵二维随机变量(X1,X2)有四个二阶中心矩(假设它们都存在),它们分别为于是(X1,X2)的协方差矩阵为当前第76页\共有100页\编于星期二\15点设(X1,X2,…,Xn)的二阶混合中心矩都存在,令则(X1,X2,…,Xn)的协方差矩阵为因而上述矩阵是一个对称矩阵.当前第77页\共有100页\编于星期二\15点

n维正态随机变量具有四条重要性质:(1)n维正态随机变量(X1,X2,…,Xn)的每一个分量都是正态变量;反之,若(X1,X2,…,Xn)的每一个分量都是正态随机变量,且相互独立,则是(X1,X2,…,Xn)

n维正态随机变量。(2)n随机变量(X1,X2,…,Xn)是正态分布的充要条件是它的任意线性组合:a1X1+a2X2+…+anXn+a0(其中,a12+a22+…+an20)都服从一维正态分布.当前第78页\共有100页\编于星期二\15点(3)若(X1,X2,…,Xn)服从n维正态分布,Y1,Y2,…,Ym是X1,X2,…,Xn的线性函数,则(Y1,Y2,…,Ym)也服从正态分布.上述性质称为正态变量的线性变换不变性.(4)设(X1,X2,…,Xn)服从n维正态分布,则“X1,X2,…,Xn相互独立”“X1,X2,…,Xn两两不相关”.当前第79页\共有100页\编于星期二\15点作业没有当前第80页\共有100页\编于星期二\15点证明

返回当前第81页\共有100页\编于星期二\15点证明

返回当前第8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论