概率论与数理统计第二章-随机变量及其分布教案_第1页
概率论与数理统计第二章-随机变量及其分布教案_第2页
概率论与数理统计第二章-随机变量及其分布教案_第3页
概率论与数理统计第二章-随机变量及其分布教案_第4页
概率论与数理统计第二章-随机变量及其分布教案_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章随机变量及其分布

为了深入研究随机事件及其概率,本章将引进随机变量的概念,从而使人

们能够进一步应用数学方法来分析和研究随机事件的概率及其性质,更深刻地

揭示随机现象的统计规律性.

§2.1离散型随机变量的概率分布

2.1.1随机变量的定义

一些随机试验的结果本身就是由数量来表示的.例如,掷一颗骰子,观

察其点数,则可能的结果分别用1、2、3、4、5、6来表示;另一些随机试验

的结果本身与数量无关,但我们可以根据问题的需要,人为的给它们建立一个

对应关系.例如,从一批产品中随机抽取一个产品检验,用0表示"抽到次

品",用1表示"抽到合格品".这启发我们引进一个变量,用其取值来刻画

随机事件,帮助我们更深入地研究随机现象.

定义1设E是随机试验,。={m为E的样本空间,X(⑼是定义在Q上

实用文档用心整理

的单值实函数,如果对任一实数X,{X(MWx}是一随机事件,则称X=X(o)

为随机变量.随机变量常用大写字母XKZ等表示,其取值用小写字母X、

Kz等表示.

顾名思义,随机变量就是"其值随机会而定”的变量,一方面,它是试验

结果的函数,与通常的函数概念没什么不同;另一方面,它的取值具有随机性,

在试验前,我们不能预知它将取何值,这要凭机会,"随机”的意思就在这里,

究竟取何值,要到试验做过后才能确定.

随机变量的概念在概率论中十分重要.引入随机变量的概念后,就可以通

过其取值来研究随机事件,从而把对随机事件的研究转化为对随机变量的研

究,为我们运用各种数学工具深入研究随机现象奠定了基础.

例1(1)考查射击某一目标100次中命中的次数,某厂100台机器在

一天中需要维修的机器数等都可以用一个随机变量X来表示,它可能取0,

I,…,100中的彳壬一非负整数;

(2)一部电梯一年内出现故障的次数,城市某十字路口一分钟内通过的

机动车数,单位时间内到达某公交车站等车的人数等都可以用随机变量X来

表示,它所有可能的取值为一切非负整数;

(3)洗衣机的使用寿命X(单位:h)是一个可以在(0,+8)上取值

千里之行始于足下

帝田

K-32-

的随机变量,{必5000}表示"洗衣机使用寿命超过5000h"这一事件.类似

的,测量误差X也是一个随机变量,它可能的取值为(-8,+8)上任意实数,

{国<。3}表示"测量的误差在(-030.3)内”.

(4)汽车司机刹车时,轮胎接触地面的点的位置X是在[0,2万打上取值

的随机变量,其中,•是轮胎的半径.

由上面可以看出,随机事件这个概念实际上是包容在随机变量这个更广的

概念内。也可以说,随机事件是从静态的观点来研究随机现象,而随机变量则是

一种动态的观点,就象高等数学中常量与变量的区别那样.

随机变量按其可能取值的特点,可以分为离散型和非离散型两类.

若随机变量的可能取值为有限个或无限可列个,则称其为离散型随机变

量,其特征是随机变量可能取的值可以——列举出来.在例1的(1)和(2)

中,随机变量X为离散型随机变量.反之,称为非离散型随机变量.非离散

型随机变量中最重要的是另一类称为连续型随机变量,其特征是其全部可能取

值不仅是无穷多的、不可列的,而是充满某个区间.在例1的(3)和(4)

中,随机变量X则为连续型随机变量.

实用文档用心整理

2.1.2离散型随机变量的概率分布

对于随机变量x,我们不仅要看它可能取哪些值,或取值的范围,更重要

的是要看它以多大的概率取这些值.

定义2设离散型随机变量X所有可能的取值为4(&=1,2,…),X取各个

可能值的概率为

P{X=xk}=pk,k=T,2,…(2.1)

则称(2.1)式为随机变量X的概率函数.

概率函数具有以下性质:

(1)非负性:A>0(左=12…);

(2)规范性:.

k=\

上述性质是检验一列非负数能否作为某个离散型随机变量的概率函数的

依据.

由性质(2),概率分布(2.1)表明了全部概率1是如何在其可能值之间分配

千里之行始于足下

亭口、

P-34-

的,或者说它指出了概率1在其可能值集{如“…乙,…}上的分布情况,故

常把(2.1)称为随机变量X的概率分布或分布律或分布列.分布律可以用表格

的形式给出

XX2•••X”…

PP\Pl一•Pn…

通常称之为X的分布表.

2.1.3常见的离散型分布

1.两点分布

若随机变量x只有两个可能的取值a和6,其概率分布为

P{X=a}=〃,P{X=Z?}=1—〃(0</?<1),

则称X服从参数为夕的两点分布.特别地,当a和6分别取1和0时,称X

服从(0-1)分布.

实用文档用心整理

若随机试验只有两个可能的结果,比如产品质量合格与不合格,种子发芽

与不发芽,新生儿是男是女等,我们总可以用服从(0-1)分布的随机变量来描

述试验的结果.

例2假设某打靶运动员命中率为0.7,X表示他射击一次命中的次数,

求X的概率分布.

解用{X=1}表示"射击一次命中",{x=o}表示"射击一次没命中",则

P{X=l}=0.7,P{X=O}=1-P{X=1}=1-0.7=0.3,

即X的概率分布为

X01

P0.30.7

2.二项分布

若随机变量X的概率分布为

P{X=k}=P"(k)=C:p]…,左=0,1,…,明

其中0<〃<1,q=\-p,则称X服从参数为〃、P的二项分布,记作

千里之行始于足下

于广、

P-36-

x~B(〃,p).

称之为二项分布,是因为概率P{x=%}=c:是二项式(px+qy的展

开式中3的系数.易知,£p{X=Z}=£GpWT=(p+q)"=l.

k=Qk=0

设X为〃重贝努里试验中事件/发生的次数,〃为A发生的概率,则

X〜B(n,p).

当〃=1时,二项分布B(l,p)即为(0-1)分布.

例3一张考卷上有5道选择题,每道题列出4个可能答案,其中只有一

个答案是正确的.某学生靠猜测能答对4道题以上的概率是多少?

解每答一道题相当于做一次贝努里试验,则答5道题相当于做5重贝

努里试验.设X表示靠猜测能答对的题数,则X~,

尸{能答对4道题以上}二P{XN4}=P{X=4}+P{X=5}

例4某厂需从外地购买12只集成电路.已知该型号集成电路的不合格率

为0.1,问至少需要购买几只才能以99%的把握保证其中合格的集成电路不少

实用文档用心整理

于12只?

解设需要购买〃只,用X表示这n只集成电路中合格品只数,则

x~8(〃,Q9),按题意,要求事件"XN12”的概率不小于0.99,即

P[X>12}=fc;(0.9)*QI)"*>0.99

k=\2

可算出至少需要购买17只集成电路,才能以99%的把握保证其中合格品

不少于12只.

3.泊松分布

历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松

(Poisson)首先提出的.以后发现,很多取非负整数的离散型随机变量都可

以用泊松分布来描述.

如果随机变量X的概率分布为

P{X=,k=0,1,2,...

Kl

其中几>0为参数,则称X服从参数为,的泊松分布,记作X~P(A).

泊松分布在实际中经常用到,比如一段时间内,电话用户对电话交换中心

千里之行始于足下

▼38

,2-OO-

的呼叫次数,售票口买票的人数,原子放射的粒子数,织布机上断头的次数等

均可近似地用泊松分布来描述.

例5某出租汽车公司共有出租车400辆,设每天每辆出租车出现故障

的概率为0.02,试求一天内没有出租车出现故障的概率.

解将观察一辆出租车一天内是否出现故障看成一次试验,因为每辆出租

车是否出现故障与其它出租车是否出现故障无关,于是观察400辆出租车是

否出现故障相当于做400次贝努里试验.设X表示每天内出现故障的出租车

数,则X~B(400,0.02),P{X=0}=C^CO^S)400^^2)0»0.000309.

这里〃值较大,直接计算比较麻烦.而在二项分布中,当〃值较大,

而P较小时,有一个很好的近似计算公式,这就是著名的泊松定理:

定理1(泊松定理)设随机变量X,,服从二项分布8(九,幺)(〃=1,2,…),

其中P.与〃有关,若P“满足limnp„=2>0(2为常数),则有

n—H-OO

wA

limP{XH=k}=limC>*(1-A,)-*=—e-伙=0,1,2,…).(2.2)

证记一=〃p“,则P“=4,/〃,

ap:(i一PJT=-+1)r4YYI-

k\vnJvny

实用文档用心整理

因此

2k

limC>i(l-p„)^=—e-A,

攵!

定理证毕.

在实际应用中,当〃比较大,夕较小(比如”0.1),而初适中时,可直

接利用以下近似公式

C:pYl_p)"Ta卑e-w(2.3)

Kl

千里之行始于足下

-40-

2k

关于JeT的值有表可查(见本书附表2).

kl

例5中>=400,np=400x0.02=8>0,满足泊松定理条件,可以用2=8

的泊松分布来近似计算

P{X=0卜唱腔0.0003.

由泊松定理可知,当〃较大时,〃重贝努里试验中小概率事件出现的次数

近似服从泊松分布.

例6为保证设备正常工作,需要配备一些维修工.若设备是否发生故障

是相互独立的,且每台设备发生故障的概率都是0.01(每台设备发生故障可

由1人排除).试求:

(1)若一名维修工负责维修20台设备,求设备发生故障而不能及时维修

的概率;

(2)若3人负责80台设备,求设备发生故障而不能及时维修的概率.

解(1波X表示20台设备中同时发生故障的台数厕X~8(20,0.01),

根据泊松定理,X又可近似地看作服从泊松分布,其中参数

X==20x0.01=0.2.

实用文档用心整理

20台设备中只配备一个维修人员,则只要有两台或两台以上设备同时发

生故障,就不能得到及时维修.故所求概率为

P{X>2}=1-P{X<2}«1-e-02-0.2e-02»0.0175.

(2)80台设备中同时发生故障的台数*~8(80,0.01),羽以的,可用

A=80x0.01=0.8的泊松分布来近似,于是所求瞬为

30

/>{X>4}=1-P{X<4}®1-^^—e-08®0.009.

«=ok!

与第一种安排方式相比,3人维修80台设备,虽然比1人维修20台设

备任务重,但工作效率却比第一种方式高,不能及时排除故障的概率仅为

0.009.

4.几何分布

在独立重复试验中,事件/发生的概率为p,设X为直到首次出现力为

止所进行的试验次数,则X所有可能的取值为一切正整数,而事件{x=Z}

(A=l,2…,)就意味着前4-1次试验事件A都没有发生,第Q欠A才发生,即

X的概率分布为

P{X=k}=qk~'P(k=x,2,),其中q=l-p(0<p<l).

千里之行始于足下

亭口、

P-42-

因为qip(%=1,2,…)是一个几何数列,因此将上述概率分布称为几

何分布,称随机变量X服从参数为P的几何分布,记作X-G(p).

例7某射手打靶命中率为〃=0.7,现进行射击试验,直到命中为止,

假设每次射击是相互独立的,求射击次数X的概率分布.

解X~G(0.',其概率分布为P{X=A}=(0.3)i,0.7,1=1,2,....

如果前m次试验中/没有出现(没有成功),则从,”+1次起到首次出现

事件/所进行的试验次数仍然服从参数为夕的几何分布,而与前面失败的次

数m无关,这一特性称为几何分布的无记忆性.

5.超几何分布

设有/V个产品,其中有例个不合格品.若从中不放回地随机抽取〃个,

则其中含有的不合格品数X是一个随机变量,由古典概率计算公式有

「k「n-k

,1;min(H,M),

P{X=M~cT,k=0

记r=min(〃,M),利用组合等式£。,;品[=禺可以证明,上述概率满

太=0

足£p{X=眉=1,故构成一个概率分布,称为超几何分布.超几何分布含有

k=0

三个参数M、/V和77,记为X~H(M,N,n).

实用文档用心整理

从一个有限总体中进行不放回抽样常会遇到超几何分布.在实际问题中,

如果总体中所含个体的数目/V很大,而抽取的数目〃相对很小(如〃W0.05N)

时,通常将不放回抽样当作放回抽样来处理,可以用二项分布来近似计算超几

何分布.例如一批种子发芽率为90%,现从中任取10粒,求播种后发芽粒数

X的概率分布,则X服从超几何分布.但由于一批种子的数目很大,抽取出

10粒对整批种子的发芽率几乎没有影响,所以可以近似地认为X服从二项分

布8(10,09).

§2.2随机变量的分布函数

对于任意给定的x,由随机变量的定义知{XKx}是一个随机事件,

P{X<x}存在且为X的函数,若能确定其具体的函数形式,则事件{X<x}的

概率也随之确定.这个函数称为随机变量X的分布函数,它的一般定义如下:

定义3设X是一个随机变量,对于任意实数,事件{X<灯的概率是X

的函数,记为

尸(x)=P{X〈x}(2.4)

称E(x)为随机变量X的概率分布函数,简称分布函数.

分布函数/(x)的基本性质:

千里之行始于足下

S二、

44

(1)对于任意实数X,0<F(x)<l,且

F(-oo)=limF(x)=0,F(+oo)=limF(x)=1.(2.5)

X->-o0X->-KC

关于Q.5)式,我们仅作出直观上的解释,不进行严格的证明(严格证明超

过本书讨论的范围),事实上,F(+oo)可视为必然事件{X<小}的概率,所以

b(4w)=limP{XWx}=P{X<a}=l.类似地,E(-8)视为不可能事件

X—>-KO

{X<-oo}的概率,故R(YO)=limP{XWX}=P{X<F}=0.

(2)尸(x)是单调不减函数,即对于任意玉,有尸(3)工尸(%2).

事实上,对于任意玉<々,事件{X4斗}包含于事件{XV%},故

F(#=P[X<^}<网凡X2•

(3)F(x)右连续,即F(x)=F(x+0).

如果一个函数同时满足上述三条性质,则该函数一定是某个随机变量的分

布函数.

利用分布函数2幻,可以很方便地求出随机变量X在某一区间上取值的

概率.比如任意给定实数a,6(a<6),有

P[a<X<b}^F(h)-F(a).(2.6)

实用文档用心整理

由分布函数尸(幻的定义,若已知离散型随机变量X的分布列

P{X=3}=p:(/三1,2,…,

则它的分布函数

尸(X)=P{X«X}=ZP{X=XJ=ZPL(2.7)

Xj^XXj^X

例1有一批产品共40件其中有3件次品.从中随机抽取5件以x表

示取到的次品件数,求:⑴X的概率分布及分布函数;(2)P(-l<X<2).

解(1)随机变量X可能取到的值为0,1,2,3,按古典概率计算事件

{X=&}(k=U,1,2,3)的概率,得X的概率分布为

P[X=k}=3攵=0,1,2,3.

或写为:

%0123

P0.66240.30110.03540.0011

当x<0时,F(x)=P{X<x}=0;

千里之行始于足下*■

当04x<l时,/(X)=ZP{X=A}=P{X=0}=0.6624;

k<x

当14x<2时,/(x)=Z2{X=%}=P{X=0}+P{X=1}

kix

=0.6624+0.3011=0.9635;

当2Mx<3时,F(x)=P{X=0}+P{X=1}+P{X=2}=0.9989;

当工23时,F(x)=l.

于是得X的分布函数为

0,x<0

0.6624,<&<

F(x)=-0.9635,l<x<2

0.9989,2<x<3

1,x>3

函数F(x)是阶梯形右连续函数,图2-1

其图像如图2-1所小,在x=0,1,2,3处有跳跃点.

(2)P(-1<X<2)=F(2)-F(-l)=0.9989,

或P(-1<X<2)=P(X=0)+P(X=1)+P(X=2)=0.9989.

实用文档用心整理

§2.3连续型随机变量的分布密度

2.3.1连续型随机变量的分布密度

连续型随机变量可能取的值为某一区间上的所有实数,因此描述连续型随

机变量的概率分布不能再用分布列的形式.分布函数R(x)是刻画连续型随机

变量概率分布的一种形式,但在理论和实践中更常用的是所谓的“概率密度”.

先来看一个实例.

例1设一个靶子是半径为2的圆盘,假设射击都能中靶,并且打到靶上

任一同心圆内的概率与该圆的面积成正比.若以X表示弹着点与圆心的距离,

试求X的分布函数尸(x).

解弹着点与圆心的距离X不可能小于0,所以,若x<0,则{X4X}是不

可能事件,即当x<0时,尸3=0;

若X22,由于题目假设射击都能中靶,所以{X4X}是必然事件,有

F(x)=P{X<x}=l;

若0Mx<2,据题意,P{X<x}=/c"x2,其中%是待定常数.

又因为当x=2时,P{X«x}=P{X<2}=h万"=1,所以--L,

4万

千里之行始于足下

帝田

K-48-

心)=+2•故X的分布函数为

0,x<0

x2

F(x)=<0<x<2

T

1,x>2

F(x)表示随机变量X的取值小于等于实数、的概率.为了能看出X在任意

一点X附近取值的概率大小,我们考虑X在区间(x,x+Ar]上取值的概率的平

均值

P{x<X<x+Ax}F(%+Ax)-F(x)

ArAx

当—0时,若上式的极限存在,则尸(x)在X处可导.随机变量X在点

X附近长度为X的区间上取值的概率P{x<X〈x+&}近似等于F\x)-X,

且F'(x)越大,X在点X附近取值的概率也就越大.记尸(x)=/(x),在本例中

X

2-

J(x)=<

a其

F(x)=P{*力.

J-00

可见,函数/*)可以直观地表现随机变量X在某点附近取值的概率分布

实用文档用心整理

特征,通常称/(X)为随机变量X的概率密度函数.

定义4如果对于随机变量X的分布函数F(x),存在可积函数/(%)>0

(-8<X<+8),使对任意实数X,有

F(x)=P{X<x}=「/(x)dx,(2.8)

J—00

则称x为连续型随机变量,函数/(X)称为X的概率密度函数,简称概率密度

或密度函数或密度.

由定义4,可得到概率密度函数/(x)的下列性质:

(1)非负性:/(x)20(-co<x<+oo);

(2)规范性:

f2+00/(x)dx=l;(2.9)

J—00

性质(2)说明,介于密度函数曲线y=/(x)及x轴之间的区域面积为1.

(3)对于任意实数。和。3<〃),有

P[a<X<b}=F(b)-F(a)=J",/(x)dx;

千里之行始于足下

亭口、

P-50-

性质(3)将连续型随机变量X在区间(“如上取值的概率转化成了密度函

数在区间3勿上的定积分,从而可以利用微积分知识求解概率计算问题.从图

形上看,该事件的概率等于密度函数曲线y=/a)与横轴之间从。到〃的曲边

梯形的面积(图2-2).

(4)在f(x)的连续点处,F'(x)=f(x).

对于连续型随机变量X,还要指出两点:

(1)尸(x)是连续函数①;

(2)P{X=a}=0(a为任意实数).

证(2)取Ax>0,因为

O〈P{X=a}〈P{a—Ar<X〈a}

=F(tz)-F(tz-Ax)

又F(x)是连续函数,所以㈣F(a…)=/⑷,故,图

因此,对于蓬翘随机转X,有

:不同的密度函数可以有相同的分布函数。即使分布函数为连续函数,相应的随机变量也可以是非连续

型的.

实用文档用心整理

P[a<X<b]^P{a<X<b}^P{a<X<b}^P[a<X<b}

=1/0)必.(2.1

Ja

0)

例2设随机变量X的概率密度函数为/(力=]窜1°就2,试求:

(1)常数。;(2)分布函数E(x);(3)pj1<X<2j.

解(1)由「'"(x)dx=l得(分+l)dx=2a+2=],故。=――;

(2)尸(x)=「(_《x+l)dx,

J-002

当x<0时,F(x)=0;

2

当0<x<2时,F(x)=['/Q)dt=「(-q+l)df=—1+x;

J-8Jo24

当%22时,F(x)=L

0x<0

2

即X的分布函数为F(x)=<~—+x0<x<2;

4

1x>2

千里之行始于足下■•:

(3)^<X<2}=^2(-1X+1)CU=^,

11o

或P{-<X<2}=F(2)-F(-)=-.

22lo

2.3.2常见的连续型分布

1.均匀分布

均匀分布是连续型分布中最简单的一种,它用来描述一个随机变量在某一

区间上取每一个值的可能性均等的分布规律.

如果随机变量X的密度函数为

AM

1,

、----,a<x<b

1

0,其它

b-a

则称X服从团,加上的均匀分布,记作

X~U[a,h].

图2-3

均匀分布的密度函数图像见图2-3.均匀分布的分布函数为

实用文档用心整理

0,x<a

x-a

F(x)=<,a<x<b

b-a

1,b<x

对于任意(c,d)u[a,b](c<d),有

p\c<X<j}=F(d)—F(c)-------

b-a

这说明服从均匀分布的随机变量X落在&切上任何一个子区间中的概率与该

区间的长度成正比,而与该区间的位置无关.这就是〃均匀〃的含义.

例3某公共汽车站从上午7:00开始,每隔15min有来一辆车,如某

乘客在7:00-7:30之间随机到此站,试求他等车少于5min的概率.

解设乘客于7:00过Ahnin到达汽车站,则%在[0,30]上服从均匀

分布,其密度函数为

—,0Wx<30

/(x)=<30

0,其它

显然,只有乘客在7:10-7:15之间或7:25-7:30之间到达汽车站时,

乘客候车时间才不少于5min,即所求概率为

千里之行始于足下_4

54

P{10<X<151+P{25<X<301=f"—dx+f'"—dx=-.

।,IJ九30"5303

均匀分布在实际中经常用到,比如一个半径为,的汽车轮胎,当司机刹车

时,轮胎接触地面的点与地面摩擦会有一定的磨损.轮胎的圆周长为2万厂,则

刹车时与地面接触的点的位置X应服从[0,24]上的均匀分布,即

X~U[O,2]力,即在[0,2仃]上任一等长的小区间上发生磨损的可能性是相同

的,这只要看一看报废轮胎的整个圆周上磨损的程度几乎是相同的就可以明白

均匀分布的含义了.

2.指数分布

如果随机变量X的密度函数为

,/、(在一优x>0

f(x)=〈

[O,x<0

其中2>0为参数,则称X服从参数为A的指数分布,记作X~£(2).

指数分布通常用来描述某一事件发生的等待时间.比如某种热水器首次

发生故障的时间,灯泡的使用寿命(等待用坏的时间),电话交换台收到两次

呼叫之间的时间间隔等.在离散型分布中,我们知道几何分布用来描述独立重

复试验中,直到某事件/发生为止共进行的试验次数.如果将每次试验视为经

实用文档用心整理

历一个单位时间,那么直到/发生为止进行的试验次数可视为直到/发生为

止的等待时间.在这个意义上,指数分布可看

作离散情形的几何分布在连续情形中的推广.

由F(x)=「/(x)dx,可求得指数分布

J—00

的分布函数为:/(幻=[~"'"2°

0,x<0

指数分布的密度函数图像见图2-4.

例4假设某电子管的使用寿命总单位:小时)服从指数分布£(0.0002),

求电子管的使用寿命超过3000小时的概率是多少?

千里之行始于足下

亭口、

P-56-

解X的密度函数为:

0.0002e°°*2x>

〃x)=

0,x<0

P(X>3000}=「'0.0002e-00(x)2vdr=e^-6®0.5488.

J3000

3.正态分布

一个连续型随机变量X,如果其密度函数为

1

/(%)=.———e2ct(-oo<x<+oo),

其中小b为常数,且b>0,则称X服从参数为〃和人的正态分布,记作

X~N(〃,o-2).

容易验证正态分布密度函数/(%)满足f+//(x)dx=1.

J—00

er-1一

+00[—-----------~----*-I--------------

,—e2。-dxo,——e'df

-8J2万cr

实用文档用心整理

正态分布密度函数f(x)的图形见图2-5,它具有下列特性:

(1)/(x)具有钟形的图像,密度曲线关于x="对称.这表明对于任意的

h>0,正态随机变量X在关于X=〃对称的区间与[〃,〃+h]上取值的

概率相等,^P[h-h<X<^=P[M<X<n+h].

(2)当x=〃时,函数/(幻达到最大值/(〃)=」-.并且x离〃越远,

/(X)的值就越小.这表明对于同样长度的区间,区间离〃越远,X落在该区

间上的概率就越小(见图2-6).

(3)在x=〃±b处曲线有拐点.曲线以x轴为水平渐近线.

(4)若固定a,改变〃值,则/*)的图形沿'轴平行移动,但不改变其形

状,如图2-7.由此可见,正态密度曲线f(x)的位置完全由参数〃来确定.若

千里之行始于足下

图2-7图2-8

1

固定〃,改变值。,由于最大值为/(〃),所以越小,图形就变得越

陡峭,而X落在M附近的概率就越大;b越大,图形就变得越扁平(见图2-8).

正态分布的“钟形"特征与实际中很多随机变量"中间大两头小"的分布

规律很吻合.比如考察一群同龄人的身高,身高x(单位:m)作为一个随机变

量,分布的显著特点是在平均身高附近的人较多,而特别高或特别矮的人较少.

一个班学生在一次考试中的成绩以及测量误差值等均有类似的特征.正态分

布是概率论中最重要、应用最为广泛的一类分布.德国数学家、天文学家高斯

实用文档用心整理

(KarlFrederickGauss,1777-1855)在研究误差理论时曾用它来刻画误差

的分布,所以很多著作中又称正态分布为高斯(Gauss)分布.

(〃,g)是曲线的拐点,也是曲线的对称中心.

特别地,当〃=0,1的正态分布称为标准正态分布,记作N(O,1).

标准正态分布的概率密度函数为图2-9

(p(ix)=-j=e2(-oo<x<+oo),

分布函数为

1r4

①(x)二一e~dt(―8<x<+oo).

以J-

事件{X4X}的概率对应着图2-10中阴影部分的面积.

千里之行始于足下

-60-

标准正态分布密度函数0(X)的曲线关于.V轴对称,其分布函数图像是关

于点(0一)中心对称的5型曲线,利用标准正态密度函数的对称性可以证明,

2

对于任意实数无,有①(-11=6中x如图2-11所示本书附表3列出了MO

时的①(x),当x<0时,可利用等式①(-*)=1-①(龙)计算.

图2-11

XW0.73}和*IX|<1.96}.

解查附表3可得P{XW0.73}=0(0.73)=0.7673.

P{|X|<1.96}=P{-1.96<X<1.96)=0(1.96)-0(-1.96)

=0(1.96)-[1-0(1.96)]=20(1.96)-1=2x0.975-1=0.95.

实用文档用心整理

由例5可知,若X~N(O,1),则刊*卜。)=?(园区4)=2<!)3)-1,这是

正态分布中常用的计算公式。

对于服从一般正态分布N(〃,b?)的随机变量x,可以通过线性变换

。=曰转化为标准正态分布,再利用中(〃)的值求相应的概率.这是因为

<7

2

I(/一〃)2—t41X-flU

FM=「=-4=「eFdr令"一,4f至广山,

J-8万J-8<2兀Je

T平),(2.11)

故有

P{a<X4力}=/3)—/(a)=①—(2.12)

称。=曰为X的标准化变换,任意一个正态随机变量经过标准化变换

后得到的随机变量都服从标准正态分布.

例6设随机变量X~N(8,0.52),求尸{8.5<X<9.5}.

P{8X<9}冬F(9-.5^

=0(3>G(H0.9-9870~8413(

千里之行始于足下

-62-

例7设X~N(〃,b?),求尸{|X—“<b}.

解p{|X-//|<o-}=P{//-o-<X</z+o-}=O(/Z+fT-/Z)-O(//-a-/Z)

O'(J

=0)(1)—①(—1)=2①(1)—1=2x0.84131=0.682.

类似地可求得:P{|X—“<2cr}=0.9544;尸{|x—〃<3b}=0.9974,如

图2-12所示.

可见正态随机变量X的取值位于参数〃附近的密集程度可用参数(7为单位

1------------------99.7%--------------------»

来度量,而且X的取值几乎全部落在区间(〃-3b,〃+3b)之内,所以有时称

3b为极限误差.如果X随机地I图2”2F在(〃—3b,〃+3。)内,那么

就有理由怀疑X~N(〃,4)是否为真.在检验产品的质量或判断异常的观测数

据时,这是一个应用十分广泛的准则,称为3。原则.

例8公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下

来设计的.设男子身高X服从〃=1704“我=&切的正态分布,即

实用文档用心整理

X~N(170,62),问车门高度应如何确定?

解设车门高度为力(。〃),按设计要求RXN〃}W0.01或

P{X</?}>0.99,

因为X~N(170,62),故

…八n/XT70A-170,J/L170)、八必

P(X</?}=P(-------<------}=①------>0.99,

66v6J

查附表3可得①(2.3衿0.9901,

故取号”=2.33,即力=184.设计车门高度为184(c〃。时,可使成年男子与

6

车门顶碰头的机会在1%以下.

§2.4随机变量函数的分布

在许多实际问题中,我们除了对某一随机变量的概率分布进行研究以外,

往往还要研究某些与该随机变量有函数关系的变量.设%是一个随机变量,

g(x)为连续实函数,则y=g(x)称为一维随机变量的函数,可以证明P也是

一个随机变量.由于g(x)本身是一个确定性的函数,即x与匕之间的关系是

确定性的,这就意味着当x取定某一数值时,%的取值将由函数关系g(x)唯

一确定.正因为此,%的随机性完全由x的随机性所决定,进而,%的概率分

千里之行始于足下

S二、

-64-

布原则上由X的分布所确定.在这一节中我们将讨论当X的分布已知时,确定

随机变量r=g(x)的概率分布的方法.

2.4.1离散型随机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论