第二章随机变量及其分布.ppt_第1页
第二章随机变量及其分布.ppt_第2页
第二章随机变量及其分布.ppt_第3页
第二章随机变量及其分布.ppt_第4页
第二章随机变量及其分布.ppt_第5页
已阅读5页,还剩165页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 随机变量及其分布,第一节 随机变量及其分布函数 第二节 离散型随机变量及其分布 第三节 连续型随机变量及其分布 第四节 随机变量函数的分布,概率论是从数量上来研究随机现象内在规律性的,为了更方便有力的研究随机现象,就要用数学分析的方法来研究, 因此为了便于数学上的推导和计算,就需将任意的随机事件数量化当把一些非数量表示的随机事件用数字来表示时, 就建立起了随机变量的概念,1. 为什么引入随机变量?,2.1 随机变量及其分布函数,一、随机变量,2. 随机变量的引入,实例1 在一装有红球、白球的袋中任摸一个球,观察摸出球的颜色.,S=红色、白色,非数量,将 S 数量化,可采用下列方法,红色

2、,白色,即有 X (红色)=1 ,X (白色)=0.,这样便将非数量的 S=红色,白色 数量化了.,例1:考虑下面的试验E:在区间0,1上任取一点,记录该点的坐标,试验E的样本空间S=e|0 e 1 ,每个样本点e是0,1上的一个数字。 若令:X表示“在0,1上任取一点的坐标”,则 I:它是在0,1上取值的的一个变量,而且它的取值依赖于试验结果e ,这种依赖关系可用一个样本点e的函数来表达:X=X(e), e S . 如:当e =1/2时, X=X(1/2)=1/2.,II: x(- ,+ ), X x=e |X(e) x是一个事件,因而可求出其概率 。 如 x= -1, PX-1=Pe |X

3、(e)-1=P()=0. x=2/3, PX2/3=Pe |X(e)2/3=2/3.,X,S,RX,x,e,例2:系球队参加学校比赛, 实验E为:记录一场比赛结果。试验E的样本空间=“胜”“平”“负” ,若设各结果对应的分数为=“胜”“平”“负” =2分,1分,0分, 令 X: e 12, e 21, e 30, 即X表示“该队参加一场比赛的分数”,I . X是变量,若根据以往的记录,该队参加一场比赛赢球的概率1/2,输及平的概率1/4,于是X的取值有概率规律。P X=2=1/2 , PX=1=PX=0=1/4.,实例3 抛掷骰子,观察出现的点数.,S=1,2,3,4,5,6,样本点本身就是数

4、量,且有,则有,II . x(-,+),X x=e |X(e) x是一个事件。 如: 当x=0.3时,PX 0.3=Pe |X(e) 0.3 =P (e 3)=1/4. 当x=1时,PX 1=P(e 2, e 3)=1/4 +1/4 =1/2,如:掷骰子试验。,有些试验结果本身就是数,随机事件与实数之间存在着客观联系.,总结:,令X=掷一次骰子得到的点数,X1,26 则“掷得i点”可记作“X=i”,并有P(X=i)=1/6.,表明:X实际上是样本点的一个函数,所以X具有随机性。,易见:对于任意实数x, e|X(e)x或Xx都是随机事件,我们关心它的概率值。,3定义:设X()是定义在概率空间(,

5、 F, P )上的单值实函数,如果对于每个 ,有一个实数X() 与之对应, 且x(-,+) , |X() xF ,则称X()为随机变量.,简记为 r.v. ,用大写字母X,Y,Z或希腊字母,表示, 表示随机变量所取的值时,一般采用小写字母x,y,z等.,一般地,X()写为X,Xx=|X() x。,.,X(),R,( random variable),(1)随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值.,(2)由于试验结果的出现具有一定的概率,于是这些实值函数取每个值和每个确定范围内的值也有一定的概率.,这些X,Y,Z就是所谓的,随,量,机,变,

6、( random variable),这几个例题中引入的变量X,Y,Z都是样本点的实值函数,且具有以下共同特点:,随机变量实际上就是定义域为事件域,值域为实数集或其子集的一种实值函数.,.,X(),R,这种实值函数与在高等数学中大家接触到的函数一样吗?它的引进有何意义?,随机事件实际上是包容在随机变量这个更广的概念内. 也可以说,随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,就象数学分析中常量与变量的区别那样.,随机变量概念的产生是概率论发展史上的重大事件. 引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.,事件及

7、事件概率,随机变量及其 取值规律,例 1.令X表示灯泡的寿命(以小时计),这个变量X是定义在样本空 =t|t0上的函数; 2.掷两次硬币这一试验,令X表示正面出现的次数,X是一随机变量, 3.从一批产品中任取n件,令X表示取出的n件产品中的次品数, 4.用X (单位cm) 表示随机抽出某地区一个人的身高,则X是随机变量, 5. 一个月某交通路口的事故数X,是随机变量。 6. 用天平称量某物体的重量的误差X,是随机变量。,3、随机变量的分类,通常分为两类:,如“取到次品的个数”, “收到的呼叫数”等.,随机变量,离散型随机变量,连续型随机变量,所有取值可以逐个 一一列举,例如,“电视机的寿命”,

8、实际中常遇到的“测量误差”等.,全部可能取值不仅 无穷多,而且还不能 一一列举,而是充满 一个区间.,二、随机变量的分布函数,通常我们称一个r.v.X取值的概率规律为X的分布。为了对r.v给出一种统一的描述方法,引进了分布函数的概念。,r.v.研究方法:共同分布函数,各自:离散分布律 连续概率密度,1、定义:,由定义,对任意实数 x1x2,随机点落 在区间( x1 , x2 的概率为:,P x1X x2 = P X x2 - P X x1 = F(x2)-F(x1),实际上,分布函数完整地描述了r.v.的统计规律,i.e.,只要知道了随机变量X的分布函数, 就可以计算它取任何值的概率.,例如(

9、1)PaXb=F(b)-F(a).,(5)PXb=1-F(b-0).,(6)PaXb=F(b-0)-F(a).,(2) PXb=F(b-0). (由概率连续性证明),(3) PX=b=F(b)-F(b-0).,(4)PXb=1-F(b). (Xb= ),分布函数完整地描述了r.v.的统计规律,只要知道随机变量X的分布函数, 就可以计算它取任何值的概率.,(因为aXb=Xb-Xa,且XbXa),(X=b=Xb-Xb,XbXb,再由(2) ),分布函数是一个普通的函数,正是 通过它,我们可以用数学分析的工具来 研究 随机变量.,例12 将一枚均匀的硬币抛三次,记X为正面向上出现的次数,求X的分布函

10、数。,所以,x 0时, F(x)=P (X x) =0,解:显然,X=0,1,2,3。且,P ( X =0 ) =1/8, P ( X=1 ) =3/8 P ( X = 2 ) =3/8, P ( X=3 ) =1/8,离散型随机变量分布函数的计算举例,0 x 1时, F(x)=(Xx)=1/8,1x 2时,F(x)=(Xx)=4/8,于是得,2x 3时,F(x)=(Xx)=7/8,3x 时,F(x)=(Xx)=1,例13 在区间 0,a 上任意投掷一个质点,以 X 表示这个质点的坐标. 设这个质点落在 0, a中任意小区间内的概率与这个小区间的长度成正比,试求 X 的分布函数.,解: 设 F

11、(x) 为 X 的分布函数,,当 x 0 时,F(x) = P(X x) = 0,当 x a 时,F(x) =1,下面我们来求一个连续型 r.v 的分布函数.,当 0 x a 时, P(0 X x) = kx (k为常数 ),F(x) = P(X x) = P(X0) + P(0 X x),=x / a,这就是在区间 0,a上服从均匀分布的随机变量的分布函数.,2、分布函数的性质,(1) F(x) 非降,即若 x1x2,则F(x1) F(x2) ;,(2) F( ) = F(x) = 0,(3) F(x) 右连续,即,如果一个函数具有上述性质,则一定是某个r.v X 的分布函数. 也就是说,性

12、质(1)-(3)是鉴别一个函数是否是某r.v的分布函数的充分必要条件.,F( ) = F(x) = 1,(1)F(x)为不减函数:当x1 x2时,有F(x1)F(x2)。,(2) 由定义可知:0F(x)1,后两式与性质(3)都可用概率连续性证明。只证(3):即要证x0, F(x0+0)=F(x0),(3)F(x)右连续,即对x:F(x)=F(x+0).,注1. 分布函数性质的证明:,因为F(x)不减,取定一数列xn x0, (例如x0+ 1/n x0)则有:,记:A=Xx0,An=Xxn,n=1,2,则:A1 A2 An 且,即:F(x0)=F(x0+0),而x0是任意的。,试说明F(x)能否

13、是某个r.v 的分布函数.,例14 设有函数 F(x),解: 注意到函数 F(x)在 上下降, 不满足性质(1),故F(x)不能是分布函数.,不满足性质(2), 可见F(x)也不能是r.v 的 分布函数.,或者,练:设连续性随即变量X的分布函数为,其中,,为参数。,求A,B的值,并计算P(-1X1)的概率。,(1,-1,1- ),小结: 1.随机变量是概率论中最重要的概念之一,用随机变量描述随机现象是近代概率中最重要的方法。 2. 分布函数完整的描述了随机变量。 分布函数是在(-,+)上值域为 0,1的普通函数,它具有良好的分析性质(四条),反之,若任意一个实值函数满足以上四条性质,则该函数一

14、定是一个分布函数。 分布函数是研究随机变量的重要工具。,思考:不同的随机变量,它们的分布函数一定也不相同吗?,答,不一定.,例如抛均匀硬币, 令,设X是一个离散型随机变量,它可能取的值是 x1, x2 , .为了描述随机变量 X ,我们不仅需要知道随机变量X的取值,而且还应知道X取每个值的概率.,2.2 离散型随机变量及其分布律,1离散型随机变量的定义 设X为一随机变量,如X的全部可能取到的值是有限个或可列无限多个,则称随机变量X为离散型随机变量。,其中 (k=1,2, ) 满足:,(2),用这两条性质判断 一个函数是否是 概率函数,证明:非负性显然,下证规范性。设离散型r.v. X的取值为x

15、1,xn, 则事件组X=x1,X=xn,构成了的一个划分。,分布律的性质的证明,解: 依据概率函数的性质:,a0,从中解得,欲使上述函数为概率函数,应有,2、表示方法,(2)公式法,(1)列表法:分布律可以用表格的形式表示:xn一般从小到大排列。,(3)图示法: 分布律可以用图形表示,3、离散型随机变量及其分布举例,例2. 某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布.,解: X可取0、1、2为值,P(X =0)=(0.1)(0.1)=0.01,P(X =1)= 2(0.9)(0.1) =0.18,P(X =2)=(0.9)(0.9)=0.81,且 P(X =0)+

16、P(X =1)+ P(X =2)=1,例3. 某射手连续向一目标射击,直到命中为止,已知他每发命中的概率是p,求所需射击发数X 的概率函数.,解: 显然,X 可能取的值是1,2, ,,P(X=1)=P(A1)=p,为计算 P(X =k ), k = 1,2, ,,Ak = 第k发命中,k =1, 2, ,,设,于是,可见,这就是求所需射击发数X的概率函数.,P(X=1)=P(A1)=p,Ak = 第k发命中,k =1, 2, ,,设,于是,若随机变量X的概率函数如上式,则称X具有几何分布.,不难验证:,例4. 一汽车沿一街道行驶,需要通过三个均设有红绿信号灯的路口,每个信号灯为红或绿与其它信号

17、灯为红或绿相互独立,且红绿两种信号灯显示的时间相等. 以X表示该汽车首次遇到红灯前已通过的路口的个数,求X的概率分布.,解: 依题意, X可取值0, 1, 2, 3.,P(X=0)=P(A1)=1/2,X表示该汽车首次遇到红灯前已通过的路口的个数,即,不难看到,X表示该汽车首次遇到红灯前已通过的路口的个数,例5 重复独立的进行贝努力试验,直到事件A出现r (r1)次为止,求试验次数X的分布律.,k= r, r+1,称X服从Pascal分布。当r=1时,,X服从几何分布。,解:设每次试验事件A出现的概率为p,若当第k次试验时,事件A出现r次,则前k-1次试验事件A出现r-1次,于是,(1)已知随

18、机变量X的分布律,可求出X的分布函数: 设一离散型随机变量X的分布律为 PX=xk=pk (k=1,2,) 由概率的可列可加性可得X的分布函数为,这里的和式是所有满足xkx的k求和的。分布函数F(x)在x=xk(k=1,2,)处有跳跃,其跃跳值为pk=Px=xk。,分布律与分布函数的关系,已知随机变量X的分布律, 亦可求任意随机事件的概率。 例如,求事件XB(B为实轴上的一个区间)的概率P XB时,只需将属于B的X的可能取值找出来,把X取这些值的概率相加,即可得概率P XB,即,因此,离散型随机变量的分布律完整地描述它的概率分布情况。,(2)已知随机变量X的分布函数,可求出X的分布律:,设一离

19、散型随机变量X的分布函数为F(x),并设F(x)的所有间断为x1,x2,,那么,X的分布律为,例6: 设随机变量X的分布律为,求X的分布函数,并求,解: 由概率的有限可加性,得所求分布函数为,F(x)的图形如下图所示,它是一条阶梯形的曲线,在x1,2,3处有跳跃点,跳跃值分别为1/4,1/2,1/4。,于是,例7已知随机变量X的分布律为,试求(1)待定系数a,(2)概率PX1/2。,即可求得a=1/6。 (2),解: (1)由分布律的性质可知,1.(01)分布: 设随机变量X只可能取0与1两个值,它的分布律为 PX=k=pk(1-p)1-k , k=0,1. (0p1)则称X服从(01)分布,

20、记为X(01)分布。 (01)分布的分布律用表格表示为:,易求得其分布函数为:,二、三种常用离散型随机变量的分布,贝努利概型,考虑一个简单的试验,它只出现(或只考虑)两种结果,如某产品抽样检查得合格或不合格,射击命中或不命中,试验成功或失败,发报机发出信号0或1。掷一次骰子点数“6”是否出现。一般地,试验E只有两种结果A和A,而P(A)=p(0p1),则称E为贝努利试验或贝努利概型。,设E为贝努利试验,将E独立地重复进行n次,(这里的“重复”是指试验E在相同条件下进行)而且每次试验中结果A出现的概率保持不变。我们把这n次独立重复贝努利试验总起来看成一个试验,称这种试验叫n重贝努利试验。总之,n

21、重贝努利试验有下面四个约定: (1)每次试验的结果只能是两个可能的结果A和A之一,(2)A在每次试验中出现的概率p保持不变, (3)各次试验相互独立, (4)共进行了n次.,定理 对于n重贝努利试验,事件A在n次试验中出现k次的概率为,证明:由n重贝努利试验,事件A在某指定的k次试 验中出现,而在其余n-k次试中不出现的概率为 pk(1-p)n-k = pkqn-k,由于 恰好是展开式(p+q)n中的第k项,所以常称 为二项概率公式。,而在n次试验中事件A发生k次共有Cnk种不同情况,对应的事件为互不相容的,由概率的可加性,例1: 对某种药物的疗效进行研究,假定这药对某种疾病的治愈率0.8,现

22、有10个人患此病的病人同时服用此药,求其中至少有6个病人治愈的概率。 解: 假定“病人服用此药后治愈”为事件A,按题意 P(A)=0.8,,10人同时服用此药可视为10重贝努利试验,因而由公式所求的概率为,例2: 某厂生产的过程中出现次品的概率为0.003,求在该厂生产的1000件产品中恰好有10件次品的概率。 解: 设A表示事件“该厂生产的一件产品为次品”,则 P(A)=0.002,依题意所求的概率为,2.二项分布: 定义:若离散型随机变量X的分布律为,其中0p1,q=1-p,则称X服从参数为n,p的二项分布,记为Xb(n,p).,即X服从二项分布。,(1)试验模型:在n重贝努利试验中,若以

23、X表示事件A出现的次数,则X是一随机变量,X可能取的值为0,1,2,n,由二项概率公式可得X的分布律为,(2)因为 ,其中 恰为二项式 的一般项,故称为二项分布。,(3)当n=1时,二项分布为(01)分布,即 Xb(,p)。,(4)二项分布的分布律为:,对于固定n及p,当k增加时 ,概率P(X=k) 先是随之增加直至 达到最大值, 随后单调减少.,当(n+1)p不为整数时,二项概率P(X=k)在k=(n+1)p达到最大值;,( x 表示不超过 x 的最大整数),对于固定n及p,当k增加时 ,概率P(X=k) 先是随之增加直至 达到最大值, 随后单调减少.,当(n+1)p为整数时,二项概率P(X

24、=k)在k=(n +1)p和k =(n+1)p-1处达到最大值.,单调性与最可能成功次数,3、泊松分布的定义及图形特点,设随机变量X所有可能取的值为0 , 1 , 2 , , 且概率分布为:,其中 0 是常数,则称 X 服从参数为 的 泊松分布,记作XP() 或(X().,显然,历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松(Poisson)引入的 .,近数十年来,泊松分布日益显示 其重要性,成为概率论中最重要的几个分布之一.,在实际中,许多随机现象服从或近似服从泊松分布.,二项分布的泊松近似,当试验次数n很大时,计算二项概率变得很麻烦,如要计算,我们先来介绍二项分布的泊松

25、近似,后面我们还将介绍二项分布的正态近似.,或诸如此类的计算问题,必须寻求近似方法.,例某人射击,每次命中率为0.02,求在独立进行400次射击中,至少击中2次的概率? 解:设X表示射击400次击中的次数,由题意Xb(400,0.02)。,直接计算很繁,下面介绍possion定理。,泊松定理: 设0是一常数,n是任意正整数,设npn=,则对于任一固定的非负整数k,有,证明:由pn=/n有,对于任意固定的k,当n时,意义:定理的条件npn=(常数)意味着当n很大时,pn必定很小。因此,上述定理表明当n很大、p很小时有以下近似式,其中=np,由泊松近似公式计算上题:,分析结果:不能忽视小概率事件。

26、,(2) 泊松分布背景: 例如,在一个时间间隔内某电话交换台收到的电话的呼唤次数、一本书一页中的印刷错误数、某地区在一天内邮递遗失的信件数、某一医院在一天内的急诊病人数、某一地区一个时间间隔内发生交通事故的次数、在一个时间间隔内某种放射性物质发出的、经过计数器的粒子数等都服从泊松分布,泊松分布也是概率论中的一种重要分布。,例1 有300台机器,工作相互独立。发生故障概率为0.01,通常,一台机器的故障可由一人来修理(一人修一台),问至少需要多少工人,才能保证当设备发生故障但不能及时修理的概率小于0.01。,解:设需要配备修理工人数为N个,设备同时发生故障的台数为X台,由题知求最小的N为多少,即

27、使 PXN0.01. 因为XB(300 , 0.01),由于n很大,p很小,故用泊松分布近似,N+1=k8 = N=8(最小的)。,例2 由一个人负责维修20台设备。 (1)求设备发生故障,而不能及时修理的概率; (2)又若由三个人共同负责维修80台,求设备及时修理的概率。,解:(1)设X为发生故障的机器数,XB(20,0.01) X取值为0,1,2,20. 因为一人只能修一台机器,故所求概率为:,(2)设X为发生故障的机器数,XB(80,0.01) X取值:0,1,2,80。,结论:(1)(2),说明尽管情况2任务重了(一个人修27台),但工作质量提高了,也说明,概率方法可用来讨论国民经济中

28、某些问题,以使达到更有效地使用人力、物力、资源的目的,这是运筹学的任务,概率论是解决运筹学问题的有力工具。,n 100, np 10 时近似效果就很好,实际计算中,,其中,也就是,n很大时,B(n,p) P(np),容易理解,当p不是很小,而是很大( 接近于1),可将问题略为转换一下,仍然可以应用泊松近似.,当 n很大时,p不是很小,而是很大( 接近于1)时, 能否应用二项分布的泊松近似?,下面我们看一个应用例子.,例8 为保证设备正常工作,需要配备适量的维修人员 . 设共有300台设备,每台的工作相互独立,发生故障的概率都是0.01.若在通常的情况下,一台设备的故障可由一人来处理 . 问至少

29、应配备多少维修人员,才能保证当设备发生故障时不能及时维修的概率小于0.01?,我们先对题目进行分析:,300台设备,独立工作,出故障概率都是0.01. 一台设备故障一人来处理. 问至少配备多少维修人员,才能保证当设备发生故障时不能及时维修的概率小于0.01?,设X为300台设备同时发生故障的台数,,300台设备,独立工作,每台出故障概率 p=0.01 . 可看作n=300的贝努里概型.,XB(n,p),n=300, p=0.01,可见,,300台设备,独立工作,出故障概率都是0.01 . 一台设备故障一人来处理. 问至少配备多少维修人员,才能保证当设备发生故障时不能及时维修的概率小于0.01?

30、,设X为300台设备同时发生故障的台数,,XB(n,p),n=300, p=0.01,设需配备N个维修人员,,所求的是满足,P(XN) 0.01 或 P(X N) 0.99,的最小的N.,设需配备N个维修人员,,所求的是满足,P(XN) 0.01的最小的N.,P(XN),n大,p小,np=3, 用 =np=3 的泊松近似,下面给出正式求解过程:,即至少需配备8个维修人员.,查泊松分布表得,N+1 9,即N 8,例9 在上例中,由一个人负责维修20台设备。 (1)求设备发生故障,而不能及时修理的概率; (2)又若由三个人共同负责维修80台,求设备及时修理的概率。,解:(1)设X为发生故障的机器数

31、,XB(20,0.01) X取值为0,1,2,20. 因为一人只能修一台机器,故所求概率为:,(2)设X为发生故障的机器数,XB(80,0.01) X取值:0,1,2,80。,结论:(1)(2),说明尽管情况2任务重了(一个人修27台),但工作质量提高了,也说明,概率方法可用来讨论国民经济中某些问题,以使达到更有效地使用人力、物力、资源的目的,这是运筹学的任务,概率论是解决运筹学问题的有力工具。,例5 (寿险)在保险公司里有2500个同一年龄和同社会阶层的人参加人寿保险在一年里死亡的概率为0.002,每个参加保险的人在一月一日付12元保险费,而死亡时家属可由保险公司领2000元。(1)求公司亏

32、本的概率(2)求获利不小于10000元的概率。 解;(1)公司一年总收入2500*12=30000, X:一年中死亡人数。 Xb(2500 , 0.002),要2000X30000,(2),由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.,我们把在每次试验中出现概率很小的事件称作稀有事件.,如地震、火山爆发、特大洪水、意外事故等等,在自然界和人们的现实生活中,经常要遇到在随机时刻出现的某种事件.我们把在随机时刻相继出现的事件所形成的序列,叫做随机事件流.,若事件流具有平稳性、无后效性、普通性,则称该事件流为泊松事件流(泊松流).,泊松分布产生的一般条件,下面简要解释平稳性、无

33、后效性、普通性.,平稳性:,在任意时间区间内,事件发生k次(k0)的概率只依赖于区间长度而与区间端点无关.,无后效性:,普通性:,在不相重叠的时间段内,事件的发生是相互独立的.,如果时间区间充分小,事件出现两次或两次以上的概率可忽略不计.,对泊松流,在任意时间间隔(0,t)内,事件 (如交通事故)出现的次数服从参数为 t 的 泊松分布 . 称为泊松流的强度.,都可以看作泊松流.,某电话交换台收到的电话呼叫数;,到某机场降落的飞机数;,一个售货员接待的顾客数;,一台纺纱机的断头数;,一放射性源放射出的 粒子数;,例如,()超几何分布 设一堆同类产品共N件,其中有M个次品,现从中任取n个(为方便计

34、算。假定nN-M),则这n个中所含的次品数X是个离散型随机变量,X的分布律为,其中L=min(M,n) ,这个概率分布称为超几何分布。,三、其它常见的分布,()几何分布 在独立重复试验中,设A在每次试验中发生的概率均为p,记X为A首次发生时的试验次数。 则不难验证,X具有如下分布律,这个概率分布称为几何分布。,()巴斯卡分布 在独立重复试验中,若记X为A在第r次发生时的 试验次数,则X的分布律为,这个分布称为巴斯卡分布。,对于离散型随机变量,如果知道了它的概率函数,也就知道了该随机变量取值的概率规律. 在这个意义上,我们说,这一讲,我们介绍了离散型随机变量及其概率分布,以及几种离散型分布.,离

35、散型随机变量由它的概率函数唯一确定.,下一节,我们将向大家介绍连续型随机变量的描述方法.,1.定义:设随机变量X的分布函数为F(x),若存在非负函数f(x),使对于任意实数x,有,则称X为连续型随机变量,其中函数f(x)称为随机变量X的概率密度函数,简称为概率密度。,例如:在0,1取点的例,设X为取得点的坐标,则随机变量X的分布函数为,2.3 连续型随机变量及其概率密度,则X为连续型随机变量。,2. 连续型随机变量的分布函数F(x)性质 (1).连续型随机变量的分布函数F(x)是连续函数。 (2).对于连续型随机变量X来说,它取任一指定实数a的概率均为零,即PX=a=0。 事实上,设X的分布函

36、数为F(x),则PX=a=F(a)-F(a-0)而F(x)为连续函数,所以有F(a-0)=F(a),即得: PX=a=0. 这里PX=a=0 ,而事件X=a并非不可能事件。就是说,若A是不可能事件,则有P(A)=0;反之,若P(A)=0 ,A并不一定是不可能事件。同样的,对必然事件也有类似的结论。,(3)在计算连续型随机变量X落在某一区间的概率时,不必区分该区间是开区间或闭区间或半开区间。例如有 PaXb=PaX b = Pa X b=PaXb 3.概率密度f(x)的性质: (1).f(x)0 (2).,反之,满足(1)(2)的一个可积函数f(x)必是某连续型随机变量X的概率密度,因此,常用这

37、两条性质检验f(x)是否为概率密度。 几何意义:曲线y=f(x)与x 轴之间的面积等于1,(3).X落在区间(x1,x2)的概率,几何意义:X落在区间(x1,x2)的概率Px1Xx2等于区间(x1,x2)上曲线y=f(x)之下的曲边梯形的面积,(4).若f(x)在点x处连续,则有F(x)=f(x)。,这是因为 ,当f(x)连续时, F(x)可导,所以在f(x)的连续点处,F(x)=f(x).,(5)概率密度f(x)的物理意义 由性质4 在f(x)的连续点x处有,这里我们看到概率密度的定义与物理学中的线密度的定义相类似,若非均匀直线的线密度为f(x),则在区间(x1,x2)上的直线的质量为 这就

38、是称f(x)为概率密度的原因,它反映了概率在x点处的密集程度。,4概率密度f(x)与分布函数F(x)的关系: (1)若连续型随机变量X具有概率密度为f(x),那么它的分布函数为,(2)若连续型随机变量X的分布函数为F(x),那么它的概率密度为f(x)=F(x).,注意:对于F(x)不可导的点x处,f(x)在该点x处的函数值可任意给出。,例1: 设随机变量X具有概率密度,(1)试确定常数k,(2)求F(x),(3)并求PX0.1。,解: (1)由于 , ,解得k=3.,于是X的概率密度为,(2)从而,例2: 确定常数A,B使得函数,为连续型随机变量X的分布函数,并求出X的概率密度及概率P-1X2

39、。,解: 由分布函数的性质知,所以 B=1. 又由连续型随机变量的分布函数的连续性知F(x)在x=0处有F(0-0)=F(0),即:A=1-A,所以:A=1/2 于是X分布函数为:,X的概率密度为,1设连续随机变量X具有概率密度,则称X在区间(a,b)上服从均匀分布,记为XU(a,b). 若XU(a,b),则容易计算出X的分布函数为,二、三种重要的连续型分布:,f(x)及F(x)的图形分别如:,例1: 设电阻值R是一个随机变量,均匀分布在900欧1100欧。求R的概率密度及R落在950欧1050欧的概率。 解: 按题意,R的概率密度为,例2: 设分布函数F(x)为严格递增的分布函数,F-1(x

40、)为F(x)的反函数,若XU (0,1),证明Y=F-1(X)的分布函数为F(y)。 证明: 设Y的分布函数为FY(y),由分布函数的定义有 FY(y)=PYy=P F-1(X)y=P XF(y)=F(y) 这个结论在随机模拟中具有基本的重要性。,注释 (1).均匀分布的特性:若XU(a,b),对于任意的区间(c,c+l)(a,b),则,就是说在同样长的子区间内概率是相同的,这个概率 只依赖于区间的长度而不依赖于区间的位置。 (2). 我们现在能把一个区间a,b上随机地选取一个点P 的直观概念加以精确化。简单地说就是所选取的点P的坐 标X在a,b上是均匀分布的。,2. 指数分布 设连续型随机变

41、量X具有概率密度为,其中o为常数,则称X服从参数为的指数分布。 容易验证: 指数分布的分布函数为,f(x)及F(x)的图形,指数分布的一个重要特性是”无记忆性”. 设随机变量X满足:对于任意的so,t0,有,则称随机变量X具有无记忆性。,设随机变量X服从参数为的指数分布,则,因此PXs+t|Xs=PXt,即指数分布具有”无记忆性”.,例 设设备在任何长为t 时间内发生故障的次数N(t)(t) 的possion分布,求相继两次故障间的时间间隔T的分布函数。,解:分析:关键:t0时,Tt=N(t)=0. 时间间隔大于t,在0,t时间内未发生故障。 因为Tt=N(t)=0,服从参数为的指数分布。,验

42、证f(x)是一个合理的概率密度函数: 显然,f(x)0; 下面验证,(1)定义1:设随机变量X的概率密度为,其中,(0)为常数,则称X服从参数为,2的正态分布,记为XN(,2)。,3正态分布,对于积分 ,作代换 ,则,定义2:当=0,=1时称X服从标准正态分布,记为 XN(0,1),其概率密度为,正态分布是应用最广泛的一种连续型分布.,正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.,德莫佛,德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.,第五章中,我们将介绍为什么这么多随机现象都近似服从正态分布 .,高 尔 顿 钉 板 试 验,这条曲线就近似我们将要

43、介绍的正态分布的密度曲线。,决定了图形的中心位置, 决定了图形中峰的陡峭程度.,正态分布 的图形特点,(2) 正态密度函数f(x)的几何特征 因为,得:驻点:x=,为函数的极大值点; 拐点:x=.作图如下,所以 曲线关于x=对称,这表明对于任意ho,有 P-hX= PX+h ; 当x=时取到最大值,X离越远,f(x)的值越小,表明对于同样长度的 区间,当区间离越远,X落这个区间上的概率越 小。,在x=处曲线有拐点,又由于 , 所以曲线以x轴为水平渐近线。,如果固定,改变的值,则图形沿着Ox轴平移,而不改变其形状,可见正态分布的概率密度曲线y=f(x)的位置完全由参数所确定,称为位置参数。 如果

44、固定,改变,由于最大值 ,可知当越小时图形变得越尖,因而X落在附近的概率越大。,(3) 正态分布的概率计算 标准正态分布的概率计算若XN(0,1),则概率密度 ,如图。,X的分布函数为:,一般的, 通过查表求得。,常用性质: A.对于任意实数x,有(x)+(-x)=1.,一般正态分布的概率计算 若XN(,2),则X的分布函数为:,对此积分作代换 s=(t-)/,则,因此计算F(x)时化为求 ,可查表求得.,一般的,,例1: 设XN(1.5,22),求P-1x2。 解:,查表得:(3-c)/2=0.43, 即c=2.14,例2: 设X具有分布N(3,4),求数c,使得 Pxc=2Pxc。 解:,

45、例3 假设测量的随机误差XN(0 , 102),试求在100次独立重复测量中至少有三次测量的绝对值大于19.6(A)的概率,并利用possion分布求的近似值。 解:设p为每次测量误差绝对值大于19.6的概率, p=P|X|19.6=P|X|/10 19.6/10 =P|X|/101.96 =1- P|X|/101.96 =1-(1.96)+(-1.96) =1-(1.96)+1-(1.96) =2-2(1.96) =0.05,设Y表示100次独立测量中事件A出现的次数,则: Yb(100 , 0.05),例4 已知X N(, 2).求:,2)P|X-|2=2(2)-1=0.9544 3)P|

46、X-|3=2(3)-1=0.9944 说明:X N(, 2)落在(-3,3)内的概率为0.9944, 这一事实称为“3规则”这也是N(0 , 1)表只作(-3 , 3)内的概率的原因。,例2 公共汽车车门的高度是按男子与车门 顶头碰头机会在0.01以下来设计的.设男子 身高XN(170,62),问车门高度应如何确定?,解: 设车门高度为h cm,按设计要求,P(X h)0.01,或 P(X h) 0.99,,下面我们来求满足上式的最小的 h.,再看一个应用正态分布的例子:,因为XN(170,62),查表得 (2.33)=0.99010.99,所以 =2.33,即 h=170+13.98 184

47、,设计车门高度为 184厘米时,可使 男子与车门碰头 机会不超过0.01.,由标准正态分布的查表计算可以求得,,这说明,X的取值几乎全部集中在-3,3区间 内,超出这个范围的可能性仅占不到0.3%.,当XN(0,1)时,,P(|X| 1)=2 (1)-1=0.6826,P(|X| 2)=2 (2)-1=0.9544,P(|X| 3)=2 (3)-1=0.9974,3 准则,将上述结论推广到一般的正态分布,时,,这在统计学上称作“3 准则” (三倍标准差原则).,2.4 随机变量的函数的分布,这类问题一般的提法是:若X是随机变量,求Y=g(X)的分布(其中y=g(x)是x的一个实值函数)。 为了

48、求Y的分布,首先我们要理解Y是一个怎样的随机变量,设X是定义在样本空间=上的随机变量,那么Y=Y()=g(X(),由此可见Y亦是定义在上的随机变量,它是经过g(.)与X(.)复合而成的。,引言,一、问题的提出,在实际中,人们常常对随机变量的函数 更感兴趣.,求截面面积 A= 的分布.,例如,已知圆轴截面直径 d 的分布,,已知t=t0 时刻噪声电压 V的分布,,求功率 W=V2/R (R为电阻)的分布等.,设随机变量X 的分布已知, 求Y=g (X) (设g是连续函数的分布?,这个问题无论在实践中还是在理论上都是重要的.,为了求Y的分布,首先我们要理解Y是一个怎样的随机变量,设X是定义在样本空

49、间=上的随机变量,那么Y=Y()=g(X(),由此可见Y亦是定义在上的随机变量,它是经过g(.)与X(.)复合而成的。,一、离散型随机变量函数的分布,设X是离散型随机变量,则Y=g(X)一般也是离散型随机变量。 此时,只需由X分布律求得Y的分布律即可。,求(1)Y=X-1; (2)Y= -2X2的分布律,例: 设离散型随机变量X的分布律为,解: 由X的分布律可得下表 P 2/10 1/10 1/10 3/10 3/10 X -1 0 1 2 3X-1 -2 -1 0 1 2-2X2 -2 0 -2 -8 -18 由此可见 (1)Y=X-1的所有可能取值为-2,-1,0,1,2,且 PY= -2

50、=PX= -1=2/10 ; PY= -1=PX=0=1/10 ; PY=0=PX=1=1/10 ; PY=1=PX=2=3/10; PY=2=PX=3=3/10。,故得Y=X-1的分布律为,(2) Y= -2X2的所有可能取值为-18,-8,-2,0;且 PY= -18=PX=3= 3/10 ; PY= -8=PX=2=3/10 ; PY= -2=PX=1+ PX= -1 =1/10 + 3/10=2/5 ; PY=0=PX=0=1/10;,故得Y= -2X2的分布律为,一般地,我们先由X的取值xk,k=1,2,求出Y的取值yk=g(xk),k=1,2 如果诸yk都不相同,则由Y=yk=PX

51、=xk可得Y的分布律; 如果诸yk中有某些取值相同,则把相应的X的取值的概率相加。,二、连续型随机变量函数的分布,再由FY(y)进一步求出Y的概率密度,设X为连续型随机变量,具有概率密度fx(x),求Y=g(X) (g连续)的概率密度。,1一般方法分布函数法 可先求出Y的分布函数FY(y): 因为FY(y)=PYy=Pg(X)y,设ly=x|g(x)y 则,例1:设随机变量X具有概率密度,求Y=2X+1的概率密度. 解: 先求Y的分布函数,计算的关键在于确定积分区间ly,即解不等式g(x)y得出x的解区间ly。这种方法我们称之为分布函数法。,当 1y9时,0(y-1)/24 ,,当 y9时 FY(y)=1,由此可得Y的概率密度为,当 y1时,(y-1)/20 FY(y)=0,求导可得,当 y0 时,注意到 Y=X2 0,故当 y 0时,,解: 设Y和X的分布函数分别为 和 ,,若,则 Y=X2 的概率密度为:,此时称Y服从自由度为1的 分布。,练 设随机变量X的概率密度为,求Y=sinX的概率密度.,当 y 0时,当 y 1时,故,解:注意到,=P(0 X arcsiny)+P( - arcsiny X ),解:当0y1时,练 设随机变量X的概率密度为,求Y=sinX

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论