随机变量及其分布_第1页
随机变量及其分布_第2页
随机变量及其分布_第3页
随机变量及其分布_第4页
随机变量及其分布_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章随机变量及其分布随机变量离散型随机变量及其概率分布随机变量的分布函数连续型随机变量及其概率密度随机变量的函数的分布在第一章中,我们用样本空间的子集,即基本事件的集合来表示随机试验的各种结果,这种表示方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大的局限。在本章中,我们将用实数来表示随机试验的各种结果,即引入随机变量的概念。这样,不仅可以更全面揭示随机试验的客观存在的统计规律性,而且可使我们用(数学分析)微积分的方法来讨论随机试验。在随机试验中,如果把试验中观察的对象与实数对应起来,即建立对应关系X,使其对试验的每个结果e,都有一个实数X(e)与之对应,试验的结果e实数X(e)对应关系X则X的取值随着试验的重复而不同,X是一个变量,且在每次试验中,究竟取什么值事先无法预知,也就是说X是一个随机取值的变量。由此,我们很自然地称X为随机变量。

关于随机变量(及向量)的研究,是概率论的中心内容.这是因为,对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而这些量就是随机变量.也可以说:随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,一如数学分析中的常量与变量的区分那样.变量概念是高等数学有别于初等数学的基础概念.同样,概率论能从计算一些孤立事件的概念发展为一个更高的理论体系,其基础概念是随机变量.2.1随机变量定义2.1(p.27)设E是一个随机试验,S是试验E的样本空间,如果对于S中的每一个样本点e,有一实数X(e)与之对应,这个定义在S上的实值函数X(e)就称为随机变量。由定义可知,随机变量X(e)是以样本空间S为定义域的一个单值实值函数。有关随机变量定义的几点说明:(1)随机变量X不是自变量的函数而是样本点e的函数,常用大写字母X、Y、Z或小写希腊字母

等表示。(2)随机变量X随着试验结果而取不同的值,因而在试验结束之前,只知道其可能的取值范围,而事先不能预知它取什么值,对任意实数区间(a,b),“a<X<b”的概率是确定的;(3)随机变量X(e)的值域即为其一切可能取值的全体构成的集合;(4)引入随机变量后,就可以用随机变量描述事件,而且事件的讨论,可以纳入随机变量的讨论中。例2.1一批产品中任意抽取20件作质量检验,作为检验结果的合格品的件数用X表示,则X是随机变量。X的一切可能取值为0,1,2,…,20{X=0}表示事件“抽检的20件产品中没有合格品”;{X=1}表示事件“抽检的20件产品中恰有1件合格品”;

……{X=k}表示事件“抽检的20件产品中恰有k件合格品”。例2.2将一颗骰子投掷两次,观察所的点数,以X表示所得点数之和,则X的可能取值为2,3,4,…,12,而且{X=2}={(1,1)},{X=3}={(1,2),(2,1)},{X=4}={(1,3),(2,2),(3,1)},……{X=12}={(6,6)}。随机变量X的取各个可能值的概率列于下表:X23456789101112P1/362/363/364/365/366/365/364/363/362/361/36……P(X=2)=1/36……………P(X=3)=2/36……P(X=4)=3/36…P(X=12)=1/36例2.4一个地铁车站,每隔5分钟有一列地铁通过该站。一位乘客不知列车通过该站的时间,他在一个任意时刻到达该站,则他候车的时间X是一个随机变量,而且X的取值范围是[0,5]?请举几个实际中随机变量的例子练习

引入适当的随机变量描述下列事件:①将3个球随机地放入三个格子中,事件A={有1个空格},事件B={有2个空格},事件C={全有球}。②进行5次试验,事件D={试验成功一次},事件F={试验至少成功一次},事件G={至多成功3次}随机变量的分类:随机变量2.2离散型随机变量及其概率分布

一、

离散型随机变量及其概率分布1、离散型随机变量的概念若某个随机变量的所有可能取值是有限多个或可列无限多个,则称这个随机变量为离散型随机变量。讨论随机变量的目的是要研究其统计规律性,要知道离散型随机变量X的统计规律必须且只须知道X的所有可能取值以及X取每一个可能值的概率。2、分布律(P.29)设离散型随机变量X,其所有可能取值为x1,x2,…,xk,…,且取这些值的概率依次为p1,p2,…,pk,…,即则称P(X=xk)=pk(k=1,2,…)为随机变量X的概率分布律,简称分布律。分布律可用表格形式表示为:P(X=xk)=pk,(k=1,2,…)而且满足(1)P(X=xk)=pk≥0,(k=1,2,…)(2)Xx1x2x3…xk…Pp1p2p3…pk…例2.5设袋中有5只球,其中有2只白球,3只黑球。现从中任取3只球(不放回),求抽得的白球数X为k的概率。解X=k的所有可能取值为0,1,2X是一个随机变量解设Ai

第i次射击时命中目标,i=1,2,3,4,5则A1,A2,…,A5相互独立,且P(Ai)=p,i=1,2,…,5。SX={0,1,2,3,4,5},例2.6某射手对目标独立射击5次,每次命中目标的概率为p,以X表示命中目标的次数,求X的分布律。二、几个常用的离散型随机变量的概率分布律1、(0-1)分布(p.30)

若随机变量X的分布律为:P(X=k)=pk(1-p)1-k,k=0,1,(0<p<1)则称X服从以p为参数的0-1分布,记为X~B(1,p)。0-1分布的分布律也可写成X10Pp1-p即随机变量只可能取0,1两个值,且取1的概率为p,取0的概率为1-p(0<p<1),亦即P(X=1)=p,P(X=0)=1-p。若某个随机试验的结果只有两个,如产品是否合格,试验是否成功,掷硬币是否出现正面等等,它们的样本空间为S={e1,e2},我们总能定义一个服从0-1分布的随机变量即它们都可用0-1分布来描述,只不过对不同的问题参数p的值不同而已。2、二项分布(1)贝努里(Bernoulli)模型(P22)

设随机试验满足:1°在相同条件下进行n次重复试验;2°每次试验只有两种可能结果,A发生或A不发生;3°在每次试验中,A发生的概率均一样,即P(A)=p;4°各次试验是相互独立的,则称这种试验为贝努里概型或n重贝努里试验。在n重贝努里试验中,人们感兴趣的是事件A发生的次数。以随机变量X表示n次试验中A发生的次数,X可能取值为0,1,2,3,…,n。设每次试验中A发生的概率为p,发生的概率为1-p=q。(X=k)表示事件“n重贝努里试验中A出现k次”,即这里每一项表示k次试验中出现A,而另外n-k次试验中出现,且每一项两两互不相容,一共有Cnk项。由4°独立性可知每一项的概率均为pk(1-p)1-k,因此此为n重贝努里试验中A出现k次的概率计算公式,记为(2)二项分布定义(P.31)若随机变量X具有概率分布律其中p+q=1,则称随机变量X服从以n,p为参数的二项分布,记为X~B(n,p)(或称贝努里分布)。可以证明:正好是二项式(p+q)n展开式的一般项,故称二项分布。特别地,当n=1时P(X=k)=pkq1-k(k=0,1)即为0-1分布。例2.7设有一大批产品,其次品率为0.002。今从这批产品中随机地抽查100件,试求所得次品件数的概率分布律。解

(视作放回抽样检验)设(X=k)表示事件“100件产品中有k件次品”,则X可能取值为0,1,2,…,100。本题可视作100重贝努里试验中恰有k次发生(k件次品),X~B(100,0.002)。因此,所求分布律为例2.9从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是1/3。(1)设X为汽车行驶途中遇到的红灯数,求X的分布律;(2)求汽车行驶途中至少遇到5次红灯的概率。解

(1)由题意,X~B(6,1/3),故X的分布律为:例2.10某人独立地射击,设每次射击的命中率为0.02,射击400次,求至少击中目标两次的概率。解每次射击看成一次试验,设击中次数为X,则X~B(400,0.02),X的分布律为所求概率为例2.10告诉我们两个事实:1°虽然每次射击的命中率很小(0.02),但射击次数足够大(为400次),则击中目标至少两次是几乎可以肯定的(概率为0.997)。

一个事件尽管在一次试验中发生的概率很小,但在大量的独立重复试验中,这事件的发生几乎是必然的,也就是说小概率事件在大量独立重复试验中是不可忽视的。2°若射手在400次独立射击中,击中目标的次数不到2次,则P(X<2)=1-P(X≥2)≈0.003,即命中目标次数不到两次是一件概率很小的事件,而这事件竟然在一次试验中发生了。则根据实际推断,我们有理由怀疑“每次射击命中率为0.02”是否正确,即可以认为命中率达不到0.02。

泊松(Poisson)定理设

>0,n是正整数,若npn=

,则对任一固定的非负整数k,有

即当随机变量X~B(n,p),(n=0,1,2,…),且n很大,p很小时,记=np,则例2.10可用泊松定理计算。取

=np=400×0.02=8,

近似地有P(X2)=1-P(X=0)-P(X=1)≈1-(1+8)e-8=0.996981

3、泊松(Poisson)分布

若随机变量X所有可能取值为0,1,2,…,且其中

>0是常数,则称X服从参数为

的泊松分布,记为X~P(

)。泊松定理表明,泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可近似地看成是参数=np的泊松分布。例2.12设某国每对夫妇的子女数X服从参数为

的泊松分布,且知一对夫妇有不超过1个孩子的概率为3e-2。求任选一对夫妇,至少有3个孩子的概率。 解由题意4、几何分布

设随机变量X的可能取值是1,2,3,…,且P(X=k)=(1-p)k-1p=qk-1p,k=1,2,3,…,其中0<p<1是参数,则称随机变量X服从参数p为的几何分布。几何分布背景:随机试验的可能结果只有2种,A与试验进行到A发生为止的概率P(X=k),即k次试验,前k-1次失败,第k次成功。2.3随机变量的分布函数前一节介绍的离散型随机变量,我们可用分布律来完整地描述。而对于非离散型随机变量,由于其取值不可能一个一个列举出来,而且它们取某个值的概率可能是零。例如:在测试灯泡的寿命时,可以认为寿命X的取值充满了区间[0,+∞),事件X=x0表示灯泡的寿命正好是x0,在实际中,即使测试数百万只灯泡的寿命,可能也不会有一只的寿命正好是x0,也就是说,事件(X=x0)发生的频率在零附近波动,自然可以认为P(X=x0)=0。

由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间(a,b]上的概率(a≤b)。

由于{a<x≤b}={x≤b}-{x≤a},(a≤b),因此对任意x∈R,只要知道事件{X≤x}发生的概率,则X落在(a,b]的概率就立刻可得。因此我们用P(X≤x)来讨论随机变量X的概率分布情况。P(X≤x):“随机变量X取值不超过x的概率”。

定义(P.36)

设X是一随机变量,x是任意实数,则实值函数F(x)=P{X

x},x∈(-∞,+∞)称为随机变量X的分布函数。有了分布函数定义,任意x1,x2∈R,x1<x2,随机变量X落在(x1,x2]里的概率可用分布函数来计算:P{x1<X

x2}=P{X

x2}-P{X

x1}=F(x2)-F(x1).在这个意义上可以说,分布函数完整地描述了随机变量的统计规律性,或者说,分布函数完整地表示了随机变量的概率分布情况。一、分布函数的概念一般地,X是离散型随机变量,其概率分布律为P(X=xk)=pk,(k=1,2,…)则X的分布函数F(x)为

F(x)的图像:非降,右连续,且在x1,x2,…,xk,…处跳跃。二、分布函数的性质(P37)

1、单调不减性:若x1<x2,

则F(x1)

F(x2);

2、归一性:对任意实数x,0

F(x)

1,且

3、右连续性:对任意实数x,反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。事件(X=c)并非不可能事件,它是会发生的,也就是说零概率事件也是有可能发生的。如X为被测灯泡的寿命。若灯泡寿命都在1000小时以上,而P(X=1000)=0,但事件(X=1000)是一定会发生的,否则不会出现事件(X>1000),所以

不可能事件的概率为零,但概率为零的事件不一定是不可能事件。同样,必然事件的概率为1,但概率为1的事件不一定是必然事件。例2.15

设随机变量X具分布律如下表解

X012P0.10.60.3试求出X的分布函数。例2.16

向[0,1]区间随机抛一质点,以X表示质点坐标。假定质点落在[0,1]区间内任一子区间内的概率与区间长成正比,求X的分布函数。解

F(x)=P(X≤x)

当x<0时,F(x)=0;当x>1时,F(x)=1当0≤x≤1时,特别,F(1)=P(0≤x≤1)=k=1例2.17离散型随机变量X的分布函数为求a,b及X的分布律。解因P(X=2)=a+b-(2/3-a)=1/2,a+b=1

于是a=1/6,b=5/6X的分布律为

X-112

p1/61/31/2例2.18设随机变量X的分布函数为求(1)常数A,B的值;(2)P(-1<X<1)。用分布函数描述随机变量不如分布律直观,对非离散型随机变量,是否有更直观的描述方法??ab2.4连续型随机变量及其概率密度1、概念(p39)设F(X)是随机变量X的分布函数,若存在非负可积函数f(x),(-

<x<+

),使对一切实数x,均有则称X为连续型随机变量,且称f(x)为随机变量X的概率密度函数,简称概率密度或密度函数。常记为X~f(x),(-

<x<+

)一、连续型随机变量及其概率密度函数X──连续型随机变量,则X的分布函数必是连续函数。

(1)

非负性

f(x)0,(-<x<+);2、密度函数的性质(p39)(2)(3)归一性事实上(4)若f(x)在x0处连续,则有(5)f(x)在x0处连续,且Δh充分小时,有

f(x)称为概率密度的原由。对任意实数c,若X~f(x),(-<x<+),则P(X=c)=0结论1连续型随机变量X取任一固定值的概率为0证明令即得P(X=c)=0。结论2对连续型随机变量X,有密度函数的几何意义为密度函数曲线位于Ox轴上方。即y=f(x),y=a,y=b,x轴所围成的曲边梯形面积。例2.19设求:(1)常数K;(2)X的分布函数;(3)解(1)由性质得解之得(2)X的分布函数为(3)练习

已知随机变量X的概率密度为(1)求X的分布函数F(x),(2)求P{X

(0.5,1.5)}二、几个常用的连续型随机变量的分布若随机变量X具有概率密度函数1.均匀分布(p.40)则称X在[a,b]上服从均匀分布,记作X~U[a,b]。对任意实数c,d

(a≤c≤d≤b),l=d-c,都有若X~U[a,b],则X具有下述等可能性:

X落在区间[a,b]中任意长度相同的子区间里的概率是相同的。即X落在子区间里的概率只依赖于子区间的长度,而与子区间的位置无关。X的分布函数f(x),F(x)的图像分别为O

ab

xf(x)O

ab

xF(x)1例2.22长途汽车起点站于每时的10分、25分、55分发车,设乘客不知发车时间,于每小时的任意时刻随机地到达车站,求乘客候车时间超过10分钟的概率。1545解设A—乘客候车时间超过10分钟,X—乘客于某时X分钟到达,则X

U(0,60)正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。2、正态分布ABA,B间真实距离为

,测量值为X。X的概率密度应该是什么形态?则称X服从参数为

,

2的正态分布,记为X~N(

,

2)。若随机变量X的概率密度函数为(其中

为实数,

>0)f(x)的图像为

(1)

单峰对称密度曲线关于直线x=

对称,即f(

+x)=f(

-x),x∈(-∞,+∞)正态分布密度函数f(x)的性质(p42)(2)x=时,f(x)取得最大值f(

)=;

(3)x=

±σ处有拐点;(4)

的大小直接影响概率的分布,

越大,曲线越平坦,

越小,曲线越陡峭。(如图)正态分布也称为高斯(Gauss)分布(5)曲线f(x)以x轴为水平渐近线。易知且事实上,令正态分布随机变量X的分布函数为其图像为OμxF(x)1标准正态分布(p43)

当参数

=0,

2=1时,称随机变量X服从标准正态分布,记作X~N(0,1)。分布函数表示为其密度函数表示为Ox1Φ(x)标准正态分布的密度函数与分布函数的图像分别为可得对于标准正态分布的分布函数Φ(x)的函数值,书后附有标准正态分布表(P.208)。表中给出了x>0的函数值。当x<0时,可利用Φ(-x)=1-

Φ(x)计算得到。例2.23已知X~N(0,1),求P(-∞<X≤-3),P(|X|<3)解P(-∞<X≤-3)=Φ(-3)=1-Φ(3)P(|X|<3)=P(-3<X<3)=Φ(3)-Φ(-3)=Φ(3)-[

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论