《概率论与数理统计》第二章随机变量及其分布课件_第1页
《概率论与数理统计》第二章随机变量及其分布课件_第2页
《概率论与数理统计》第二章随机变量及其分布课件_第3页
《概率论与数理统计》第二章随机变量及其分布课件_第4页
《概率论与数理统计》第二章随机变量及其分布课件_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 随机变量及其分布随机变量离散型随机变量及其分布规律分布函数连续型随机变量及其概率密度随机变量的函数的分布第1页,共84页。为了揭示随机现象的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化,引入随机变量的概念。 在随机现象中,有很大一部分问题与数值发生关系,例如在产品检验问题中,我们关心的是抽样中出现的废品数;在电话问题中关心的是某段时间中的话务量,它与呼叫的次数及各次呼叫占用交换设备的时间长短有关。这些都与数值有关。 有些初看起来与数值无关的随机现象,也常常能联系数值来描述,例如在掷硬币问题中,每次出现的结果为正面或反面,与数值没有关系,但是我们能用下面方法使它

2、与数值联系起来,当出现正面时对应数“1”,而出现反面时对应数“0”,为了计算n次投掷中出现的正面数就只须计算其中“1”出现的次数了。2.1 随机变量的概念第2页,共84页。一般地,如果A为某个随机事件,则一定可以通过如下示性函数使它与数值发生联系: 如果A发生 如果A不发生 这些例子中,试验的结果能用一个数x来表示,这个数x是随着试验的结果的不同而变化的,也即它是样本点的一个函数,这种量以后称为随机变量。下面我们就来考虑应当如何给这种量以严格的数学定义。 正如对随机事件一样,我们所关心的不仅是试验会出现的结果,更重要的是要知道这些结果将以怎样的概率出现,也即对随机变量我们不但要知道它取什么数值

3、,而且要知道它取这些数值的概率。第3页,共84页。例1:将一枚硬币抛掷3次,我们感兴趣的是三次投掷中,出现H的总次数,而对H,T出现的次序不关心。以X记三次投掷中出现H的总次数,那么对于样本空间=中的每一个样本点,X都有一个值与之对应,即有样本点HHH HHT HTH THH HTT THT TTH TTT X的值 3 2 2 2 1 1 1 0我们注意到,随机变量的取值随试验的结果而定,而试验的各个结果出现有一定的概率,因而随机变量的取值有一定的概率。如,当且仅当事件A=HHT,HTH,THH发生时有x=2,而且P(A)=3/8,则Px=2=3/8。 设随机试验的样本空间为=,X=X()是定

4、义在样本空间上的单值实函数,称X=X()为随机变量。 随机变量 第4页,共84页。 X取其各个可能值xk(k1,2,)的概率PXxkpk,称为离散型随机变量X的概率函数或概率分布,简称分布律。分布律也可以用表格的形式来表示: 如果随机变量X的取值是有限个或可列个值,则称X为离散型随机变量。离散型随机变量的概念Xx1 x2 xn pkp1 p2 pn 离散型随机变量的概率分布2.2 离散型随机变量及其分布第5页,共84页。 在离散型随机变量的概率分布中,事件“X=x1”, “X=x2”.“X=xk”,.构成一个完备事件组。因此,上述概率分布具有以下两个性质: 第6页,共84页。例:设一汽车在开往

5、目的地的道路上需经过四组信号灯,每组信号灯以12的概率允许或禁止汽车通过。以X表示汽车首次停下时,它已通过的信号灯的组数(设各组信号灯的工作是相互独立的),求X的分布律。解 以p表示每组信号灯禁止汽车通过的概率,易知X的分布律为或写成 PX=k=(1-p)kp,k=0,1,2,3,PX=4=(1-p)4以p=1/2代入得X 0 1 2 3 4pk p (1-p)p (1-p)2p (1-p)3p (1-p)4X 0 1 2 3 4pk0.5 0.25 0.125 0.0625 0.0625P34 例题2.8第7页,共84页。 两点分布或(0-1)分布 对于一个随机试验,如果它的样本空间只包含两

6、个元素,即=1,2,我们总能在上定义一个服从(0-1)分布的随机变量来描述这个随机试验的结果。 例如,对新生婴儿的性别进行登记,检查产品的质量是否合格,某车间的电力消耗是否超过负荷以及前面多次讨论过的“抛硬币”试验等都可以用(0-1)分布的随机变量来描述。(0-1)分布是经常遇到的一种分布。常见离散型随机变量的概率分布第8页,共84页。 (0-1)分布的分布律也可写成 设随机变量X只可能取0与1两个值,它的分布律是 PXkpk(1-p)1-k,k0,1 (0p1),则称X服从(0-1)分布或两点分布。X0 1pk1-p p 第9页,共84页。 考虑n重伯努里试验中,事件A恰出现k次的概率。 以

7、X表示n重伯努利试验中事件A发生的次数,X是一个随机变量,我们来求它的分布律。X所有可能取的值为o,1,2,n由于各次试验是相互独立的,故在n次试验中,事件A发生k次的概率为 二项分布与伯努利试验第10页,共84页。第11页,共84页。第12页,共84页。从图中可以看出,对于固定的n及p,当k增加时,b(k;n,p)险随之增加并达到某极大值,以后又下降。此外,当概率p越与1/2接近时,分布越接近对称。第13页,共84页。固定n和p,当k取何值时,b(k;n,p)取最大值? 由于对0p1,因此 当kb(k-1;n,p) 当k=(n+1)p时,b(k;n,p)=b(k-1;n,p) 当k(n+1)

8、p时,b(k;n,p)0,Ak为A在第k次试验中出现,则 于是在前n次试验中,A至少出现一次的概率为 其实际意义是,我们可以借助它判断事情的真实性。因为根据实际推断原理,小概率事件在一次试验中几乎是不可能发生的。而某一认为概率很小的事件,居然在一次试验中发生了,人们就有理由怀疑其正确性。第17页,共84页。例:设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是001,且一台设备的故障能由一个人处理。考虑两种配备维修工人的方法,其一是由4人维护,每人负责20台;其二是由3人共同维护80台试比较这两种方法在设备发生故障时不能及时维修的概率的大小。 解 按第一种方法。以X记“第1人维护的

9、20台中同一时刻发生故障的台数”,以Ai(i1,2,3,4)表示事件“第i人维护的20台中发生故障不能及时维修”,则知80台中发生故障而不能及时维修的概率为 P(A1UA2UA3UA4)P(A1)PX2 而Xb(20,001),故有第18页,共84页。 按第二种方法以Y记80台中同一时刻发生故障的台数。此时,Yb(80,0.01),故80台中发生故障而不能及时维修的概率为 我们发现,在后一种情况尽管任务重了(每人平均维护约27台),但工作效率不仅没有降低,反而提高了。第19页,共84页。例 保险事业是最早使用概率论的部门之一。保险公司为了估计企业的利润,需要计算各种各样的概率,例如:若一年中某

10、类保险者里面每个人死亡的概率等于0.005,现有10000个这类人参加人寿保险,试求在来来一年中在这些保险者里面,(1)有40个人死亡的概率;(2)死亡人数不超过70个的概率。解: 作为初步近似,可以利用贝努里概型,n=10000p=0005,设为未来一年中这些人里面死亡的人数,则所求的概率分别为第20页,共84页。 直接计算这些数值相当困难,要有更好的计算方法。可以利用概率论中的极限定理来实现近似计算。关于极限定理后面将讨论。第21页,共84页。 在事件A发生的概率为p的贝努利试验中,若以X=k记A首次出现时的试验次数,即表示试验进行了k次,前k-1次A都没出现。则X为随机变量,它可能取的值

11、为1,2,3,由独立性可知,X=k的概率为(1-p)k-1p,故X的分布律为: PX=k= (1-p)k-1p, k=1,2, 并称X服从参数为p的几何分布。 几何分布第22页,共84页。几何分布的无记忆性 在贝努利试验中,等待首次成功的时间服从几何分布。现在假定已知在前m次试验中没有出现成功,那么为了达到首次成功所再需要的等待时间也还是服从几何分布,与前面的失败次数m无关,形象化地说,就是把过去的经历完全忘记了。因此无记忆性是几何分布所具有的一个有趣的性质。但是更加有趣的是,在离散型分布中,也只有几何分布才具有这样一种特殊的性质。 若X是取正整数值的随机变量,并且,在已知Xk的条件下,X=k

12、+1的概率与k无关,那么X服从几何分布。(证明略)什么样的随机现象服从几何分布?第23页,共84页。 对某批N件产品进行不放回抽样检查,若这批产品中有M件次品,现从整批产品中随机抽出n件产品,则在这n件产品中出现的次品数v是随机变量,它取值0,1,2,n,其概率分布为超几何分布。 超几何分布第24页,共84页。 当N很大而n较小、M很大而k较小时,超几何分布可用二项分布近似第25页,共84页。 设随机变量X所有可能取的值为0,1,2,而取各个值的概率为其中0是常数。则称X服从参数为的泊松分布,记为X丌() 。 易知,PX=k)0,k=0,1,2,且有 泊松(poisson)分布第26页,共84

13、页。 历史上泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的,近数十年来,泊松分布日益显示其重要性,成了概率论中最重要的几个分布之一。 在实际应用中许多随机现象服从泊松分布。这种情况特别集中在两个领域中。一是社会生活,对服务的各种要求:诸如电话交换台中来到的呼叫数,公共汽车站来到的乘客数等等都近似地服从泊松分布,因此在运筹学及管理科学中泊松分布占有很突出的地位;另一领域是物理学,放射性分裂落到某区域的质点数,热电子的发射,显微镜下落在某区域中的血球或微生物的数目等等都服从泊松分布。 关于泊松分布第27页,共84页。例 对上海某公共汽车站客流进行调查,统计了某天上午10:30至1

14、1:47左右每隔20秒钟来到的乘客批数(每批可能有数人同时来到),共得230个记录,我们分别计算了来到0批,1批,2批,3批,4批及4批以上乘客的时间区间的频数,结果列于下表中,其相应的频率与=0.87的泊松分布符合得很好。 来到批数i01234总共频数ni100813496230频率fi=ni/n0.430.350.150.040.03Pi=ie-/i!0.420.360.160.050.01公共汽车客流统计第28页,共84页。 二项分布的泊松(poisson)逼近 在很多应用问题中,我们常常这样的贝努利试验,其中,相对地说,n大,p小,而乘积=np大小适中。在这种情况下,有一个便于使用的近

15、似公式。 定理(泊松) 在贝努利试验中,以pn代表事件A在试验中出现的概率,它与试验总数n有关,如果npn ,则当n时, 在应用中,当p相当小(一般当p0.1)时,我们用下面近似公式第29页,共84页。证 记n=npn,则第30页,共84页。 把随机现象中事件的发生看作“流”的时候,如果事件流满足:(1)平稳性。即流的发生次数只与时间间隔t的长短有关,而与初始时刻无关;2)无后效性。即任一时间t0前流的发生与t0后流的发生无关;(3)普通性。即当时间间隔t很小时,流至多发生一次。则“流”称为泊松流,其概率分布服从泊松分布。(证明略)什么样的随机现象服从泊松分布? 如商店里等待服务的顾客数,电话

16、交换台的呼唤数,火车站的乘客数,铸件的气孔数,棉布的疵点数,田地里一定面积上的杂草数,房间里单位面积上的尘埃数,等等,都属于普阿松分布的随机变量。普阿松分布被称为空间散布点子的几何模型。第31页,共84页。 超几何分布、二项分布和泊松分布都是重要的离散型随机变量的概率分布。有时,他们的概率计算会十分繁冗。当试验次数n很大时,可以推导出这三个分布间有一种近似关系式 这里,第一个等式要求n很大,且n/N较小,取p=M/N即成立。第二个等式要求n很大时成立。实际使用时,n20即可,当n50时,效果更好。而泊松分布可通过查表计算,比较简单。 超几何分布、二项分布和泊松分布之间的关系第32页,共84页。

17、 巴斯卡分布 在事件A发生的概率为p的贝努利试验中,若以记A第r次出现时的试验次数,则为随机变量,它可能取的值为r,r+1,,其概率分布为巴斯卡分布。显然当r=1时,即为几何分布。第33页,共84页。设X是随机变量,x是任意实数,函数称为X的分布函数。对于任意实数 分布函数2.3 分布函数 因此,若已知X的分布函数,就能确定X落在任意区间(x1,x2上的概率,从这个意义上说,分布函数完整地描述了随机变量的统计规律性。第34页,共84页。 分布函数的基本性质分布函数F(x)具有下列性质:F(x)是一个单调不减函数。即对于任意实数x1,x2 (x1x2), 有F(x1) F(x2);F(x)是右连

18、续的。即F(x+0)=F(x)第35页,共84页。F(x)是一个不减函数:对于任意实数x1,x2(x1x1x2xn,xnx成立因为 分布函数基本性质的证明第38页,共84页。 为什么分布函数定义为右连续? 定义左连续或者右连续只是一种习惯。目前,俄罗斯和东欧国家一般定义左连续;西欧和美国一般定义右连续;我国的大多数书籍也采用右连续。左连续和右连续的区别在于计算F(x)时,X=x点的概率是否计算在内。对于连续型随机变量而言,因为一点上的概率等于零,定义左连续和右连续没有什么区别;对于离散型随机变量,如果PX=x 0,则左连续和右连续时的F(x)值就不相同了。因此,在阅读关于概率论的参考书时,要注

19、意作者是定义左连续还是右连续的,以免出错。第39页,共84页。例: 设随机变量X的分布律为求X的分布函数,并求PX1/2,P3/2X5/2,P2X3.解X1 2 3pk1/4 1/2 1/4 第40页,共84页。F(X)的图形如下F(x)O1-1321X第41页,共84页。例:一个靶子是半径为2米的圆盘,设击中靶上任意同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能击中靶,以X表示弹着点于圆心的距离。试求随机变量X的分布函数。解 若x2,由题意,有 F(x)=PXx=1. 综合上述,即得X的分布函数为第42页,共84页。O1321X1/2F(x)第43页,共84页。第44页,共84页。

20、退化分布若随机变量a只取常数值c,即 Px=c=1这时分布函数为第45页,共84页。 连续型随机变量、概率密度函数 如果对于随机变量X的分布函数F(x),存在非负函数f(x)使对于任一实数x,有则称X为连续型随机变量。函数f(x)称为X的概率密度函数。 由数学分析的知识知,连续性随机变量的分布函数一定是连续函数。2.4 连续型随机变量及其分布第46页,共84页。 概率密度函数的性质 由分布函数的性质可知,概率密度函数具有以下性质: (1)f(x)0,函数曲线位于x轴上方; 反之,对于定义在(-, )上的可积函数f(x),若它满足性质1和性质2,则由它定义的F(x)是一个分布函数,即它满足分布函

21、数所必须具备的三个性质。第47页,共84页。 连续型随机变量在任何一点的概率为零 对于连续性随机变量X,X取任一指定实数值a的概率均为0,即PX=a=0。证 X的分布函数为F(x),x0,则由 Xa)a-x Xa)得 0PXaPa-xXaF(a)一F(a-x)。在上述不等式中令x0,并注意到X为连续型随机变量,其分布函数F(x)是连续的。即得 PXa=0第48页,共84页。注意 在计算连续型随机变量落在某一区间的概率时,可以不必区分该区间是开区间或闭区间或半闭区间。例如有 PaXbPaXb=PaX。此处,事件X=a)并非不可能事件,但有PXa=0这就是说,若A是不可能事件,则有P(A)=0;反

22、之,若P(A)0,并不一定意味着A是不可能事件。 以后当我们提到一个随机变量X的“概率分布”时,指的是它的分布函数;或者,当X是连续型时指的是它的概率密度,当X是离散型时指的是它的分布律。第49页,共84页。 连续型随机变量的f(x)x在概率中的含义 由概率密度f(x)的性质4,有 若不计高阶无穷小,有 PxXx+x f(x)x 这表示X落在小区间(x,x+x上的概率近似地等f(x)x。 第50页,共84页。例 设随机变量X具有概率密度确定常数k;求X的分布函数F(x);求P10为常数,则称X服从参数为的指数分布。相应的分布函数为: 分布函数第57页,共84页。 指数分布的无记忆性 这一性质称

23、为指数分布的无记忆性。事实上,指数分布是唯一具有上述性质的连续型分布。第58页,共84页。 分布设连续型随机变量X具有概率密度其中0,r0为常数,则称X服从分布。 显然当r=1时,分布化为指数分布。分布在概率论、数理统计、随机过程中有不少应用。第59页,共84页。 正态分布设连续型随机变量X的概率密度为其中,(0)为常数,则称X服从参数为,的正态分布或高斯(Gauss)分布,记为XN(,2)。相应的分布函数为: 分布函数第60页,共84页。性质:1.曲线关于x=对称。 2.当x=时取到最大值。 3.固定,改变,曲线沿Ox轴平移;固定,改变 ,曲线变得越尖,因而X落在附近的概率越大。正态分布密度

24、函数图示第61页,共84页。正态分布分布函数图示第62页,共84页。 标准正态分布当=0,=1时称X服从标准正态分布,记为XN(0,1)。其概率密度和分布函数分别用(x),(x)表示,即有显然(-x)=1- (x)另外,有(x)的函数表可查。第63页,共84页。第64页,共84页。思考 设XN(,2),由(x)的函数表得到: P-X+=(1)-(-1)=2(1)-1=68.26P-2X+2=(2)-(-2)=2(2)-1=95.44P-3X+3=(3)-(-3)=2(3)-1=99.74可见,服从正态分布的随机变量虽然取值在(-,+),但其值落在( -3,+3)内几乎是可以肯定的。第65页,共

25、84页。例 将一温度调节器放置在存储着某种液体的容器内,调节器定在d,液体的温度X(以计)是一个随机变量,且XN(d,0.52)。(1)若d=90,求X90的概率;(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?第66页,共84页。第67页,共84页。为什么说正态分布是概率论中最重要的分布? 正态分布表现为其取值具有对称性,极大部分取值集中在以对称点为中心的一个小区间内,只有少量取值落在区间外。在自然现象和社会现象中,大量随机变量都服从或近似服从正态分布。如人的身体特征指标(身高、体重),学习成绩,产品的数量指标等等都服从正态分布。许多较复杂的指标,只要在受到的大量因素作用下每个因素的影响都不显著,且因素相互独立,也可认为近似服从正态分布。又如二项分布、泊松分布在n很大时,也以正态分布为极限分布。因此,可以说正态分布是最重要的分布。第68页,共84页。 为什么要讨论随机变量函数的分布? 在实际中,我们常对某些随机变量的函数更感兴趣。例如,在一些试验中,所关心的随机变量往往不能由直接测量得到,而它却是某个能直

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论