随机变量及其分布.ppt_第1页
随机变量及其分布.ppt_第2页
随机变量及其分布.ppt_第3页
随机变量及其分布.ppt_第4页
随机变量及其分布.ppt_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章随机变量及其分布,管理统计学,1随机变量,在概率的研究中为什么需要引入随机变量?,引入随机变量是研究随机现象统计规律性的需要。为了便于数学推理和计算,有必要将随机试验的结果数量化,使得可以用高等数学课程中的理论与方法来研究随机试验,研究和分析其结果的规律性,因此,随机变量是研究随机试验的重要而有效的工具。,如何引入随机变量的概念?,为了全面地研究随机试验的结果,揭示随机现象的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化,引入随机变量的概念。在随机现象中,有很大一部分问题与数值发生关系,例如在产品检验问题中,我们关心的是抽样中出现的废品数;在车间供电问题中,我们关心的是某时刻正在工作的车床数;在电话问题中关心的是某段时间中的话务量,它与呼叫的次数及各次呼叫占用交换设备的时间长短有关。此外如测量时的误差,气体分子运动的速度,信号接收机所收到的信号(用电压表示或数字表示)的大小,也都与数值有关。,例1:将一枚硬币抛掷3次,我们感兴趣的是三次投掷中,出现H的总次数,而对H,T出现的次序不关心。以X记三次投掷中出现H的总次数,那么对于样本空间S=e中的每一个样本点e,X都有一个值与之对应,即有,我们注意到,随机变量的取值随试验的结果而定,而试验的各个结果出现有一定的概率,因而随机变量的取值有一定的概率。如,当且仅当事件A=HHT,HTH,THH发生时有x=2,而且P(A)=3/8,则Px=2=3/8。,如何引入随机变量的概念?,有些初看起来与数值无关的随机现象,也常常能联系数值来描述,例如在掷硬币问题中,每次出现的结果为正面或反面,与数值没有关系,但是我们能用下面方法使它与数值联系起来,当出现正面时对应数“1”,而出现反面时对应数“0”,为了计算n次投掷中出现的正面数就只须计算其中“1”出现的次数了。,如何引入随机变量的概念?,一般地,如果A为某个随机事件,则一定可以通过如下示性函数使它与数值发生联系:如果A发生如果A不发生这些例子中,试验的结果能用一个数x来表示,这个数x是随着试验的结果的不同而变化的,也即它是样本点的一个函数,这种量以后称为随机变量。下面我们就来考虑应当如何给这种量以严格的数学定义。,如何引入随机变量的概念?,正如对随机事件一样,我们所关心的不仅是试验会出现的结果,更重要的是要知道这些结果将以怎样的概率出现,也即对随机变量我们不但要知道它取什么数值,而且要知道它取这些数值的概率。,本书约定:,大写字母,如:X,Y,Z,W等,表示随机变量;小写字母,如x,y,z,w等,表示实数;,2离散型随机变量及其分布律,设随机试验的样本空间为S=e,X=X(e)是定义在样本空间S上的单值实函数,称X=X(e)为随机变量。,随机变量,X取其各个可能值xk(k1,2,)的概率PXxkpk,称为离散型随机变量X的概率函数(概率分布或分布律)。分布率也可以用表格的形式来表示:称为随机变量X的分布律。,如果随机变量X的取值是有限个或可列无限多个,则称X为离散型随机变量。,离散型随机变量的概念,离散型随机变量的概率分布,由概率的定义,pk满足如下条件:(1)pk0;(2),例2:设一汽车在开往目的地的道路上需经过四组信号灯,每组信号灯以1/2的概率允许或禁止汽车通过。以X表示汽车首次停下时,它已通过的信号灯的组数(设各组信号灯的工作是相互独立的),求X的分布律。解以p表示每组信号灯禁止汽车通过的概率,易知X的分布律为,或写成PX=k=(1-p)kp,k=0,1,2,3,PX=4=(1-p)4以p=1/2代入得,(0-1)分布的分布律也可写成,(01)分布,设随机变量X只可能取0与1两个值,它的分布律是PXkpk(1-p)1-k,k0,1(0p1),则称X服从(0-1)分布或两点分布。,关于(01)分布,对于一个随机试验,如果它的样本空间只包含两个元素,即S=e1,e2,我们总能在S上定义一个服从(0-1)分布的随机变量来描述这个随机试验的结果。例如,对新生婴儿的性别进行登记,检查产品的质量是否合格,某车间的电力消耗是否超过负荷以及前面多次讨论过的“抛硬币”试验等都可以用(01)分布的随机变量来描述。(0-1)分布是经常遇到的一种分布。,伯努利试验,设试验E只有两个可能结果:A及,则称E为伯努利(Bernoulli)试验。,设P(A)p(0p(n+1)p时,b(k;n,p)0是常数。则称X服从参数为的泊松分布,记为X丌()。,易知,PX=k)0,k=0,1,2,且有,关于泊松分布,历史上泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的,近数十年来,泊松分布日益显示其重要性,成了概率论中最重要的几个分布之一。在实际应用中许多随机现象服从泊松分布。这种情况特别集中在两个领域中。一是社会生活,对服务的各种要求:诸如电话交换台中来到的呼叫数,公共汽车站来到的乘客数等等都近似地服从泊松分布,因此在运筹学及管理科学中泊松分布占有很突出的地位;另一领域是物理学,放射性分裂落到某区域的质点数,热电子的发射,显微镜下落在某区域中的血球或微生物的数目等等都服从泊松分布。,例9对上海某公共汽车站的客流进行调查,统计了某天上午10:30至11:47左右每隔20秒钟来到的乘客批数(每批可能有数人同时来到),共得230个记录,我们分别计算了来到0批,1批,2批,3批,4批及4批以上乘客的时间区间的频数,结果列于下表中,其相应的频率与=0.87的泊松分布符合得很好。公共汽车客流统计,二项分布的泊松(poisson)逼近(选读),在很多应用问题中,我们常常这样的贝努利试验,其中,相对地说,n大,p小,而乘积=np大小适中。在这种情况下,有一个便于使用的近似公式。定理在贝努利试验中,以pn代表事件A在试验中出现的概率,它与试验总数n有关,如果npn,则当n时,在应用中,当p相当小(一般当p0.1)时,我们用下面近似公式,证记n=npn,则,二项分布的泊松(poisson)逼近,例10假如生三胞胎的概率为10-4,求在100000次生育中,有0,1,2次生三胞胎的概率。解这可以看作贝努利试验;N=100000,P=0.0001,所求的概率直接计算为b(0;100000,0.0001)=0.000045378b(1;100000,0.0001)=0.00045382b(2;100000,0.0001)=0.0022693这时也可用泊松逼近,=np=10,而p(0,10)=0.00004540p(1,10)=0.0004540p(2,10)=0.002270,2随机变量的分布函数,离散型随机变量的可能取值可以一个个列出来.但非离散型随机变量却不行,因此,描述非离散型随机变量不能用“随机变量的分布律”来表示.另一方面,在实际应用中,我们对某些随机变量(如:误差)在某个区间(范围)内的概率更感兴趣.因此,我们需要研究随机变量所取的值在某一区间的概率.,由于Px1Xx2=PXx2-PXx1,因此,只需求出PXx2及PXx1即可.如:,由于P1X3=PX3-PX1=1/2-1/6=1/3,定义:设X是一个随机变量,x是任意实数,函数F(x)=PXx称为X的分布函数.,引入分布函数后,则有:Px1Xx2=PXx2-PXx1=F(x2)-F(x1)(*),分布函数的基本性质,分布函数F(x)具有下列性质:F(x)是一个不减函数。即对于任意实数x1,x2(x1x2),有F(x1)F(x2);F(x)是右连续的。即F(x+0)=F(x),为什么分布函数定义为右连续?,定义左连续或者右连续只是一种习惯。目前,俄罗斯和东欧国家一般定义左连续;西欧和美国一般定义右连续;我国的大多数书籍也采用右连续。左连续和右连续的区别在于计算F(x)时,X=x点的概率是否计算在内。对于连续型随机变量而言,因为一点上的概率等于零,定义左连续和右连续没有什么区别;对于离散型随机变量,如果PX=x0,则左连续和右连续时的F(x)值就不相同了。因此,在阅读关于概率论的参考书时,要注意作者是定义左连续还是右连续的,以免出错。,离散型随机变量分布函数的计算,有了分布律,可以通过下式求得分布函数显然这时F(x)是一个跳跃函数,我们可以用分布律或分布函数来描述离散型随机变量。,例1设随机变量X的分布律为求X的分布函数,并求PX1/2,P3/2X5/2,P2X3.解,F(X)的图形如下,例2:一个靶子是半径为2米的圆盘,设击中靶上任意同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能击中靶,以X表示弹着点于圆心的距离。试求随机变量X的分布函数。解若X2,由题意,有F(x)=PXx=1.综合上述,即得X的分布函数为,4连续型随机变量及其概率密度,考虑连续型随机变量X落在区间(x,x+Dx)内的概率P(x0是区间长度,比值,叫做随机变量X在该区间上的平均概率密度.如果当Dx0时,上述比值的极限存在,则这个极限叫做随机变量X在点x处的概率分布密度(或概率密度),记作f(x):,由于P(xXx+Dx)=F(x+Dx)-F(x),并根据导数的定义可知,因此,随机变量的概率密度f(x)是分布函数F(x)的导数;也就是说,分布函数F(x)是密度函数f(x)的一个原函数.,由分布函数的定义,并根据牛顿莱布尼兹公式得:,所以,连续型随机变量的分布函数F(x)等于概率密度f(x)在区间(-,x)上的广义积分.,概率密度函数的性质,由分布函数的性质可知,概率密度函数具有以下性质:(1)f(x)0,函数曲线位于x轴上方;,反之,对于定义在(-,)上的可积函数f(x),若它满足性质1和性质2,则由它定义的F(x)是一个分布函数,即它满足分布函数所必须具备的三个性质。,由性质2知道介于曲线y=f(x)与Ox轴之间的面积等于1.,由性质3知,随机变量X落在区间(x1,x2的概率P(x1x0,则由Xaa-DxXa得0PXaPa-DxXaF(a)一F(a-Dx)。在上述不等式中令Dx0,并注意到X为连续型随机变量,其分布函数F(x)是连续的。即得PXa=0,注意在计算连续型随机变量落在某一区间的概率时,可以不必区分该区间是开区间或闭区间或半闭区间。例如有PaXbPaXb=PaXb。在这里,事件X=a并非不可能事件,但有PX=a=0也就是说,若A是不可能事件,则有P(A)=0;反之,若P(A)0,并不一定意味着A是不可能事件。以后当我们提到一个随机变量X的“概率分布”时,指的是它的分布函数;或者,当X是连续型时指的是它的概率密度,当X是离散型时指的是它的分布律。,连续型随机变量的f(x)Dx在概率中的含义,由概率密度f(x)的性质4,有若不计高阶无穷小,有Px0)为常数,则称X服从参数为,的正态分布或高斯(Gauss)分布,记为XN(,2)。,相应的分布函数为:,分布函数,性质:1.曲线关于x=对称。2.当x=时取到最大值。3.固定,改变,曲线沿Ox轴平移;固定,改变(越小),曲线变得越尖,因而X落在附近的概率越大。,正态分布密度函数图示,正态分布分布函数图示,如前所述,对于概率密度有,对于正态分布来说,标准正态分布,当=0,=1时称X服从标准正态分布,记为XN(0,1)。其概率密度和分布函数分别用(x),(x)表示,即有,显然(-x)=1-(x)另外,有(x)的函数表可查。,设XN(,2),由(x)的函数表得到:P-X+=(1)-(-1)=2(1)-1=68.26P-2X+2=(2)-(-2)=2(2)-1=95.44P-3X+3=(3)-(-3)=2(3)-1=99.74可见,服从正态分布的随机变量虽然取值在(-,+),但其值落在(-3,+3)内几乎是可以肯定的。,例3将一温度调节器放置在存储着某种液体的容器内,调节器定在d,液体的温度X(以计)是一个随机变量,且XN(d,0.52)。(1)若d=90,求X89的概率;(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?,(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?,解:按题意需求d满足,设随机变量XN(m,s2),则随s增大,概率P|x-m|s应()(A)单调增大(B)单调减少(C)保持不变(D)增减不定,设XN(m,s2),F(x)为其分布函数,则对任意实数a,有F(m+a)+F(m-a)=?解:因为XN(m,s2),由正态分布的性质知:,从而有:,为什么说正态分布是概率论中最重要的分布?,正态分布表现为其取值具有对称性,极大部分取值集中在以对称点为中心的一个小区间内,只有少量取值落在区间外。在自然现象和社会现象中,大量随机变量都服从或近似服从正态分布。如人的身体特征指标(身高、体重),学习成绩,产品的数量指标等等都服从正态分布。许多较复杂的指标,只要在受到的大量因素作用下每个因素的影响都不显著,且因素相互独立,也可认为近似服从正态分布。又如二项分布、泊松分布在n很大时,也以正态分布为极限分布。因此,可以说正态分布是最重要的分布。,5随机变量的函数的分布,为什么要讨论随机变量函数的分布?,在实际中,我们常对某些随机变量的函数更感兴趣。例如,在一些试验中,所关心的随机变量往往不能由直接测量得到,而它却是某个能直接测量的随机变量的函数。比如我们能测量圆轴截面的直径d,而关心的却是截面面积Ad2/4。这里,随机变量A是随机变量d的函数。我们将讨论如何由已知的随机变量X的概率分布去求得它的函数Y=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论