版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 随机变量及其分布这一章里我们介绍概率统计的一个非常重要的概念: 随机变量随机变量. 借助于随机变量, 概率统计 对随机现象的研究才能完全量化完全量化的以较统一的方式统一的方式进行, 从而使概率统计的研究能够向深入发展. 第一节 随机变量及其分布1. 随机变量的概念2. 随机变量的分布函数3. 离散随机变量的概率分布列4. 连续随机变量的概率密度函数1. 随机变量的概念为什么要引进随机变量? 上一章里, 我们介绍了随机现象, 样本空间, 事件及其概率等知识, 知道了随机现象的样本空间的类型很多, 即其样本点的类型和数量在不同的研究中有很大差别: 有时样本空间的样本点本身就是数量. 如掷一
2、颗骰子, 样本点是出现的点数; 电视机的寿命, 样本点是电视机可能的寿命. 但在很多的情况下, 样本空间的样本点本身不是数, 而且数量多, 这会对相关事件的深入研究造成麻烦. 而且, 我们感兴趣的往往不是样本点本身, 而仅仅是其某一个数字特征.例如例如, 对对50个人进行对于某项政策是否同意的民个人进行对于某项政策是否同意的民意调查意调查, 其每一个样本点是其每一个样本点是50个个“同意同意”或或“不不同意同意”的排列的排列, 如如(同意同意, 不同意不同意,不同意不同意,同意同意,同意同意,同意同意, 不同意不同意)50样本空间里含的样本点数有250个. 这样的原始的样本空间不便于我们表达和
3、讨论有关事件的研究.该如何简化呢? 答案是根据研究目的引进随机变量答案是根据研究目的引进随机变量, 从而建立原从而建立原始样本点和数的关系始样本点和数的关系, 得到一个新的由数构成的得到一个新的由数构成的简单的样本空间简单的样本空间.例如在本例中例如在本例中, 我们感兴趣的数量仅仅是50个人中同意该项政策的人数. 记X为50个人中同意该项政策的人数, 则对于每一个原始样本空间的样本点, X有唯一的数与之相对应.所以, X是样本点的函数, 根据试验结果的不同取不同的值, 我们把X称为一个随机变量. 该例中引入随机变量的好处有哪些? 引入变量引入变量X后后, X对应的样本空间为对应的样本空间为0,
4、1,50, 与原与原始样本空间相比有两个优点始样本空间相比有两个优点: (1)数量化数量化, (2)元素少元素少; 而且用原始样本空间难以表达的事件而且用原始样本空间难以表达的事件, 如有一半人同如有一半人同意该项政策意该项政策, 可以用随机变量简单表示成可以用随机变量简单表示成: : X(X()=25)=25, 或缩写成或缩写成 X=25. 所以说, 随机变量的引进大大方便了对概率的研究. 以上的例子表明, 在随机试验里, 有这样的一种量X, 它要么就是试验结果即样本点, 要么跟试验结果相关, 它随着试验结果的不同而取不同的值, 所以是变量. 这就是随机变量的通俗的定义. 从数学的角度看,
5、随机变量X本质上是试验结果即样本点的函数。故有如下的数学的定义.随机变量的定义随机变量的定义: 设= 为试验的样本空间, 如果对每个, 都对应一个实数X(), 则称这样的实值函数X()为随机变量随机变量.X()可理解成样本点的某一个数字特征随机变量常用大写字母X, Y, Z等来表示, 其取值常用相应的小写字母x, y, z来表示.随机变量的一些例子如:(1) 同时掷两只骰子, 令X=掷得的数字和;(2) 连续抛一枚硬币25次, 令Y=25次中的到的正面的次数.变量的分类变量的分类 假如一个随机变量只能取有限个或可列无穷个值, 则称其为离散随机变量(Discrete Random Variabl
6、e). 假如一个随机变量的可能取值充满数轴的一个区间, 如(a,b), 则称其为连续随机变量(Continuous Random Variable).例如例一中的X是一个离散随机变量, 灯泡的寿命T是一个连续随机变量.有了随机变量的概念后, 随机事件就可以通过随机变量来表示. 例如在维修人员的配备问题中, 用X表示同一时刻发生故障的台数, 则X是一个随机变量. 有关事件如(1)“同一时刻恰有k台机床发生故障”可用X=k来表示;(2) “车间里同一时刻发生故障的机床台数不超过m台”可用Xk来表示这样, 我们对随机事件的研究就可以转化成对随机变量的研究.概率分布的定义概率分布的定义 随机变量X的可
7、能取值和它取这些值的概率称为X的概率分布. 正如研究随机试验那样正如研究随机试验那样, 我们不仅要知道随机试验可能我们不仅要知道随机试验可能出现哪些结果出现哪些结果, 更要了解这些结果出现的概率有多大更要了解这些结果出现的概率有多大. 同样对随机变量, 我们不仅要知道它取哪些值, 还要知道它取这些值的概率, 也就是该随机变量的概率分布.本章的重点就是考察随机变量的概率分布本章的重点就是考察随机变量的概率分布. 概率分概率分布由于随机变量的特点有不同的表达方式布由于随机变量的特点有不同的表达方式, 下面首先介绍一个通用的工具通用的工具:随机变量的分布函数.2. 随机变量的分布函数(Cumulat
8、ive Distribution Function, 简称 cdf)定义定义 设X是一个随机变量, 对任意实数x, 称F(x)=P(Xx)为随机变量X的分布函数, 记为 XF(x). 分布函数刻画的是变量X落在(-,x这种区间里的概率. 那么其它种类的区间呢?P(aa)=1-P(Xa)=1-F(a)这方面更详细的讨论待我们介绍完分布函数的性质再继续.X落在其它种类区间的概率均可以用F(x)来表示.如:例一例一. 连续抛一枚硬币三次, 定义X=获得的正面的次数. 求X的分布函数.解解: X的取值情况如下表HHH HHT HTH THHTTHTHTHTTTTTX()32221110故故 X是一个离
9、散随机变量是一个离散随机变量, 可求得可求得X的概率分布为的概率分布为 x0123P(X=x)1/83/83/81/8所以根据分布函数的定义有所以根据分布函数的定义有:当x0时, F(x)=P(Xx)=0当0 x1时, F(x)=P(Xx)=P(X=0)=1/8当1x2时, F(x)=P(Xx)=P(X=0)+P(X=1)=1/2当2x3时, F(x)=P(Xx)=P(X=0)+P(X=1)+P(X=2)=7/8当x3时, F(x)=P(Xx)=P(X=0)+P(X=1)+P(X=2)+P(X=3)=1综上所述综上所述, X的分布函数为的分布函数为: xxxxxxF3 132 /8721 /2
10、110 /810 0)(当当当当当当当当当当X的分布函数的图形为的分布函数的图形为:分布函数的三条基本性质分布函数的三条基本性质:)()( ,)( .) 1 (2121xFxFxxxF有时即当是单调非减函数单调性1)(lim)( , 0)(lim)( , 1)(0 , .)2(xFFxFFxFxxx且对任意有界性).()0( ),()(lim ,)( .) 3(00000 xFxFxFxFxxxFxx或写成即对任意的右连续函数是右连续性证明: (1)(2)显然, 我们证(3). )( )()()( ,1111001 iixXxPxXxPxFxF为此为此 .lim,)()3(0 F(x)xFxx
11、存在存在所以所以是单调有界不减函数是单调有界不减函数因为因为 ).()(lim , ,0n021xFxFxxxxxnnn 有有时时当当只要对单调下降数列只要对单调下降数列为证右连续性为证右连续性 )(lim)()()( )(11111nniiiiiixFxFxFxFxXxP )0()(lim)( ,00 . xFxFx Fnn 所以所以 )()()( a)(aFbFbXaP )(1)( (b) bFbXP 有了X的分布函数, 那么有关X的各种事件的概率都能方便地用分布函数表示了.从例二中X的F(x)图象, 可以清楚地看出分布函数的这三条性质.例如例如, 对于任意的实数a, b, 有 )0()(
12、)( c)( aFaFaXP),()()( , 0 : aFaFaXaP有有对对证明证明)0()()( , 0 aFaFaXP有有令令 )0()( (d) bFbXP )()()( :bXFbFbXP 证明证明)0()0()()( bFbFbFbF )()0()( e)(aFbFbXaP )0()()( (f) aF bFbXaP)0()0()( (g) aFbFbXaP)()0( ),()0( ,)(bFbFaFaFxF 连续时连续时当当我们看一个连续随机变量分布函数的例子.例三例三. 设连续型随机变量X的分布函数为 0 , 00 ,)(22xxBeAxFx)21( )2(,)1( XPBA
13、求求求常数求常数解解:1)(lim , 1)(lim2/2 ABeAxFxxx)0()(lim ,0FxFx 右连续性右连续性0)(lim 2/02 BABeAxx1 B 0 00 1)( 2/2xxexFx)1()02()21()2(FFXP 4712. 0)1()2(22/1 eeFF注意到F(x)是连续的3. 离散随机变量的概率分布列定义定义 若X是一个离散随机变量, 如果X的所有可能值为x1, x2, ,xn, 则称X取xi的概率pi=P(X=xi), i=1,2,n,为X的概率分布列概率分布列.一个离散型随机变量的概率分布用分布函数来描述并不是一个离散型随机变量的概率分布用分布函数来
14、描述并不是最方便的最方便的. 因为一个离散随机变量只取有限个或可列无限个值因为一个离散随机变量只取有限个或可列无限个值, 所以我所以我们可以定义其取每个值的概率们可以定义其取每个值的概率, 即给出该变量的即给出该变量的概率分布列概率分布列.例如例如, 变量变量X=掷一颗骰子得到的数掷一颗骰子得到的数, 则则X的概率分布列的概率分布列是是概率分布列除可以用函数的方式给出, 也可以用列表的方式给出. P(X=xi)=1/6, i=1,2,6或者用列表的方式给出或者用列表的方式给出x123456P(X=x)1/61/61/61/61/61/6概率分布列的两条基本性质概率分布列的两条基本性质:0)(
15、.)1( ixP非负性非负性1)( .)2(1 iixP正则性正则性反之, 如果一个数列pk满足上面的两条性质, 则必存在某离散随机变量X, 使得pk成为X的概率分布列. )()()(: xxiiixXPxXPxF它的图形是介于0,1间的阶梯函数, 它在X的每个取值点xi处有个跳跃, 其跳跃值恰为P(X=xi).(参看例二中F(x)的图形).由X的概率分布列还可求得其分布函数:例四例四(几何分布几何分布). 某射手每次射击的命中率为p, 现对一个目标连续射击, 直到射中为止. 设X为该射手命中目标时射击的次数, 求X的分布列和分布函数.解解: 显然显然, X是一个离散随机变量是一个离散随机变量
16、, 其可能取值为其可能取值为1,2,.pqppppppkXPkk11)1()1()1)(1()( X的概率分布列为的概率分布列为k-1个当当 x1时时, F(x)=P(Xx)=0或者用列表的方式给出或者用列表的方式给出k123kP(X=k)ppqpq2pqk-1现求其分布函数现求其分布函数.当当1 x2时时, F(x)=P(Xx)=P(X=1)=p=1-q当当 2x3时时, F(x)=P(Xx)=P(X=1)+P(X=2) =p+pq=p(1+q)=1-q2当当 kxk+1时时, F(x)=P(Xx) =P(X=1)+P(X=2)+P(X=k) =p+pq+pqk-1 =p(1+q+qk-1)
17、 =p(1-qk)/(1-q) =1-qk故分布函数为故分布函数为 1 ,11 , 0)(xqxxFx其中其中, x是对是对x取整取整, 即取小于或等于即取小于或等于x的最大整数的最大整数.几何分布是较为常用的一种离散分布, 一般用来描述次数不限的伯努利试验中次数不限的伯努利试验中A事件事件“首首次出现次出现”的概率的概率模型.通常称为通常称为几何分布几何分布.pqkpqkXPk1 , 2 , 1 ,)(1该例中该例中X服从的分布服从的分布:之所以称为几何分布之所以称为几何分布, 是因为分布列是因为分布列pqk-1正好组成一个正好组成一个几何级数几何级数.4.连续随机变量的概率密度函数(Pro
18、bability Density Function, 简称 pdf)除了上面介绍的离散型随机变量外, 还有另外一类随机变量, 即连续型随机变量, 如灯泡的寿命, 等候公共汽车的时间等. 它们的取值是非离散的, 充满了某一实数区间. 是不是也可以用概率分布列的方式去描述其概率分布呢?首先连续随机变量的取值是不可列的, 没法象分布列那样以可列的方式定义每个值的概率.答案是否定的.其次, 一个连续随机变量取每个值的概率等于0, 所以研究其取每个值的概率是平凡的. 其原因是对于任意x0, 根据分布函数的性质有 P(X=x0)=F(x0)-F(x0-0), 又根据连续随机变量的定义, F(x)连续, 所
19、以F(x0)=F(x0-0), 所以P(X=x0)=0. 定义定义: 设随机变量X的分布函数为F(x), 如果存在一个非负可积函数p(x), 使得对任意实数x,xdttpxF)()(对于连续随机变量, 我们常用其概率密度函数来描述其概率分布. 则称X为连续随机变量, 称p(x)为X的概率密度函数概率密度函数, 简称密度函数.由定义知, 在F(x)导数存在的点上有 )( )(xFxp即概率密度函数是分布函数的导数概率密度函数是分布函数的导数.密度函数密度函数p(x)的两条基本性质的两条基本性质:0)( .)1( xp非负性非负性1)( .)2( dxxp正则性正则性1)(lim)(lim)(:)
20、2( xFdttpdxxpxxx的证明的证明基于这两条性质, 从图形上看, 密度函数曲线密度函数曲线y=p(x)位于位于x轴上方轴上方, 且与且与x轴之间的面积等于轴之间的面积等于1.这一结果有直观的几何意直观的几何意义义: X落在(x1,x2之间的概率恰好等于密度函数曲线下与x轴在(x1,x2上包围的面积.例如:如果X的密度函数为p(x), 则对任意x1,x2(x1x2)有 2112)( )()( )()()(1221xxxxdttpdttpdttpxFxFxXxP*借助于密度函数, 我们可以计算关于变量X的概率. )()()()( bXaPbXaPbXaPbXaP *由于连续随机变量取任意
21、一点的概率恒为0, 从而在事件“aXb” 减去X=a或者X=b, 不影响概率, 即*由定义可看出, 连续随机变量的分布函数一定是连续函数, 而密度函数只是非负可积, 未必一定连续.事实上, 对于一个连续的密度函数, 任意改变其中一点的数值, 得到的不连续函数仍然是密度函数, 因为其积分值不变. 由此可知由此可知, 密度函数密度函数p(x)在在x处的值反映了随机变量处的值反映了随机变量X在在x附近附近取值的概率的大小取值的概率的大小, 相比于概率分布列相比于概率分布列p(xi)反映一个离散反映一个离散变量变量X在在xi处取值的概率的大小处取值的概率的大小, 两者是很相似的两者是很相似的.为什么这
22、么说呢?xxxXxPxxFxxFxFxpxx)(lim )()(lim)( )(00 *密度函数描述连续型随机变量的概率分布, 在某种意义上与离散型时用分布列来描述是类似的.)()(xxXxPxxp 例五例五. 设随机变量X具有概率密度 其它其它 , 043 , 2/230 ,)(xxxkxxf)2/71()3( ;)2( ;)1( XPXk求求的分布函数的分布函数求求求常数求常数解解: 30431)2/2( 1)( )1(dxxkxdxdxxf解得解得 k=1/6(2) X的分布函数为304330304 ,)22(643 ,)22(630 ,60 , 0)(xdttdttxdttdttxdttxxFxx即 4 , 143 ,42330 ,12 0 , 0)(22xxxxxxxxF4841) 1 ()2/7( )2/7(1 )3(FFXP例六例六. 设G是曲线y=1-x2与x轴所围成的区域, 在G内任取一点P, P到x轴的距离定义为X, 求变量X的分布函数和密度函数.的面积阴影部分的面积G)( tX
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年出售转让单梁行车合同范本
- 2024年出售铝厂铝渣合同范本
- 2024年代理补账合同范本
- 2024年便利店挂名协议书模板范本
- 乳腺癌手术手术室
- 江苏省无锡市宜兴市2024-2025学年八年级上学期期中语文试卷(含答案解析)
- 可复制的领导力培训课程
- 2024经济金融热点
- 产前助产手术
- 2024柑桔采购合同范本参考
- 施工工程可索赔内容清单表
- 静脉的输液并发症防治及处理措施课件
- XX化工有限责任公司维保方案
- 社会消防技术服务机构质量管理体系创建指南、程序文件和记录清单、记录表单参考模板、评价工具、判定准则
- 《智慧农业》的ppt完整版
- 水闸维修养护技术规程-共89页PPT课件
- 蓝色简约商务工作总结汇报PPT模板课件
- 新技能英语Unit 5
- 家庭植物养护
- s3-2多级汽轮机的损失及汽轮机装置的效率
- 数学建模第02章_简单的优化模型
评论
0/150
提交评论