随机变量及其分布1.ppt_第1页
随机变量及其分布1.ppt_第2页
随机变量及其分布1.ppt_第3页
随机变量及其分布1.ppt_第4页
随机变量及其分布1.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第二章 一维随机变量及其分布,在第一章里,我们研究了随机事件及其概率,建 立了概率论中的一些基本概念,通过随机事件的概 率计算使我们初步了解了如何定量描述和研究随机 现象及其统计规律的基本方法然而实际中由一个 随机试验导出的随机事件是多种多样的,因此,想 通过随机事件概率的计算来达到了解随机现象的规 律性显得很不方便 本章,我们将引进概率论中的一个重要概念 随机变量随机变量的引进是概率论发展史上的,重大事件,它使概率论的研究从随机事件转变为随 机变量,使随机试验的结果数量化,这有利于我们 用分析的方法来研究随机现象的统计规律 本章我们将介绍随机变量的概念、随机变量的分 布及一些常见的典型分布,给出分布函数的概念及 计算,最后给出随机变量函数的分布,2.1 随机变量及其分布,一、随机变量的概念 直观上,我们将随机现象的每一种表现,即随机试验的每一个可能观察到的结果叫随机事件随机试验的结果本身有两种表达形式:一种是数值型,一种是描述型为了全面地研究随机试验的结果,揭示客观存在着的统计规律性,我们将随机试验的结果数量化,引入随机变量的概念. 实际中试验的结果不管是哪种形式,我们总可以设法使其结果与唯一的实数对应起来,将它转化为数值型这样,不管随机试验可能出现的结果是否为数值型,我们总可以在试验的样本空间上定义一个函数,使试验的每一个结果都与唯一的实数对应起来为此我们引入以下定义:,定义2.1 设E是一个随机试验, 是由E产生的样 本空间,对于任意的 ,X= 是定义在 上的单 值实值函数,则称X= 为一个定义在 上的随机 变量(Random Variable),简记为X 一般地,随机变量用大写字母X,Y,Z表示,其取 值用小写字母x,y,z,表示 设E是一个随机试验, 是由E产生的样本空间.若 X= 为一个定义在 上的随机变量,则对任意的 X、 、( ),形如 ; ; ;,; ; ; ; ; 的都是随机事件 随机变量引入后,任意随机事件 的概率 以后就简记为 ,或简记为 即 类似地, ; ; .,二、随机变量的特征 1. 随机变量引进以后,任一随机事件就可以用随机变量在实数轴上的某一集合中的取值来表示,而随机变量是定义在样本空间上的 (样本空间的元素不一定是实数) 一个函数,它不同于普通函数,普通函数是定义在实数轴上的一个函数,这是二者的差别之一. 2作为样本空间上的函数,随机变量的取值随试验的结果而定,而试验的各个结果出现有一定的概率,因而,随机变量的取值也有一定的概率,这是随机变量与普通函数的差别之二. 3随机变量的引入,使随机事件的发生可以用随机变量的取值表示这样,我们可以用随机变量取值的概率来研究随机事件发生的概率,从而将随机事件概率的研究转化为随机变量取值概率的研究,使我们用分析的方法来研究随机试验成为可能随机变量是研究随机试验的有效工具,一般地,随机变量X取值的概率称为该随机变量X 的概率分布要研究随机变量X的概率分布,我们 就要完成如下两件事: 1随机变量的取值范围是什么? 2它取每个值或在某个范围内取值的概率是多少? 按随机变量的取值特征常把随机变量分为如下两 种形式:离散型随机变量和非离散型随机变量,非 离散型随机变量中最主要的是连续型随机变量,我 们将分别讨论它们的概率分布,2. 离散型随机变量的概率分布,一、离散型随机变量的概念 定义2.2 如果随机变量X的所有可能的不同取值 是有限或可列无限多个,则称X为离散型随机变量. 设X所有可能的不同取值为 (k=1,2, ,),若 = , k=1,2, (21) 则称(21)为X的分布律,也称为概率分布或概率函 数,即:(Probability Distribution)或 (Probability Function),分布律(21)也可用表格形式表示: 因此,分布律也称为分布列离散型随机变量的分布 律通常用分布列形式表示 注意:分布律(21)是指k=1,2, ,时的一串 式子 = 例2.1和例2.3中的随机变量X都是离散型随机变 量要掌握一个离散型随机变量的分布律,只需知道 X的所有可能的不同值 (k=1,2,;)及X取各个值 的概率即可.,显然,分布律 具有如下两个性质: 1.(非负性) 0 =1,2, (23) 2.(规范性) (24) 事实上, . 当给定了 及 ( k=1,2, )之后,我们就能描述离散 型随机量X的分布律,这是因为我们已经知道它取什么值, 以及以多大的概率取这些值,这也正是我们研究随机变量的 分布所需要的,二、几种常见离散型随机变量及其分布律 1. (01)分布 定义2.3 设随机变量X只可能取0与1两个值,它的分布律是 (0 1) (25) 即 则称X服从(01)分布或两点分布 (Two-point Distribution) 对于一个随机试验E,它只有两种可能的结果A和 ,即A 要么发生,要么不发生,则这种试验E总可以用(01)分布 来描述,这种试验在实际中很普遍例如,抛掷硬币试验, A = “出现正面”, “出现反面”;在射击试验中,,A=“命中目标”, “未命中目标”;它们都可用 (01)分布来描述(01)分布是实际中 经常用到的一种分布 2. 二项分布 设E为n重贝努利试验,用X表示n重贝努利试验 中事件A发生的次数,则X是一个随机变量,X所有可 能的取值为0,1,2,n;由于各次试验是相互独立 的,因此由第一章(118)知 =PA在n次试验中恰好发生 次= , =0,1,2,n; 显然 () 0 , =0,1,2,n; (),注意到 恰好是二项式 的展开式中出现 的 那一项,因此,称X服从的分布为参数是( , )的二项分布. 定义2.4 若随机变量X的分布律为 = , =0,1,2,; (26) 其中n为正整数,0 1,则称服从参数为( ,)的二项分 布(Binomial Distribution),记为 . 特别地,当n=1时, ,这就是(01)分布 在实际中,把概率很小(一般要求在0.05以下)的事件称 为小概率事件由于小概率事件在一次试验中发生的可能性 很小,因此,在一次试验中,小概率事件实际上是不应该发 生的. 这条原则我们称它为实际推断原理需要注意的是,实 际推断原理是指在一次试验中小概率事件几乎是不可能发生 的,当试验次数充分大时,小概率事件至少发生一次却几乎 是必然的,在实际中,我们经常要计算n次独立重复的贝努 利试验中恰好有 次成功的概率 ,至少有 次成功的概率 等.当n很大时,要计算出它 们的确切数值很不容易因此,人们希望能找到二 项分布的近似计算公式法国数学家泊(Poisson,1781-1840)对此进行了研究,得到了如下二项分 布概率计算的逼近公式 定理2.1 (泊松逼近定理) 若 ,且 =(为常数),则对任意确定的自然数k,有 PX=k= , k= 0,1,2, , (27),由于 n = 为常数,当n较大时, 必定较小因此, 由上述定理可知,当n较大, 较小时,有以下近似表达式 (其中n ) k= 0,1,2,n, (28) 而 的值则可通过查本书附表1获得 实际应用中, 当 10且 0.1时, 即可用上述近似公 式计算;而当 n100且 = n 10时,利用上述近似公式效 果更佳如上例中 = 0.031828 二项分布是离散型分布中的重要分布, 应用十分广泛. 利用 泊松逼近定理,很自然引入另一个重要的分布泊松分布,3. 泊松分布 定义2.5 设E是随机试验,X是定义在样本空间上的随机 变量,若X的分布律 = 0, 1, 2, , (28) 则称X服从参数为的泊松分布(Poisson Distribution),记 为 在实际中,许多随机现象都可用泊松分布来描述例如, 一批产品的废品数;一本书中某一页上印刷错误的个数;某 汽车站单位时间内前来候车的人数;某段时间内,某种放射 性物质中发射出的粒子数等等,均可用泊松分布来描述. 泊松分布是概率论中的又一个重要分布,在随机过程中也有 重要应用,4. 几何分布 定义2.6 若X的分布律为 (29) 其中 0 1, ,则称X服从参数为 的几何分 布(Geometrical Distribution),记为X 若令X表示贝努利试验中事件A首次出现所需要的 试验次数,则X服从几何分布例如,向某一目标进 行独立射击,首次击中目标所需要的射击次数;从 含有正品和次品的产品中有放回地抽取产品,首次 抽到次品时取出的产品数等都服从几何分布,2.3 随机变量的分布函数,一、分布函数的概念 对于离散随机变量X,我们可以用分布律来描述概率分 布,对于非离散型随机变量由于其可能取的值不能一一列 出,因此想采用分布律的形式来描述其概率分布是不可能 的然而,我们可以转而去研究该随机变量在一个区间内取 值的概率如,考虑对于任意实数 ( ),落在区间 上的概率 , 但由于 = 因此我们只需考虑 和 形式的概率就可以 了,而 与 具有相同的形式,因此,我们有 下面的概念.,定义2.7 设X是一个随机变量, 是任意实数,则称函数 (210) 为X的分布函数或累积分布函数 (Cumulative Distribution Function) 根据定义, 定义在整个实数轴上, 在任意实数 处 的函数值就是随机变量X落在实数轴 点及其整个左侧区间 的概率 对于任意的实数 , 当 时,有 (211) 从这个意义上说,分布函数完整地描述了随机变量的统计规 律性分布函数是一个普通的函数,通过它,我们将能用分 析的方法来研究随机现象的统计规律,二、分布函数的性质 1(单调非降性) 对于任意实数 ,当 时, 有 ; 事实上,由(211), = 0 即 知此性质成立 2.(规范性)对于任意实数 , ;且 ;(证略) 3. (右连续性) 对于任意实数 ,有 F(x+0) = F(x)(证略) 反过来,理论上还可以证明满足以上三条性质的函数 , 一定是某个随机变量X的分布函数利用分布函数,可以进 行概率计算,几个经常用到公式为:,对于任意实数 ,有 (1). = ;(证略) (212) (2). = ; 证明 根据(210)和(212)可知 类似可证 (3). =1 ; (4). =1 ;,三、分布函数与离散型随机变量分布律的关系 一般地 (1)若离散型随机变量的分布律为: 则对于任意实数 ,X的分布函数为 (213) = 即, 的值等于所有不大于 的 对应的概率之和 (2)设离散型随机变量X的分布函数为 , 为其间断 点 =1, 2, , 则X的分布律为 = , =1,2,. (214),2.4 连续型随机变量及其概率密度函数,一、连续型随机变量的概念 定义2.8 设随机变量X的分布函数为 ,若存在非负可 积函数 ,使得对于任意实数 ,都有 (215) 则称X为连续型随机变量, 称 为X的概率密度函数 (Probability Density Function),简称概率密度或密度. 由定义可知,连续型随机变量X的分布函数 在x点的函 数值等于其概率密度函数 在区间 上的积分 类似于离散型随机变量,连续型随机变量 的概率密度 函数具有如下基本性质:,(1)(非负性) 对任意的实数 , 0; (2)(规范性) (216) 反过来,若已知一个函数 满足上述性质(1)和(2),则 一定是某连续型随机变量X的概率密度函数 另外,对连续型随机变量X的分布,还具有如下性质: 1.对于任意实数 ( ), = ; 2.连续型随机变量X的分布函数 是连续的,但反之不真; 3.连续型随机变量X取任一确定值的概率为0;即对于任意 实数 , = 0; 事实上,由(212)和 的连续性即知: 因为连续型随机变量取任一确定值是可能的,所以,(1)概率为零的事件未必是不可能事件;概率为1的事件 也不一定是必然事件; (2)在计算连续型随机变量X落在某一区间的概率时,可 不必区分是开区间、闭区间还是半开半闭区间, 即对任意的 实数 ,有 (217) 这样,如果 除可数个点外导数处处连续,那么在 的 导数连续点处 ,而在其它点处f(x)的值可任意补充 定义,不妨取为0,于是可得到X的一个概率密度函数 (218),二、常见的几种连续型分布 1均匀分布 定义2.9 若X的概率密度函数为 (219) 则称X服从区间(a, b)内的均匀分布(Uniform Distribution),记 为 U(a, b) 均匀分布的特征: (1) 若XU(a, b), 则落在(a, b)内任意子区间内的概 率只依赖于子区间的长度,而与子区间的位置无关 事实上,对于任意一个长度的子区间 ,(2)若X ,则X的分布函数为 (220) (3) 和 的图形分别为 图2.3,2. 指数分布 定义2.10 若X的概率密度函数为 ( 0) (221) 则称X服从参数为 的指数分布(Exponential Distribution),记 为 ,其分布函数为 (222) 指数分布的概率密度函数 和分布函数 的图形分别为 图2.4,生活中,指数分布应用很广像电子元件的使用寿命、电 话的通话时间、排队时所需的等待时间都可用指数分布描述 因此,指数分布在生存分析、可靠性理论和排队论中有广泛的 应用 3正态分布 (1)正态分布的概念 定义2.11 若X的概率密度函数为 (223) 其中 和 为常数且 ,则称X服从参数为 的正态分布 (Normal Distribution),记为 ,正态分布也叫高 斯分布(Gauss), 其分布函数为,(224) 特别地, 当 时,则称正态分布 为标准正态分布, 它的概率密度函数特记为 ,即 (225) 它的分布函数特记为 ,即 (226 ) 标准正态分布的概率密度函数和分布函数的图形分别如图2.6 所示:,由于 是概率密度函数,因此 . 从而, 有 (227) (228) 上述两个式子请熟练掌握,它在以后的计算中经常用到,(2)正态分布的特征 若 ,则其概率密度函数 具有如下特征: (1) 的图像关于直线 对称; 由此便有 ; ; (2) 的最大值为 ; (3) 愈远, 值愈小,曲线 以O 轴为渐近线; (4) 对于确定的 越小, 越大,X落在 附近的概率 越大; 越大, 越小,X落在 附近的概率越小; (5) 曲线 的拐点是 和,图片2.5 易知:若 ,则 . 事实上,对于任意实数 , 的分布函数 (令 ) 所以 .,这样我们便有如下定理: 定理2.2 若 ,其分布函数为 ,则对任意 实数 ,有 (229) 证明 因为 , 所以 . 推论 若 ,则对于任意实数 ,有 (230) 利用(230),可将一般正态分布的概率计算转化为标 准正态分布的概率计算,而标准正态分布的分布函数值可由 附表2获得,这样一般正态分布的概率计算就可解决,关于标准正态分布,一个重要的公式是:对于任意实数 . (2-31) 这可用 的定义证明或由下图说明这里就不做证明了. 图26 另外, 还有几个经常用到的公式: 若X ,则对于任 意实数 , ,( ),有 (1) ; (2) ; (3) .,特别地,如果 ,则对任意 ,有 , 当 、2、3时,分别有 ; ; ;,可见, 服从正态分布 的随机变量X,虽然理论上可以 取任意实数值,但实际上它的取值落在区间 内的概 率约为68.26 %;落在区间 内的概率约为95.44 %,落 在区间 内的概率99.74%.因此,服从正态分布 的随机变量X落在区间 之外的概率约0.26%,还不到 千分之三,这是一个小概率事件,在实际中认为它几乎不可 能发生,这就是著名的“ ”准则它在实际中常用来作为质 量控制的依据 在自然现象和社会现象中, 大量的随机变量都服从或近似 服从正态分布,如,测量误差、炮弹落点距目标的偏差、海 洋波浪的高度、一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论