版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。其在实际中的应用。关键词1 一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常 用分布,即(0 1)分布、二项分布、泊松分布、均匀分布、指数分布和正态 分布.下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。它是一种“定性”类型的概念。为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即, 根据试验结果而定取什么值(实值或向量值)的变数。称这种变数为随机变数。本章内将讨论取实值的这种变数一维随机变数。定义 1.1 设 X 为
2、一个随机变数,令F(x) =P(X (一:,x) =P(X x),( 一二 Yx 二).这样规定的函数 F(x)的定义域是整个实轴、函数值在区间0,1上。它是一个普通的函数。成这个函数为随机函数 X 的分布函数。有的随机函数 X 可能取的值只有有限多个或可数多个。更确切地说:存在着有限多个值或可数多个值 a(,a2,.,使得P(X 伉忑,.) =1称这样的随机变数为离散型随机变数。称它的分布为离散型分布。【例 1】下列诸随机变数都是离散型随机变数。(1) X 可能取的值只有一个,确切地说,存在着一个常数 a,使 P(X=a)=1。称这种随机变数的分布为退化分布。一个退化分布可以用一个常数a 来
3、确定。(2)X 可能取的值只有两个。确切地说,存在着 两个常数 a , b ,使P( X 在a,b) = .1 称这种随机变数的分布为两点分布。如果 P(X = b) = p ,那么,P =(X =a) =1-p。因此,一个两点分布可以用两个不同的常数a,b 及一个在区间(0,1 )内的值 p 来确定。特殊地,当 a,b 依次为 0,1 时,称这两点分布为零-壹分布。从而,一个零-壹分布可以用一个在区间(0, 1)内的值 p 来确定。(3) X 可能取的值只有 n 个:a1,.,a2(这些值互不相同),且,取每个司值_ _一 1得概率都是-,称这种随机变数的分布为离散型均匀分布。一个离散型均匀
4、分布n可以用一个正整数 n 及 n 个不同的常数 a-,.,a2来确定。定义 1.2 若随机变量 X 的概率分布为P( X= 0= 1- p ,P X= 1* p其中 0p1,则称 X 服从参数为 p 的(0-1)分布。(0-1)分布是最简单的一种分布,它用丁描述只有两个可能结果的试验。例 如,对新生婴儿的性别登记,观察机器是否正常工作,考察一件产品是否为合格 品等,均可用(0-1)分布来描述。定义 1.3 若随机变量 X 的概率分布为X =k=C:pk(1-p)(n,k=0,1,.,n其中 n X 为正整数,0 p1 ,则称 X 服从参数为 n, p 的二项分布,记作X B(n,p)由二项分
5、布的导出可知, 该种分布用丁描述 n 重伯努利试验中发生的概率为 p.在研究某事件 A 发生的概率时,我们对事件 A 所在的试验进行独立重复观察,统计出事件 A 发生的次数 氏。这里*是一个随机变量,它就服从二项分布。另 外,一批种子能发芽的个数,一定人群中患某种疾病的人数,某时刻一个城市开 着的灯的盏数都可以认为是服从二项分布的。在二项分布中,如果 n=1,那么只能取 0 或 1,这是显然有p=1-p ,p=p也可以表示成01pi1- pp这个分布就是上面介绍的(0-1 )分布,它是二项分布的特例。在讨论 抛 掷均匀硬币的例子中,随机变量 听的分布列为01pi-221 .它就是(0-1 )分
6、布当 p =时的特例。2定义 1.4 若随机变量 X 的概率分布为P(X = k =e,k =0,1,2,. k!其中人 A0 为常数,则称 X 服从参数为岛的泊松分布,记作 XP(Q.泊松分布是作为二项分布的极限分布而引入的。事实上,泊松定理表明,当n 很大时,p 很小,np 适中时,B(n, p)分布就近似丁 P(A)分布,其中舄=np。由二项分布描述的内容可知,泊松分布主要用丁描述大量独立重复实验中稀有事件发生的次数,所谓稀有事件指概率很小的事件。由此,纺织品上的疵点数,印 刷品中的错字数,某时间段内电话交换台接到的呼叫次数,某时间段内公共汽车站等车的乘客人数等均可用泊松分布来描述。O定
7、理 1.1 (泊松定理) 在 n 重贝努力试验中,事件 A 在一次实验中出现的概率为 pn(与实验总数 n 有关),如果当 nT时,npnt 九(?0 常数),则 有,k|im b(k;n, pn)二后 一, k = 0,1,2,.证明 记 npn=扁,贝 U.z In k一Jkb( k; n,np ) :np 91 p )_ n(n -1).(n - k 1) ,n对丁任一固定的 k ,显然有k kl i mn= nj:从而.k2).-枫 lI,1nnJ还有khk!1 Y1 -n 人lim=lim 11n )1 k -1lim 1.11 一二 1nJ nnlim b(k; n, pn)=e-
8、nk!对任意 k ( k=0,1,2,.)成立,定理得证。2 连续性随机变量分布以上对离散型随机变量做了一些研究,下面将要研究另一类十分重要而且常 见的随机变量连续型随机变量定义 2.1 若 &)是随机变量,F(x)是它的分布函数,如果存在函数 p(x), 使对任意的,有xF(x) = j-p(y)dy则称颈。)对连续型随机变量,相应的 F(x)为连续型分布函数,同时称 p(x )是F (x)的概率密度函数或简称为密度。由分布函数的性质即可验证任一连续型分布的密度函数p( x)必具有下述性质:一一p(x)dx =1定义 2.2若随机变量 X 的概率分布为 (x-r,(a20)# 是常数
9、).、2 -_为密度连续型分布,称这种分布为正态分布,记作 XN(a,。2)卜面验证平(x)是一个密度函数。因为这时为显然,此外还可以验证有(x J二 一 一 一2e2- dx = 1-oO,. x -为此,可令-=y ,这时有(1)p(x) -0(2)(X,二 ye2;y21二 cdx=:e dy_1_2二-二2二yedy =打匚/盼 1232-二-二_X2-y2e2dxdyx = r cos jy = r sin n这时,变换的雅可比式 J =r ,而_2rG -2e2rdr所以有22 yTdy:(x)dx = 1-f-XJf这说明给出的的确是一个密度函数,这个密度函数成为正态密度。正态分
10、布是德国数学家和天文学家棣莫弗丁1733 年在求二项分布的渐进公式时得到的.棣莫弗一拉普拉斯中心极限定理表明正态分布是二项分布的极限分布.正态分布 N(卜,a2)的密度函数曲线是钟型曲线,它的“钟型”特征与 实际中很多随机变“中间大,两头小”的分布规律相吻合. 人的各种生理指标, 一个班的一次考试成绩,测量的误差等均服从或近似服从正态分布.在许多实际问题中,遇到的随机变数是受到许多互不相干扰的随机因素的影 响的,而每个个别因素的影响都不起决定性作用, 且这些影响是可以叠加的。例 如,电灯泡的耐用时数(寿命)受到原料,工艺,保管条件等因素的随机变动的 影响,而这些因素的波动在正常情况下是互不干扰
11、的,且,每一个都不起决定性作用,乂,可以认为是可以叠加的。在概率论的极限理论中可以证明:具有上述 特点的随机变数一般都可以认为服从正态分布。二项分布,泊松分布和正态分布(或称高斯分布)时概率论中最重要的分布, 在实际理论中有着广泛的应用。本文从三中分布的区别与联系出发, 采用实例计 算及比较方法,以达到较准确选择合适的分布解决实际问题为目的,对三种分布进行进一步探讨。一、三种分布的区别1. 定义不同:以每个分布的定义为切入点,阐明定义特征。二项分布 B(n,p)、 泊松分布 P(入)和正态分布 N( H , b 2)的分布规律分别由它们的参数确定,并且 三种分布的数字特征均值及方差是用不同的参
12、数来描述。因此,区别参数的意义 是深刻理解定义的关键。2. 随机变量的取值范围不同:二项分布的随机变量取值是有限个,泊松分布 的随机变量取值是无穷可列,它们届丁离散型的。正态分布的随机变量取值无穷 不可列,充满某一区间,届丁连续型的。3.适用的条件不同:二项分布用丁描述只有“成功”与“失败”两种试验结 果的数学模型。例如:某个学生做 n 道数学题,每道题的结果只有“对”与“错”, 若每题做对的概率已知,则可利用二项分布求出现在作坐标变换2r=-e0 7T .e2rdr做对 k 道题的概率;泊松分布适 用丁描绘大量重复试验中稀有事件(飞机意外坠落、高楼突然倒塌等);正态分布 用丁一个随机变量由大
13、量相互独立的偶然因素之和构成,每个因素所起的作用对总的来说很微小。例如:某校 2002 级 3000 名学生的数学考试分数,受每个学生考分的影响,但 每个学生的考试分数对总的分数影响不大,所以,考试分数服从正态分布。二、三种分布之间的联系尽管三种分布有许多不同点,但它们之间还有着相互的联系。在 n 次贝努力 试验中,二项分布的极限是泊松分布,我们可以用二项分布逼近泊松分布。反之, 也可以用泊松分布近似具有较大 n 的二项分布,即若已知泊松分布 P(入),可用二 项分布 B(n,入/n)去逼近它;若已知二项分布 B(n,p),可用泊松分布 P(入)近似二 项分布,其理论根据是近似公式:k鸟C;p
14、k(1-p)(E出(1)!这里要求 n较大,p 较小,舄=np。正态分布是二项分布的极限分布,当 n 较大时,可用正态分布近似二项分布, 其近似公式为:Cnkpk(1-p)(J=中广冲(2).np(1 - p) . np(1 - p)若叫 B(n,p),则有咐叫水2(k2;np)_以k1np)(3)np(1 - p) 一 np(1 - p)从上面可以看到,泊松分布和正态分布都是二项分布的极限分布,在满足 一定条件下都能近似二项分布。在实际中,利用这种关系有时能够带来很多方便, 从而简化计算。三、三种分布在实际中的应用三种分布在实际中有广泛的应用。二项分布适用丁抽查产品、能量供应、药 效试验、保
15、险公司估计利润等;泊松分布用丁公共汽车站来到的乘客数、电话总 机在一段时间内收到的呼唤次数、运输损耗等;正态分布用丁年平均气温和降雨量、测量误差、发电站电能消耗、人的身高和体重等。在日常生活、生产实际和 科学研究中,怎样利用三种分布的特点及联系,简单准确计算出所求事件的概率 呢?下面通过实际例子说明这一问题。例如:某大城市有一个繁忙的交通岗,若每天有 100000 人通过,每人出事故的 概率为 0.0001,求该天出事故的人数 X 不超过 2 人的概率。解法一:显然 X B(1000000,0.0001),利用二项分布得 PX M2 =0.00276849这里 n 较大,p 较小,直接用二项分
16、布计算比较麻烦。f (x) = b -a0其他解法二:用泊松分布近似二项分布的方法计算,代入公式(1)得这里赤= np=10 ,直接查泊松分布表求出,产生的误差为 5.仆 10 工。由此可 见,当 n较大时,p 较小时,泊松分布近似二项分布,其近似程度非常好,而 且计算简单。解法三:用正态分布的分布函数近似二项分布的方法计算,由近似公式(3)得PX 三 2 :,(一 2.53)-:,(-3.16) =0.00501这里直接查标准正态分布的分布函数表求得,其误差为0.00224151 ,这比用泊松分布产生的误差要大。在实际中,用二项分布计算量较大时,一般满足0.1 苴 p 苴 0.9, Jnp(
17、1 p)芝 3 的条件下,采用正态分布近似二项分布的方法,较为 方便准确有效。解法四:用正态分布的密度函数近似二项分布的计算方法,近似公式(2)1PX _2 : - (3.16) (2.85) (2.53) =0.0081907.9.999这里通过查标准正态分布的密度函数表直接求出,产生的误差为 0.00542221,其误差比上面的两种近似求值所产生的误差都大。所以,在实际中,当 p 不太接近 0 或 1, n 不太小,随机变量的取值较小时,应该利用近似(2) 计算,结果更准确。从以上四种解法中可以得到: 对丁一个实际问题, 首先应该根据三中分布 适用的条件,判断是服从什么分布。然后用此分布去
18、解决问题。若随机变量 XB(n,p),当 n 不太大,p不很小(一般 nV 10, p 芝 0.001)时,可以用二项分布直接计算,也可以查二项分布表求出;当 n 芝 10, p 苴 0.1 ,且随机变量的取值个数较少时,可以用泊松分布直接查表计算;当 0.1 V p 菱 0.9,Jnp(1p)是 3,随 机变量的取值比较多,用二项分布计算量太大时,可以用正态分布直接查表求 出结果。定义 2.2 (均匀分布)若随机变量 X 的密度函数为2PX 2: K封k 1010 e_k!=0.002769则称服从区间上的均匀分布,记作 XUa,b均匀分布描述的是在一个区间上等可能取值的分布规律,也即是说概率在该 区间上的分布是均匀的。均匀分布是最简单。最基本的连续型分布,就像直线运 动中的匀速运动,物体中的均匀物体一样.设某路公共汽车每 10 分钟一趟,则 乘客的等车时间可认为是在区间0, 10上均匀分布的.还可以把这个分布推广到一个在实数轴上某个指定的长度不为 0 的集合 B 上的连续型均匀分布。相应的密度函数为% = B的长度0,其余地方按连续型随机变数 X 的密度函数x)的定义,有X!F(x) = P(X Yx) = j(x)dx
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 线上课程设计 动画
- 药学课程设计指南
- 机设课程设计的模板
- 网络服务器配置课程设计
- 捅马蜂窝课程设计
- 智能可穿戴手表课程设计
- 2024年职业生涯规划教案篇
- 药品检验类课程设计论文
- 2024年移动智慧家庭工程师(高级)资格认证考试题库-上(选择题)
- 物流运输行业营销工作总结
- 2024智能变电站新一代集控站设备监控系统技术规范部分
- 企业反恐专项经费保障制度
- 电梯工程师在电梯设计中的工作内容
- 《概率论与数理统计基础》全套教学课件
- 2024国家开放大学电大本科《液压气动技术》期末试题及答案
- 肥猪销售合同模板
- 餐饮顾问合作协议
- 新教材牛津译林版高中英语必修第二册全册各单元重点语法精讲
- 两课 说课 单相桥式整流电路分析(获奖)
- 中国移动《下一代全光骨干传送网白皮书》
- 消费者行为学智慧树知到期末考试答案章节答案2024年浙江大学
评论
0/150
提交评论