学年论文浅谈泊松分布及其应用重点讲义_第1页
学年论文浅谈泊松分布及其应用重点讲义_第2页
学年论文浅谈泊松分布及其应用重点讲义_第3页
学年论文浅谈泊松分布及其应用重点讲义_第4页
学年论文浅谈泊松分布及其应用重点讲义_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本科生学年论文(设计)( 级)论文(设计)题目 浅谈泊松分布及其应用 作 者 分院、 专业 班 级 指导教师(职称) 字 数 成果完成时间 杭州师范大学钱江学院教学部制I浅谈泊松分布及其应用摘要:泊松分布作为大量试验中稀有事件出现的频数的概率分布的数学模型,是指一个系统在运行中超负载造成的失效次数的分布形式。根据泊松分布的一些性质,引出这些性质在实际生活中的重要应用。 关键词:泊松分布 概念 实际应用Discuss poisson distribution and its applicationWuSuLing guidance teacher: QiuLiangHuaAbstract: th

2、e poisson distribution as a large number of test rare event of frequence of the probability distribution of the mathematical model, it is to point to a system in running the super load caused by the failure frequency distribution form. According to some properties of poisson distribution, leads to t

3、hese properties in real life important application.Keywords: poisson distribution concept practical application.目录1 引言41.1 泊松分布42 泊松分布的基础知识43 泊松分布下的非线性拟合43.1 拟合函数是非线性的近似方法43.2 求解泊松分布问题的一般途径54 泊松分布在现实生活中的应用54.1 “非典”的流行和传播服从泊松分布54.2 泊松分布在生物学中的应用64.2.1泊松分布在遗传图距计算中的应用64.2.2泊松分布在计算病毒粒体对细胞感染率中的应用64.2.3泊松分

4、布在估计一个基因文库所需克隆数中的应用64.3 初步研究固体火箭发动机可靠性74.4 保险损失费若干问题研究85 .结论85.1 结语8泊松分布存在在现实生活的各地,在各个领域都有泊松分布85.2 参考文献8浅谈泊松分布及其应用1 引言1.1 泊松分布泊松分布,是一种统计与或然率学里常见到的离散或然率分布,由法国数学家西莫恩德尼·泊松在1838年时发表,是在推广伯努利形式下的大数定律时,研究得出的一种概率分布,因而命名为泊松分布。在概率论中现称泊松分布。 常用于描述单位时间、单位平面或单位空间中罕见“质点”总数的随机分布规律。泊松分布作为大量试验中稀有事件出现的频数的概率分布的数学模

5、型, 它具有很多性质,泊松分布在实际生活中起着很大的重要作用。2 泊松分布的基础知识泊松分布定义:设随机变量 X 的可能取值为0, 1, 2, ; 且 pX = k =ke-/k! (k=0,1,2,n), > 0为常数。则称 X 服从参数为 的泊松分布, 记作 X D。特征:泊松分布的特点是总体上的稀有性和局部的密集性加偶然性。定理1.如果 X 是一个具有以为参数的泊松分布, 则 E =且D =。定理2.设随机变量 xn(n = 1, 2, ) 服从二项分布, 其分布律为 Pxn = k = Cn(k)Pn(k)( 1- pn)(n-k)k =0, 1, 2, ?, n。 又设 npn

6、 => 0 是常数, 则lim xn = k =ke-/k!(n趋向无穷大)。泊松分布参数的最短置信区间:由于泊松分布的数学期望 E (X ) =,从而E( k)=E (xi) = 。因此如果我们对总体参数进行区间估计, 可以先求出 的置信区间的上下限,再分别除以样本容量 n,便得到的置信区间。利用泊松分布的分布函数可以计算出参数 的置信区间, 当 k>=1时, 可分别解出置信下限 a= 和置信上限 b= 其中, k为样本总计数, 1- 为所需的置信度, 0< <1 , 0<<。3 泊松分布下的非线性拟合3.1 拟合函数是非线性的近似方法

7、对服从泊松概率分布的实验数据组进行拟合,如果拟合函数是非线性的,常常以下近似方法。近似性之一:表现在将拟合函数线性化,或者采用某种参数寻优 的方法。近似性之二:则是将泊松问题近似地看作高斯分布问题。泊松分布与高斯分布:泊松分布与高斯分布是既相近又有差别的两种概率分布。在概率论中,泊松分布和高斯分布都是二项分布中总项数 N 趋于无限大时的极限形式。不同的是,泊松分布很适合描述其数据的可能值在一端严格有界,在另一端无界的实验。而高斯分布的两端都可以无界。并且,对事件的平均值而言,高斯分布是绝对对称的。仅当事件的平均值远远大于 1时,泊松分布才接近于对称分布,与高斯分布相似。3.2 求解泊松分布问题

8、的一般途径首先还是比较一下当数据涨落分别服从两种不同概率分布情况 下的异同.对于高斯概率分布问题,观测到该数据组的概率为最大或然法与最小二乘法均给出同样结果,即 j=1,2,n4 泊松分布在现实生活中的应用4.1 “非典”的流行和传播服从泊松分布2003年,春, 肆虐的“非典”病毒向人类发起了猖狂攻击。 来势汹涌的“非典”, “非典”给了置身其中的我们很多很多的思索。 比如,为什么我国会成为“非典”的重灾区?“非典”的传播和扩散是否遵循一定的规律呢?2003年5月26日10时至5月27日10时,全国各地共报告新增非典型肺炎临床诊断病例9例,治愈出院115例,死亡4例。 其中,北京新增临床诊断病

9、例9例, 治愈出院81例, 死亡4例; 其他省份都没有新增临床诊断病例和死亡病例。 ”从“非典”在我国流行和传播的空间分布来看,主要发生在北京,显现总体上的稀有性和局部的密集性加偶然性的特点; 从时间上看,从发现病例以来,以2003年为高峰期,它符合泊松分布的特点, 各段时间出现失效与否,是相互独立的。 所以,“非典”在我国的流行和传播是符合泊松分布规律的的爆发,其流行和传播都是服从泊松分布规律的。 腐败现象的产生与发展符合泊松分布腐败现象作为社会现象中的一种非常态, 它的发生和发展规与泊松分布规律完全相同, 特点是总体上的稀有性和局部的密集性加偶然性,具体表现有“前腐后继案”“串案”“窝案”

10、等形式。 “前腐后继案”表明了腐败现象在时间上是呈泊松分布,“窝案” 表明了腐败现象在空间上呈泊松分布,而“串案”则表明了腐败现象在立体上呈泊松分布。4.2 泊松分布在生物学中的应用泊松分布广泛应用于遗传学的遗传图距计算、 生物物理学的辐射生物学的定量分析、 病毒学中的病毒感染率计算、 分子生物学中一个基因文库所需克隆数的估计、 PCR扩增片段保真率的估算以及酵母单双杂交中转化率的估计等学科领域。4.2.1泊松分布在遗传图距计算中的应用在遗传学上,计算遗传图距的基本方法是建立在重组率基础上的, 根据重组率的大小作出有关基因间的距离, 绘出线性基因图。如果所研究的两基因座相距甚远, 其间可发生双

11、交换、三交换、四交换或更高数目交换, 而形成的配子总有一半是非重组型的。因此,我们可利用泊松分布原理来描述减数分裂过程中染色体上某区段交换的分布。4.2.2泊松分布在计算病毒粒体对细胞感染率中的应用在感染病毒的细胞培养物中, 培养细胞可被不同数量的病毒粒体感染, 了解病毒粒体在培养细胞上的分布, 即了解病毒粒体所感染的细胞比率。而受感染的细胞比率取决于每个细胞中所含有的病毒粒体的平均数, 称感染重数 ( m )。感染细胞的病毒粒体是指那些早期起始感染的粒体, 无活性病毒粒体不计。因此, m同感染细胞病毒粒体总数 ( N)和细胞总数 ( C)的关系是 m =aN/C, 这里 a是指细胞早期起始感

12、染病毒粒体的比率, 如果a能确定, 则 m值可由已知的 N值与 C值计算出来。实际上细胞大小和表面特性等许多方面细胞是不同的, 但这些偏差是可忽略的, 现假定对细胞来说被感染的能力都一样。由泊松分布可知p(n)=(mn)(e-m)/n!z则未被感染的细胞比率p (0)=(m0)(e-m)/0!=e-m那么感染重数 m也可以通过未被感染的细 胞比率 p ( 0 )的实 验测定来求得:m = - Inp (0)。4.2.3泊松分布在估计一个基因文库所需克隆数中的应用在分子生物学中, 一个完整的基因文库所需克隆数的估计对基因克隆实验方案的设计具有重要意义。由于基因组 DNA是从大量细胞中提取的, 每

13、个细胞中均含有全部基因组 DNA, 那么每一种限制性片段的数目是大量的, 因此可以说各限制性片段的数目是相等的。在基因克隆中, 基因组 DNA 用限制性酶切割后与载体混合反应以及随后的过程均是随机的生化反应过程。第一, 对克隆来说一限制性片段要么被克隆、 要么不被克隆, 只有这两种结果;第二, 由于总体限制性片段是大量的, 被克隆的对总体影响很小; 第三, 在克隆中一片段被克隆的概率为f( f较小 ), 不被克隆的概率为 1- , f 且克隆时这两种概率都不变。综上所述, 基因克隆的过程符合泊松分布, 可用泊松分布来分析计算。设 p为基因被克隆的概率; N 为要求的克隆的概率为 p时一个基因文

14、库所需含有重组 DNA 的克隆数; f为限制性片段的平均长度与 基因组 DNA 总长度之比, 若基因 组DNA 被限制性酶切割成 n个 DNA 片段, f即1/n。则在克隆数为 N 时, 任一段被克隆一次或一次以上的概 率 为 p = 1 - p ( 0 ) = 1 e , 可 推 出 N =1n( 1- p )/f, 一般要求目的基因序列出现的概率 p的期望值定为99%,那么N =- n1n (1- p)=- n1n ( 1- 0. 99) = 4. 605n。4.3 初步研究固体火箭发动机可靠性固体火箭发动机研制一般要经过模样、初样、试样、定型等阶段, 在研制中进行可靠性增长试验是提高产品

15、可靠性的有效手段. 通过这种试验, 不断发现和消除系统性缺陷, 提高产品的可靠性. 发动机可靠性增长研究是近年来发动机可靠性研究的一个重要方向, 已引起国内外学者的高度重视.数学模型假设: 研制生产的固体火箭发动机总数为 n; 最初设计的固体火箭发动机系统性缺陷数为 B0; 各系统性缺陷失效率均为 p;若试验失败, 则导致失败的故障模式可以确定, 并从以后的固体火箭发动机产品中成功消除.研究问题: 给定产品总数 n, 选择试验量 t,通过可靠性增长试验发现固体火箭发动机产品的系统性缺陷, 通过改进设计, 使余下的 (n- t)台固体火箭发动机成功数期望值最大.成功数 S0服从成功率为 ( 1-

16、 p)B0的二项分布, 即S0 B in(n, (1- p )B0), 则条件期望为E S0 | B0 = n( 1- p ).进一步, 假设完成了 t次试验, E St | Bt = (n - t)( 1- p)其中, Bt是 t次试验后剩余的系统性缺陷数.注意到 t次试验后任一缺陷继续存在的概率为( 1- p), 则 Bt关于 B0的条件分布为二项分布:P Bt = k | B0=(B0 ; k)(列矩阵) ( 1- p )(1- ( 1- p) 其母函数为gBt|B0(z) = E z| B0 设 gB0( z) 为 B0的母函数, 由条件期望的性质为gBt(z) = EBtz| B0

17、= EB0E z| B0 = EB0 (z( 1- p)+ (1- ( 1- p) )= gB0(z( 1- p)+ ( 1- ( 1- p )t) ).至此, 只要知道 B0的分布特征, 就可求得E z, 进而得到 E St.一般取初始系统性缺陷数 B0为服从均值为的泊松分布, 则其母函数为 gB0(z) = , 所以EBtz = gB0(z ( 1- p)+ ( 1- ( 1- p) )= .推出E St= = (n - t) 。此时, 若所有参数已知或可估计, 就可得到最佳试验量 t = topt(n), 使剩余产品成功数期望值最大. 实际应用过程中, 参数 p 值不易确定, 为消除E

18、St 与 p的相关性, 设f (p ) = lnE St = ln(n - t) ( 1- p)p. 令 df (p ) /dp = 0 , 求出 p, 即 p的最小值 pm in =1/(1+ t). 则Em inSt = (n - t) exp- (t/(1+ t)(1/(1+ t). 最佳可靠性增长试验量的准则是选取使Em in St 最大的试验量 t . 这一准则称为极大 -极小准则. 此时, Em in St 值只与 n, 和 t有关, 消除了p对试验量选择的影响.4.4 保险损失费若干问题研究设在某一时段内共有 N 个投保者, 第 i 个在此时段内的损失费用Xi 表示( i= 1,

19、 2, , N) , 且设 X i 间相互独立, N 为随机变量, X 1, X 2, ,XN, N 间相互独立, 则在此时段内承保者所面临的风险为S= X 1+ X 2+ ,+ X N事实上, 危险事故保险( 如汽车保险、 火灾保险等)的损失费可由指数分布来描述, 这是由这些保险具有/ 无记忆性0的特征所决定的. 即投保人投保后已发生危险事故所发生的损失费在超过 t的前提下再次发生危险事故其损失费超过s 的条件概率与自投保后首次发生危险事故其损失费超过的无条件概率相等, 即可由下列简单过程导出.以 X 表示投保人在某一时间内发生危险事故的损失费, 令 g(t) = P X> t , 则

20、由/ 无记忆性0的涵义可得: P X > s+ t | X > t = P X >s, 这里 s> 0, t> 0. 则由条件概率的计算公式易得, g( t+ s) = g( t ) g( s). 通过适当的运算, 可以得到, 当 t> 0 时, g( t)= e-K t, 这里 K > 0. 显然 P t F0= 0, 即当 t F0时, 都有 g( t) = 0.综合之, 可知, X 为服从参数 K的指数分布.本文将以危险事所发生的损失费为研究对象, 讨论投保人数 N 服从泊松分布下总损失费的分布。保险损失费分布是保险精算中的重要内容,对其加以研究是必要的. 由于分布的复杂,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论