概率论与数学建模_第1页
概率论与数学建模_第2页
概率论与数学建模_第3页
概率论与数学建模_第4页
概率论与数学建模_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 概率论与数学建模一、随机事件及其概率1.随机事件:可重复;可预测结果且结果明确;试验前出现那个结果不能确定例如:抛骰子一次,抛一枚硬币三次等。2.事件的运算及其含义:A为B的子事件。其含义是:A发生则B必发生:事件A,B相等。其含义是:A发生则B必发生,反之亦然:事件A与B的交。其含义是:C发生当且仅当A,B同时发生:事件A与B的并(和)。其含义是:C发生当且仅当A,B中至少有一个发生。:事件A与B的差。其含义是:C发生当且仅当A发生并且B不发生。:事件A与B互不相容。其含义是:A与B不可能同时发生。:事件A的对立事件。3.概率:刻化某一事件在一次试验中发生的可能性大小的数量指标。 (

2、当时,) 4.古典概论:某个试验共有n个等可能的结果(样本点),事件A包含其中m个结果(样本点),则认为就是事件A的概率。这种基于等可能性确定概率的模型称为古典概率模型。例6.1.1(Monte Hall Problem)20世纪60,70年代,美国“电视游戏秀”曾经非常流行一个名叫“Lets Make a Deal”的节目,由Monte Hall 主持。游戏过程如下:有三扇关着的门,其中一扇门后面有奖品(一辆汽车),其余两扇门后面则没有奖品,若猜中了有奖品的门就能赢取这辆汽车。你从中挑选一扇门,但暂不打开。这时,主持人在另外两扇门中挑一个没有奖品的门打开,并展示给你和观众。然后,主持人问你:

3、是坚持原来的选择,还是换成最后那扇门?解:从能不能得奖的角度看,这个游戏只有两个结果:不换门得奖(A)、换门能得奖(B)。第一个门是你“三选一”随机(等可能地)挑选的,故P(A)=1/3,自然,另一个结果的概率就是P(B)=2/3。因此,正确的决定是换成那扇门。例6.1.2(抽签原理)袋中有2只红球8只黑球(除颜色外无法再分辨)。10个人依次摸球,得红球者中奖。求:第k个摸球者中奖的概率,k=1,2,10解法一:假定对解题者来说这些球可辨别。样本点为一轮抽签结束后这10个球的排列,共有10!个等可能的样本点。事件所含样本点的特征是:两个红球中任选一个排在第k位(有种可能),而其余9个球在其余9

4、个位置上可任意排列(有9!种可能)。因此包含了9!个样本点,故.解法二:假定球不可辨,只需关注红球落入哪两个人之手,样本空间共有个等可能的样本点。事件发生意味着第k个人得一红球,另一红球落入其余9人中某一人之手,这有种可能,所以。例6.1.3(分球入盒模型)将2只球随机地放入3个可辨的盒子中。求事件A=甲乙两个盒子中各有一只球的概率。模型一:假定球可辨,根据乘法原理,样本空间有个等可能的样本点,而事件A所含的样本点有个(两只球的排列),所以.模型二:假定球不可辨,则样本空间共有个样本点(两块隔板就可以代表三个盒子,两只球以及两块隔板共4个位置,任选其中两个放置隔板): 而事件A所含的样本点只有

5、一个。人的直觉经验一般应该是这样的:从物理学上说,球总是可辨的(难以想象这个球既是这个球又是那个球),所谓不可辨,也只是根据问题或研究的目的,不在乎它们之间的区别而已。如果需要,后三种情形还是可以区别的。因此,现在这6个样本点不是等可能的:前三个均为,后三个均为。故答案应该还是。例6.1.4(浦丰投针问题)在平面上画一些间距为d的平行线,向此平面投掷一根长为l的(l<a)的针,试求A=此针能与某一直线相交的概率。 略。5.条件概率、乘法公式、独立性、全概率公式、贝叶斯公式(1)条件概率:表示事件B发生的条件下事件A发生的概率。且 (2) 乘法公式:若,有.(3)独立性:若,有或。则称A、

6、B相互独立。(4)全概率公式:设是S的一个分割,且,则对任一事件,有.条件全概率公式:设是S的一个分割,且,,则 例6.1.5(Polya模型)罐子里有r只红球和b只黑球,随机取出一球,放回后再加入同颜色的球c只。如此下去,求第n次取出红球的概率。解:设=第n次取出的是红球,=第n次取出的是黑球,n=1,2,.根据全概率公式,有 依次递推,易知有。(5)贝叶斯公式:设是S的一个分割,且,则对概率大于零的事件,有 i=1,2,n例6.1.6一个从不抽烟的60岁男性去医院看病,主诉有症状A=慢性咳嗽及非经常性憋气,医生安排他做肺部活组织检验,假定检验只有三种可能的结果:=正常(没有严重的肺病),=

7、肺癌,=结节病。假设医生根据临床经验,得知这三种病与该组症状之间的关联(条件概率)如下: ,另外,从疾病资料库中“年龄-性别-抽烟”这个症状组合栏目可以找到,在60岁从不抽烟的男性群体中,患这三种病的先验概率(频率)为 ,问:肺部活组织检查前,医生对该名男子应该如何诊断?解:用贝叶斯公式,已知症状组合A,三种疾病的条件概率分别为 虽然结节病的先验概率0.009很小,但他患有结节病的后验概率却高达0.8108.也就是说,虽然这组症状与两种疾病(肺癌和结节病)都比较相符,但结合病人的年龄、性别和抽烟等情况综合考虑,应该诊断为结节病。下面举一个综合运用加法公式、乘法公式、全概率公式、贝叶斯公式和独立

8、性的例子。例6.1.7一个罪犯单独作案,在现场留下了一些DNA信息。法医研究后发现能够辨别的只有5对,而且无罪的人也可能与此匹配,匹配的概率为。检查官认为罪犯就是该城镇100万居民之一。过去10年,该城镇曾有包括琼斯在内的10000人蹲过监狱,他们的DNA资料均记录在案。在检查对比这些DNA文档之前,检察官根据经验,认为有前科的人又犯罪的概率是没有前科的人犯罪概率的k倍。实际的DNA对比结果是:琼斯是唯一匹配的人。琼斯有罪的概率是多少?解:设有前科者的犯罪概率为,无前科者的犯罪概率为,则。由于是单独作案,某甲作案与某乙作案不相容,且必有一人作案,故,因此 ,记A=琼斯是作案者,B=琼斯是100

9、00人中唯一与现场留下的DNA信息匹配的人,则。我们要求的概率是,由贝叶斯公式 在10000个有前科的DNA对比试验中,每个人是否与现场DNA信息匹配是相互独立的。这里我们必须再补充一个假设:DNA对比试验技术上完美无缺(即,事实上匹配的人,对比结果必然匹配,事实上不匹配的人,对比结果必然不匹配)。因此,在琼斯是作案者(其他9999人都不是作案者)的前提下,琼斯匹配而其他9999人都不匹配的概率应该是 现来求.设=琼斯以外的9999个有前科者这次都没作案,根据条件全概率公式,有 显然其中的 ,注意到,事件意为“该案是990000个没有前科者之一所为”,故,即。于是 最终,我们得到 例如,若则新

10、的DNA证据表明琼斯作案的概率为,若则琼斯作案的概率为。二、随机变量1.随机变量的概念:2.常见的随机变量:(1)泊松分布:实际应用:一本书中一页中的印刷错误数。 (小概率事件)某地区在一天内邮件遗失的信件数。 某一天内医院的急症病人数。 某一地区一个时间间隔内发生交通事故的次数 一个时间间隔内某种放射性物质发出的经过计数器的粒子数等等(2)指数分布:其中为常数 ,记为 特点:无记忆性一个元件已经使用了s小时,在此情形下,它总共能使用至少s+t小时的概率,与开始使用时算起它至少能使用t小时的概率相等,即元件对已使用过s小时无记忆。实际应用:可靠性理论、排队论,许多“等待时间”服从指数分布,一些

11、没有明显“衰老”迹象的机械元器件(如半导体元件)的寿命也可也用指数分布来描述(3)正态分布:,记为 图6.1若,则此分布为标准正态分布,记为。对于一般的正态分布,通常可以转化为标准正态分布,这样就可以直接查标准正态分布表。定理:设,则,并且 证明:对任意的,有 这说明。于是,又有 图6.2图6.3“”原则:原则被实际工作者发现,工业生产上用的控制图和一些产品质量指数都是根据3原则制定。学生的考分一般服从正态分布,为了避免因微小随机差异而误评学生的表现,很多国家将分数(百分制)超过的评为A级,再以一个为单位,依次往下评定为B级、C级和D级,分数低于的评为E级。例6.2.1设从甲地到乙地有两条路可

12、供选择。第一条路较短但交通比较拥堵,所需要的时间(分钟)服从正态分布,第二条路较长但意外阻塞可能性较小,所需要的时间服从正态分布。(1)如果有70分钟可用,宜选哪条路?(2)如果只有60分钟可用,宜选哪条路?解:(1)走第一条路所需设为,,则70分钟内可以到达的概率为。走第二条路所需时间为,则70分钟内可以到达的概率为(2)假设同(1),则60分钟内可以到达的概率分别为 3.随机变量的特征数(数字特征):均值(期望):方差:例6.2.2(分赌本问题)1654年,职业赌徒de Mere爵士(可能是历史上最敬业的赌徒)向法国数学家Pascal提出一个困惑他已久的问题:甲乙二人赌技相同,各出赌资50

13、法郎,假定无平局,事前约定:谁先胜三局则拿走全部赌资100法郎。当甲赢了二局、乙赢了一局时,因故要中止赌博。问:这100法郎要如何分才算公平?解:以下有两种分法(1)甲得100法郎中的2/3,乙得100法郎中的1/3.这是基于已赌局数:甲赢了二局、乙赢了一局。(2)帕斯卡提出如下的分法:设想再赌下去,则甲最终所得为一个随机变量,其可能取值为0或100.再赌二局必可结束,其结果不外乎以下四种情况之一: 甲甲,甲乙,乙甲,乙乙其中“甲乙”表示第一局甲胜第二局乙胜。因为赌技相同,所以在这四种情况中有三种可使甲获100法郎,只有一种情况(乙乙)下甲获0法郎。所以甲获得100法郎的可能性为3/4,获得0

14、法郎的可能性为1/4,即的分别列为 0 100 0.25 0.75经上述分析,帕斯卡认为,甲的“期望”所得应为: 即甲得75法郎,乙得25法郎。这种分法不仅考虑了已赌局数,而且还包含了对再赌下去的一种“期望”,它比(1)的分法更为合理。例6.2.3在一个人数很多的团体中普查某种疾病,为此要抽验N个人的血,可以用两种方法进行。(1)将每个人的血分别去验,这就需验N次。(2)按K个人一组进行分组,把从K个人抽来的血混合在一起进行检验,如果这混合血液呈阴性反应,就生命K个人的血都呈阴性反应,这样,这K个人的血就只需验一次,若呈阳性,则再对这K个人的血液分别进行化验,这样,这K个人的血总共要化验K+1

15、次。假设每个人化验呈阳性的概率为,且这些人的试验反应是相互独立的,试说明当较小的时,选取适当的K,按第二种方法可以减少化验的次数,并说明K取什么值时最适宜。解 各人的血呈阴性反应的概率为.因而K个人的混合血呈阴性反应的概率为,K个人的混合血呈阳性反应的概率为。设以K个人为一组时,组内每人化验的次数为,则是一个随机变量,其分布率为 的数学期望为 N个人平均需化验的次数为由此可知,只要选择K使 则N个人平均需化验的次数<N,当固定时,我们选取K使得 小于1且渠道最小值,这时就能得到最好的分组方法。例如,=0.1,则=0.9,当K=4时,L 取到最小值。此时得到最好的分组方法,若N=1000,

16、此时以K=4分组,则按第二种方法平均只需化验 (次)这样平均来说,可以减少40%的工作量。三.概率模型:(一)报童的诀窍模型问题:报童每天清晨从报社购进报纸零售,晚上将没有卖掉的报纸退回。设报纸每份的购进价为b,零售价为a,退回价为c(a>b>c)。这就是说,报童售出一份报纸赚a-b,退回一份赔b-c。报童每天如果购进的报纸太少,不够卖的,会少赚钱;如果购进太多,卖不完,将要赔钱。请你为报童筹划一下,他应如何确定每天购进报纸的数量,以获得最大的收入。分析:需求量是随机的,假定报童已经掌握了需求量的随机规律,即在他的销售范围内每天报纸的需求量为r份的概率是。有了和a,b,c,就可以建

17、立关于购进量的优化模型了。因为需求量r是随机的,致使报童每天的收入也是随机的,所以作为优化模型的目标函数,应该是他长期卖报的日平均收入,即每天收入的期望值。模型建立与求解:假设每天购进量为n份,则每天的收入为 于是每天购进n份报纸时的平均收入为 (6.2.1)问题归结为:在和a,b,c已知时,求使最大。通常需求量r的取值和购进量都相当大,将r近似地看成连续变量更便于分析和计算,这时概率转化为概率密度,式(6.2.1)变成 (6.2.2)计算 令,得到 (6.2.3)使报童日平均收入达到最大的购进量应满足(6.2.3)。因为,所以式(6.2.3)又可表为 (6.2.4)根据需求量的概率密度的图形

18、很容易从式(6.2.3)或(6.2.4)确定购进量。 图6.4在上图中用和分别表示曲线下的两块面积,则式(6.2.3)可记作 因为当购进份报纸时,是需求量不超过时的概率,即卖不完的概率,是需求量超过的概率,即卖完的概率,所以式(6.2.3)表明,购进的份数应该使卖不完与卖完的概率之比,恰好等于卖出一份赚的钱a-b与退回一份赔的钱b-c之比。显然,当报童与报社签订的合同使报童每份赚钱与赔钱之比越大时,报童购进的份数就应该越多。(二)蔬菜销售的最优订购量问题问题:某超市蔬菜部在一时期内每天订购几种蔬菜销售,现考虑其中一种蔬菜的销售利润问题。设这种蔬菜每千克批进价为元,零售价为;若卖不完就在当天以每

19、千克元处理掉。这里,;对这种蔬菜每天需支付运费和行政费元。试制订一个使得销售该种蔬菜平均每天利润达到最大的最优方案,进而求出这个最大平均利润。问题分析:运用数学建模方法解决这一问题时,要抓住以下三个要点:一是超市蔬菜部每天销售这种蔬菜的数量是一个随机变量,因此每天销售这种蔬菜的利润也是一个随机变量,显然后者是前者的函数,必须根据问题所提供的信息将这一关系式列举出来;二是每天的订购量必须适当,既不能太少,否则供不应求,并将会减少收益,也不能太多,否则当天因卖不完以较低的价格处理掉将会影响收益。既然每天销售这种蔬菜的利润是一个随机变量,所以作为优化模型的目标函数,不能是每天的利润,而应考虑每天利润

20、的统计平均值,即数学期望;三是所要求的制订使得销售该种蔬菜平均每天利润达到最大的最优订购方案是数学上的最值问题。模型假设:为便于在数学上建模处理,需作如下假设:(1)蔬菜批发市场每天有足够的这种蔬菜可供超市蔬菜部批进;(2)蔬菜部除了支付批进这种蔬菜所需的成本费用外,其他有关费用已考虑在零售价之中,不另计算;(3)记(单位:千克)为在一段时期内,市场上每天对该超市销售这种蔬菜的需求量,(单位:元)为蔬菜部每天销售这种蔬菜的利润,为研究作为的函数的统计特性,必须知道的统计规律性。假设蔬菜部已通过长期的销售经验或其他渠道掌握了市场在这段时期内其的概率分布可以近似地用概率密度函数 刻画。模型建立:设

21、在一段时期内,超市蔬菜部每天对这种蔬菜的订购量为(单位:千克),则由于销售利润等于销售收入减去销售成本,于是作为的函数。其表达式为 此问题的目标函数为每天销售这种蔬菜的平均利润,即的数学期望是的函数,记为。利用连续型随机变量函数的数学期望求法,有 化简,得 问题归结为求使得达最大的值。模型求解 为求得上式的最大值,将上式对求导,得 令,解得唯一稳定点满足 即注意到的分布函数单调递增,于是得 由于 故使得平均利润达最大值的最优订购量由给出。进而,最大平均利润为 (三)轧钢中的浪费模型:问题:将粗大的钢坯制成合格的钢材需要两道工序:粗轧(热轧),形成刚才的雏形;精轧(冷轧),得到规定长度的成品材料

22、。由于受到环境、技术等因素的影响,得到钢材的长度是随机的,大体上呈正态分布,其均值可以通过调整轧机设定,而均方差是由设备的精度决定,不能随意改变。如果粗轧后的钢材长度大于规定长度,精轧时要把多余的部分切除,造成浪费;而如果粗轧后的钢材长度小于规定长度,则造成整根钢材浪费。如何调整轧机使得最终的浪费最小。(1) 问题概述:成品材料的规定长度已知为,粗轧后的钢材长度的标准差为,粗轧后的钢材长度的均值,使得当轧钢机调整到m进行粗轧,然后通过精轧以得到成品材时总的浪费最少。(2) 问题分析:精轧后的钢材长度记为,的均值记为m,的方差为,按照题意,。概率密度函数记为f(x),当成品钢材的规定长度给定后,

23、记的概率为,=p()。在轧钢过程中产生的浪费由两种情况构成:若,则浪费量为;若,则浪费量为。注意到当很大时,的可能性增加,浪费量同时增加;而当很小时,的可能性增加,浪费量也增加,因此需要确定一个合适的使得总的浪费量最小。(3) 模型建立与求解:这是一个优化模型,建模的关键是选择合适的目标函数,并用,m把目标函数表示出来。根据前面的分析,粗轧一根钢材平均浪费长度为: 利用,和由(1)得:W=m- 以W为目标函数是否合适?由于轧钢的最终产品是成品材,浪费的多少不应以每粗轧一根钢材的平均浪费量为标准,而应该用每得到一根成品材浪费的平均长度来衡量。因此目标函数为:因为是已知的常数,所以目标函数可以等价

24、的取为: 其中,易见平均每得到一根成品钢材所需要的刚才长度,问题就转化为求m使达到最小。令则(2)式可表为:其中:可用微分法解的极值问题。注意到,不难推出最优值Z应满足方程: (*)记,可根据标准正态分布的函数值和制成表格式给出图形。Z-3.0-2.5-2.0-1.5 -1.0-0.5227.056.7918.107.2603.4771.680Z00.51.01.52.02.51.2530.8760.6560.5160.4200.355由上表可得方程(*)的根Z*注:当给定> =1.253时,方程(*)不止一个根,但是可以证得,只有唯一负根Z*<0,才使取得极小值。(四)火灾报警问

25、题(美国)一个地区911应急服务中心在过去的一年内平均每月要收到171个房屋火灾电话,基于这个资料的,火灾率被估计为每月171次,下个月收到火灾报警电话只有153个,这表明房屋火灾率实际上实际上是减少了,或是或是它只是一个随机波动?分析:第n-1次和第n次火灾之间的时间(月),X1,Xn,是独立的且每一个Xn服从参数为的指数分布,为报告的房屋火灾率(月),即是:,(Xi>0)目标:给定=171,确定每月收到153次这样的少的电话报警的概率有多大?或者说每月收到153是否属于正常范围内?建模:, ,将代入得:(利用3原理):若要有95%的把握,则:若要有98%的把握,则:选择95%的把握得

26、到: 将=171,n=153代入(1),有:即:因此我们的观察值是在正常的变化范围之内结论:断言火灾报警率降低的证据不充分,它可能是正太随机变量的正常结果。当然,若每月都连续这样低,则需重新评估。灵敏度分析:当=171代入(1)得: 因为对任何的,区间总会包含1,即在之间都属于正常范围。 对于“每月171次”的假设的敏感性分析。去掉特殊性,假设每月的均值是,我们有一个月的报警电话次数的观测值n=153,代入(1),有:因为对于任何的之间总会包含1,所以=153属于正常的变化范围。(续)随机过程部分一、随机过程:热噪声电压:电子元件或器件由于内部微观粒子的随机热骚动所引起的端电压称为热噪声电压。

27、它在任一时刻t的值是一随机变量,记为V(t),不同时刻对应不同的随机变量,当时间在某区间,譬如在上推移时,热噪声电压表现为一族随机变量,记为:V(t),t>=0。由于热骚动的随机性,在相同条件下每次测量都将产生不同的电压时间函数。这样,不断的独立的测量就可以得到一族不同的电压时间函数。tV1(t)V2(t)V3(t)tttjtjtj设T是一无限实数集,我们把依赖于参数的一族(无限多个)随机变量称为随机过程。记为X(t), 。这时每一个,X(t)是一随机变量,T叫做参数集。把t看作为时间,称X(t)为时刻t时过程的状态,而X(t)=x或是t=t1时过程处于状态x。对于一切的,X(t)的所有

28、可能的一切值的全体称为随机过程的状态空间。 二、马尔可夫链及其基本方程:将时间离散化为n=0,1,2,对每个n,系统的状态用随机变量Xn表示,设Xn可以取k个离散的值Xn=1,2,k,且记即状态概率从Xn=iXn+1=j的概率记为即转移概率。如果Xn+1的取值只取决于Xn的取值及转移概率,而与X1,X2,Xn-1的取值无关,则称这种离散状态按照离散的时间的随机转移过程叫做马尔可夫过程。或者说此过程具有马尔可性或无后效性。注:还可以这样表示由状态转移的无后效性和全概率公式可以写出马尔可夫链的基本方程为 并且和应满足: (2)引入状态概率向量和转移概率矩阵则(1)式可表为:由此可得 :(2)式表明

29、转移矩阵P是非负矩阵,且P的行和为1,称为随机矩阵。说明:对于马尔可夫链模型最基本的问题是构造状态Xn及写出转移矩阵P,一旦有了P,那么给定初始状态概率a(0)就可以用(3)和(4)或计算任意时段n的状态概率a(n)例题:(1)健康与疾病: 其中(i,j=1,2)0.20.70.30.8n012310.80.780.7787/900.20.220.2222/9若开始处于疾病状态,即,n012300.70.770.7777/910.30.230.2232/9更一般的,当时,的趋向与上面两表相同。结论:当时,趋向于稳定值,与初始状态无关。(2)健康、疾病、死亡0.650,250.180.10.80.021n0125010.80.7570.1293000.180.1890.0326000.20.0540.83811对于例题中的(1)小问,看出从任意状态出发经过有限次的转移都能达到另外的任意状态,而(2)小问中则不能。正则链定义:一个有k可状态的马尔可夫链,如果存在正整数N,使从任意的状态i经N次转移都以大于0的概率到达状态j(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论