第一章-随机事件与概率_第1页
第一章-随机事件与概率_第2页
第一章-随机事件与概率_第3页
第一章-随机事件与概率_第4页
第一章-随机事件与概率_第5页
已阅读5页,还剩194页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计谨以此献给我所有可爱的,才华横溢的学生!是的,正是这样!我们将开始神奇之旅,感动上帝!

在第二次世界大战中,美国曾经宣布:一名优秀数学家的作用超过10个师的兵力。这句话有一个非同寻常的来历。

1943年以前,在大西洋上英美运输船队常常受到德国潜艇的袭击,当时,英美两国限于实力,无力增派更多的护航舰。一时间,德军的“潜艇战”搞得盟军焦头烂额。为此,有位美国海军将领专门去请教了一位数学家,数学家们运用概率论分析后认为:舰队与敌潜艇相遇是一个随机事件,从数学角度来看这一问题,它具有一定的规律性。一定数量的船(为100艘)编队规模越小,编次就越多(为每次20艘,就要有5个编次)。编次越多,与敌人相遇的概率就越大。美国海军接受了数学家的建议,命令舰队在指定海域集合,再集体通过危险海域,然后各自驶向预定港口。结果奇迹出现了:盟军舰队遭袭被击沉的概率由原来的25%降为1%,大大减少了损失,保证了物资的及时供应.1名数学家=10个师回顾引入概率论的历史概率(Probability),亦称为赌博法,机遇论,猜测艺术等,它的思想可追溯自公元前220年以前的中国的一些文献.不过真正的历史却只有三百来年而已.如今,但凡要进行信息处理,决策制定,实验设计等等,只要涉及数据,必用概率统计的模型和方法.例如,在经济,管理,工程,技术,物理,化学,生物,环境,天文,地理,卫生,教育,语言,国防等领域有非常重要的应用.

这一天,法国一位贵族、职业赌徒梅累(DeMere)向法国数学家、物理学家帕斯卡(Pascal)提出了一个十分有趣的“分赌注”问题.问题是这样的,一次梅累和赌友掷硬币,各押赌注32个金币.双方约定先胜三局者为胜,取得全部64个金币.

赌博进行了一段时间,梅累已经赢了两局,赌友已经赢了一局.这时候梅累接到通知,要他马上陪同国王接见外宾,赌博只好中断了.请问:两个人应该怎样分这64个金币才算合理呢?概率论的生日:1654年7月29日赌友说,他要再碰上两次正面,或梅累要再碰上一次正面就算赢,所以他主张赌金应按2:1来分。即自己分64个金币的,梅累分64个金的。

梅累争辩说,不对,即使下一次赌友掷出了正面,他还可以得到,即32个金币;再加上下一次他还有一半希望得到16个金币,所以他应该分得64个金币的,赌友只能分得64个金币的。两人到底谁说得对呢?帕斯卡是17世纪有名的“神童”数学家。可是,梅累提出的“分赌注”的问题,却把他难住了.他苦苦思考了两三年,到1654年才算有了点眉目,于是写信给他的好友费马,两人讨论结果,取得了一致的意见:梅累的分法是对的,他应得64个金币的四分之三,赌友应得64金币的四分之一。这时有位荷兰的数学家惠更斯在巴黎听到这件新闻,也参加了他们的讨论.结果他们这样回答了梅累的问题;“先做一个树结构图,根据树结构图A胜的概率是3/4时,就把赌钱的3/4分给A,把剩下的1/4分给B就可以了.”于是,概率的计算就这样产生了.

在他们三人提出的解法中,首先都涉及了数学期望(mathematicalexpectation)这一概念,并由此奠定了古典概率论的基础.

讨论结果,惠更斯把它写成一本书叫做《论赌博中的计算》(1657年),这就是概率论最早的一部著作.

概率论现在已经成了数学的一个重要分支,在科学技术各领域里有着十分广泛的应用.古典概率时期工具:排列组合主要工作:PascalFermatHuygensBernoulliJamesDeMoivreAbrahamBernoulliDaniel等等.《论赌博中的计算》,1657,(DeRatiociniisinLudoAleae)《猜测的艺术》,1713,ArsConjectandi,详尽论述排列组合理论,提出了概率论在民间,道德,经济上的应用.《论赌博法》,1711,《机遇说》,1722,

Laplace以前关于概率论的最大贡献.《赌博法新论》,1730,

《关于猜测的新问题的分析研究》,1759,将概率论推广于人寿保险,健康统计上.分析概率时期工具:微积分等现代数学主要工作:DeMoivreAbrahamLaplaceTheDoctrineofChances,1733,由二项式公式推出正态分布曲线《概率分析理论》,1812,ThéorieAnalytiquedesProbabilités

,标志进入分析概率时期的伟大著作.等等.Kolmogorov(1903–1987)《概率论的基本概念》,1933,给出了概率论的公理化定义,标志概率论进入现代数学范畴.概率论研究的对象是什么?现象确定现象随机现象一、随机现象§1.1 随机事件第一章 随机事件与概率它的原意是指刮风、 下雨、阴天、晴天 这些天气状况很难 预料,后来它被引 申为:世界上很多 事情具有偶然性, 人们不能事先判定这些事情是否会发生。

降水概率90%“天有不测风云”人们果真对这类偶然事件完全无法把握、束手无策吗?随着对事件发生的可能性的深入研究,人们发现许多偶然事件的发生也具有规律可循的。概率这个重要的数字概念,正是在研究这些规律中产生的。人们用它描叙事件发生的可能性的大小。例如,天气预报说明天的降水概率为90%,就意味着明天有很大可能下雨(雪)。降水概率90%试分析:“从一堆牌中任意抽一张抽到红牌”这一事件的发生情况?可能发生,也可能不发生必然发生必然不会发生

木柴燃烧,产生热量明天,地球还会转动问题情境在00C下,这些雪融化实心铁块丢入水中,铁块浮起煮熟的鸭子,飞了水从高处流向低处太阳从西边升起

在一定条件下,事先就能断定发生或不发生某种结果,这种现象就是确定性现象.“函数在间断点处不存在导数”等.确定性现象的特征

条件完全决定结果.研究的数学工具:代数,微积分,微分方程等等.转盘转动后,指针指向黄色区域

在一定条件下,某种现象可能发生也可能不发生,事先不能断定出现哪种结果,这种现象就是随机现象.这两人各买1张彩票,她们中奖了实例1

“在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况”.结果有可能出现正面也可能出现反面.结果有可能为:“1”,“2”,“3”,“4”,“5”或“6”.实例3

“抛掷一枚骰子,观察出现的点数”.实例2

“在相同条件下生产同一种零件,观察它们的尺寸”.结果:“它们的尺寸总会有一点差异

”.实例4

“从一批含有正品和次品的产品中任意抽取一个产品”.其结果可能为:

正品、次品实例5

“过马路交叉口时,可能遇上各种颜色的交通指挥灯”.实例6

“一只灯泡的寿命”可长可短.

个别随机现象:原则上不能在相同条件下重复出现(例6).随机现象的特征条件不能完全决定结果.随机现象的分类

大量性随机现象:在相同条件下可以重复出现(例1-5).2°随机现象从表面上看,似乎杂乱无章,没有规律.但实践证明,如果同类的随机现象大量重复出现,它的总体就呈现出一定的规律性.1°随机现象揭示了条件和结果之间的非确定性联系

,其数量关系无法用函数加以描述.

这种规律性随着我们观察的次数的增多而愈加明显.这种由大量同类随机现象所呈现出来的集体规律性叫做统计规律性.概率论和数理统计就是研究这种统计规律性的数学学科.二、随机现象的统计规律性必然性使人们愿意事先好好准备。随机性使人们对未来,充满着盼望与戒慎恐惧。光有必然性,亳无变异,对未来缺乏盼望,人们将少了努力的动机。光有随机性,只靠运气,将令人失去积极认真的企图心。机遇在爱情与工作上扮演着极其重要的角色。我们在人生中其实不是按明确路线前进的汽车司机,而更像是弹珠游戏里到处碰运气的珠子。以开放的心态面对生活中的岔道口,能看到别人错过的机会。即使事与愿违,也能很快摆脱失望,走向下一个幸运之地。他们更加快乐,更容易达成心愿。

三分天注定,五分靠打拼,两分靠运气。由于变异无可避免的存在,要了解变异,设法减少变异。虽世事多变,但万物有常,存在随机法则。看似没有规律,其实被大数法则规范。随机现象是通过随机试验来研究的.问题

什么是随机试验?随机试验现在,就让我们一起,步入这充满随机性的世界,开始第一步的探索和研究.1.可以在相同的条件下重复地进行;2.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;3.每次测试的结果事前不可预言.定义:在概率论中,把具有以下三个特征的试验称为随机试验.随机试验简称为试验,记为

E.特点:可重复性,可观察性,随机性.实例“抛掷一枚硬币,观察字面,花面出现的情况”.分析:(1)试验可以在相同的条件下重复地进行;(2)试验的所有可能结果:字面、花面;(3)进行一次试验之前不能确定哪一个结果会出现.

故为随机试验.1.“抛掷一枚骰子,观察出现的点数”.2.“从一批产品中,依次任选三件,记录出现正品与次品的件数”.同理可知下列试验都为随机试验3.记录某公共汽车站某日上午某时刻的等车人数.4.考察某地区10月份的平均气温.5.从一批灯泡中任取一只,测试其寿命.

三、样本空间样本点:随机试验结果的出现是不确定的,但所有可能结果是明确的.随机试验的每一个可能结果称为一个样本点,记为样本空间:样本点的全体,记为

如果试验是将一枚硬币抛掷两次,则样本空间由如下四个样本点组成:S={(H,H),(H,T),(T,H),(T,T)}第1次第2次HHTHHTTT(H,T):(T,H):(T,T):(H,H):其中

样本空间在如下意义上提供了一个理想试验的模型:

在每次试验中必有一个样本点出现且仅有一个样本点出现.例1 写出下列随机试验的样本空间.

1)观将一枚硬币连抛N次,观察正面出现的次数.2)抛掷一枚骰子,观察出现的点数.从一批产品中,依次任选三件,记录出现正品与次品的情况.4)记录某公共汽车站某日上午某时刻的等车人数.5)

考察某地区12月份的平均气温.6)从一批灯泡中任取一只,测试其寿命.

同一试验,若试验目的不同,则对应的样本空间也不同.如:

对于同一试验:“将一枚硬币抛掷三次”.若观察正面H(Heads)、反面T(Tails)出现的情况,则样本空间为若观察出现正面的次数,则样本空间为注

试验不同,对应的样本空间也不同.3°建立样本空间,事实上就是建立随机现象的数学模型.因此,一个样本空间可以概括许多内容大不相同的实际问题.如:只包含两个样本点的样本空间,它既可以作为抛掷硬币出现正面

或出现反面的模型,也可以作为产品检验中合格与不合格的模型,又能用于排队现象中有人排队与无人排队的模型等.

所以在具体问题的研究中

,描述随机现象的第一步就是建立样本空间.四、随机事件(Event)事件:随机试验中某些结果所构成的集合,这些结果具有某一可观察的特征.随机事件:在试验中,可能发生,亦可能不发生的事件.必然事件:必然发生的事件,记为不可能事件:一定不会发生的事件,记为基本事件:恰含一个样本点的事件.Remark一般可将必然事件,不可能事件视为随机事件的极端情形,并统一简称为事件.2.事件A与B相等:记作A=B,表示A

ÌB并且BA.AB六、事件间的关系及运算

1.事件A包含B(B包含于A):表示事件B发生事件A必然发生,记作A

B

É(或B

AÌ)。例如:A(掷出奇数点)B(掷出一点)

解:1)显然,B发生必然导致A发生,所以BA;.

2)又因为A发生必然导致B发生,所以AB,由此得A=B.Example

口袋中有a个白球、b个黑球,从中一个一个不返回地取球。A=“取到最后一个是白球”,B=“取到最后是白球段”。问A

与B

的关系?A+BAB5.事件A与B的差事件:表示A发生而B不发生,记作A-B。A-BABBAProperty8.有限个或可数个事件的并与交9.完备事件组七、随机事件的运算律和的交换律:和的结合律:交的交换律:交的结合律:第一分配律:第二分配律:自反律:第一对偶律:第二对偶律:

记号概率论集合论

Ω

样本空间,必然事件空间

φ

不可能事件空集

样本点

元素

AB

A发生必然导致B发生A是B的子集

AB=φ

A与B互不相容A与B无相同元素

AB

A与B至少有一发生A与B的并集

AB

A与B同时发生

A与B的交集

AB

A发生且B不发生A与B的差集

A不发生、对立事件A的余集Example试用A、B、C表示下列事件:①A出现;②仅A出现;③恰有一个出现;④至少有一个出现;⑤至多有一个出现;⑥都不出现;⑦不都出现;⑧至少有两个出现;§1.2 随机事件的概率概率的直观定义

随机事件发生的可能性大小的度量(数值),称为事件发生的概率,记为拉普拉斯有一个信念:偶然现象有稳定的统计规律性一般人或许认为:生男生女的可能性是相等的,因而推测出男婴和女婴的出生数的比应当是1:1,可事实并非如此.1814年,法国数学家拉普拉斯(Laplace1794——1827)在他的新作《概率的哲学探讨》一书中,记载了一下有趣的统计.他根据伦敦,彼得堡,柏林和全法国的统计资料,得出了几乎完全一致的男婴和女婴出生数的比值是22:21,即在全体出生婴儿中,男婴占51.2%,女婴占48.8%.可奇怪的是,当他统计1745——1784整整四十年间巴黎男婴出生率时,却得到了另一个比是25:24,男婴占51.02%,与前者相差0.14%.

对于这千分之一点四的微小差异!拉普拉斯对此感到困惑不解,他深信自然规律,他觉得这千分之一点四的后面,一定有深刻的因素.于是,他深入进行调查研究,终于发现:当时巴黎人“重男轻女”,有抛弃女婴的陋俗,育婴堂嬷嬷捡去后又上报一次,以至于歪曲了出生率的真相,经过修正,巴黎的男女婴的出生比率依然是22:21.定义

一、概率及其频率解释

通常称与试验有关的所有事件的集合为事件域,记为

F.则为

F上关于的函数.二、从频率的性质看概率的性质

对任意的事件若 两两互不相容,有频率的核心性质实例

将一枚硬币抛掷5次、50次、500次,各做7遍,观察正面出现的次数及频率.试验序号12345672315124222521252418272512492562472512622580.40.60.21.00.20.40.80.440.500.420.480.360.540.5020.4980.5120.4940.5240.5160.500.502波动最小随n的增大,频率

f呈现出稳定性实验设计。仿真产生数据。林觉民,在“与妻诀别书”中,写不尽对爱妻的不舍。最后说“纸短情长,所未尽者尚有几万千,汝可以模拟得之。”纸上谈兵试验者抛掷次数n“正面向上”次数m“正面向上”频率m/n棣莫弗204810610.518布丰404020480.5069费勒1000049790.4979皮尔逊1200060190.5016皮尔逊24000120120.5005张老师100000随着抛掷次数的增加,“正面向上”的频率的变化趋势有何规律?仔细看一看从上述数据可得抛硬币次数n较小时,频率f

的随机波动幅(1)频率有随机波动性,即对于同样的n,所得的f不一定相同;度较大,但随n

的增大,频率f

呈现出稳定性.即当n

逐渐增大时频率f

总是在0.5

附近摆动,且逐渐稳定于0.5.掷骰子实验:把一个骰子抛掷多次,观察其出现的结果,并记录各结果出现的频数,然后计算各频率.一枚硬币引发的故事在掷硬币试验中,当较小时,比值 的波动较大,而当逐渐增大时,该值波动亦逐渐稳定于0.5.

若对一试验重复足够多次,我们可认为此试验的所有可能情形均已发生.那么,我们再做一次试验,只不过在重复曾经的试验而已,结果当然应该与那次被重复的试验的结果一致.于是,我们只要看看我们要考虑的事件与总试验次数的比值的稳定值,便可估计该事件发生的可能性大小.当然,此稳定值并非概率的本质,不应作为概率的定义.但正如上面所说,由于它揭示了隐藏于随机现象中的内在规律性,用于估计事件发生的可能性大小却是合理的.孩子们,明白了吗?不明白?好吧,理性点。大数定律告诉我们,当n→∞时,频率的极限是概率!概率的统计定义在相同条件下重复进行的n

次试验中,事件A

发生的频率稳定地在某一常数p附近摆动,

且随n越大摆动幅度越小,则称p为事件A

的概率,记作P(A).统计概率的特性优点:易于理解,生活中比比皆是缺点:大量重复试验的局限性只能得到近似值作为频率的稳定值,很自然地有:

对任意的事件若 两两互不相容,有概率的核心性质(2)显然成立;Proof(1)由于Ω是必然事件,每次试验均发生,则其频率恒等于1,自然p=1;1

概率的统计定义直观地描述了事件发生的可能性大小,反映了概率的本质内容。Remark2

与P(A)的区别而P(A)是一个确定的数!随机试验有关;是一个随机数,是变数,它与3

当试验次数n很大时,有4

概率统计定义的缺陷(1)不便于理论研究.需要作大量的试验,才能观察出的稳定值,即无法根据此定义计算某事件的概率.(2)在数学上不够严谨.毛泽东,《满江红·和郭沫若同志

》:一万年太久,只争朝夕。对于机率:不争一时而争千秋。观测次数够多后,机率的威力就显现。机率是千秋的事马克吐温(1907):Therearethreekindsoflies:lies,damnedlies,and

statistics.(有三种谎言:谎言,可恶的谎言,及统计)统计为何被当做谎言?张老师说:有数据说明,掷硬币时正面向上的概率为80%。张老师这么老实,肯定没有说谎。那么,谁说谎了哩?ExampleinPractice

(统计数字会撒谎,『美』达莱尔·哈夫)

使用多克斯牌牙膏将使蛀牙减少23%,结论出自一家信誉良好的“独立”实验室,并且还经过了注册会计师的证实。然而,如果你不是特别容易轻信他人或者盲目乐观,经验将告诉你:一种牙膏难以比其他牙膏好。那么多克斯公司是怎样制造了上述结论?这里的主要把戏是不充分的样本——统计角度的不充分,但对于多克斯公司来说已经足够了。只有当你读小字体的文字时才会发现:被测试的用户仅由12人组成。单凭这点,你便不得不佩服多克斯公司,而且它留给你一个可能知道全部情况的机会。有的广告商索性将类似的文字都略去,留给读者——即便他是一个老练的统计专家——一个猜想:这里面到底玩了什么把戏?

让规模不大的一组人连续记录六个月的蛀牙数,接着使用多克斯牙膏。之后一定会发生以下的其中一种结果:蛀牙明显增多,蛀牙明显减少或者蛀牙数量无显著变化。如果是第一或者第三种结果,多克斯公司编档保存好这些数字,当然最好是藏在别人找不到的地方,然后重新实验。由于机遇的作用,迟早有一组被测试者将证明有很好的效果,并且这个结果足以好到作为标题甚至引发一场广告战。不过,不管实验者使用的是多克斯牙膏还是发酵粉,或者还是继续使用原来的品牌,上述结果都会发生。任何由于机遇产生的差异,在大样本的使用中都是微不足道的,不足以作为广告标题。

多克斯公司是怎样轻易地获得一个不存在漏洞并经得起检验的结论?张老师患了重感冒,奄奄一息地来到医生面前。听到医生的话,你猜张老师有什么反应?“你的病很重,在十个得这种病的人中只有一个能救活.”当张老师被这个消息吓得够呛时,医生继续说:“但你是幸运的。因为你找到了我,我已经看过九个病人了,他们都死于此病.”

OR洗具医生在检查完的时候摇摇头:吓出一身冷汗,感冒好了~~~治疗10个病人,相当于做10次试验,每次试验的结果都是随机的,所以第10次治疗的结果也是随机的,张老师挂掉的概率依然是90%.

恭喜张老师死里逃生!继续上课!赫拉克利特:

人不能两次踏进同一条河流有的事件无法重复试验,称为一次性事件。如:张老师挂掉的可能性是90%,张老师肯定没有说谎,明天是否下雨,这个病人是否能治愈,新产品销路如何,火星上是否有生命,核弹爆炸的威力,…

主观概率定义:合理的信念的测度,是认识主体根据其所掌握的知识、信息和证据,而对某种情况出现可能性大小所做的数量判断。如:降水率,治愈率,洲际导弹命中率,明年国民经济增长率,…

主观概率 对于不可重复进行的实验,在符合概率的公理化定义的三个基本条件下所定义的概率。

主观概率的确定或是依赖于经验所形成的个人信念,或是依赖于对历史信息的提炼,概括和应用。主观概率的确定虽然带有很大的个人成分,但并不是完全的臆测,并且主观概率在一定的条件下,还可使用贝叶斯公式加以修正。主观概率至少是频率方法及古典方法的一种补充.有了主观概率,至少可以使人们在频率观点不适用时也能谈论概率,且能使用概率统计方法解决相应的实际问题。

主观概率的应用主要在于决策问题。在数据分析方面,贝叶斯概率起着重要的作用。它在20世纪得到发扬光大,被称为数理统计学中的贝叶斯学派。与频率学派(基于频率的概率,不允许有主观慨率的作用)间曾发生令人瞩目的争论(部分是主观概率合法性之争)。主观概率适用于对只出现一次而不能重复的事件进行概率描述,而频率的解释则适用于能大量重复的随机事件。批评:如果概率是人的主观信念的数量度量,那么概率论就很象心理学的一个分支,而对概率进行纯主观的解释最终将导致唯心论。辩解:客观上有很多只出现一次而又需要作出决策的事件,决策人通过主观概率把自己的以数据、分析和经验为依据的判断表示为数量形式,就可以利用概率的整套数学理论和工具得到结论,这些结论对决策往住非常有用。ExampleinPractice1999年1月14日的《科学时报》对“神农架是否存在野人”问题的讨论做了报道。这当然是一个一次性事件,因为普天下并无第二个神农架。从报道上看,学者们的意见基本一致,即可能性很小。但仍有不同:有的学者认为完全不可能,即把“神农架存在野人”这个事件的概率判为0,另一位学者将其判为0.05,还有的学者只判断“很小”但未给出数值。这就是各学者对这事件发生所判的主观概率。

三、概率的公理化定义1933年,苏联数学家柯尔莫哥洛夫(1903-1987)提出了概率论的公理化结构,给出了概率的严格定义,使概率论有了迅速的发展.(A.H.Колмогоров1903-1987)

1939年任苏联科学院院士.先后当选美,法,意,荷,英,德等国的外籍院士及皇家学会会员.为20

世纪最有影响的苏联数学家.苏联数学家柯尔莫哥洛夫设为样本空间,F

为上的事件域,称

F上的实值函数为上的一个概率测度,若它满足:公理一: (规范性)公理二:对任意的事件 (非负性)公理三:若 两两互不相容,有

(可列可加性)其中,对任意给定的具体事件 称为事件的概率.一个具有概率测度的样本空间称为一个概率空间,记为 F

简记为

证明由公理3知所以四、概率测度的其他性质不可能事件的概率为零

1.最小性注意事项但反过来,如果P(A)=0,未必有A=Φ

例如:

随机在闭区间[0,5]取值,在某次试验中,取到的数字为2.我们知道,在这类试验中,刚好取到2的概率为0,但它却真实发生了,并非不可能事件.设A1,A2,…,An两两互不相容,则证明

在公理3中,取Ai=(i=n+1,n+2,…).2.有限可加性证明由于A与其对立事件互不相容,由有限可加性有

所以

3.逆事件的概率若AB,则P(B-A)=P(B)-P(A)

P(B-A)=P(B)-P(A)4.差事件的概率推论1(单调性)推论2(性质5:有界性)推论3(减法公式)对任意两个随机事件A、B,有

6.加法定理又由减法公式,得因此得BCA

加法定理的推广例1:如果某种彩票的中奖概率为

,那么买1000张这种彩票一定能中奖吗?为什么?不一定.买1000张这种彩票的中奖概率约为1-0.9991000≈0.632,即有63.2%的可能性中奖,但不能肯定中奖.97321456810解法1例2解法2ExampleTheWallStreetJournal,2004.4.10,

公布了30家最大的股票和对冲基金的1年期收益率和5年期收益率,截止日期为2000.3.31.假定1年期收益率超过50%,或5年期收益率超过300%称为高收益.有9项基金1年期收益率超过50%,7项基金5年期收益率超过300%,其中5项基金1年期收益率超过50%且5年期收益率超过300%.现在我们随机选择一个基金,问选到的基金1年期和5年期收益率均非高收益的概率是多少?若随机试验E具有下列两个特征:1)有限性

样本空间中,只有有限个样本点:2)等可能性

则称E所描述的概率模型为古典概型.古典概型随机试验一、古典概型定义§1.3 古典概型与几何概型古典概型中事件概率的计算公式A为E的任意一个事件,且包含m个样本点,则事件A出现的概率为:

设试验E的样本空间由n个样本点构成,

例1将骰子先后抛掷2次,计算:(1)一共有多少种不同的结果?(2)其中向上的数之和是5的结果有多少种?(3)向上的数之和是5的概率是多少?问题1

设箱中有只白球和

β只黑球,现从袋中(1)无放回地摸球基本事件总数为:A所包含基本事件的个数为解设A={所取球恰好含a个白球,b个黑球}无放回地依次摸出a+b只球,求所取球恰好含a个白球,b个黑球的概率(a,bβ)?古典概型的问题一般可转化为摸球模型有一个黑壶,一个白壶.黑壶中有5个红球,6个绿球;白壶中有3个红球,4个绿球.你可以先选择一个壶,然后从这个壶中随机抽取一球.假如你抽到红球的话,你将会获得奖励.你愿意选择哪个壶进行抽球哩?选择黑壶的话,抽中红球的概率是5/11=0.455;选择白壶的话,抽中红球的概率是3/7=0.429.应选择黑壶.Example再考虑另外的一个黑壶和一个白壶.这个黑壶中有6个红球,3个绿球;白壶中有9个红球,5个绿球.现在打算选择哪个壶来抽球哩?选择黑壶的话,抽中红球的概率是6/9=0.667;选择白壶的话,抽中红球的概率是9/14=0.643.还是应该选择黑壶.最后,我们把第二次试验中黑壶的球倒入第一次试验中的黑壶,把第二次试验中白壶的球倒入第一次试验中的白壶.同样地你可以先选择一个壶来抽取红球,你愿意选择哪个壶?直观告诉我们,选择黑壶.我们还是算一算来验证吧.黑壶中有11个红球,9个绿球,抽到红球的概率是11/20=0.55.白壶中有12个红球,9个绿球,抽到红球的概率是12/21=0.571.应当选择白壶,与我们的直觉完全相反.辛普森悖论(Simpson’sparadox).量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏.念天地之悠悠,独怆然而涕下。如果我们在人生的抉择上选择了一条比较难走的路,就更有可能不被赏识。迎合普世价值,让我们成为全才,同时也陷入“怀才不遇”困境。独特的人生更精彩!陈子昂,《登幽州台歌》:(2)有放回地摸球例2

设袋中有4只红球和6只黑球,现从袋中有放回地解第1次摸球10种第2次摸球10种6种第1次摸到黑球6种第2次摸到黑球4种第3次摸到红球基本事件总数为摸球3次,求前2次摸到黑球、第3次摸到红球的概率.第3次摸球10种基本事件总数为A所包含基本事件的个数为Example3请问:在个人中,至少有一对生日相同的概率有多大?(假定一年365天)本问题可摸球化为:黑箱中有365个球,随机有放回地取次,问必有重复取球的概率有多大?

世界杯正在举行,5个球迷好不容易才搞到一张入场券.大家都想去,只好用抽签的方法来解决.入场券5张同样的卡片,只有一张上写有“入场券”,其余的什么也没写.将它们放在一起,洗匀,让5个人依次抽取.后抽比先抽的确实吃亏吗?

“先抽的人当然要比后抽的人抽到的机会大.”

到底谁说的对呢?让我们用概率论的知识来计算一下,每个人抽到“入场券”的概率到底有多大?“大家不必争先恐后,你们一个一个按次序来,谁抽到‘入场券’的机会都一样大.”“先抽的人当然要比后抽的人抽到的机会大。”抽签不必争先恐后.二、几何概型定义若试验E具有下列特征:1)无限性:E的样本空间是某几何空间中的2)等可能性:每个样本点的出现是等可能的,则称E所描述的概率模型为几何概型,并称E为几何概型随机试验.一个区域,其包含无穷多个样本点,每个样本点由区域内的点的随机位置所确定.即样本点落在内几何度量相同的子区域是等可能的,例如,考虑平面区域其面积记为 在中等可能任意投点.“等可能”的确切含义是:点落于中任意子区域的概率与区域的面积成正比.即:若仍以表示“点落于中”,则存在常数使再利用有注1几何空间一维二维三维…几何度量长度面积体积…

对于随机试验E,以m(A)表示事件A的几何度量,为样本空间.若0<m()<+,则对于任一事件A,其概率为2

那末

两人会面的充要条件为连.求甲、乙两人能会面的概率.解甲、乙两人相约在0到T

这段时间内,在预定地点会面.先到的人等候另一个人,经过时间t(t<T)后离去.设每人在0到T这段时间内各时刻到达该地是等可能的,且两人到达的时刻互不牵例1.18(会面问题)故所求的概率为若以x,y

表示平面上点的坐标,则有浦丰问题相交的概率.alMx解

设M表示针落下后,针的中心,x表示M与最近一平行线的距离,表示针与这平行线的夹角,则样本空间:l/21777年,法国科学家蒲丰(Buffon)提出了投针试验问题.平面上画有等距离a(a>0)的一些平行线,向平面任意投一长为l(l<a)的针,试求针与平行线针与一平行线相交设A=“针与一平行线相交”,则0xa/2A蒲丰投针试验的应用及意义根据频率的稳定性,当投针试验次数n很大时,算出针与平行直线相交的次数m,则频率值即可作为P(A)的近似值代入上式,那么上述方法被称为MonteCarlo方法.由于现今可通过计算机模拟大量重复试验,此法如今应用广泛.历史上一些学者的计算结果(直线距离a=1)3.179585925200.54191925Reina3.1415929180834080.831901Lazzerini3.159548910300.751884Fox3.1373826001.01860DeMorgan3.1554121832040.61855Smith3.1596253250000.81850Wolf相交次数投掷次数针长时间试验者萨特,法国思想家、作家, 存在主义哲学的大师:

“Hellisotherpeople”

他人即地狱对“我”来说,其他的人就像一个贼,要将“我”的世界偷去,将我纳入他们的轨道中,成为一个“在己存有”(being-in-itself),成为一个对象或东西。§1.4 条件概率WhatshouldIdo?ShouldIbewhoyouwantmetobe?Justdoit!

在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.1.条件概率的概念如在事件B发生的条件下求事件A发生的概率,将此概率记作P(A|B).

一般地P(A|B)≠P(A)

P(A)=1/6,例如,掷一颗均匀骰子,A={掷出2点},

B={掷出偶数点},P(A|B)=?掷骰子

已知事件B发生,此时试验所有可能结果构成的集合就是B,

P(A|B)=1/3.B中共有3个元素,它们的出现是等可能的,其中只有1个在集A中.容易看到P(A|B)于是P(A)=3/10,

又如,10件产品中有7件正品,3件次品,7件正品中有3件一等品,4件二等品.现从这10件中任取一件,记

B={取到正品}A={取到一等品},P(A|B)则P(A)=3/10,

B={取到正品}P(A|B)=3/7

本例中,计算P(A)时,依据的前提条件是10件产品中一等品的比例.A={取到一等品},

计算P(A|B)时,这个前提条件未变,只是加上“事件B已发生”这个新的条件.

这好象给了我们一个“情报”,使我们得以在某个缩小了的范围内来考虑问题.条件概率的直观定义

某个事件发生的可能性大小经常会受到另一相关事件发生与否的影响.若在事件已发生的条件下,事件发生的概率为则称为在已知发生的条件下,发生的条件概率,记为Example考虑美国东部某大城市警察局男性与女性警官的升职情况.警察局有1200名警官,男性960人,女性240人.在过去两年中有324名警官得到提升,男性288人,女性36人.在浏览了升职记录后,一个由女性警官组成的委员会指出在升职过程中存在性别歧视.其依据是升职人数男性与女性比为288:36;而警察局官员否认歧视,认为男性升职多只是因为警官中男性本来就比女性多很多.经过计算,男性警官升职概率为0.30,女性警官升职概率为0.15.条件概率的使用本身不能表明歧视的存在,但条件概率的数值则成为女警官们指控的有力证据!稍后,我们还可以利用独立性分析,断言升职过程中,升职与否绝对与性别有关!1.在古典概型中,讨论 时,样本空间已缩小为“包含的所有事件”,故2.同样,在几何概型中

若事件B已发生,则为使A也发生,试验结果必须是既在B中又在A中的样本点,即此点必属于AB.由于我们已经知道B已发生,故B变成了新的样本空间,于是有(1).设A、B是两个事件,且P(B)>0,则称

(1)定义1.3为在事件B发生的条件下,事件A的条件概率.Samplespace

ReducedsamplespacegiveneventB条件概率

P(A|B)的样本空间条件概率的性质譬如

2)从加入条件后改变了的情况去算条件概率的计算1)用定义计算:P(B)>0

掷骰子例:A={掷出2

点},

B={掷出偶数点}P(A|B)=B发生后的缩减样本空间所含样本点总数在缩减样本空间中A所含样本点个数例

甲、乙两厂共同生产1000个零件,其中300件是乙厂生产的.而在这300个零件中,有189个是标准件,现从这1000个零件中任取一个,问这个零件是乙厂生产的标准件的概率是多少?所求为P(AB).甲、乙共生产1000个189个是标准件300个乙厂生产300个乙厂生产设B={零件是乙厂生产},A={是标准件}所求为P(AB).设B={零件是乙厂生产}A={是标准件}若改为“发现它是乙厂生产的,问它是标准件的概率是多少?”求的是P(A|B).B发生,在P(AB)中作为结果;在P(A|B)中作为条件.甲、乙共生产1000个189个是标准件300个乙厂生产例

人寿保险公司常常需要知道存活到某一个年龄段的人在下一年仍然存活的概率。根据统计资料可知,某城市的人由出生活到50岁的概率为0.90718,存活到51岁的概率为0.90135。问现在已经50岁的人,能够活到51岁的概率是多少?

解记因此要求显然因为从而

可知该城市的人在50岁到51岁之间死亡的概率约为0.00643。在平均意义下,该年龄段中每千个人中间约有6.43人死亡。由条件概率的定义:即若P(B)>0,则P(AB)=P(B)P(A|B)(2)而P(AB)=P(BA)三、乘法公式若已知P(B),P(A|B)时,可以反求P(AB).将A、B的位置对调,有故P(A)>0,则P(AB)=P(A)P(B|A)(3)若

P(A)>0,则P(BA)=P(A)P(B|A)(2)和(3)式都称为乘法公式,利用它们可计算两个事件同时发生的概率乘法公式应用举例

一个罐子中包含b个白球和r个红球.随机地抽取一个球,观看颜色后放回罐中,并且再加进c个与所抽出的球具有相同颜色的球.这种手续进行四次,试求第一、二次取到白球且第三、四次取到红球的概率.(波里亚罐子模型)b个白球,r个红球于是W1W2R3R4表示事件“连续取四个球,第一、第二个是白球,第三、四个是红球.

b个白球,r个红球

随机取一个球,观看颜色后放回罐中,并且再加进c个与所抽出的球具有相同颜色的球.

解设Wi={第i次取出是白球},i=1,2,3,4Rj={第j次取出是红球},j=1,2,3,4用乘法公式容易求出

当c>0时,由于每次取出球后会增加下一次也取到同色球的概率.这是一个传染病模型.每次发现一个传染病患者,都会增加再传染的概率.=P(W1)P(W2|W1)P(R3|W1W2)P(R4|W1W2R3)P(W1W2R3R4)Recall样本空间的划分全概率公式与贝叶斯公式图示证明化整为零各个击破

某一事件B的发生有各种可能的原因

,如果B是由原因Ai(i=1,2,…,n)所引起,则B发生的概率是

每一原因都可能导致B发生,故B发生的概率是各原因引起B发生概率的总和,即全概率公式.P(BAi)=P(Ai)P(B|Ai)全概率公式.我们还可以从另一个角度去理解

由此可以形象地把全概率公式看成为“由原因推结果”,每个原因对结果的发生有一定的“作用”,即结果发生的可能性与各种原因的“作用”大小有关.全概率公式表达了它们之间的关系.诸Ai是原因B是结果例有一批同一型号的产品,已知其中由一厂生产的占30%,二厂生产的占50%,三厂生产的占20%,又知这三个厂的产品次品率分别为2%,1%,1%,问从这批产品中任取一件是次品的概率是多少?设事件A为“任取一件为次品”,解由全概率公式得30%20%50%2%1%1%称此为贝叶斯公式.

3.贝叶斯公式贝叶斯资料证明[证毕]贝叶斯公式在实际中有很多应用.

它可以帮助人们确定某结果(事件B)发生的最可能原因.全概率公式贝叶斯公式若干原因结果

如果把随机事件B

看成是结果,随机事件组A1,…,An

看成可能导致结果B

发生的若干原因,

贝叶斯公式在决策理论中有重要应用:不断地根据新得到的信息来修正原来的观点。

某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?则表示“抽查的人不患癌症”.已知

P(C)=0.005,P()=0.995,

P(A|C)=0.95,P(A|)=0.04求解如下:设C={抽查的人患有癌症},

A={试验结果是阳性},求P(C|A).现在来分析一下结果的意义.由贝叶斯公式,可得代入数据计算得P(C|A)=0.10662.检出阳性是否一定患有癌症?

1.这种试验对于诊断一个人是否患有癌症有无意义?

如果不做试验,抽查一人,他是患者的概率患者阳性反应的概率是0.95,若试验后得阳性反应则根据试验得来的信息,此人是患者的概率为从0.005增加到0.1066,将近增加约21倍.1.这种试验对于诊断一个人是否患有癌症有意义.P(C|A)=0.1066

P(C)=0.005

试验结果为阳性,此人确患癌症的概率为

P(C|A)=0.1066

2.即使你检出阳性,尚可不必过早下结论你有癌症,这种可能性只有10.66%(平均来说,1000个人中大约只有107人确患癌症),此时医生常要通过再试验来确认.

P(Ai)(i=1,2,…,n)是在没有进一步信息(不知道事件B是否发生)的情况下,人们对诸事件发生可能性大小的认识.当有了新的信息(知道B发生),人们对诸事件发生可能性大小P(Ai|B)有了新的估计.贝叶斯公式从数量上刻划了这种变化

在贝叶斯公式中,P(Ai)和P(Ai|B)分别称为原因的先验概率和后验概率.Example甲、乙、丙三囚犯,国王宣布以抽签决定释放一位,处决另两位。他告诉狱卒那一位将被释放,但要求狱卒不可先透露。甲请狱卒透露那一位被释放遭拒后,改问狱卒:乙及丙中,那一位会被处决?狱卒经一番思考,遂(诚实地)告诉甲:乙会遭处决。他认为这样做并未违反国王规定:乙、丙二人,至少有一会遭处决,这是大家都知道的,因此他并未提供甲任何有关甲会被释放的有用信息。甲听到狱卒说乙会被处决后很高兴。原先他有1/3的机率遭释放,现在因只剩他与丙了,所以机率提高至1/2。狱卒与甲的分析,何者正确?解.令A,B,C分别表甲、乙、丙三人会被释放的事件。K表狱卒说乙会被处决的事件。样本空间Ω=A∪B∪C。由假设P(A)=P(B)=P(C)=1/3。想求P(A|K)。若丙偷听到狱卒与甲的对话,则知他会被释放的机率提高至2/3。若乙偷听到狱卒与甲的对话,则知他没有活命机会。乙、丙二人中,有一人被释放之机率为2/3,若给定乙被处决,则丙便独自拥有全部被释放之机率2/3。狱卒所提供的信息是否无用?至于甲,被释放之机率不会改变,还是1/3。而三人被释放之条件机率和:P(A|K)+P(B|K)+P(C|K)=1/3+0+2/3=1。此例有时候以不同的型式出现,如汽车与山羊问题(Car-GoatProblem)。在电影斗智21点(21)中曾出现。三羊问题《斗智21点》的一个场景:参加一个游戏,有三扇门。一门后有一辆车,另两门后有羊,主持人让你随意挑。当你选择了一扇门后,主持人随后打开了其余两扇门中一扇有羊的门。此时问你是否换到剩下的一扇门?是否换?为什么?概率多少?主人公选择:换!选择正确!换的话得到车的概率是2/3.2008年美国总统大选

9月4日,美国共和党的全国代表大会上,阿拉斯加州长佩林(SarahPalin),被提名为共和党的副总统候选人。原先共和党总统候选人麦凯恩(JohnMcCain)的民意支持度,落后民主党的总统候选人奥巴马(BarackObama)。提名佩林后,麦凯恩人气迅速窜升,声势立涨,在几份民调中,均胜过奥巴马。维吉尼亚大学政治学者萨巴托(LarrySabato),根据1960年以来的分析,指出全代会后民调结果与大选结果相符者,只有一半:跟丢铜板预测差不多Youcouldflipacoinandbeaboutaspredictive.对共和党而言,是否全代会后随即做的民调,不论领先或落后,于当年11月的总统大选,其提名人当选或落选之机率相同?民调无用?只需丢铜板?依萨巴托的分析,设

P(当选|领先)=P(落选|领先)=1/2,(*)其中

领先表两党已决定正副总统候选人后,对两组候选人所立即做的民调,共和党领先;当选表在当年总统大选时,共和党获胜。P(当选|落后)=P(落选|落后)?(**)若成立,则全代会后的民调领先或落后,共和党便可不必在意。甚至此民调根本就是多余的。令P(当选|落后)=a,⇒P(落选|落后)=1-a。由(*)并无法决定a。再令

P(当选)=r,P(领先)=s。

⇒P(当选)=P(当选|领先)P(领先)+P(当选|落后)P(落后)。r=s=1/2⇒

a=1/2⇒

(**)成立。r=0.48,s=0.5⇒

a=0.46<1/2;r=0.52,s=0.6⇒

a=0.55>1/2。a值乃与r及s有关!Example小汽车油耗小,但不如大汽车安全.小汽车事故中死亡率为0.128,大汽车事故中死亡率为0.05.某城市小汽车的市场占有率为18%.1.请问该市事故中的死亡率是多少?(假定事故发生与车型无关)2.若某次事故中有死亡发生,请问该事故由小汽车引起的概率是多少?每周一题3 17世纪,法国的ChevaliesDeMere注意到在赌博中一对骰子抛25次,把赌注押到“至少出现一次双六”比把赌注押到“完全不出现双六”有利.但他本人找不出原因.后来请当时著名的法国数学家帕斯卡(Pascal)才解决了这一问题.

这问题是如何解决的呢?QuestionThomasBayesBorn:1702inLondon,England

Died:17April1761inTunbridgeWells,Kent,England概率论理论创立人,如果你使用过Google,你就已经从贝叶斯的理论中收益了。

搜索巨人Google和Autonomy(一家出售信息恢复工具的公司),都使用了Bayesianprinciples为数据搜索提供近似的.研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系,开发能够根据数据和经验来决定行动的人工智能设备,创建个人机器人.值得一提的是,后来的学者还依据贝叶斯公式的思想发展了一整套统计推断方法,叫作“贝叶斯统计”.可见贝叶斯公式的影响.ThomasBayes,一位伟大的数学大师,1702年出生于伦敦,后来成为了一名Presbyterianminister.和他的同事们不同:他认为上帝的存在可以通过方程式证明,虽然他看到了自己的两篇论文被发表了,但是《EssayTowardSolvingaProblemintheDoctrineofChances》却一直到他死后的第三年(1764年)才被发表.他的理论很有效,照亮了今天的计算领域,研究者正在把对这种思想的应用从基因研究推广到filleringemail的研究.

显然P(A|B)=P(A)这就是说,已知事件B发生,并不影响事件A发生的概率,这时称事件A、B独立.§1.5 事件的独立性A={第二次掷出6点},B={第一次掷出6点},先看一个例子:将一颗均匀骰子连掷两次,设

由乘法公式知,当事件A、B独立时,有

P(AB)=P(A)P(B)

用P(AB)=P(A)P(B)刻划独立性,比用

P(A|B)=P(A)或

P(B|A)=P(B)更好,它不受P(B)>0或P(A)>0的制约.若两事件A、B满足

P(AB)=P(A)P(B)

(1)则称A、B相互独立,简称A、B独立.两事件独立的定义例1

从一副不含大小王的扑克牌中任取一张,记A={抽到K},B={抽到的牌是黑色的}可见,P(AB)=P(A)P(B)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论