




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论基础谨以此献给我所有可爱的,才华横溢的学生!关彦辉G_yanhui@163.com
在第二次世界大战中,美国曾经宣布:一名优秀数学家的作用超过10个师的兵力。这句话有一个非同寻常的来历。
1943年以前,在大西洋上英美运输船队常常受到德国潜艇的袭击,当时,英美两国限于实力,无力增派更多的护航舰。一时间,德军的“潜艇战”搞得盟军焦头烂额。为此,有位美国海军将领专门去请教了一位数学家,数学家们运用概率论分析后认为:舰队与敌潜艇相遇是一个随机事件,从数学角度来看这一问题,它具有一定的规律性。一定数量的船(为100艘)编队规模越小,编次就越多(为每次20艘,就要有5个编次)。编次越多,与敌人相遇的概率就越大。美国海军接受了数学家的建议,命令舰队在指定海域集合,再集体通过危险海域,然后各自驶向预定港口。结果奇迹出现了:盟军舰队遭袭被击沉的概率由原来的25%降为1%,大大减少了损失,保证了物资的及时供应.1名数学家=10个师回顾引入概率论的历史概率(Probability),亦称为赌博法,机遇论,猜测艺术等,它的思想可追溯自公元前220年以前的中国的一些文献.不过真正的历史却只有三百来年而已.如今,但凡要进行信息处理,决策制定,实验设计等等,只要涉及数据,必用概率统计的模型和方法.例如,在经济,管理,工程,技术,物理,化学,生物,环境,天文,地理,卫生,教育,语言,国防等领域有非常重要的应用.
这一天,法国一位贵族、职业赌徒梅累(DeMere)向法国数学家、物理学家帕斯卡(Pascal)提出了一个十分有趣的“分赌注”问题.问题是这样的,一次梅累和赌友掷硬币,各押赌注32个金币.双方约定先胜三局者为胜,取得全部64个金币.
赌博进行了一段时间,梅累已经赢了两局,赌友已经赢了一局.这时候梅累接到通知,要他马上陪同国王接见外宾,赌博只好中断了.请问:两个人应该怎样分这64个金币才算合理呢?概率论的生日:1654年7月29日帕斯卡是17世纪有名的“神童”数学家。可是,梅累提出的“分赌注”的问题,却把他难住了.他苦苦思考了两三年,到1654年才算有了点眉目,于是写信给他的好友费马,两人讨论结果,取得了一致的意见:梅累的分法是对的,他应得64个金币的四分之三,赌友应得64金币的四分之一。这时有位荷兰的数学家惠更斯在巴黎听到这件新闻,也参加了他们的讨论.结果他们这样回答了梅累的问题;“先做一个树结构图,根据树结构图A胜的概率是3/4时,就把赌钱的3/4分给A,把剩下的1/4分给B就可以了.”于是,概率的计算就这样产生了.
在他们三人提出的解法中,首先都涉及了数学期望(mathematicalexpectation)这一概念,并由此奠定了古典概率论的基础.
讨论结果,惠更斯把它写成一本书叫做《论赌博中的计算》(1657年),这就是概率论最早的一部著作.
概率论现在已经成了数学的一个重要分支,在科学技术各领域里有着十分广泛的应用.古典概率时期工具:排列组合主要工作:PascalFermatHuygensBernoulliJamesDeMoivreAbrahamBernoulliDaniel等等.《论赌博中的计算》,1657,(DeRatiociniisinLudoAleae)《猜测的艺术》,1713,ArsConjectandi,详尽论述排列组合理论,提出了概率论在民间,道德,经济上的应用.《论赌博法》,1711,《机遇说》,1722,
Laplace以前关于概率论的最大贡献.《赌博法新论》,1730,
《关于猜测的新问题的分析研究》,1759,将概率论推广于人寿保险,健康统计上.分析概率时期工具:微积分等现代数学主要工作:DeMoivreAbrahamLaplaceTheDoctrineofChances,1733,由二项式公式推出正态分布曲线《概率分析理论》,1812,ThéorieAnalytiquedesProbabilités
,标志进入分析概率时期的伟大著作.等等.Kolmogorov(1903–1987)《概率论的基本概念》,1933,给出了概率论的公理化定义,标志概率论进入现代数学范畴.一、随机现象§1. 随机现象与统计规律性第一章 事件与概率概率论研究的对象是什么?现象确定现象随机现象概率论研究什么问题?RPWT它的原意是指刮风、 下雨、阴天、晴天 这些天气状况很难 预料,后来它被引 申为:世界上很多 事情具有偶然性, 人们不能事先判定这些事情是否会发生。
降水概率90%“天有不测风云”人们果真对这类偶然事件完全无法把握、束手无策吗?随着对事件发生的可能性的深入研究,人们发现许多偶然事件的发生也具有规律可循的。概率这个重要的数字概念,正是在研究这些规律中产生的。人们用它描叙事件发生的可能性的大小。例如,天气预报说明天的降水概率为90%,就意味着明天有很大可能下雨(雪)。降水概率90%试分析:“从一堆牌中任意抽一张抽到红牌”这一事件的发生情况?可能发生,也可能不发生必然发生必然不会发生
木柴燃烧,产生热量明天,地球还会转动问题情境在00C下,这些雪融化实心铁块丢入水中,铁块浮起煮熟的鸭子,跑了水从高处流向低处太阳从西边升起
在一定条件下,事先就能断定发生或不发生某种结果,这种现象就是决定性现象.“函数在间断点处不存在导数”等.决定性现象的特征
条件完全决定结果.研究的数学工具:代数,微积分,微分方程等等.转盘转动后,指针指向黄色区域
在一定条件下,某种现象可能发生也可能不发生,事先不能断定出现哪种结果,这种现象就是随机现象.这两人各买1张彩票,她们中奖了实例1
“在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况”.结果有可能出现正面也可能出现反面.结果有可能为:“1”,“2”,“3”,“4”,“5”或“6”.实例3
“抛掷一枚骰子,观察出现的点数”.实例2
“在相同条件下生产同一种零件,观察它们的尺寸”.结果:“它们的尺寸总会有一点差异
”.实例4
“从一批含有正品和次品的产品中任意抽取一个产品”.其结果可能为:
正品、次品实例5
“过马路交叉口时,可能遇上各种颜色的交通指挥灯”.实例6
“一只灯泡的寿命”可长可短.
个别随机现象:原则上不能在相同条件下重复出现(例6).随机现象的特征条件不能完全决定结果.随机现象的分类
大量性随机现象:在相同条件下可以重复出现(例1-5).某些物理学家,说不定认为对投掷铜板,由给定投掷的速度、角度、地面的弹性、铜板的形状及重量等条件,可算出铜板落地后,会那一面朝上,因此这不是随机。至于六合彩的开奖,只要起始条件都能测出,则会开出那一号球,也能算出,因此这也不是随机。但你大约也知道所谓蝴蝶效应(butterflyeffect)。测量极可能有误差,而有时一些微小的改变,影响却可能很大。因此我们宁可相信这些都是随机现象。某些神学家,可能认为一切其实都是按照神的旨意在进行,只是我们不知而已。说不定真是如此。但若无从了解神的旨意,对于未来,也只好视为随机。随着科技进步,人们逐渐弄明白很多现象的来龙去脉。例如,我们知道女性一旦怀孕,婴儿性别便已确定。但对一大腹便便的妇女,好事者由于不知,仍可猜测其生男生女之机率。考试前夕,学生们虽认真准备,但还是绞尽脑汁猜题,各有其认为考出机率很大的题目。老师获知后,觉得好笑。实则试题早已印妥,而学生不知考题,且未体会老师的暗示及明示,所以仍可以大猜一通。另外,诸如门外有人敲门,你好奇是男是女?老师要你猜拿在背后的水果,是橘子或苹果?同学盖住落地的铜板,要你猜正面或反面朝上?这类明明已确定的事,本身其实并不随机,只是对你而言,却有如“子非鱼”,当然可猜鱼快乐的机率。2°随机现象从表面上看,似乎杂乱无章,没有规律.但实践证明,如果同类的随机现象大量重复出现,它的总体就呈现出一定的规律性.1°随机现象揭示了条件和结果之间的非确定性联系
,其数量关系无法用函数加以描述.
这种规律性随着我们观察的次数的增多而愈加明显.这种由大量同类随机现象所呈现出来的集体规律性叫做统计规律性.概率论和数理统计就是研究这种统计规律性的数学学科.随机现象的统计规律性拉普拉斯有一个信念:偶然现象有稳定的统计规律性一般人或许认为:生男生女的可能性是相等的,因而推测出男婴和女婴的出生数的比应当是1:1,可事实并非如此.1814年,法国数学家拉普拉斯(Laplace1794——1827)在他的新作《概率的哲学探讨》一书中,记载了一下有趣的统计.他根据伦敦,彼得堡,柏林和全法国的统计资料,得出了几乎完全一致的男婴和女婴出生数的比值是22:21,即在全体出生婴儿中,男婴占51.2%,女婴占48.8%.可奇怪的是,当他统计1745——1784整整四十年间巴黎男婴出生率时,却得到了另一个比是25:24,男婴占51.02%,与前者相差0.14%.
对于这千分之一点四的微小差异!拉普拉斯对此感到困惑不解,他深信自然规律,他觉得这千分之一点四的后面,一定有深刻的因素.于是,他深入进行调查研究,终于发现:当时巴黎人“重男轻女”,有抛弃女婴的陋俗,育婴堂嬷嬷捡去后又上报一次,以至于歪曲了出生率的真相,经过修正,巴黎的男女婴的出生比率依然是22:21.必然性使人们愿意事先好好准备。随机性使人们对未来,充满着盼望与戒慎恐惧。光有必然性,亳无变异,对未来缺乏盼望,人们将少了努力的动机。光有随机性,只靠运气,将令人失去积极认真的企图心。机遇在爱情与工作上扮演着极其重要的角色。我们在人生中其实不是按明确路线前进的汽车司机,而更像是弹珠游戏里到处碰运气的珠子。以开放的心态面对生活中的岔道口,能看到别人错过的机会。即使事与愿违,也能很快摆脱失望,走向下一个幸运之地。如是更加快乐,更容易达成心愿。
“有时候,人生会拿砖块砸你的头,但不要因此丧失你的信心。我相信,唯一支撑我不断走下去的是, 我热爱我所做的事。”三分天注定,五分靠打拼,两分靠运气。由于变异无可避免的存在,要了解变异,设法减少变异。虽世事多变,但万物有常,存在随机法则。看似没有规律,其实被大数法则规范。二、频率的稳定性频率的定义描述一个随机事件发生的频繁程度在相同的条件下进行了
n次重复试验,记
nA
是
A发生的次数(又称频数);则定义随机事件
A发生的频率为实例
将一枚硬币抛掷5次、50次、500次,各做7遍,观察正面出现的次数及频率.试验序号1234567231512422252125241827251249256247251262251.00.440.500.420.480.360.540.5020.4980.5120.4940.5240.5160.500.502波动最小随n的增大,频率
f呈现出稳定性实验设计。仿真产生数据。林觉民,在“与妻诀别书”中,写不尽对爱妻的不舍。最后说“纸短情长,所未尽者尚有几万千,汝可以模拟得之。”纸上谈兵试验者抛掷次数n“正面向上”次数m“正面向上”频率m/n棣莫弗204810610.518布丰404020480.5069费勒1000049790.4979皮尔逊1200060190.5016皮尔逊24000120120.5005关老师100000随着抛掷次数的增加,“正面向上”的频率的变化趋势有何规律?仔细看一看从上述数据可得抛硬币次数n较小时,频率f
的随机波动幅(1)频率有随机波动性,即对于同样的n,所得的f不一定相同;度较大,但随n
的增大,频率f
呈现出稳定性.即当n
逐渐增大时频率f
总是在0.5
附近摆动,且逐渐稳定于0.5.掷骰子实验:把一个骰子抛掷多次,观察其出现的结果,并记录各结果出现的频数,然后计算各频率.高尔顿板
Galton_Boxsimulator概率的频率定义
自然地,可以采用一个随机事件的频率的稳定值去描述它在一次试验中发生的可能性大小,即用频率的极限来作为概率的定义.随机事件
A发生的可能性大小的度量(数值),称为事件
A发生的概率,记为
P(A).概率(Probability)的直观定义概率的统计定义在相同条件下重复进行的n
次试验中,事件A
发生的频率稳定地在某一常数p附近摆动,
且随n越大摆动幅度越小,则称p为事件A
的概率,记作P(A).统计概率的特性优点:易于理解,生活中比比皆是缺点:大量重复试验的局限性只能得到近似值频率的性质(1)(非负性)(2)(规范性)Fn(A)≥
0
;Fn()=1;(3)(可加性)如果
A,B
是两个不会同时发生的随机事件,以
A+B表示
A或
B至少出现其一这个事件,则
Fn(A+B)=Fn(A)+Fn(B).三、频率与概率1
概率的统计定义直观地描述了事件发生的可能性大小,反映了概率的本质内容。Remark2
与P(A)的区别而P(A)是一个确定的数!随机试验有关;是一个随机数,是变数,它与3
当试验次数n很大时,有4
概率统计定义的缺陷(1)不便于理论研究.需要作大量的试验,才能观察出的稳定值,即无法根据此定义计算某事件的概率.(2)在数学上不够严谨.毛泽东,《满江红·和郭沫若同志
》:一万年太久,只争朝夕。对于机率:不争一时而争千秋。观测次数够多后,机率的威力就显现。机率是千秋的事马克吐温(1907):Therearethreekindsoflies:lies,damnedlies,and
statistics.(有三种谎言:谎言,可恶的谎言,及统计)统计为何被当做谎言?关老师说:有数据说明,掷硬币时正面向上的概率为80%。关老师这么老实,肯定没有说谎。那么,谁说谎了哩?ExampleinPractice
(统计数字会撒谎,『美』达莱尔·哈夫)
使用多克斯牌牙膏将使蛀牙减少23%,结论出自一家信誉良好的“独立”实验室,并且还经过了注册会计师的证实。然而,如果你不是特别容易轻信他人或者盲目乐观,经验将告诉你:一种牙膏难以比其他牙膏好。那么多克斯公司是怎样制造了上述结论?这里的主要把戏是不充分的样本——统计角度的不充分,但对于多克斯公司来说已经足够了。只有当你读小字体的文字时才会发现:被测试的用户仅由12人组成。单凭这点,你便不得不佩服多克斯公司,而且它留给你一个可能知道全部情况的机会。有的广告商索性将类似的文字都略去,留给读者——即便他是一个老练的统计专家——一个猜想:这里面到底玩了什么把戏?
让规模不大的一组人连续记录六个月的蛀牙数,接着使用多克斯牙膏。之后一定会发生以下的其中一种结果:蛀牙明显增多,蛀牙明显减少或者蛀牙数量无显著变化。如果是第一或者第三种结果,多克斯公司编档保存好这些数字,当然最好是藏在别人找不到的地方,然后重新实验。由于机遇的作用,迟早有一组被测试者将证明有很好的效果,并且这个结果足以好到作为标题甚至引发一场广告战。不过,不管实验者使用的是多克斯牙膏还是发酵粉,或者还是继续使用原来的品牌,上述结果都会发生。任何由于机遇产生的差异,在大样本的使用中都是微不足道的,不足以作为广告标题。
多克斯公司是怎样轻易地获得一个不存在漏洞并经得起检验的结论?Heraclitus:
"Ever-newerwatersflow onthosewhostepintothe samerivers."
赫拉克利特:
人不能两次踏进同一条河流有的事件无法重复试验,称为一次性事件。如:关老师肯定没有说谎,明天是否下雨,这个病人是否能治愈,新产品销路如何,火星上是否有生命,核弹爆炸的威力,核能电厂的意外,彗星撞地球
…主观概率主观概率定义:合理的信念的测度,是认识主体根据其所掌握的知识、信息和证据,而对某种情况出现可能性大小所做的数量判断。如:降水率,治愈率,洲际导弹命中率,明年国民经济增长率,…
某君看上一女孩,惊为天人,觉得这是他今生的新娘。评估后信心满满,自认追上的机会有8成。旁人却都不看好,问他8成这一数字,是如何冒出来的?该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。这个0.8的概率,就是所谓主观概率。大约少有女孩,会让你做实验,反复地追,然后数一数其中成功几次,来定下她会被你追上的机率。对这类无法重复观测的现象,在谈概率时,主观概率就常派上用场。虽说“主观”,但仍要合理。例如,考试有及格与不及格。若认为会及格的机率为0.9,这没问题,人总要有点自信,但若又同时担心有0.8的机率会不及格,那就不行了。各种可能性发生机率相加要为1。即使是主观,可以独排众议,仍须自圆其说。不能说,既然是主观,便可以任意自定各事件之概率。因此不论是那一种对概率的解释,都自然地,或必须要满足一些共同的规则。有个与曾子同名的人杀人,好心者告诉曾母“曾参杀人”。曾母说“吾子不杀人”,继续织布。过一会儿,又有人来说“曾参杀人”。曾母仍继续织她的布,这么好的儿子怎可能杀人?但当第三人跑来说“曾参杀人”,曾母就害怕了,丢掉织布器具翻墙而逃。所谓“其母惧,投杼踰墙而走”。主观概率 对于不可重复进行的实验,在符合概率的公理化定义的三个基本条件下所定义的概率。
主观概率的确定或是依赖于经验所形成的个人信念,或是依赖于对历史信息的提炼,概括和应用。主观概率的确定虽然带有很大的个人成分,但并不是完全的臆测,并且主观概率在一定的条件下,还可使用贝叶斯公式加以修正。主观概率至少是频率方法及古典方法的一种补充.有了主观概率,至少可以使人们在频率观点不适用时也能谈论概率,且能使用概率统计方法解决相应的实际问题。
主观概率的应用主要在于决策问题。在数据分析方面,贝叶斯概率起着重要的作用。它在20世纪得到发扬光大,被称为数理统计学中的贝叶斯学派。与频率学派(基于频率的概率,不允许有主观概率的作用)间曾发生令人瞩目的争论(部分是主观概率合法性之争)。主观概率适用于对只出现一次而不能重复的事件进行概率描述,而频率的解释则适用于能大量重复的随机事件。批评:如果概率是人的主观信念的数量度量,那么概率论就很象心理学的一个分支,而对概率进行纯主观的解释最终将导致唯心论。辩解:客观上有很多只出现一次而又需要作出决策的事件,决策人通过主观概率把自己的以数据、分析和经验为依据的判断表示为数量形式,就可以利用概率的整套数学理论和工具得到结论,这些结论对决策往住非常有用。ExampleinPractice1999年1月14日的《科学时报》对“神农架是否存在野人”问题的讨论做了报道。这当然是一个一次性事件,因为普天下并无第二个神农架。从报道上看,学者们的意见基本一致,即可能性很小。但仍有不同:有的学者认为完全不可能,即把“神农架存在野人”这个事件的概率判为0,另一位学者将其判为0.05,还有的学者只判断“很小”但未给出数值。这就是各学者对这事件发生所判的主观概率。
《俄狄浦斯王》中,王后伊俄卡斯忒安慰俄狄浦斯:“偶然控制着我们,未来的事又看不清楚,我们为什么惧怕呢?”§2. 样本空间与事件一、样本空间随机现象是通过随机试验来研究的.Question
什么是随机试验?随机试验现在,就让我们一起,步入这充满随机性的世界,开始第一步的探索和研究.1.可以在相同的条件下重复地进行;2.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;3.每次测试的结果事前不可预言.定义:在概率论中,把具有以下三个特征的试验称为随机试验.随机试验简称为试验,记为
E.特点:可重复性,可观察性,随机性.实例“抛掷一枚硬币,观察字面,花面出现的情况”.分析:(1)试验可以在相同的条件下重复地进行;(2)试验的所有可能结果:字面、花面;(3)进行一次试验之前不能确定哪一个结果会出现.
故为随机试验.1.“抛掷一枚骰子,观察出现的点数”.2.“从一批产品中,依次任选三件,记录出现正品与次品的件数”.同理可知下列试验都为随机试验3.记录某公共汽车站某日上午某时刻的等车人数.4.考察某地区10月份的平均气温.5.从一批灯泡中任取一只,测试其寿命.
样本点:随机试验结果的出现是不确定的,但所有可能结果是明确的.随机试验的每一个可能结果称为一个样本点,记为样本空间:样本点的全体,记为
如果试验是将一枚硬币抛掷两次,则样本空间由如下四个样本点组成:S={(H,H),(H,T),(T,H),(T,T)}第1次第2次HHTHHTTT(H,T):(T,H):(T,T):(H,H):其中
样本空间在如下意义上提供了一个理想试验的模型:
在每次试验中必有一个样本点出现且仅有一个样本点出现.例1 写出下列随机试验的样本空间.1)观将一枚硬币连抛N次,观察正面出现的次数.2)抛掷一枚骰子,观察出现的点数.从一批产品中,依次任选三件,记录出现正品与次品的情况.4)记录某公共汽车站某日上午某时刻的等车人数.5)
考察某地区12月份的平均气温.6)从一批灯泡中任取一只,测试其寿命.
2°
同一试验,若试验目的不同,则对应的样本空间也不同.如:
对于同一试验:“将一枚硬币抛掷三次”.若观察正面H(Heads)、反面T(Tails)出现的情况,则样本空间为若观察出现正面的次数,则样本空间为注
1°
试验不同,对应的样本空间也不同.3°建立样本空间,事实上就是建立随机现象的数学模型.因此,一个样本空间可以概括许多内容大不相同的实际问题.如:只包含两个样本点的样本空间,它既可以作为抛掷硬币出现正面
或出现反面的模型,也可以作为产品检验中合格与不合格的模型,又能用于排队现象中有人排队与无人排队的模型等.
所以在具体问题的研究中
,描述随机现象的第一步就是建立样本空间.二、事件(Event)事件:随机试验中某些结果所构成的集合,这些结果具有某一可观察的特征.随机事件:在试验中,可能发生,亦可能不发生的事件.必然事件:必然发生的事件,记为不可能事件:一定不会发生的事件,记为基本事件:恰含一个样本点的事件.Remark一般可将必然事件,不可能事件视为随机事件的极端情形,并统一简称为事件.2.事件A与B等价(相等):记作A=B,表示A
ÌB并且A
É
B.AB三、事件间的关系及运算
1.事件A包含B(B包含于A):表示事件B发生事件A必然发生,记作A
B
É(或B
AÌ)。例如:A(掷出奇数点)B(
掷出一点)
解:1)显然,B发生必然导致A发生,所以BA;.
2)又因为A发生必然导致B发生,所以AB,由此得A=B.Example
口袋中有a个白球、b个黑球,从中一个一个不返回地取球。A=“取到最后一个是白球”,B=“取到最后是白球段”。问A
与B
的关系?BAPropertyA+BAB7.事件A与B的差事件:表示A发生而B不发生,记作A-B。A-BABBA8.有限个或可列个事件的并与交随机事件的运算律和的交换律:和的结合律:交的交换律:交的结合律:第一分配律:第二分配律:自反律:第一对偶律:第二对偶律:符号 测度论含义 概率论含义Ω
全集 样本空间,必然事件空集 不可能事件ω∈Ω
集合的元素 样本点{ω} 单点集 基本事件A
Ω
一个集合 一个事件AB
A的元素在B中 A发生必然导致B发生A=B
集合A与B相等 事件A与B相等A∪B
A与B的所有元素 A与B至少有一个发生A∩B
A与B的共同元素 A与B同时发生
A的补集 A的对立事件A
-
B
在A中而不在B中的元素 A发生而B不发生A∩B= A与B无公共元素 A与B互不相容Example试用A、B、C表示下列事件:①A出现;②仅A出现;③恰有一个出现;④至少有一个出现;⑤至多有一个出现;⑥都不出现;⑦不都出现;⑧至少有两个出现.四、有限样本空间样本空间
Ω只包含有限个样本点,对每个样本点赋予一个非负实数:
ωk
↔pk
,这些
pk称为样本点ωk的概率,
只要全部这些
pk
的和为1.Definition1.2.1
对任何随机事件,A发生的概率就是它包含的样本点概率之和.关老师患了重感冒,奄奄一息地来到医生面前。听到医生的话,你猜关老师有什么反应?“你的病很重,在十个得这种病的人中只有一个能救活.”当关老师被这个消息吓得够呛时,医生继续说:“但你是幸运的。因为你找到了我,我已经看过九个病人了,他们都死于此病.”
OR洗具医生在检查完的时候摇摇头:吓出一身冷汗,感冒好了~~~治疗10个病人,相当于做10次试验,每次试验的结果都是随机的,所以第10次治疗的结果也是随机的,关老师挂掉的概率依然是90%.
恭喜关老师死里逃生!继续上课!若随机试验E具有下列两个特征:1)有限性
样本空间中,只有有限个样本点:2)等可能性
则称E所描述的概率模型为古典概型.古典概型随机试验一、模型与计算公式§3. 古典概型古典概型中事件概率的计算公式A为E的任意一个事件,且包含m个样本点,则事件A出现的概率为:
设试验E的样本空间由n个样本点构成,
例1将骰子先后抛掷2次,计算:(1)一共有多少种不同的结果?(2)其中向上的数之和是5的结果有多少种?(3)向上的数之和是5的概率是多少?二、基本的组合分析公式1.加法原理与乘法原理加法原理
假设做一件事情可采用
A或
B两类不同方式,A方式有
n种不同的方法可以完成这件事,B方式有
m种不同的方法可以完成这件事.则完成这件事情一共有
n+m种不同的方法.
如果有若干类方式,就把 所有方式的各种方法全部相加城市甲:2城市乙
:4
:3
则从甲城市到乙城市一共有2+4+3=9条线路
乘法原理(Productrule)
做一件事必须经过
A与
B两个不同步骤,步骤
A包含了
n种不同的方法,步骤
B包含m种不同的方法.
则完成这件事情一共有
n×m种不同方法.
如果有若干个步骤,就把 所有步骤的各种方法全部相乘:2城市甲:4:3
城市乙32
从甲城市到丙乡村的线路一共有9×(3+2)条。 乡村丙2.排列(Permutation)(1)可以重复的排列从
n个不同元素中允许放回任意取
r个出来排成有顺序的一列(即取出的这些元素可以相同).所有不同的排列方式一共有
n×n×…×n=nr
r
例如广州的电话号码是
8位数字,那么理论上广州可以容纳108
,即一亿门电话.足球彩票有313
种可能等等.(2)不可重复的排列
从
n个不同的物体中无放回任意取出
r个(1≤r≤n)
排成有顺序的一列,称为
n取
r的不可重复排列(又称为选排列).
不同的排列方法一共有:Example从
26个英文字母中任取
2个排列,所有不同方式的数目为(3)全排列n
个不同元素的全排列数为(1)二项式组合
从
n个不同元素中不允许放回任意取
r个(r
≤n)构成一个集合,称为n取
r的组合.构成这个集合的不同的组合方法一共有几个基本组合公式:
3.组合(Combination)称为二项系数,是下列二项展开式的系数:n!52!(2)多项式组合
把
n个不同元素分成
k个部分,各个部分包含的元素个数分别是:r1,r2,…,rk
;则全部不同的分配方式一共有:
nr1
r2
…rk=
r1!×r2!×…×rk!Example 把52张扑克牌平均分给4个人,每人13张,则所有不同的分配方案有:()13!×13!×13!×13!称为多项系数,是
(x1+x2+…+xk)n展开式中 的系数.
nr1
r2
…rk()若
n个元素中有
n1个带足标“1”,n2个带足标“2”,……,nk个带足标“k”,且
n1+n2+…+nk=n,从这
n个元素中取出
r个,使得带有足标“i”的元素有
ri个(1≤i≤k),而
r1+r2+…+rk=r,这时不同取法的总数为(3)不重复组合(4)可重复组合
从
n个不同元素中允许放回任意取
r个构成一个集合,称为
n
取
r的可重复组合.不同的组合方法一共有:实际上等价于不定方程的非负解:
x1+x2+…+xn
=r每个
xi
表示第
i号元素出现的次数.n=4,r=3,考虑4只有序的匣子共装有3个不可分辨的球.一个可重复组合对应于3个球在4个匣中的一种分配情况,例如:装球模型Remark排列与组合的区别在于: 排列必须考虑顺序,而组合不考虑顺序.以上除可重复组合方式外都具有等可能性.如果取的人加以区别并考虑顺序的话,可重复组合方式具等可能性.排列与组合都可以用来构造样本空间.古典概率的计算一般是先计算样本空间里的样本点总数,再从中挑选出随机事件包含的样本点个数.将排列公式推广,定义4.关于二项系数的一些公式若,则(2)由泰勒公式得:因此Property因为特别地或(3)利用幂级数的乘法,计算的幂级数展开式中幂前面的系数知:Example 有一个黑壶,一个白壶.黑壶中有5个红球,6个绿球;白壶中有3个红球,4个绿球.你可以先选择一个壶,然后从这个壶中随机抽取一球.假如你抽到红球的话,你将会获得奖励.你愿意选择哪个壶进行抽球哩?选择黑壶的话,抽中红球的概率是5/11=0.455;选择白壶的话,抽中红球的概率是3/7=0.429.应选择黑壶.古典概型的问题一般可转化为摸球模型
三、概率直接计算的例子
再考虑另外的一个黑壶和一个白壶.这个黑壶中有6个红球,3个绿球;白壶中有9个红球,5个绿球.现在打算选择哪个壶来抽球哩?选择黑壶的话,抽中红球的概率是6/9=0.667;选择白壶的话,抽中红球的概率是9/14=0.643.还是应该选择黑壶.最后,我们把第二次试验中黑壶的球倒入第一次试验中的黑壶,把第二次试验中白壶的球倒入第一次试验中的白壶.同样地你可以先选择一个壶来抽取红球,你愿意选择哪个壶?直观告诉我们,选择黑壶.我们算一算验证.黑壶中有11个红球,9个绿球,抽到红球的概率是11/20=0.55.白壶中有12个红球,9个绿球,抽到红球的概率是12/21=0.571.应当选择白壶,与我们的直觉完全相反.辛普森悖论(Simpson’sparadox).量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏.念天地之悠悠,独怆然而涕下。如果我们在人生的抉择上选择了一条比较难走的路,就更有可能不被赏识。迎合普世价值,让我们成为全才,同时也陷入“怀才不遇”困境。独特的人生更精彩!陈子昂,《登幽州台歌》:Remark
生日问题,分房问题可以归结为这类问题。,于是有所含基本结果数(2),于是有(1)所含基本结果数,且各结果机会均等。显然,所有可能基本结果数为小球各占一个纸盒”。表示“个盒内各有一个小球”;解:设表示“指定的小球各占一个纸盒的概率。(2)(1)指定的个纸盒各有一个小球的概率;中,试求解下列问题:小球随意放入纸盒盒子,个小球(),欲将这个可容纳任意个小球的纸例4(投球入格)设现有例(生日问题)设每个人的生日在一年365天中的任一天是等可能的,即都等于,那么随机选取n(≤365)人。(1)他们的生日各不相同的概率为多少?(2)n个人中至少有两个人生日相同的概率为多少?解(1)设A=“n个人的生日各不相同”(2)设B=“n个人中至少有两个人生日相同”n20233040506480100p0.4110.5070.7060.8910.9700.9970.9990.9999997
世界杯正在举行,5个球迷好不容易才搞到一张入场券.大家都想去,只好用抽签的方法来解决.入场券5张同样的卡片,只有一张上写有“入场券”,其余的什么也没写.将它们放在一起,洗匀,让5个人依次抽取.后抽比先抽的确实吃亏吗?
“先抽的人当然要比后抽的人抽到的机会大.”
到底谁说的对呢?让我们用概率论的知识来计算一下,每个人抽到“入场券”的概率到底有多大?“大家不必争先恐后,你们一个一个按次序来,谁抽到‘入场券’的机会都一样大.”“先抽的人当然要比后抽的人抽到的机会大。”
四、抽签与顺序无关
例5
袋中有a只黑球和b只白球,k个人把球随机的一只只『解法二』
把小球编号,将k个人取球构造样本空间『解法一』
把小球编号,将(a+b)个人取球构造样本空间,则样本点总数为(a+b)!;第k个人取到黑球,有a种,其余的顺序可以任意排列,因此摸出来,求第k个人摸出的是黑球的概率.『解法三』
把
a只黑球看作是无区别的,把
b只白球也看作没有区别的.第一、二种解法考虑到了顺序,因此用排列来解决;第二种解法不注重顺序而用组合.对于同一个随机现象可以用不同的样本空间来描述,因此同一个概率也有不同的求法.例6如果某批产品中有a件次品b件合格品,我们采用放回和不放回取样方式从中抽n件产品,问正好有k件是次品的概率各是多少?
五、二项分布与超几何分布
把a+b件产品进行编号,有放回的抽n次,把可能的重复排列全体作为样本空间,样本点总数为(a+b)n.(1)有放回抽样场合n次取出的产品中
a件次品中
b件合格品究竟哪
k次是次品
取
k个次品取出
n-k件ak
bn-kCnk这即为二项分布中随机变量取值为k的概率.
17世纪,法国的ChevaliesDeMere注意到在赌博中一对骰子抛25次,把赌注押到“至少出现一次双六”比把赌注押到“完全不出现双六”有利.但他本人找不出原因.后来请当时著名的法国数学家帕斯卡(Pascal)才解决了这一问题.
这问题是如何解决的呢?Question
从a+b件产品中取出n件产品的可能组合全体作为样本点.这即为超几何分布中随机变量取值为k的概率.Remark
当产品总数很大而抽样数不大时,采用有放回抽样与采用不放回抽样,差别不大.(2)不放回抽样场合池中有多少魚?统计里,常在做预测、做估计。做以偏概全的事。最大似然法依发生机率之最大者来决定估计值。日常生活常以此法来做决策:教室的玻璃窗破了,小明平常最喜欢乱丢东西,最可能是他。警方办案,从有前科者开始调查。例7 从某鱼塘捕得1200条鱼,做了标记之后放回鱼塘经过一段时间后,在从中捕得1000条鱼,发现其中有标记的鱼100条,试以此数据估计鱼塘中鱼的数量.
第二次捕出的有记号的鱼数为k的概率是:用最大似然法估计湖中的鱼数为了估计湖中的鱼数n,第一次捕上m条鱼,做上记号后放回.隔一段时间后,再捕出r条鱼,
结果发现这r条鱼中有k条标有记号.根据这个信息,如何估计湖中的鱼数呢?应取使Pk(n)达到最大的n,作为n的最大似然估计.这个比值大于或小于1,或而定
.由但用对n求导的方法相当困难,我们考虑比值:这就是说,当n增大时,序列Pk(n)先是上升而后下降;当n为小于的最大整数时,达到最大值.故n的最大似然估计为我们看人看事喜欢以偏概全,看到少数特点就开始想当然,容易形成偏见,此所谓代表性偏差。例如,有人告诉你某人性格安静、害羞、保守、谦逊,那么他的职业是什么——是推销员,还是脑外科医生?大多数人会选择脑外科医生,因为在他们的印象中,推销员是外向、爱交际的。然而,社会上推销员远远多于脑外科医生,一个人当一名推销员的可能性远远高于当脑外科医生的可能性,因此要猜的话,某人更有可能是推销员。统计学一般常用在预测事情最可能之结果,例如选举时的民意调查、收视率调查等。ExampleinPractice2011年4月25日,民进党以全民调方式进行台湾地区领导人党内初选,在15000选民中,蔡英文以1.35%的微弱优势击败苏贞昌,获党内提名角逐台湾2012“大选”。若样本实在太偏差,便是以管窥天,见不到全貌。关于美国选举的两个例子谁会在1936选举中获胜?AlfLondon(兰登)还是
F.D.R.(罗斯福)?LiteraryDigest(文摘)送出一千万份问卷(返回二百四十万份)后,预测London将以57%对43%的比例获胜,并大力进行宣传。结果,罗斯福以62%对38%的巨大优势获胜,连任总统.《文学摘要》杂志社威信扫地,不久只得关门停刊.在调查史上,样本容量这么大是少见的,几乎已经没有犯错的可能,何以结果却偏差如此之大?谁会在1948选举中获胜?ThomasDewey(杜威)还是HarryTruman(杜鲁门)?Crossley,Gallop(盖洛普),Roper所有都预测Dewey会赢(每个机构用了5000个问卷).最后一次盖洛普民意测验显示,杜鲁门仍然落后杜威5个百分点。共和党人弹冠相庆认为大局已定,杜威已经开始准备总统就职演说。在大选日当晚,《芝加哥论坛报》抢先印刷了印有“杜威击败杜鲁门”大标题的号外,向全国发行。
最后,他们都输了,杜鲁门以49.5%比45.1%胜出.杜鲁门高兴地对新闻界举起报纸,哈哈大笑,并被拍摄成照片。这张照片至今悬挂在《芝加哥论坛报》的主编办公室里,每一任《芝加哥论坛报》主编都要看着这张耻辱的记录而工作。1936年,《文学摘要》杂志社以电话簿上的地址和俱乐部成员名单上的地址发出调查信,而当时美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭。结果只能看出有钱人的投票倾向较支持共和党候选人。1948年使用电话访问来做民意调查,同样是在富人中抽取的样本,严重偏离了总体(全体美国公民),导致样本不具有代表性.预测结果为何出错?调查若与人有关,不容易做:人会改变想法,不见得会与调查者合作,不同群体的人想法差异很大。六、古典概率的基本性质(1)非负性:对任一事件A,有P(A)≥0;(2)规范性:对必然事件,有
P()=1;(3)有限可加性:若事件A1,A2,…,An两两互斥,则推论:对立事件的概率例8(德·梅尔问题)
一颗骰子投4次至少得到一个六点与两颗骰子投24次至少得到一个双六,这两个事件中哪一件有更多的机会遇到?因而解:以A表示一颗骰子投4次至少得到一个六点这一事件,则表示投一颗骰子4次没有出现六点,故
这个问题在概率论发展史上颇有名气,因为它是德梅尔向巴斯卡提出的问题之一.正是这些问题导致了巴斯卡的研究和他与费马的著名通信.他们的研究标志着概率论的诞生.
同理,若以B表示两颗骰子投24次至少得到一个双六,则
因而,这两件事情中,前面一件事情更容易遇到.例9
盒子中有N-1
个黑球与1个白球,每次 随机取出一个并换进一个黑球,一直持续;
计算第k
次取球时取到黑球(Ak)的概率. 【解】
Ak的对立事件表示“第
k次取时取到的是白球”,它要发生只可能是前
k-1
次都取到黑球而最后一次是白球,因此§4. 几何概型定义若试验E具有下列特征:1)无限性:E的样本空间是某几何空间中的2)等可能性:每个样本点的出现是等可能的,则称E所描述的概率模型为几何概型,并称E为几何概型随机试验.一个区域,其包含无穷多个样本点,每个样本点由区域内的点的随机位置所确定.即样本点落在内几何度量相同的子区域是等可能的,例如,考虑平面区域其面积记为 在中等可能任意投点.“等可能”的确切含义是:点落于中任意子区域的概率与区域的面积成正比.即:若仍以表示“点落于中”,则存在常数使再利用有注1几何空间一维二维三维…几何度量长度面积体积…
对于随机试验E,以m(A)表示事件A的几何度量,为样本空间.若0<m()<+,则对于任一事件A,其概率为2
那末
两人会面的充要条件为连.求甲、乙两人能会面的概率.解甲、乙两人相约在0到T
这段时间内,在预定地点会面.先到的人等候另一个人,经过时间t(t<T)后离去.设每人在0到T这段时间内各时刻到达该地是等可能的,且两人到达的时刻互不牵例4(会面问题)故所求的概率为若以x,y
表示平面上点的坐标,则有浦丰问题相交的概率.alMx解
设M表示针落下后,针的中心,x表示M与最近一平行线的距离,表示针与这平行线的夹角,则样本空间:l/21777年,法国科学家蒲丰(Buffon)提出了投针试验问题.平面上画有等距离a(a>0)的一些平行线,向平面任意投一长为l(l<a)的针,试求针与平行线针与一平行线相交设A=“针与一平行线相交”,则0xa/2A蒲丰投针试验的应用及意义根据频率的稳定性,当投针试验次数n很大时,算出针与平行直线相交的次数m,则频率值即可作为P(A)的近似值代入上式,那么上述方法被称为MonteCarlo方法.由于现今可通过计算机模拟大量重复试验,此法如今应用广泛.历史上一些学者的计算结果(直线距离a=1)3.179585925200.54191925Reina3.1415929180834080.831901Lazzerini3.159548910300.751884Fox3.1373826001.01860DeMorgan3.1554121832040.61855Smith3.1596253250000.81850Wolf相交次数投掷次数针长时间试验者
几何概型在现代概率概念的发展中曾经起过重大作用。19世纪时,不少人相信,只要找到适当的等可能性描述,就可以给概率问题以唯一的解答,然而有人却构造出这样的例子,它包含着几种似乎都同样有理却相互矛盾的答案。下面就是一个著名的例子。贝特朗(Bertrand)奇论
在半径为1的圆内随机地取一弦,求其长超过该圆内接等边三角形的边长的概率。Ω1【解法一】
任何弦交圆周两点,不失一般性,先固定其中一点于圆周上,以此点为顶点作等边三角形,显然只有落入此三角形内的弦才满足要求,这种弦的弧长为整个圆周的,故所求的概率为。Ω2【解法二】
弦长只跟它与圆心的距离有关,而与方向无关,因此可以假定它垂直于某一直径,当且仅当它与圆心的距离小于时,其长才大于,因此所求的概率为。Ω3【解法三】
弦被其中点唯一确定,当且仅当其中点属于半径为的同心圆时,弦长才大于
,此小圆面积为大圆面积的,故所求的概率为。
同一问题有三种不同的答案,细究其原因,发现是在取弦时采用了不同的等可能性假定。在第一种解法中,假定端点在圆周上均匀分布,在第二种解法中,假定弦的中点在直径上均匀分布,而在第三种解法中,又假定弦的中点在圆内均匀分布。这三种答案针对三种不同的随机试验,对于各自的随机试验而言,它们都是正确的。
因此在使用术语“随机”、“等可能”、“均匀分布”等时,应明确指明其含义,这又因试验而异。几何概率的性质(1)非负性:对任一事件A,有P(A)≥0;(2)规范性:对必然事件,有
P()=1;(3)可列可加性:若事件A1,A2,…,两两互斥,则古典概型和几何概型的局限性采用等可能性来定义概率有困难循环定义,自圆其说并没有对事件的集合进行限制。对于事件,一个很明显的要求就是所有事件组成的集合对于并、交、余这三种运算封闭。概率论缺乏严格的理论基础§5.概率空间一、走向概率论公理化结构测度论的发展,概率抽象化为测度。19世纪末,数学各分支的公理化潮流定义概率这一基本概念时只指明概率应具有的基本性质,而把具体概率的给定放在一边,这样做的好处是能针对不同的随机试验给定适当的概率。
即通过规定概率应具备的基本性质来定义概率.1933年,前苏联数学家柯尔莫哥洛夫给出了概率的公理化定义.
柯尔莫哥洛夫提出的公理为数很少且极为简单,
但在此基础上建立起了概率论的宏伟大厦.二、事件域
随机试验:一个试验(或观察),若它的结果预先无法确定,则称之为随机试验,简称试验;
样本空间:所有试验的可能结果组成的集合,称为样本空间,记作;
样本点:中的元素称为样本点,用表示;
事件:事件A定义为的一个子集,它包含若干样本点,事件A发生当且仅当A所包含的样本点中有一个发生。常用大写字母A、B、C等表示;
集类:由中的若干子集构成的集合称为集类,用花写字母ℬ、F等表示;Question
针对哪些事件给出概率?记F为研究的所有事件的全体。F一般不包括所有的事件,即样本空间的一切子集,因为这将对给定概率带来困难。F必须把感兴趣的事件包含进来。因为事件的交、余、并等也应该为事件,也应该有相应的概率,需要把它们亦包括进来。当然,和必不可少。Definition(σ域)(包含全集)(对逆运算封闭)(对可列并运算封闭)我们把事件的全体记为
F,它是由Ω的某些子集构成的集类,并且还应满足下面的条件:称满足上述条件的集类为σ域,也称σ代数。Definition1.5.1
若F是由样本空间
Ω的一些子集构成的一个σ域,则称它为事件域(eventfield),F
中的元素称为事件,Ω
称为必然事件,称为不可能事件。
很显然,根据定义,必然事件和不可能事件都在事件域中,事件的有限及可列交、并也都在事件域中。例1为一域。例2为一域。例3是由的一切子集构成。这时,是一个有限的集合。共有元素2n
个。为一域。例4为一域。可以验证对于一般的,若由的一切子集构成。
Remark
事件域可以选得很简单,也可以选得十分复杂,需要我们根据不同要求选择适当的事件.命题
给定的一个非空集类,必然存在唯一的一个中的域,满足:(1)包含,(2)若有其它域包含,则必包含。称为包含的最小域,或由产生的域。
包含的某些子集,从它的这些最基本子集出发反复进行“最多可列次并、交、补运算(Borel运算)”,不断添加子集从而得到所需要的σ
代数。或者把包含这些基本子集的全部
σ
代数做交运算。
由一切形为[a,b)的有界左闭右开区间构成的集类所产生的域称为一维博雷尔域,记为,中的集合称为一维博雷尔点集。一维博雷尔(Borel)点集
以后,用记数直线或实数全体,用
记
n维欧几里得(Euclid)空间。博雷尔(Borel)集类若x,y表示任意实数,由于
因此,中包含一切开区间,闭区间,单个实数,可列个实数,以及由它们经可列次并、交运算而得出的集合。这是一个相当大的集合,足够把实际问题中感兴趣的点集都包括在内。
同样,也是一个相当大的集合,足够把实际问题中感兴趣的点集都包括在内。
n维博雷尔点集由一切
n维矩形产生的
n维博雷尔σ域。三、概率(i)非负性:
概率P
为定义在事件域上的函数,即它是一个从
到的映射:,且它满足(ii)规范性:(iii)可列可加性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 青岛职业技术学院《教育研究方法与论文写作(2)》2023-2024学年第二学期期末试卷
- 山东英才学院《发育生物学实验》2023-2024学年第二学期期末试卷
- 北京市北京四中2025届高三寒假语文试题学情检测试题(二)含附加题含解析
- 长沙理工大学《东西方艺术考察》2023-2024学年第一学期期末试卷
- 毛概练习题及参考答案
- 国家保安员题库及答案
- B2B购销合同:数据分析的合规性与效率
- ppp监理项目合同标准文本
- 产品销售居间合同标准文本
- 内部包协议合同范例
- 外交学院专职辅导员招聘真题2024
- 浙江省宁波市“十校”2025届高三下学期3月联考英语试卷答案
- 《南海争端解析》课件
- 服装数字化设计技术课件 5-2男西装款式分析
- 历史-广西壮族自治区考阅评·2025届(年)2月高三毕业班联合调研测试试题和答案
- 水声通信组网技术第二讲-水声信道传输特性
- 2025年3月版安全环境职业健康法律法规标准文件清单
- 【源版】中医药健康管理服务规范
- 盖板天然气管道保护方案
- 2025年安徽财贸职业学院单招综合素质考试题库新版
- 2025年安徽电气工程职业技术学院单招综合素质考试题库及答案参考
评论
0/150
提交评论