版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
秦佑国燕翔
随机变量与概率
建筑数学第十一讲
扔掷数获得6点的次数获得6点的频率111.00000210.50000310.33333410.25000520.400001020.200002050.25000100120.12000200390.1950030046018000500760.152006001020.170007001200.1714310001700.1700020003430.1715030005600.16867
下表是掷骰子获得6点的试验记录,共掷了3000次。随着掷的次数的增加,得到6点的“频率”在震荡中趋近于“概率”(理论分析)值1/6=0.16666……(伯努利)大数定律当试验次数足够多时,事件发生的频率无穷接近于该事件发生的概率。即频率的稳定性。
设
μ
是
n
次独立试验中事件A发生的次数,且事件A在每次试验中发生的概率为
p,则对任意正数ε,有公式:在抽样调查中,当样本数量足够多时,可用样本值去估计总体值,其理论依据就在于此。
概率论只不过是把常识用数学公式表达了出来。——拉普拉斯概率公理如果一个函数PA→P(A)给一个事件空间S中的事件A,指定一个实数P(A),并且其满足下面的3个公理,那么函数P叫做概率函数,相应的P(A)叫做事件A的概率。公理1:
事件P(A)的概率是一个0与1之间(包含0与1)的非负实数。公理2:
完全事件的概率值为1。公理3:
如果A、B是互斥事件
互斥事件的加法法则。公理3可以推广到可数个互斥事件的并。
定理5(乘法法则)事件A、B,同时发生的概率是:公式中的是指在B条件下A发生的概率,称作条件概率。在52张牌中随机连续抽出2张(第一次抽出的牌不放回去),都是K的概率是多少呢?第一次抽到K的概率是P(A)=4/52,第二次抽到K的概率是P(B/A)=3/51,则有:4/52×3/51=12/2652定理6(无关事件乘法法则),两个不相关联的事件,同时发生的概率是:轮盘赌是把一个圆盘等分成37个扇形,其中18个是红色,18个是黑色,1个是绿色。旋转圆盘,赌它停下后指针指的扇形的颜色。游戏中两次连续的旋转过程,P(A)代表第一次出现红色的概率,P(B)代表第二次出现红色的概率,两者没有关联,利用上面提到的公式,连续两次出现红色的概率为:
造成许多玩家失败的原因是因为,大家普遍认为,经过连续出现若干次红色后,黑色出现的概率会越来越大,事实上两种颜色每次出现的概率是相等的,之前出现的红色与之后出现的黑色之间没有任何联系。连续10次出现红色的概率为P=(18/37)10=0.0007
通常人们看这张图片会认为有6栋建筑。不会想到树干挡住的可能是2栋房子而不是1栋。因为是2栋房子的可能性很小——小概率事件。首先,图片中没有遮挡的房子都高低和颜色不同,人们自然“顺势”推想,树干挡住的房子,一样的高度一样的颜色,应是一栋房子,两栋房子的可能性小(小概率);再说树干怎么就正好挡住房子空挡呢?太巧合了!(小概率)这个问题是计算机图像自动识别的书中提出的案例。
另一个案例是计算机自动翻译问题:“Thegirlsawtheboywithatelescope.”这句英语如何翻(如何理解其含义)?一种理解是:女孩用望远镜看到了男孩。另一种是:女孩看到了拿着望远镜的男孩。正如Thegirlsawtheboywithabook.翻译成:女孩看到了拿着一本书的男孩。也可以withabasketball等等。机器翻译,按一般规则,可能翻成:女孩看到了拿着望远镜的男孩。但人们更可能理解为:女孩用望远镜看到了男孩。因为人可能“逆向”思考,男孩带着望远镜是“小概率事件”,而“女孩用望远镜看到了男孩”,“望远镜”和“看”关联性大。计算机是从“句型”出现的概率来判别的,而人是从“词语”含义搭配的概率来决定的。
美国加拿大大都数住宅都是木结构,都要投火灾保险。
龙卷风是一种灾害性天气现象,破坏力极强。美国是龙卷风多发的国家。1974年4月3日,有48个龙卷风席卷美国11个州,造成300多人死亡,数百人受伤,经济损失315亿美元。设计建造住房能抵抗龙卷风几乎是不可能的,如想做到,经济代价极高。尽管美国龙卷风每年都有,但某一家住房遭遇到龙卷风仍然是小概率事件。对待龙卷风灾害,首先是气象部门的发现、跟踪和发布预警;再有,保证人生安全是第一位的,龙卷风到来时人员能躲避逃生;房子一定要投保险的,一旦受灾,损失有保险公司赔付。
二项分布
一个试验只包含2个可能的结果,但两者发生的概率可能不同。若出现其中一个结果的概率为
p,则出现另一个结果(或不发生这个结果)的概率为1-p
。例如,产品检验,抽到的样品可能是正品,也可能是次品,正品率p=99%,次品是1%;
一个城市平均10年发一次洪水,“十年一遇”,发洪水概率是p=0.9,不发洪水的概率是1-p=0.1。称为二项分布。二项分布是最重要的离散概率分布之一,由瑞士数学家雅各布·伯努利(JakobBernoulli)所发展,二项分布指出:
一条河流历史统计每10年会发一次洪水(10年一遇),讨论:今后10年发生洪水的概率是1(必定发生洪水)吗?今后10年不发生洪水的概率呢?3年内可能发生洪水吗?这个问题是伯努利二项分布问题,发生洪水的概率p=0.1,不发生洪水的概率q=0.9。在n年内发生k次洪水的概率可按伯努利概率公式计算:
“今后10年发生洪水的概率是1吗?”,不是,尽管发生洪水的可能性很大,但不能确定一定发生,可能不发生。“今后10年不发生洪水的概率呢?”,第1年不发生洪水的概率q=0.9=(0.91),第2年也不发生洪水的概率:0.9×0.9
=
0.92
=
0.81,第3年还不发生洪水的概率:0.9×0.9×0.9
=
0.93
=
0.729,直到第10年还不发生洪水的概率是:0.910=0.3487。用二项概率公式计算,n=10,
k=0(1次也没有发生),p=0.1,带入公式,C010=1,0.10=1,(1-0.1)10-0=0.910=0.3487,结果相同。“3年内可能发生洪水吗?”n=3,k=0,p=0.1,带入公式,用公式算出3年内不发生洪水的概率是0.93=0.729,于是可得,3年内发生洪水的概率是1-0.729=0.271。同样10年内发生洪水的概率1-0.3487=0.6513。
再来做抛掷硬币的试验,不是一次抛1枚,而是抛很多枚。
一次抛100枚(n=100)硬币,把正面朝上的个数K与总数n=100的比值,记录下来,有可能是42个正面,比例是42/100,可能是62个正面,比例是62/100……。可以猜测(理性分析):得到一半正面向上,即比例是50/100的次数可能性要大(概率大),而100枚中没有一个正面的(比例是0/100),或全部是正面的比例是(100/100),出现的可能性微乎其微(概率很小),1/100与99/100,2/100与98/100,概率也很小……;而49/100与51/100,概率会大。一共有101个结果,概率总和是1。但这101个结果的概率分布是怎样的呢?首先应该是对称的,即1/100与99/100概率相同,49/100与51/100概率相同,K/100与(100-K)/100概率相同;第二是“两头小中间大”,K<50,K越小概率越小;K>50,K越大,概率越小,K越接近50,概率越大。如果做试验,一次一次地抛,抛的次数很多,例如1000次,2000次,……试验得到的“频率”会无限接近“概率”,从而得到我们想要的概率分布。如果可以理论分析求算出概率分布,试验就可用来验证计算结果。
泊松分布泊松近似是二项分布的一种极限形式。其强调如下的试验前提:一次抽样的概率值
p相对很小,而抽取次数值n又相对很大。因此泊松分布又被称之为罕有事件分布。泊松分布指出,如果随机一次试验出现的概率为p,那么在n次试验中出现k次的概率是:其中e=2.71828……,数学常数(自然对数的底数)
例如,某工厂生产零件,次品率P=0.01。随机抽取100个零件,出现0个、1个、2个、3个、……、99、100次品的概率各是多少?可以推测,抽出1个次品的概率最高(p=0.01,就意味着100个零件中有1个次品),抽出0个(没有抽到)次品的概率会略小一些,抽出2个、3个次品还有可能,但出现99、100个次品几乎不可能,概率接近于零,也就是说,当K>1时,抽出的次品数K越大,概率就越小。
如果,次品(或换一种说法是“特殊”品)率p=0.1。随机抽取100个零件,可以推测,抽出k=10个次品的概率最高(p=0.1,就意味着100个零件中有10个次品),k<10(但>0),k越小,概率越小;k>10(但<100),k越大,概率就越小。依然是“两头小中间大”,但不对称,最高点在10,此时k/n=10/100=p。如果p=0.5,就是抛硬币了,分布就对称了。泊松分布n=9,p=1/3的二项分布泊松分布:两头小中间大,不对称泊松分布是二项分布的近似在实际事例中,当一个随机事件,以一定的平均速率λ(或称密度)随机且独立地出现时,例如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌数,等等。那么这个事件在单位时间内(或面积、体积上)出现的次数或个数就近似地服从泊松分布。在离散事件泊松公式中,以λ=np
代入,就得到泊松公式的另一种表达:而二项分布概率公式,在n→∞时的极限就是上面的公式。
为了保证设备正常工作,需配备适量的维修工人,现有同类型设备300台,各台工作是相互独立的,发生故障的概率都是0.01;一台设备的故障可由一人来修理。至少需配备多少工人,才能保证当设备发生故障但不能及时维修的概率小于0.01?解:设需配备N人,记同一时刻发生故障的设备台数为X,n=300,p=0.01,λ=np=3,需要确定最小的N的取值,使得:查Poisson分布表可知,满足上式的最小的N是8,因此至少需配备8个维修工人。
一条单向车行道上,1小时平均车流量是300辆,平均时距是3600/300=12秒,实际来车是随机的,前后两车的时距可能长,可能短,但不能短于两车安全时距t0:(两车安全距离+车身长度)/车速。则时距t(t0<t<∞)就服从泊松分布。注意:t的取值理论上是连续的,但也可以以秒(或0.1秒)为单位化成离散的取值。
一张考卷上有5道选择题,每道题列出4个可能答案,其中只有一个答案是正确的。一学生靠猜测至少能答对4道题的概率是多少?解:每答一道题相当于做一次伯努利试验,P{至少能答对4道题}
=
P{
X
≥
4
}=
P{
X=
4
}
+
P{
X=
5
},由二项公式:设:随机数X为学生靠猜测的答对题数,则X~B(5,1/4)求得
前面讨论的是离散概率分布,即随机事件是离散的,事件取值是一个一个可列举的离散的数值。如有n个结果(事件),各自的概率P(Aj)(j=1,2,3,……,n)已知,则有∑P(Aj)=1(离散值相加求和)。但还有一些随机现象是连续的,例如在一条线或一个面上随机确定一个点,其位置就是连续的。人的身高,在样本量极大时,只要测量工具的“精度”足够,也可以看做是连续的。即是一个连续的随机变量。连续随机变量不能象离散随机变量那样一一列举各个取值的概率而直接给出概率分布,而是给出一个连续的“概率密度函数”f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村房屋租赁合同书模板
- 房地产抵押典当合同的税务问题
- 建筑材料批发购销合同
- 《用餐礼仪培训》课件
- 百万医疗宣讲课件
- 科技创新奖励办法
- 仿铜漆项目可行性研究报告
- 年产xx直接印刷板项目建议书
- 气胸护理查房查体流程
- 2023年高密度电阻率仪资金需求报告
- 金坛区苏科版二年级上册劳动《08不倒翁》课件
- 三级安全教育培训课件(项目级)
- 永辉超市门店SOP标准作业流程制度规定(五篇)
- 高边坡锚索试验孔基本试验报告
- 研读新课标“数据意识”的培养策略与评价
- 不断提升能源利用效率做好“双碳”工作心得体会
- 新版GMP变更控制详解
- 制糖蒸发工序操作
- 《中国书法基础知识讲解》PPT课件
- 《逻辑学》第五章-词项逻辑
- 头痛的国际分类(第三版)中文
评论
0/150
提交评论