概率论与数据统计课件_第1页
概率论与数据统计课件_第2页
概率论与数据统计课件_第3页
概率论与数据统计课件_第4页
概率论与数据统计课件_第5页
已阅读5页,还剩567页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1概率统计

概率统计序言一.

概率统计的研究对象A.太阳从东方升起;B.上抛物体一定下落;C.明天的最高温度;D.新生婴儿的体重.随机现象确定性现象在我们所生活的世界上,

充满了随机性

从扔硬币、掷骰子和玩扑克等简单的机会游戏,到复杂的社会现象;从婴儿的出生,到世间万物的繁衍生息;从流星坠落,到大自然的千变万化……,我们无时无刻不面临着随机性.概率统计的研究对象二.概率统计的研究内容

随机现象的统计规律性随机现象是不是没有规律可言?否!在一定条件下对随机现象进行大量观测会发现某种规律性.从表面上看,随机现象的每一次观察结果都是随机的,但多次观察某个随机现象,便可以发现,在大量的偶然之中存在着必然的规律.

这种随机现象所呈现出的固有规律性,称为随机现象的统计规律性.概率统计的研究内容三.概率统计的应用

经济管理保险金融生物医药…………天气预报下面我们就来开始一门“将不定性数量化”的课程的学习,这就是概率论与数理统计概率论与数理统计概率论与数理统计第一章随机事件及其概率§1.1

随机事件及其运算

对某事物特征进行观察,统称试验.若它有如下特点,则称为随机试验,用E表示试验前不能预知出现哪种结果

1.随机试验与样本空间

可在相同的条件下重复进行试验结果不止一个,但能明确所有的结果样本空间——随机试验E所有可能的结果样本空间的元素,即E

的直接结果,称为随机事件

——

的子集,记为A,B,…它是满足某些条件的样本点所组成的集合.组成的集合称为样本空间记为

样本点(或基本事件)

常记为,={}其中T1,T2分别是该地区的最低与最高温度观察某地区每天的最高温度与最低温度观察总机每天9:00~10:00接到的电话次数有限样本空间无限样本空间投一枚硬币3次,观察正面出现的次数例1

给出一组随机试验及相应的样本空间基本事件

——

仅由一个样本点组成的子集它是随机试验的直接结果,每次试验必定发生且只可能发生一个基本事件.

必然事件——全体样本点组成的事件,记为,每次试验必定发生的事件.复合事件

——由若干个基本事件组成的随机事件.不可能事件——不包含任何样本点的事件,记为

,每次试验必定不发生的事件.A

随机事件的关系和运算类同集合的关系和运算

2.事件的关系和运算文氏图(Venndiagram)——

A

包含于B事件A发生必导致事件B

发生AB

且1.事件的包含2.事件的相等或

事件A与事件B

至少有一个发生发生的和事件——

的和事件——

——

A

与B

的和事件

3.事件的并(和)

或事件A与事件B

同时发生发生的积事件

——

的积事件——

——

A

与B

的积事件

4.事件的交(积)发生事件

A发生,但

事件B不发生

——

A

与B

的差事件5.事件的差——

A

与B

互斥A、

B不可能同时发生AB两两互斥两两互斥6.事件的互斥(互不相容)——

A

与B

互相对立每次试验A、

B中有且只有一个发生A称B

为A的对立事件(或逆事件),记为注意:“A

与B

互相对立”与“A

与B

互斥”是不同的概念7.事件的对立

吸收律

幂等律

差化积

重余律运算律对应事件运算集合运算

交换律

结合律

分配律

反演律运算顺序:逆交并差,括号优先例1

在图书馆中随意抽取一本书,表示数学书,表示中文书,表示平装书.——抽取的是精装中文版数学书——精装书都是中文书——非数学书都是中文版的,且中文版的书都是非数学书则事件设在n

次试验中,事件A

发生了m

次,

1.频率与概率则称为事件A发生的频率频率的性质

事件A,B互斥,则可推广到有限个两两互斥事件的和事件非负性规范性可加性稳定性某一定数

投一枚硬币观察正面向上的次数

n=4040,nH=2048,fn(H)=0.5069

n=12000,nH=6019,fn(H)=0.5016n=24000,nH=12012,fn(H)=0.5005频率稳定性的实例

蒲丰投币

皮尔逊投币概率的统计定义在相同条件下重复进行的n

次试验中,事件A

发生的频率稳定地在某一常数p附近摆动,

且随n越大摆动幅度越小,

则称p为事件A

的概率,记作P(A).对本定义的评价优点:直观易懂缺点:粗糙模糊不便使用设随机试验E

具有下列特点:

基本事件的个数有限每个基本事件等可能性发生则称

E

古典(等可能)概型古典概型中概率的计算:记

则2.古典概型

概率的古典定义例一颗骰子掷两次,求出现点数之和是8的概率答案:P(A)=5/36掷一颗骰子,有6个等可能的结果,掷两次有6·6=36个等可能结果,设A

为点数之和是8,有(2,6),(3,5),(4,4),(5,3),(6,2)共5种情形。例把C、C、E、E、I、N、S七个字母分别写在七张同样的卡片上,并且将卡片放入同一盒中,现从盒中任意一张一张地将卡片取出,并将其按取到的顺序排成一列,有多大可能排列结果恰好拼成一个英文单词:CISNCEE拼成英文单词SCIENCE

的情况数为故该结果出现的概率为:解:七个字母的排列总数为7!例设有N件产品,其中有M件次品,现从这N件中任取n件,求其中恰有k件次品的概率.解:令A={恰有k件次品}超几何公式设有k

个不同的球,每个球等可能地落入N

个盒子中(),设每个盒子容球数无限,求下列事件的概率:(1)某指定的k

个盒子中各有一球;(3)恰有k

个盒子中各有一球.(2)某指定的一个盒子恰有m

个球()例

(分房模型)解例“分房模型”的应用解

n

个人的生日均不相同,相当于本问题中的人可被视为“球”,365天为365只“盒子”每个盒子至多有一个球或恰有n个盒子中各有一球.

某班级有n(n≤365)个人,求n

个人的生日均不相同(设为事件A)的概率.3.几何概型(古典概型的推广)把等可能推广到无限个样本点场合,人们引入了几何概型.由此形成了确定概率的另一方法——几何概率.早在概率论发展初期,人们就认识到,只考虑有限个等可能样本点的古典方法是不够的.几何方法的思路是:1、设样本空间S是平面上某个区域,它的面积记为μ(S);S该点落入S内任何部分区域内的可能性只与这部分区域的面积成比例,而与这部分区域的位置和形状无关.S2、向区域S上随机投掷一点,“随机投掷一点”的含义是:3、设事件A是S的某个区域,它的面积为μ(A),则向区域S上随机投掷一点,该点落在区域A的概率为SA4、假如样本空间S可用一线段,或空间中某个区域表示,并且向S上随机投掷一点的含义如前述,则事件A的概率仍可用确定,只不过把

理解为长度或体积即可.几何概率

设样本空间为有限区域

,若样本点落入内任何区域G

中的概率与区域G

的测度成正比,则样本点落入G内的概率为例某人的表停了,他打开收音机听电台报时,已知电台是整点报时的,问他等待报时的时间短于十分钟的概率9点10点10分钟例两船欲停靠同一个码头,设两船到达码头的时间各不相干,而且到达码头的时间在一昼夜内是等可能的.

如果两船到达码头后需在码头停留的时间分别是1小时与2小时,试求在一昼夜内,任一船到达时,需要等待空出码头的概率.解设船1到达码头的时刻为x

,0

x<24

船2到达码头的时刻为y

,0

y<24设事件A

表示任一船到达码头时需要等待空出码头xy2424y=xy=x+1y=x-2概率的公理化理论由前苏联数学家柯尔莫哥洛夫1933年建立.

4.概率的公理化定义

即通过规定概率应具备的基本性质来定义概率.

设是随机试验E的样本空间,若对于E

的每一事件A,都有一个实数P(A)与之对应,则称之为事件A的概率,只要满足下面的三条公理:非负性:规范性:可列可加性:其中为两两互斥事件,三条公理:

非负性:

规范性:

可列可加性:其中为两两互斥事件,1.概率的性质基本性质加法公式性质1加法公式因为1=P(S)=P(A)+P(

)AA

性质2

逆事件公式对任一事件A

,有

性质2在概率的计算上很有用,如果正面计算事件A的概率不容易,而计算其对立事件的概率较易时,可以先计算,再计算P(A).注意:再由由可加性

设A、B是两个事件,若,则有性质3减法公式移项得

对任意两个事件A,B,有

BAB=AB+(B–A)P(B)=P(AB)+P(B–AB)

B-ABAB注意:又因再由性质3得证.

对任意两个事件A、B,有性质4

广义加法公式推广:一般:右端共有项.解法一:性质1解法二:计算事件A的概率不容易,而计算其对立事件的概率较易时,可以利用性质2。性质2例2

有r个人,设每个人的生日是365天的任何一天是等可能的,试求事件“至少有两人同生日”的概率.

为求P(A),先求P()解:令A={至少有两人同生日}={r个人的生日都不同}则

例已知P(A)=P(B)=P(C)=1/4,P(AB)=0,P(AC)=P(BC)=1/9则事件A,B,C全不发生的概率为.§1.3

概率的基本运算法则2.条件概率与乘法公式

在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.(1).条件概率

如在事件A发生的条件下求事件B发生的概率,将此概率记作P(B|A).

一般P(B|A)≠P(B)

P(B)=1/6,例如,掷一颗均匀骰子,B={掷出2点},

A={掷出偶数点},P(B|A)=?掷骰子

已知事件A发生,此时试验所有可能结果构成的集合就是A,于是P(B|A)=1/3.A中共有3个元素,它们的出现是等可能的,其中只有1个在集合B中,容易看到P(B|A)

设A、B为两事件,P(A)>0,则称为事件

A

发生的条件下事件

B

发生的条件概率.定义称为在事件B发生的条件下事件A的条件概率.同理条件概率也是概率,故具有概率的性质:

非负性

规范性

可列可加性

概率的一些重要性质都适用于条件概率.例如:性质计算2)可用缩减样本空间法1)用定义计算:P(A)>0

掷骰子例:B={掷出2点},

A={掷出偶数点}P(B|A)=A发生后的缩减样本空间所含样本点总数在缩减样本空间中B所含样本点个数例1掷两颗均匀骰子,已知第一颗掷出6点,问“掷出点数之和不小于10”的概率是多少?解法1:解法2:解:设A={掷出点数之和不小于10}B={第一颗掷出6点}应用定义在B发生后的缩减样本空间中计算例2

某单位100名员工做体检,95人血压正常(事件A),94人肝功能正常(事件B),92人两项都正常。随机抽一人,求P(A|B),P(B|A).用第二种方法简单由条件概率的定义:若已知P(A),P(B|A)时,可以反过来求P(AB).乘法公式利用条件概率求积事件的概率即乘法公式推广(2)乘法公式例3

盒中装有100个产品,其中3个次品,从中不放回地取产品,每次1个,求(1)取两次,两次都取得正品的概率;(2)取两次,取得正品次品各一件的概率;(3)取三次,第三次才取得正品的概率。解

令Ai

为第

i次取到正品(3)提问:第三次才取得正品的概率,是乘法公式应用举例

一个罐子中包含b个白球和r个红球.随机地抽取一个球,观看颜色后放回罐中,并且再加进c个与所抽出的球具有相同颜色的球.这种手续进行四次,试求第一、二次取到白球且第三、四次取到红球的概率.

(波里亚罐子模型)b个白球,r个红球于是W1W2R3R4表示事件“连续取四个球,第一、第二个是白球,第三、四个是红球.”

随机取一个球,观看颜色后放回罐中,并且再加进c个与所抽出的球具有相同颜色的球.

解:设Wi={第i次取出是白球},i=1,2,3,4Rj={第j次取出是红球},j=1,2,3,4b个白球,r个红球用乘法公式容易求出

当c>0时,由于每次取出球后会增加下一次也取到同色球的概率.这是一个传染病模型.每次发现一个传染病患者,都会增加再传染的概率.=P(W1)P(W2|W1)P(R3|W1W2)P(R4|W1W2R3)P(W1W2R3R4)

我们说,在事件B发生的条件下事件A的条件概率一般地不等于A的无条件概率.但是,会不会出现P(A)=P(A|B)的情形呢?

我们介绍了条件概率的概念,给出了计算两个或多个事件同时发生的概率的乘法公式,它在计算概率时经常使用,需要牢固掌握.独立性问题3事件的独立性显然P(A|B)=P(A)这就是说,已知事件B发生,并不影响事件A发生的概率,这时称事件A、B独立.B={第一次掷出6点},A={第二次掷出6点},将一颗均匀骰子连掷两次,设(1).

两事件的独立性§1.3

概率的基本运算法则由乘法公式知,当事件A、B独立时,有P(AB)=P(A)P(B)

用P(AB)=P(A)P(B)刻划独立性,比用

P(A|B)=P(A)

P(B|A)=P(B)

更好,它不受P(B)>0或P(A)>0的制约.P(AB)=P(B)P(A|B)定义设A,B为两事件,若则称事件A

与事件

B

相互独立

两事件独立的定义P26.26

在实际应用中,往往根据问题的实际意义去判断两事件是否独立.

由于“甲命中”并不影响“乙命中”的概率,故认为A、B独立.甲、乙两人向同一目标射击,记

A={甲命中},B={乙命中},A与B是否独立?例如(即一事件发生与否并不影响另一事件发生的概率)

一批产品共n件,从中抽取2件,设

Ai={第i件是合格品}i=1,2若抽取是有放回的,则A1与A2独立.因为第二次抽取的结果受到第一次抽取的影响.又如:因为第二次抽取的结果不受第一次抽取的影响.若抽取是无放回的,则A1与A2不独立.两事件相互独立的性质

若若

若则“事件A

与事件

B

相互独立”和“事件A

与事件

B

互斥”不能同时成立.请问:如图的两个事件是独立的吗?

即:若A、B互斥,且P(A)>0,P(B)>0,则A与B不独立.反之,若A与B独立,且P(A)>0,P(B)>0,

则A

、B不互斥.而P(A)≠0,P(B)≠0故A、B不独立我们来计算:P(AB)=0P(AB)≠P(A)P(B)即

四对事件任何一对相互独立,则其它三对也相互独立=P(A)[1-P(B)]=P(A)P()=P(A)-P(AB)P(A)=P(A-A

B)A、B独立故A与独立.概率的性质=P(A)-P(A)P(B)证明:仅证A与独立容易证明,若两事件A、B独立,则

也相互独立.(2).多个事件的独立性将两事件独立的定义推广到三个事件:

对于三个事件A、B、C,若

P(AB)=P(A)P(B)四个等式同时

P(AC)=P(A)P(C)成立,则称事件

P(BC)=P(B)P(C)A、B、C相互

P(ABC)=P(A)P(B)P(C)独立.

定义

n个事件A1,A2,…,An

相互独立是指下面的关系式同时成立定义推广到n个事件的独立性定义,可类似写出:独立随机事件的性质请注意多个事件两两独立与相互独立的区别与联系两两独立相互独立对n(n>2)个事件?例2

随机投掷编号为1与2的两个骰子

事件A

表示1号骰子向上一面出现奇数

B

表示2号骰子向上一面出现奇数

C

表示两骰子出现的点数之和为奇数

则但本例说明

不能由A,B,C

两两独立A,B,C

相互独立n个独立事件和的概率公式:设事件相互独立,则也相互独立也就是说,n个独立事件至少有一个发生的概率等于1减去各自对立事件概率的乘积.例4

加工某零件三道工序,三道工序的次品率分别为2%,1%,5%,假设各道工序互不影响,求加工出来的零件为次品的概率。记Ai={第i道工序出现次品}i=1,2,3利用独立性

P(A1∪A2∪A3)

=1-[1-P(A1)][1-P(A2)][1-P(A3)]

例5某型号高射炮的命中率为0.2,现有一架敌机即将入侵,如果欲以90%的把握击中它,则需配备此型号高射炮多少门?

设需配备

n门此型号高射炮,设事件Ai

表示第i

门炮击中敌机,故需至少配备11

门炮

一.全概率公式例1有三个箱子,分别编号为1,2,3,1号箱装有1个红球4个白球,2号箱装有2红3白球,3号箱装有3红球.某人从三箱中任取一箱,从中任意摸出一球,求取得红球的概率.解:记

Ai={球取自i号箱},

B={取得红球}即B=A1B+A2B+A3B,

且A1B、A2B、A3B两两互斥B发生总是伴随着A1,A2,A3之一同时发生,123P(B)=P(A1B)+P(A2B)+P(A3B)运用加法公式得将此例中所用的方法推广到一般的情形,就得到在概率计算中常用的全概率公式.对每一项运用乘法公式代入数据计算得:P(B)=8/15

设S为随机试验的样本空间,A1,A2,…,An是两两互斥的事件,且有P(Ai)>0,i=1,2,…,n,全概率公式称满足上述条件的A1,A2,…,An为完备事件组.则对任一事件B,有证明加法公式乘法公式

某一事件B的发生有各种可能的原因(i=1,2,…,n),如果B是由原因Ai所引起,则B发生的概率是

每一原因都可能导致B发生,故B发生的概率是各原因引起B发生概率的总和,即全概率公式.P(BAi)=P(Ai)P(B|Ai)全概率公式我们还可以从另一个角度去理解全概率公式的关键:数学模型完备事件组B表示产品为次品分别表示产品由甲、乙、丙车间生产完备事件组全概率公式

例3

甲、乙、丙三人同时对飞机进行射击,三人击中的概率分别为0.4、0.5、0.7.飞机被一人击中而击落的概率为0.2,被两人击中而击落的概率为0.6,若三人都击中,飞机必定被击落,求飞机被击落的概率.设B={飞机被击落}Ai={飞机被i人击中},i=1,2,3

由全概率公式

P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)依题意,P(B|A1)=0.2,P(B|A2)=0.6,

P(B|A3)=1

为求P(Ai),设Hi={飞机被第i人击中},i=1,2,3P(A1)=0.36;P(A2)=0.41;P(A3)=0.14.P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=0.458=0.36×0.2+0.41×0.6+0.14×1即飞机被击落的概率为0.458.加法公式独立性该球取自哪号箱的可能性最大?实际中还有下面一类问题“已知结果求原因”

这一类问题在实际中更为常见,它所求的是条件概率,是已知某结果发生条件下,求各原因发生可能性大小.

某人从任一箱中任意摸出一球,发现是红球,求该球是取自1号箱的概率.1231红4白或者问:

有三个箱子,分别编号为1,2,3,1号箱装有1个红球4个白球,2号箱装有2红球3白球,3号箱装有3红球.某人从三箱中任取一箱,从中任意摸出一球,发现是红球,求该球是取自1号箱的概率.1231红4白?记Ai={球取自i号箱},i=1,2,3;

B={取得红球}求P(A1|B).运用全概率公式计算P(B)将这里得到的公式一般化,就得到贝叶斯公式条件概率公式二.贝叶斯公式

该公式于1763年由贝叶斯(Bayes)给出.它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率.

设A1,A2,…,An是完备事件组,则对任一事件B,有

贝叶斯公式在实际中有很多应用,它可以帮助人们确定某结果发生的最可能原因.---后验概率在B已经发生的前提下,再对导致

B

发生的原因的可能性大小重新加以修正。

P(Ai)---先验概率它是由以往的经验得到的,是事件

B的原因。该产品由乙车间生产的可能性最大。贝叶斯公式例4

用甲胎蛋白检测法(AFP)诊断肝病,已知确实患肝病者被诊断为肝病的概率为0.95,未患肝病者被误诊为肝病的概率为0.02,假设人群中肝病的发病率为0.0004,现在有一个人被诊断为患有肝病,求此人确实为肝病患者的概率。设A={肝病患者},B={被诊断为患有肝病},由贝叶斯公式,

例袋中有3个白球,2个红球,有放回地取球

4次,每次一只,求其中恰有2个白球的概率.解古典概型设B表示4个球中恰有2个白球解二每取一个球看作是做了一次试验记取得白球为事件A,有放回地取4个球看作做了4重Bernoulli试验,记第

i次取得白球为事件Ai感兴趣的问题为:4次试验中A

发生2次的概率一般地,若则二项概率公式随机变量概念的产生

在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念.

上一章中,随机试验的结果用基本事件的集合表示。局限性全面性

为更好地揭示随机现象的规律性并利用数学工具描述其规律,有必要引入随机变量来描述随机试验的不同结果.电脑的使用寿命……1、有些试验结果本身与数值有关(本身就是一个数).

例如,掷一颗骰子面上出现的点数;

七月份济南的最高温度;2、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说,把试验结果数值化.例

检测一件产品可能出现的两个结果,

也可以用一个离散变量来描述随量机变这种对应关系§2.1随机变量及其分布函数设

是试验E的样本空间,若则称

X(

)为上的随机变量定义一.随机变量(randomvariable)按一定法则ω.X(ω)R随机变量是上的映射,此映射具有如下特点

定义域事件域

随机性

r.v.

X

的可能取值不止一个,

试验前只能预知它的可能的取值,但不能预知取哪个值

概率特性

X

以一定的概率取某个值

而表示随机变量所取的值时,一般采用小写字母x,y,z等.随机变量通常用大写字母X,Y,Z或希腊字母

,,等表示

有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来.引入随机变量的意义

如:单位时间内某电话交换台收到的呼叫次数用X表示,它是一个随机变量.

事件{收到不少于1次呼叫}{X1}{没有收到呼叫}{X=0}(1)任何随机现象可被r.v.描述(2)借助微积分方法研究规律

可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内.也可以说,随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,就象数学分析中常量与变量的区别那样.

随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.事件及事件概率随机变量及其取值规律离散型非离散型随机变量的分类

随机变量-----连续型所有取值可以逐个一一列举有无穷多取值不能一一列举充满一个区间

为了对离散型的和连续型的r.v以及更广泛类型的r.v给出一种统一的描述方法,引进了分布函数的概念.

f(x)xo0.10.30.6kPK012为X

的分布函数.

设X为r.v.,x是任意实数,称函数二.随机变量的分布函数定义

———|——>x

如果将X

看作数轴上随机点的坐标,那么分布函数F(x)

的值就表示X落在区间的概率.用分布函数计算

X落在(a,b]里的概率:

因此,只要知道了随机变量X的分布函数,它的统计特性就可以得到全面的描述.

分布函数是一个普通的函数,正是通过它,我们可以用数学分析的工具来研究随机变量.分布律的性质

非负性

归一性X~或用性质可以判断是否为分布律

F(x)是分段阶梯函数,在X

的可能取值xk处发生间断,间断点为第一类跳跃间断点,在间断点处有跃度

pk.离散型随机变量的分布函数其中.

例1

设汽车在开往甲地途中需经过4盏信号灯,每盏信号灯独立地以概率p允许汽车通过.出发地甲地首次停下时已通过的信号灯盏数,求X

的概率分布与p=0.4时的分布函数.令

X

表示•0•1•2•3•4xx]]]•]••kpk

012340.60.240.0960.03840.0256代入•0•1•2•3•4xF(x)o•o•1•o•o•o用分布律或分布函数来计算事件的概率例2

在上例中,分别用分布律与分布函数计算解或此式应理解为极限解:依据概率函数的性质:P(X=k)≥0,

a≥0从中解得欲使上述函数为概率函数应有这里用到了常见的幂级数展开式例3.设随机变量X的概率函数为:k=0,1,2,…,试确定常数a.常见离散型随机变量的分布例

设有N件产品,其中有M件次品,现从中任取n件,用X表示其中的次品数,求其分布律。超几何公式1.超几何分布超几何分布例某射手连续向一目标射击,直到命中为止,已知他每发命中率是p,求所需射击发数X

的分布律.解:显然,X可能取的值是1,2,…,

P(X=1)=P(A1)=p,

Ak

={第k发命中},k=1,2,…,2.几何分布

若随机变量X的概率分布如上式,则称X具有几何分布.不难验证:3.两点分布(0–1分布)是否超标等等.凡试验只有两个结果,常用0–1分布描述,如产品是否合格、人口性别统计、系统是否正常、电力消耗X01Pk

1-pp0<p<

1应用场合或4.

二项分布n

重Bernoulli试验中,X是事件A

在n次试验中发生的次数,P(A)=p,若则称X服从参数为n,p

的二项分布,记作0–1分布是n=1的二项分布二项分布的取值情况设.039.156.273.273.179.068.017.0024.00000123456780.273•由图表可见,当时,分布取得最大值此时的称为最可能成功次数xP•0•1•2•3•4•5•6•7•8设.01.06.14.21.22.18.11.06.02.01.002<.00101234567891011~20••xP•••••1•3•5•7•9••••0•2•4•6•8•10•20由图表可见,当时,分布取得最大值0.22•二项分布中最可能出现次数[x]表示不超过

x

的最大整数当(n+1)p=整数时,在k=(n+1)p与(n+1)p–1处的概率取得最大值当(n+1)p

整数时,在k=[(n+1)p]处的概率取得最大值例独立射击400次,命中率为0.01,

(1)k=[(n+1)p]

=[(400+1)0.01]=4(2)命中次数不少于3次的概率.求(1)最可能命中次数及相应的概率;

令X表示命中次数,则X~B(400,0.01)问题如何计算

泊松近似5.泊松分布若其中是常数,则称

X服从参数为的泊松(Poisson)分布.或记作应用场合在某个时段内:某地区拨错号的电话呼唤次数;市级医院急诊病人数;某地区发生的交通事故的次数.一本书一页中的印刷错误数.

泊松分布的图形特点:泊松分布中最可能出现次数当λ=整数时,在λ与λ–1处的概率取得最大值当λ

整数时,在[λ]处的概率取得最大值例一家商店由过去的销售记录知道,某种商品每月的销售数服从参数λ=5的泊松分布,为了以95%以上的把握保证不脱销,问商店在月底至少应进该种商品多少件?设该商品每月的销售数为X,月底应进m件商品P(X≤m)>0.95查泊松分布表得P(X>m)≤0.05m+1=10,m=9件二项分布的泊松近似

当试验次数n很大时,计算二项概率变得很麻烦,必须寻求近似方法.

我们先来介绍二项分布的泊松近似,后面我们将介绍二项分布的正态近似.

历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的.,则对固定的

k设Possion定理若X~B(n,p),则当n

较大,p

较小,则结论二项分布的极限分布是Poisson分布n>10,p<0.1时近似效果较好查附表3泊松分布表利用Poisson定理再求前例(2)命中次数不少于3次的概率.

令X表示命中次数,则X~B(400,0.01)泊松近似一.连续型随机变量定义

X

是随机变量,若存在一个非负可积函数

f(x),使得其中F(x)是它的分布函数则称X

是连续型r.v.

,f(x)是它的概率密度函数(p.d.f.),简记为d.f.xf(x)xF(x)分布函数与密度函数几何意义p.d.f.f(x)的性质

在f(x)

的连续点处,判定函数f(x)是否为r.vX的概率密度函数的充要条件.

f(x)xo面积为1注意:

概率为0(1)的事件未必不发生(发生)连续型r.v取任一指定值的概率为0即:a为任一指定值这是因为需要指出的是:由P(A)=0,不能推出由P(B)=1,不能推出

B=S对于连续型r.v.

Xbxf(x)axf(x)a

由上述性质可知,对于连续型随机变量,关心它在某一点取值的问题没有太大的意义;我们所关心的是它在某一区间上取值的问题.

二.常见连续型随机变量的分布(1)均匀分布若X的d.f.

为则称X

服从区间(a,b)上的均匀分布记作X

的分布函数为即X落在(a,b)内任何长为

d–c的小区间的概率与小区间的位置无关,只与其长度成正比.这正是几何概型的情形.xf(x)abxF(x)ba例(2)指数分布若X

的d.f.为则称X

服从

参数为

的指数分布记作X

的分布函数为

>0为常数1xF(x)0xf(x)0应用场合用指数分布描述的实例有:随机服务系统中的服务时间电话问题中的通话时间无线电元件的寿命动物的寿命

指数分布常作为各种“寿命”分布的近似若X~E(

),则故又把指数分布称为“永远年轻”的分布指数分布的“无记忆性”事实上命题例

有没有更简便方法?(3)正态分布若X的d.f.为则称X服从参数为

,2的正态分布记作X~N(,2)为常数,

亦称高斯(Gauss)分布

正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.

德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.

正态分布的图形特点

正态分布的密度曲线是一条关于对称的钟形曲线.特点是“两头小,中间大,左右对称”.

决定了图形的中心位置,决定了图形中峰的陡峭程度.

正态分布的图形特点—位置参数

—形状参数f(x)的性质:

图形关于直线x=

对称,即在x=

时,f(x)取得最大值在x=

±

时,曲线

y=f(x)在对应的点处有拐点曲线

y=f(x)以x轴为渐近线曲线

y=f(x)的图形呈单峰状f(+x)=f(-x)各种测量的误差;人体的生理特征;工厂产品的尺寸;农作物的收获量;海洋波浪的高度;金属线抗拉强度;热噪声电流强度;学生的考试成绩;正态分布是应用最广泛的一种连续型分布正态分布的重要性

正态分布是概率论中最重要的分布,这可以由以下情形加以说明:⑴.正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的.可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布.⑵.正态分布有许多良好的性质,这些性质是其它许多分布所不具备的.⑶.正态分布可以作为许多分布的近似分布.

正态分布由它的两个参数μ和σ唯一确定,当μ和σ不同时,是不同的正态分布.标准正态分布下面我们介绍一种最重要的正态分布一种重要的正态分布是偶函数,分布函数记为其值有专门的表供查.——标准正态分布N(0,1)密度函数-xx

标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.

根据定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则~N(0,1)

设对一般的正态分布:X~N(

,

2)其分布函数作变量代换例

附表4例设X~N(1,4),求P(0

X1.6)解

附表4例例

3

原理设

X~N(

,

2),求解一次试验中,X落入区间(

-3,

+3)的概率为0.9974,而超出此区间可能性很小由3

原理知,当标准正态分布的上

分位数u

设X~N(0,1),0<

<1,称满足的点u

为X的上

分位数

z

常用数据例7

设测量的误差X~N(7.5,100)(单位:米)

问要进行多少次独立测量,才能使至少有一次误差的绝对值不超过10米的概率大于0.9?解设A

表示进行n次独立测量至少有一次误差的绝对值不超过10米n>3故至少要进行4次独立测量才能满足要求.设r.v.X

的分布律为由已知函数g(x)可求出r.v.Y的所有可能取值,则Y

的概率分布为离散型随机变量函数的分布如果g(xk)中有一些是相同的,把它们作适当并项即可.一般,若X是离散型r.v,X的分布律为X~则Y=g(X)例1

已知

X

的概率分布为Xpk-1012求Y

1=2X–1与

Y2=X

2

的分布律解Y1pi-3-113Y2pi1014Y2pi014已知

X的d.f.f(x)或分布函数求Y=g(X)的d.f.方法:(1)从分布函数出发(2)用公式直接求d.f.

连续型随机变量函数的分布

对于连续型随机变量,在求Y=g(X)的分布时,关键的一步是把事件

{g(X)≤y}

转化为X在一定范围内取值的形式,从而可以利用X

的分布来求P{g(X)≤y}.方法一从分布函数出发解:设Y的分布函数为FY(y),例设X~求Y=2X+8的概率密度.FY(y)=P{Yy}=P(2X+8y)=P{X}=FX()于是Y的密度函数故注意到0<x<4时,

即8<y<16

此时Y=2X+8解当a>0时,例已知X的d.f.为为常数,且

a

0,求fY(y)当a<0时,故例如设X~N(,2),Y=aX+b,则Y~N(a+b,a2

2)特别地,若X~N(

,

2),则例设

X具有概率密度,求Y=X2的概率密度.求导可得当y>0时,

注意到Y=X20,故当y0时,解:设Y和X的分布函数分别为和

,则Y=X2

的概率密度为:例如,设X~N(0,1),其概率密度为:

从上述两例中可以看到,在求P(Y≤y)的过程中,关键的一步是设法从{g(X)≤y}中解出X,从而得到与{g(X)≤y}等价的X的不等式.例如,用代替{2X+8≤y}{X}用代替{X2

y}

这样做是为了利用已知的

X的分布,从而求出相应的概率.这是求r.v的函数的分布的一种常用方法.其中,此定理的证明与前面的解题思路类似.定理

设连续型r.vX具有概率密度fX(x),又设y=g(x)单调可导,其反函数为则Y=g(X)是一个连续型r.v,其概率密度为方法二用公式前例设X~求Y=2X+8的概率密度.

二维随机变量的联合分布函数定义设(X,Y)为二维r.v.对任何一对定义了一个二元实函数F(x,y),称为二维r.v.(X,Y)的分布函数,即(记为)的概率实数(x,y),事件分布函数的几何意义如果用平面上的点(x,y)表示二维r.v.(X,Y)的一组可能的取值,则F(x,y)表示

(X,Y)的取值落入图所示角形区域的概率.(x,y)xy(X,Y)

落在矩形区域内的概率可用分布函数表示

yxox1x2y1y2(X,Y)(x2,y2)(x2,y1)(x1,y2)(x1,y1)联合分布函数的性质xy(x,y)xy①固定x,对任意的y1<y2,固定y,对任意的x1<x2,F(x0,y0)=F(x0+0,y0)F(x0,y0)=F(x0,y0+0)对每个变量单调不减②对每个变量右连续③F(x,y1)

F(x,y2)F(x1,y)

F(x2,y)定义若二维r.v.(X,Y)所有可能的取值为有限多个或无穷可列多个,则称

(X,Y)为二维离散型r.v.

要描述二维离散型r.v.的概率特性及其与每个r.v.之间的关系常用其联合概率分布和边缘概率分布二维离散型r.v.及其概率分布联合分布律设(X,Y)的所有可能的取值为则称为二维r.v.(X,Y)的联合概率分布也简称概率分布

或分布律显然,x1xi

XY

(X,Y)的联合分布律y1yj二维离散r.v.的联合分布函数已知联合分布律可以求出其联合分布函数的求法⑴利用古典概型直接求;⑵利用乘法公式由题意知,(X=i,Y=j)的取值情况是:i=1,2,3,且是等可能的;j

取不大于i

的正整数。由乘法公式求得(X,Y)的分布律。例设随机变量X

在1,2,3三个数中等可能地取值,另一个随机变量

Y

在1~X

中等可能地取一整数值,试求(X,Y)的分布律。

解§3.1二维随机变量及其分布3.二维连续型随机变量定义

设二维r.v.(X,Y)的分布函数为

F(x,y),若存在非负可积函数f(x,y),

使得对于任意实数

x,y

有则称(X,Y)为二维连续型r.v.

f(x,y)为(X,Y)的联合概率密度函数简称概率密度函数简记p.d.f.联合密度的性质(3)

在的连续点处(4)

若G

是平面上的区域,则例设r.v.(X,Y)的联合d.f.

为(2)常用连续型二维随机变量分布

G是平面上的有界区域,面积为A

若r.v.(X,Y)的联合d.f.为则称(X,Y)服从区域G上的均匀分布区域G上的均匀分布,记作U(G)则

G1

G,设G1的面积为A1,若(X,Y)服从区域G上的均匀分布,例

设(X,Y)~G

上的均匀分布,

f(x,y);

P(Y>X2);(X,Y)在平面上的落点到

y

轴距离小于0.3的概率.求解

(1)y=x10xy1G(2)y=x2(3)y=x10xy10.3若r.v.(X,Y)的联合d.f.为则称(X,Y)服从参数为

1,

12,

2,

22,

的正态分布,记作(X,Y)~N(

1,

12;

2,

22;

)

其中

1,

2>0,-1<<1.二维正态分布边缘分布边缘分布也称为边沿分布或边际分布二维随机变量的边缘分布函数xyxxyy由联合分布函数边缘分布函数,逆不真.例设随机变量(X,Y)的联合分布函数为其中A,B,C

为常数.

确定A,B,C

;求X和Y的边缘分布函数;求P(X>2).解

(1)(2)(3)二维离散型随机变量的边缘分布由联合分布律可确定边缘分布律1x1xi

pi•p1•pi•p•jp•1p•jyjy1XY

联合分布律及边缘分布律例(P55.1)

设随机变量X

在1,2,3三个数中等可能地取值,另一个随机变量

Y

在1~X

中等可能地取一整数值,试求X,Y的边缘分布律。1例箱子里装有4只白球和2只黑球,在其中随机地取两次,每次取一只。考虑两种试验:(1)有放回抽样,(2)不放回抽样。我们定义随机变量X,Y如下,写出X和Y的联合分布律和边缘分布律。(1)有放回抽样YX

010

11(2)不放回抽样YX

1010

1已知联合密度可以求得边缘密度二维连续型随机变量的边缘分布yo1x2Dyo1x2Dyo1x2D例在第一章中,我们介绍了条件概率的概念.在事件B发生的条件下事件A发生的概率推广到随机变量设有两个随机变量X,Y,在给定Y取某个值的条件下,求X的概率分布.这个分布就是条件分布.一.离散型随机变量的条件分布律设(X,Y)是离散型随机变量,其分布律为

P(

X=xi,Y=yj

)=pij

,i,j=1,2,...(X,Y)关于X和关于Y的边缘分布律分别为:

由条件概率公式自然地引出如下定义:定义:设(X,Y)是二维离散型随机变量,对于固定的j,若P(Y=yj

)>0,则称为在Y=yj

条件下随机变量X的条件分布律.同样对于固定的i,若P(X=xi)>0,则称为在X=xi条件下随机变量Y的条件分布律.条件分布是一种概率分布,它具有概率分布的一切性质.例如:例(P55.1)设随机变量X

在1,2,3三个数中等可能地取值,另一个随机变量

Y

在1~X

中等可能地取一整数值,求Y=1时,X的条件分布律。1联合分布与边缘分布X123将表中第一列数据代入得条件分布二.连续型随机变量的条件分布设(X,Y)是二维连续型随机变量,由于

P(X=x)=0,P(Y=y)=0所以不能直接代入条件概率公式,先利用极限的方法来引入条件分布函数的概念。定义:给定y,设对于任意固定的正数,

P(y-<Y

y+

)>0,若对于任意实数x,存在,则称其为在条件Y=y下X的条件分布函数,记为FX|Y(

x|

y)=

P(

X

x

|Y=y

).由条件分布函数可以引出条件概率密度在条件Y=y下X的条件分布函数定义例已知求解同理,例设求解y=x11y=x11当0<y<1时,y当0<x<1时,y=x11x例已知求解y=x11当fX(x)>0时,即0<x<1时,当fX(x)=0时,f(x,y)=0故用分布函数表示,即设X,Y是两个r.v,若对任意的x,y,有则称X,Y相互独立.

它表明,两个r.v相互独立时,联合分布函数等于两个边缘分布函数的乘积.X与Y

独立即对一切i,j

有离散型连续型二维随机变量

(X,Y)

相互独立,则边缘分布完全确定联合分布X与Y

独立对任何x,y有二维连续r.v.(X,Y)相互独立证对任何x,y有取相互独立命题故将代入即得例已知(X,Y)的联合d.f.为(1)(2)讨论X,Y是否独立?解(1)由图知边缘d.f.为显然,故X,Y相互独立11(2)由图知边缘d.f.为显然,故X,Y不独立11例(P55.1,P63.1)

设随机变量X

在1,2,3三个数中等可能地取值,另一个随机变量

Y

在1~X

中等可能地取一整数值,试问X,Y的独立性。1不独立例(P59.1)箱子里装有4只白球和2只黑球,在其中随机地取两次,每次取一只.问X,Y的独立性.(1)有放回抽样YX

010

11独立已知r.v.(X,Y)的概率分布,

g(x,y)为已知的二元函数,转化为(X,Y)的事件问题方法求Z=g(X,Y)的概率分布当(X,Y)为离散r.v.时,Z

也离散离散型二维r.v.的函数例

设二维r.v.(X,Y)的概率分布为XYpij-112-10求的概率分布解

根据(X,Y)的联合分布可得:PX+YXY(X,Y)(-1,-1)

(-1,0)

(1,-1)

(1,0)

(2,-1)

(2,0)-2-1011210-10-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论