《概率论与数理统计》(韩旭里-谢永钦版)教案_第1页
《概率论与数理统计》(韩旭里-谢永钦版)教案_第2页
《概率论与数理统计》(韩旭里-谢永钦版)教案_第3页
《概率论与数理统计》(韩旭里-谢永钦版)教案_第4页
《概率论与数理统计》(韩旭里-谢永钦版)教案_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE概率论与数理统计主编:韩旭里,谢永钦复旦大学出版社第一章概率论的基本概念引言:自然现象分两类:1确定性现象.2随机现象.

1在一定条件下必然发生的现象,称为确定性现象.——特点:在相同的条件下,重复进行实验或观察,它的结果总是确定不变的。

2在一定的条件下,可能出现这样的结果,也可能出现那样的结果,而试验或观察前,不能预知确切的结果。称为随机现象.——特点:即在相同的条件下,重复进行观测或试验,它的结果未必是相同的。虽然在个别试验中,其结果呈现出不确定性,但是人们经过长期实践并深入研究之后,发现在大量重复试验或观察下,这类现象的结果呈现出某种规律性——这种在大量重复试验或观察中,所呈现出的固有规律性称之为统计规律性概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科.概率论的有关应用:概率论是数学的一个分支,它研究随机现象的数量规律,概率论的应用几乎遍及所有的科学领域,例如天气预报、地震预报、产品的抽样调查,在通讯工程中概率论可用以提高信号的抗干扰性、分辨率等等.总之:概率论与数理统计在自然科学和社会科学的很多领域都具有非常广泛的应用.我对此不再展开介绍了.§1样本空间、随机事件1.1随机试验(E)试验的特点:

1,可在相同条件下重复地进行;

2,每次试验的可能结果不止一个,并且能事先明确所有可能的结果.

3,进行一次试验之前不能确定哪一个结果会出现.试验的例:

E1:抛一枚硬币,观察正面H,反面T出现的现象.

E2:将一枚硬币掷三次,观察正面H,反面T出现的情况.

E3:将一枚硬币抛掷三次,观察出现正面的次数.

E4:抛一颗骰子,观察出现的点数.

E5:记录某城市120急救电话台一昼夜接到的呼唤次数.

E6:在一批灯泡中任取一只,测试它的寿命.

E7:记录某地一昼夜的最高温度和最低温度.1.2样本空间、随机事件(一)样本空间对于随机试验,尽管在每次试验之前不能预知试验的结果,但试验的所有可能的结果组成的集合是已知的,将随机试验E的所有可能结果组成的集合称为E的样本空间,记为Ω={ω1,ω2,ω3,…}.样本空间的元素ω1,ω2,ω3,…,即E的每个基本结果,称为样本点.例:

E1:抛一枚硬币,观察正面H,反面T出现的现象.

Ω1:{H,T}

E2:将一枚硬币掷三次,观察正面H,反面T出现的情况.

Ω2:{HHH,HHT,HTH,THH,HTT,THT,TTH,TTT};

E3:将一枚硬币抛掷三次,观察出现正面的次数.

Ω3:{0,1,2,3};

E4:抛一颗骰子,观察出现的点数.

Ω4:{1,2,3,4,5,6};

E5:记录某城市120急救电话台一昼夜接到的呼唤次数.

Ω5:{0,1,2,3,...};

E6:在一批灯泡中任取一只,测试它的寿命.

Ω6:{t|t0}

E7:记录某地一昼夜的最高温度和最低温度.

Ω7:{(x,y)|T0xyT1},这里x表示最低温度,y表示最高温度.并设这一地区的温度不会小于T0,也不会大于T1.(二)随机事件称试验E的样本空间S的子集为E的随机事件,简称事件.在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生.

特别,由一个样本点组成的单点集,称为基本事件.例如,掷一次硬币的实验E1有两个基本事件{H}和{T};掷一次骰子的实验E4有6个基本事件{1},{2},{3},{4},{5},{6}.样本空间S包含所有的样本点,它是S自身的子集,在每次试验中它总是发生的,称为必然事件,空集不包含任何样本点,它也作为样本空间的子集,它在每次试验中都不发生,称为不可能事件.几个事件的例子:

例1:在E2:掷三次硬币观察正反面出现情况中事件A1:"第一次出现的是H",即

A1={HHH,HHT,HTH,HTT}.

事件A2:"三次出现同一面",即

A2={HHH,TTT}

在E6:测试任取的一只灯泡寿命中,事件A3:"寿命小于1000小时",即

A3={t|0t<1000}(三)事件间的关系与事件的运算事件是一个集合,因而事件间的关系与事件的运算按照集合论中集合间的关系和集合运算来处理.下面给出这些关系和运算在概率论中的提法.并根据"事件发生"的含义,给出它们在概率论中的含义.

设试验E的样本空间为S,而A,B,Ak(k=1,2,...)是S的子集.

通常喜欢用一个矩形来代表S,其中的子区域代表一个事件.1,若AB,则称事件B包含事件A,这是指的事件A发生必然导致事件B发生.

若AB且BA,即A=B,则称事件A与事件B相等.2,事件AB={x|xA或xB}称为事件A与事件B的和事件.当且仅当A,B中至少有一个发生时,事件AB发生.3,事件AB={x|xA且xB}称为事件A与事件B的积事件.当且仅当A,B同时发生时,事件AB发生.AB也记作AB4,事件AB={x|xA且xB}称为事件A与事件B的差事件,当且仅当A发生,B不发生时事件A--B发生.5.若AB=,则称事件A与事件B是互不相容的,或互斥的,这指的是事件A与事件B不能同时发生,基本事件是两两互不相容的.6,若AB=S且AB=,则称事件A与事件B互为逆事件,又称事件A与事件B互为对立事件,这指的是对每次试验而言,事件A,B中必有一个发生,且仅有一个发生.A的对立事件记为在进行事件运算时,经常要用到下述定律.设A,B,C为事件,则有

交换律:AB=BA;AB=BA.

结合律:A(BC)=(AB)C;

A(BC)=(AB)C.

分配律:A(BC)=(AB)(AC);

A(BC)=(AB)(AC);(可推广到有穷或可数无穷情形)

德•摩根律:例2试验为掷三次硬币,事件A1:"第一次出现的是H",事件A2:"三次出现同一面",

A1={HHH,HHT,HTH,HTT},

A2={HHH,TTT},

A1A2={HHH,HHT,HTH,HTT,TTT},

A1A2={HHH},

A2-A1={TTT},§2概率、古典概型2.1频率,概率频率1)定义在相同条件下,进行了n次试验,在这n次试验中,事件A发生的次数k称为事件A发生的频数.比值k/n称为事件A发生的频率,并记成fn(A).2)频率基本性质:

1,0fn(A)1;

2,fn(S)=1;

3,若A1,A2,...,Ak是两两互不相容的事件,则

fn(A1A2...Ak)=fn(A1)+fn(A2)+...+fn(An事件A发生的频率表示A发生的频繁程度,fn(A).大,事件发生越频繁,在试验中,发生可能性就大2)频率基本性质:

3)历史上的掷硬币试验试验者抛掷次数n正面出现次数m正面出现频率m/n德.摩尔根204810610.518蒲丰404020480.5069皮尔逊1200060190.5016皮尔逊24000120120.5005维尼30000149940.4998大量实验证实,当重复试验的次数增大时,频率fn(A)呈现出稳定性,逐渐稳定于某个常数,我们称之为事件A的概率P(A),这叫大数定律.但是从纯数学的角度看,概率无非是赋予事件A的一个实数.(故我们用概率来表示事件A在一次试验中发生的可能性的大小)

因此,从纯数学的观点看问题,只要对每个事件赋予一个满足一定性质的实数就行,是不关心概率在实际中的情况的.数学对实际的应用,都属于某种方式的数学建模.概率1)定义设E是随机试验,S是它的样本空间,对于E的每一事件A赋予一个实数,记为P(A),称为事件A的概率,如果集合函数P(•)满足下列条件:

1,非负性:对于每一个事件A,有P(A)0;

2,规范性:对于必然事件S,有P(S)=1;

3,可列可加性:设A1,A2,...是两两互不相容事件,即对于ij,AiAj=,i,j=1,2,...,则有

P(A1A2...)=P(A1)+P(A2)+... (3.1)

概率P(A)2)概率性质性质1P()=0.证则令An=f(n=1,2,...),则由概率的可列可加性(3.1)得注:不可能事件的概率为0,逆命题不成立(见第二章)性质2(有限可加性)若A1,A2,...,An是两两互不相容的事件,则有

P(A1A2...An)=P(A1)+P(A2)+...+P(An)

证令An+1=An+2=...=,即有AiAj=f,i¹j,i,j=1,2,由(3.1)式得性质3设A,B是两个事件,若AB,则有

P(B-A)=P(B)-P(A) P(B)P(A) 证由AB知B=A(B-A)(参见),且A(B-A)=,再由概率的有限可加性(3.2),得

P(B)=P(A)+P(B-A),

又由概率的非负性1,P(B-A)0知

P(B)P(A).性质4对于任一事件A,P(A)1

证因AS,由性质3得

P(A)P(S)=1

性质5(逆事件的概率)对任一事件A,有性质6(加法公式)对任意两事件A,B有P(AÈB)=P(A)+P(B)-P(AB).证因AB=A(B-AB)(参见),且A(B-AB)=,ABB,故由(3.2)及(3.3)得

P(AB)=P(A)+P(B-AB)

=P(A)+P(B)-P(AB).

(3.5)式还可推广到多个事件,例如,设A,B,C为任意三个事件,则有P(AÈBÈC)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC) 例1.4:P92.2等可能概型(古典概型)1)定义:§1中所说的试验E1:抛一枚硬币,观察正反两面出现的情况,E4:掷一枚骰子,观察出现的点数,它们具有两个共同的特点:

1,试验的样本空间只包含有限个元素;

2,试验中每个基本事件发生的可能性相同.

具有上面两个特点的试验称为等可能概型,也称为古典概型.设试验的样本空间为S={e1,e2,...,en}.由于在试验中每个基本事件发生的可能性相同,即有

P({e1})=P({e2})=...=P({en}).

又由于基本事件是两两互不相容的,于是

1=P(S)=P({e1}{e2}...{en})=

P({e1})+P({e2})+...+P({en})=nP({ei}),2)计算公式若事件A包含k个基本事件,即这里i1,i2,...,ik是1,2,...,n中某k个不同的数.则有(4.1)式就是等可能概型中事件A的概率的计算公式例1将一枚硬币抛掷三次.(1)设事件A1为"恰有一次出现正面",求P(A1);(2)设事件A2为"至少有一次出现正面",求P(A2).

解(1)考虑§1中E2的样本空间:

S2={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}.

而 A1={HTT,THT,TTH}.

故由(4.1)式,得注意:1)若本题考虑§1中E3的样本空间:

S3={0,1,2,3}

则由于各个基本事件发生的可能性不相同,就不能利用(4.1)来计算P(A1)和P(A2).因而对本题来说,考虑样本空间S2才能顺利计算有关事件的频率.2)当样本空间元素较多时,一般不一一列出,只分别求S和A中元素的个数例2一口袋装有6只球,其中4只白球,2只红球.从袋中取球两次,每次随机地取一只.考虑两种取球方式:(a)第一次取一只球,观察其颜色后放回袋中,搅匀后再取一球.这种取球方式叫做放回抽样.(b)第一次取一球不放回袋中,第二次从剩余的球中再取一球.这种取球方式叫做不放回抽样,试分别就上面两种情况求(1)取到的两只球都是白球的概率;(2)取到的两只球颜色相同的概率;(3)取到的两只球中至少有一只是白球的概率.解(a)放回抽样的情况.以A,B,C分别表示事件"取到的两只球都是白球","取到的两只球都是红球","取到的两只球中至少有一只是白球",易知"取到两只颜色相同的球"这一事件即为AB,而由于AB=,得(b)不放回抽样的情况例3将n只球随机地放入N(Nn)个盒子中去,试求每个盒子至多有一只球的概率(设盒子的容量不限).

解将n只球放入N个盒子,每种放法是一基本事件,共有NN...N=Nn种不同放法,而每个盒子中至多放一只球共有N(N-1)...[N-(n-1)]种不同放法,因而所求概率为许多问题和本例有相同的数学模型.例如,假设每人的生日在一年365天的任一天是等可能的,即都等于1/365,则随机选取n(365)个人,他们的生日各不相同的概率为因而,n个人中至少有两人生日相同的概率为经计算可得下述结果:n20233040p0.4110.5070.7060.891n5064100p0.9700.9970.9999997关于组合例4设有N件产品,其中有D件次品,今从中任取n件,问其中恰有k(kD)件次品的概率是多少?

解所求的概率为(4.2)式即所谓超几何分布的概率公式.例5袋中有a只白球,b只红球,k个人依次在袋中取一只球,(1)作放回抽样;(2)作不放回抽样,求第i(i=1,2,...,k)个人取到白球(记为事件B)的概率(ka+b).

解(1)放回抽样的情况,显然有(2)不放回抽样的情况.各人取一只球,每种值得注意的是P(B)与i无关,即k个人取球,尽管取球的先后次序不同,各人取到白球的概率是一样的,大家机会相同.另外还值得注意的是放回抽样的情况与不放回抽样的情况下P(B)是一样的.例6在1~2000的整数中随机地取一个数,问取到的数即不能被6整除,又不能被8整除的概率是多少?

解设A为事件"取到的数能被6整除",B为事件"取到的数能被8整除",则所求概率为又由于一个数同时能被6与8整除,就相当于能被24整除,因此,由例7将15名新生随机地平均分配到三个班级中去,这15名新生中有3名是优秀生.问(1)每一个班级各分配到一名优秀生的概率是多少?(2)3名优秀生分配在同一班级的概率是多少?

解15名新生平均分配到三个班级中的分法总数为每一种分配法为一基本事件,且由对称性易知每个基本事件发生的可能性相同.(1)将3名优秀生分配到三个班级使每个班级都有一名优秀生的分法共3!种,对于这每一种分法,其余12名新生平均分配到三个班级中的分法共有12!/(4!4!4!)种.因此,每一班级各分配到一名优秀生的分法共有

(3!12!)/(4!4!4!)种.于是所求概率为(2)将3名优秀生分配在同一班级的分法共有3种.对于这每一种分法,其余12名新生的分法(一个班级2名,另两个班级各5名)有

12!/(2!5!5!)种,因此3名优秀生分配在同一班级的分法共有(312!)/(2!5!5!)种,于是,所求概率为例8某接待站在某一同曾接待过12次来访,已知所有这12次接待都是在周二和周四进行的,问是否可以推断接待时间是有规定的.

解假设接待站的接待时间没有规定,而各来访者在一周的任一天中去接待站是等可能的,那么,12次接待来访者都是在周二,周四的概率为212/712=0.0000003.而"概率很小的事件在一次试验中实际上几乎是不发生的"(称之为实际推断原理),因此可以推断接待站不是每天都接待来访者.即认为接待时间是有规定的.作业2.3几何概型§3条件概率、全概率公式3.1条件概率条件概率是概率论中的一个重要概念,所考虑的是事件A已发生的条件下,事件B发生的概率.。一般情况下,

例1,掷一颗均匀骰子,A={掷出2点},B={掷出偶数点},P(A)=1/6,P(A|B)=?已知事件B发生,此时试验所有可能结果构成的集合就是B,B中共有3个元素,它们的出现是等可能的,其中只有1个在集A中于是P(A|B)=1/3.容易看到例1将一枚硬币抛掷两次,观察其出现正反面的情况.设事件A为"至少有一次为H",事件B为"两次掷出同一面".现在求已知事件A已经发生条件下事件B发生的概率.

样本空间为S=(HH,HT,TH,TT},A={HH,HT,TH},B={HH,TT}.已知事件A已发生,知道"TT"不可能发生.即知试验所有可能结果所成的集合就是A,A中共有3个元素,其中只有HHB.于是,在A发生的条件下B发生的概率,记为P(B|A),为另外,易知既有对于一般古典概型问题,若仍以P(B|A)记事件A已经发生的条件下B发生的概率,则关系式(5.1)仍然成立.事实上,设试验的基本事件总数为n,A所包含的基本事件数为m(m>0),AB所包含的基本事件数为k,即有定义设A,B是两个事件,且P(A)>0,称为在事件A发生条件下事件B发生的条件概率.(二)条件概率性质不难验证,条件概率P(|A)符合概率定义中的三个条件,即1,非负性:对任一事件B,有P(B|A)02,规范性:对于必然事件S,有P(S|A)=1;3,可列可加性:设B1,B2,...,是两两互斥事件,既然条件概率符合上述三个条件,上节中对概率重要结果都适用于条件概率.例如,对于任意事件B1,B2有

P(B1B2|A)=P(B1|A)+P(B2|A)-P(B1B2|A).

条件概率P(A|B)实质就是缩减了样本空间上的事件的概率。由于已知事件B已经发生,原样本空间S缩减为B,在该空间上再进一步计算事件A发生的概率(三)条件概率的计算(1)用定义计算:(2)在缩减的样本空间上计算条件概率P(A|B)实质就是缩减了样本空间上的事件的概率。由于已知事件B已经发生,原样本空间S缩减为B,在该空间上再进一步计算事件A发生的概率P(A|B)=1/3.B发生后的缩减样本空间所含样本点总数B={掷出偶数点}={2,4,6};A={掷出2点}={2}在缩减样本空间中A所含样本点个数

例2一盒子装有4只产品,其中有3只一等品,1只二等品,从中取产品两次,每次任取一只,作不放回抽样.设事件A为"第一次取到的是一等品",事件B为"第二次取到的是一等品".试求条件概率P(B|A).解易知此属古典概型问题.将产品编号,1,2,3号为一等品;4号为二等品.以(i,j)表示第一次,第二次分别取到第i号,第j号产品.试验E(取产品两次,记录其号码)的样本空间为

S={(1,2),(1,3),(1,4),(2,1),(2,3),(2,4),...,(4,1),(4,2),(4,3)},共12个基本事件组成,

A={(1,2),(1,3),(1,4),(2,1),(2,3),(2,4),(3,1),(3,2),(3,4)},共9个基本事件组成,

AB={(1,2),(1,3),(2,1),(2,3),(3,1),(3,2)}.

共6个基本事件组成.按(5.2)式,得条件概率也可以直接按条件概率的含义来求P(B|A).我们知道,当A发生以后,试验E所有可能结果的集合就是A,A中有9个元素,其中只有(1,2),(1,3),(2,1),(2,3),(3,1),(3,2)属于B,故可得(二)乘法定理由条件概率的定义(5.2)可得乘法定理设P(A)>0,则有P(AB)=P(A)P(B|A) (5.3)上式容易推广到多个事件的积事件的情况.例如,设A,B,C为事件,且P(AB)>0,则有 P(ABC)=P(A)P(B|A)P(C|AB) (5.4)一般地,设A1,A2,...,An为n个事件,n2,且P(A1A2...An1)>0,则有P(A1A2...An)=P(A1)P(A2|A1P(An1|A1A2...An2)P(An|A1A2...An设袋中装有r只红球,t只白球.每次自袋中任取一只球,观察其颜色后放回,并再放入a只与所取出的那只球同色的球.若在袋中连续取球四次,试求第一,二次取到红球且第三,四次取到白球的概率.

解以Ai(i=1,2,3,4)表示事件"第i次取到红球",例4某种透镜,第一次落下时打破的概率为1/2,若第一次落下来未打破,第二次落下打破的概率为7/10,若前两次落下未打破,第三次落下打破的概率为9/10.试求透镜落下三次而未打破的概率.

解以Ai(i=1,2,3)表示事件"透镜第i次落下打破",以B表示事件"透镜落下三次而未打破,则3.2全概率公式和贝叶斯公式

(一)定义设S为试验E的样本空间,B1,B2,...,Bn为E的一组事件,若

(1)BiBj=,ij,i,j=1,2,...,n;

(2)B1B2...Bn=S,

则称B1,B2,...,Bn为样本空间的一个划分.

若B1,B2,...,Bn是样本空间的一个划分,那么,对于每次试验,事件B1,B2,...,Bn中必有一个且仅有一个发生.划分的图示(二)全概率公式定理设试验E的样本空间为S,A为E的事件,B1,B2,...,Bn为S的一个划分,且P(Bi)>0(i=1,2,...,n),则(5.6)式称为全概率公式.证因为

A=AS=A(B1B2...Bn)=AB1AB2...ABn,

由假设P(Bi)>0(i=1,2,...,n),且(ABi)(ABj)=,ij,

i,j=1,2,...,n得到

P(A)=P(AB1)+P(AB2)+...+P(ABn)

=P(A|B1)P(B1)+P(A|B2)P(B2)+...

+P(A|Bn)P(Bn).(三)贝叶斯公式定理设试验E的样本空间为S.A为E的事件,B1,B2,...,Bn为S的一个划分,且P(A)>0,P(Bi)>0(i=1,2,...,n),则下面的贝叶斯公式成立:证由条件概率的定义及全概率公式得特别在(5.6),(5.7)中取n=2,并将B1记为B,此时这两个公式是常用的.例5某电子设备厂所用元件由三家元件厂供给,根据以往纪录有以下数据:元件制造厂次品率提供元件的份额10.020.1520.010.8030.030.05解设A表示"取到次品",Bi表示"产品来自第i家厂",则B1,B2,B3构成划分,P(B1)=0.15,P(B2)=0.8,P(B3)=0.05,P(A|B1)=0.02,P(A|B2)=0.01,P(A|B3)=0.03.

(1)由全概率公式

P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|B3)P(B3)

=0.0125.

(2)由贝叶斯公式例6对以往数据分析结果表明,当机器调整得良好时,产品的合格率为98%,而当机器发生某种故障时,其合格率为55%.每天早上调整良好的概率为95%.试求已知某日早上第一件产品是合格品时,机器调整良好的概率是多少?

解设A为事件"产品合格",B为"机器调整良好"这就是说,当生产出第一件产品是合格品时,此时机器调整良好的概率为0.97.这里,概率0.95是由以往的数据分析得到的,叫做先验概率.而在得到信息(即生产出第一件产品是合格品)之后再重新加以修正的概率(即0.97)叫做后验概率.有了后验概率我们就能对机器的情况有进一步的了解.例7某种症断癌症的试验有如下效果:若以A表示事件"试验反应为阳性",以C表示事件"被论断者有癌症",则有P(A|C)=0.95,,设被试人患有癌症的概率为0.005,即P(C)=0.005,试求P(C|A).解已知P(A|C)=0.95,,由贝叶斯公式本题结果表明,虽然这两个概率都比较高,但若将此试验用于普查,则有P(C|A)=0.087,亦即其正确性只有8.7%(平均1000个具有阳性反应的人中大约只有87人确患有癌症),如果不注意到这一点,将会得出错误的诊断,这也说明,若将P(A|C)和P(C|A)混淆了会造成不良的后果.§4独立性设A,B是试验E的两事件,若P(A)>0,可以定义P(B|A).一般,A的发生对B发生的概率是有影响的,这时P(B|A)P(B),只有在这种影响不存在时才会有P(B|A)=P(B),?P(AB)=P(B|A)P(A)=P(A)P(B)例1设试验E为"抛甲,乙两枚硬币,观察正反面出现的情况".设事件A为"甲币出现H",事件B为"乙币出现H".E的样本空间为

S={HH,HT,TH,TT}.

则有可知P(B|A)=P(B),而P(AB)=P(A)P(B).事实上,由题意,甲币是否出现正面与乙币是否出现正面是互不影响的.这就是说,已知事件A发生,并不影响事件B发生的概率,这时称事件A、B独立1.两个事件的独立性(一)定义设A,B是两事件,如果满足等式

P(AB)=P(A)P(B), (6.1)

则称事件A,B相互独立,简称A,B独立.注意必然事件与任何事件独立不可能事件与任何事件独立

容易知道,若P(A)>0,P(B)>0则A,B相互独立与A,B互不相容不能同时成立.

定理一设A,B是两事件,且P(A)>0,若A,B相互独立,则P(B|A)=P(B)反之亦然.定理二若事件A与B相互独立,则,和都相互独立.证因为,得, .因此相互独立,由此可立即推出相互独立,又推出相互独立.例1从一副不含大小王的扑克牌中任取一张,记A={抽到K},B={抽到的牌是黑色的}问事件A、B是否独立?解:1)由于P(A)=4/52=1/13,P(B)=26/52=1/2P(AB)=2/52=1/26可见,P(AB)=P(A)P(B)说明事件A、B独立2)由于P(A)=1/13,P(A|B)=2/26=1/13P(A)=P(A|B),说明事件A、B独立.2.多个事件的独立性定义设A,B,C是三个事件,如果满足等式则称事件A,B,C相互独立.一般,设A1,A2,...,An(n2)个事件,如果对于其中任意2个,任意3个,...,任意n个事件的积事件的概率,都等于各事件概率之积,则称事件A1,A2,...,An相互独立.由定义可以得到以下两点推论.

1若事件A1,A2,...,An(n2)相互独立,则其中任意k(2kn)个事件也是相互独立的.

2若n个事件A1,A2,...,An(n2)相互独立,则将A1,A2,...,An中任意多个换成它们的对立事件,所得的n个事件仍相互独立.3若A1,…,An相互独立,则即:n个独立事件至少有一个发生的概率等于1减去各自对立事件概率的乘积.4注意:多个事件两两独立与相互独立的区别与联系两事件相互独立的含义是它们中一个已发生,不影响另一个发生的概率.在实际应用中,对于事件的独立性常常是根据事件的实际意义去判断.一般,若由实际情况分析,A,B两事件之间没有关联或关联很微弱,那就认为它们是相互独立的.例如,A,B分别表示甲乙两人患感冒.如果甲乙两人的活动范围相距甚远,就认为A,B相互独立,若甲乙两人是同住在一个房间里的,那就不能认为A,B相互独立了.例1甲,乙,丙三人同时独立向同一目标射击,他们射中目标的概率分别为0.4,0.5,0.7。求(1)至少有一人射中目标的概率(2)恰有一人射中目标的概率例2P23例1.23例3一个元件(或系统)能正常工作的概率称为元件(或系统)的可靠性.如图,设有4个独立工作的元件1,2,3,4按先串联再并联的方式联接.设第i个元件的可靠性为pi(i=1,2,3,4),求系统的可靠性.121234解以Ai(i=1,2,3,4)表示事件第i个元件正常工作,以A表示系统正常工作.

A=A1A2A3A4

由系统的独立性,得系统的可靠性:

P(A)=P(A1A2)+P(A3A4)-P(A1A2A3A4)

=P(A1)P(A2)+P(A3)P(A4)-P(A1)P(A2)P(A3)P(A4)

=p1p2+p3p4例4要验收一批(100件)乐器,验收方案如下:自该批乐器中随机地取3件测试(设3件乐器的测试是相互独立的),如果3件中至少有一件在测试中被认为音色不纯,则这批乐器就被拒绝接收.设一件音色不纯的乐器经测试查出其为音色不纯的概率为0.95,而一件音色纯的乐器经测试被误认为不纯的概率为0.01.如果已知这100件乐器中恰有4件音色不纯的.试问这批乐器被接收的概率是多少?解设以Hi(i=0,1,2,3)表示事件"随机地取出3件乐器,其中恰有i件音色不纯",H0,H1,H2,H3是S的一个划分,以A表示事件"这批乐器被接收".已知一件音色纯的乐器,经测试被认为音色纯的概率为0.99,而一件音色不纯的乐器,经测试被误认为音色纯的概率为0.05,并且3件乐器的测试是相互独立的,于是有

P(A|H0)=(0.99)3,P(A|H1)=(0.99)20.05,

P(A|H2)=0.99(0.05)2,P(A|H3)=(0.05)3,例5甲乙两人进行乒乓球比赛,每局甲胜的概率为p,p1/2.问对甲而言,采用三局二胜制有利,还是采用五局三胜制有利.设各局胜负相互独立.

解采用三局二胜制,甲最终获胜,其胜局的情况是:"甲甲"或"乙甲甲"或"甲乙甲".而这三种结局互不相容,于是由独立性得甲最终获胜的概率为

p1=p2+2p2(1-p).采用五局三胜制,甲最终获胜,至少需比赛3局(可能赛3,4,5局),最后一局必需是甲胜,前面甲需胜二局.例如,共赛4局,可能的情况是:"甲乙甲甲","乙甲甲甲","甲甲乙甲",且这三种结局互不相容,由独立性得甲获胜的概率为而p2--p1=3p2(p-1)2(2p-1)当p>(1/2)时p2>p1;故对甲来说采用五局三胜制为有利.作业:伯努利(Bernoulli)试验概型n重伯努利试验概型:(试验重复独立的进行n次概率模型)1试验可重复n次,每次试验只有两个可能的结果:且2每次试验的结果与其他次试验无关——称为这n次试验是相互独立的n重伯努利试验中事件A出现k次的概率记为设E为伯努利试验,且P(A)=p(0<p<1),对于n重伯努利概型En,事件A恰好发生k(0£k£n)次的概率为k=0,1,2,…,n例1某射手的命中率为0.9,他独立重复向目标射击5次,求他恰好命中4次的概率.(2)他恰好不命中3次的概率.例2P25例1.25,1.26,1.27第二章随机变量及其分布§1随机变量§1.1随机试验引入随机变量X,X的概率为了全面研究随机试验的结果,揭示随机现象的统计规律性,将随机试验的每一个可能结果与一个实数对应起来,将随机试验的结果数量化,引入随机变量的概念.

在随机试验完成时,人们常常不是关心试验结果本身,而是对于试验结果联系着的某个数感兴趣.例1在一袋中装有编号分别为1,2,3的3只球.在袋中任取一只球,放回.再取一只球,记录它们的编号.计算两只球的号码之和.试验的样本空间S={e}={i,j},i,j=1,2,3.这里i,j分别表示第一,二球的号码.以X记两球号码之和,对于每一个样本点e,X都有一个值与之对应,如图所示.试验的样本空间S={e}={i,j},i,j=1,2,3.这里i,j分别表示第一,二球的号码.以X记两球号码之和,对于每一个样本点e,X都有一个值与之对应,如图所示.例2将一枚硬币抛掷3次.关心3次抛掷中,出现H的总次数,而对H,T出现的顺序不关心.比如说,我们仅关心出现H的总次数为2,而不在乎出现的是"HHT","HTH"还是"THH".以X记三次抛掷中出现H的总数,则对样本空间S={e}中的每一个样本点e,X都有一个值与之对应,即有样本点HHHHHTHTHTHHHTTTHTTTHTTTX的值32221110§1.2随机变量(一)定义设随机试验的样本空间为S={e}.X=X(e)是定义在样本空间S上的实值单值函数.称X=X(e)为随机变量.有许多随机试验,它的结果本身是一个数,即样本点e本身是一个数.我们令X=X(e)=e,则X就是一个随机变量.例如,用Y记某车间一天的缺勤人数,以W记录某地区第一季度的降雨量,以Z记某工厂一天的耗电量,以N记某医院某一天的挂号人数.那么Y,W,Z,N都是随机变量.

本书中,一般以大写字母如X,Y,Z,W,...表示随机变量,而以小写字母x,y,z,w,...表示实数.(二)随机变量的概率规律随机变量的取值随试验结果而定,而试验的各个结果出现有一定的概率,因而随机变量的取值有一定的概率.例如,在例2中X取值为2,记成{X=2},对应于样本点的集合A={HHT,HTH,THH},这是一个事件,当且仅当事件A发生时有{X=2}.则称P(A)=P{HHT,HTH,THH}为{X=2}的概率,即P(X=2)=P(A)=3/8.类似地有一般,若L是一个实数集合,将X在L上取值写成{XÎL}.它表示事件B={e|X(e)ÎL},即B是由S中使得X(e)ÎL的所有样本点e所组成的事件.此时有

P{XÎL}=P(B)=P{e|X(e)ÎL},

随机变量的取值随试验的结果而定,在试验之前不能预知它取什么值,且它的取值有一定的概率.这些性质显示了随机变量与普通函数有着本质的差异.有了随机变量,随机试验中的各种事件,就可以通过随机变量的取值表达出来。随机变量概念的产生是概率论发展史上的重大事件。引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.§2.1离散型随机变量及其分布律有些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这种随机变量称为离散型随机变量.例如§1例2中的随机变量X,它只可能取0,1,2,3四个值,它是一个离散型随机变量.又如某城市的120急救电话台一昼夜收到的呼唤次数也是离散型随机变量.若以T记某元件的寿命,它所可能取的值充满一个区间,是无法按一定次序一一列举出来的,因而它是一个非离散型的随机变量.本节讨论离散型随机变量要掌握一个离散型随机变量X的统计规律,必须且只需知道X的所有可能取的值及取每一个可能值的概率.

设X所有可能取的值为xk(k=1,2,...),而

P{X=xk}=pk,k=1,2, (2.1)

由概率的定义,pk满足如下两个条件称(2.1)式为离散型随机变量X的分布律.分布律也可用表格的形式来表示:Xx1x2...xn...pkp1p2...pn...例1设一汽车在开往目的地的道路上需经过四组信号灯,每组信号灯以1/2概率允许或禁止汽车通过.以X表示汽车首次停下时,它已通过的信号灯组数(设各组信号灯的工作是相互独立的),求X的分布律.

解以p表示每组信号灯禁止汽车通过的概率,易知X的分布律为X01234pkp(1-p)p(1-p)2p(1-p)3p(1-p)4P={X=k}=(1-p)kp,k=0,1,2,3,P{X=4}=(1-p)4.以p=1/2代入得X01234pk0.50.250.1250.06250.0625下面介绍三种重要的离散型随机变量.(一)两点分布,(0-1)分布设随机变量X只可能取x1,x2(0与1)两个值,它的分布律是

P(X=x1)=1-p,P(X=x2)=p(0<p<1),

则称X服从两点分布或(0-1)分布.

(0-1)分布的分布律也可写成X01pk1-pp对一个随机试验中的任何一个给定的事件A,0<P(A)<1,都可以根据事件A定义一个服从0-1分布的随机变量来描述.例如,对新生婴儿的性别进行登记,检查产品的质量是否合格,某车间的电力消耗是否超过负荷以及前面多次讨论过的"抛硬币"试验等都可以用(0-1)分布的随机变量来描述.(0-1)分布是经常遇到的一种分布.定义随机变量X表示n重伯努利试验中事件A发生的次数,我们来求它的分布律.X所有可能取的值为0,1,2,...,n.由于各次试验是相互独立的,因此事件A在指定的k(0kn)次试验中发生,在其它nk次试验中A不发生的概率为若随机变量X的分布律为:n,p的二项分布,记为X~b(n,p).q=1-p,二项分布模型:描叙n重贝努力试验中时间A出现次数,射手射击n次中中的次数的,抛n次硬币出现正面次数概率分布等等例2按规定,某种型号电子元件的使用寿命超过1500小时的为一级品.已知一大批产品的一级品率为0.2,现在从中随机地抽查20只.问20只元件中恰有k只(k=0,1,...,20)为一级品的概率是多少?

解这是不放回抽样.但由于这批元件的总数很大,且抽查的元件数量相对于元件的总数来说又很小,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.检查一只元件看它是否为一级品,检查20只元件相当于20重贝努利试验,以X记其中一级品总数,则X~b(20,0.2).由(2.6)式即得所求概率为将计算结果列表如下:P(X=0)=0.012P(X=4)=0.218P(X=8)=0.022P(X=1)=0.058P(X=5)=0.175P(X=9)=0.007P(X=2)=0.137P(X=6)=0.109P(X=10)=0.002P(X=0)=0.205P(X=7)=0.055

P{X=k}<0.001,当k³11时计算结果的图形:注意:当n很大时,计算麻烦,给出当n很大而p或者1-p很小时的近似计算公式:定理2.1泊松定理设npn=(>0是一常数,n是任意正整数),则对任意一固定的非负整数k,有此定理表明,当n很大p很小时,二项分布的泊松近似,常被应用于研究稀有事件(即每次试验中事件A出现的概率p很小)例3某人进行射击,设每次射击命中率为0.02,独立射击400次,试求至少击中两次的概率.

解将一次射击看成是一次试验.设击中的次数为X,则X~b(400,0.02).X的分布律为P{X2}=1-P{X=0}-P{X=1}=1-(0.98)400-400(0.02)(0.98)399=0.9972.例4设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是0.01,且一台设备的故障能由一个人处理,考虑两种配备维修工人的方法,其一是由4人维护,每人负责20台;其二是由3人共同维护80台.试比较这两种方法在设备发生故障时不能及时维修的概率的大小.

解按第一种方法,以X记"第1人维护的20台中同一时刻发生故障的台数",以Ai(i=1,2,3,4)表示事件"第i人维护的30台中发生故障不能及时维修".则知80台中发生故障而不能及时维修的概率为

P(A1A2A3A4)P(A1)=P(X2).

而X~b(20,0.01),故有即有P(A1A2A3A4)0.0169.按第二种方法,以Y记80台中同一时刻发生故障的台数.此时,Y~b(80,0.01),故80台中发生故障而不能及时维修的概率为可以看出,在后一种情况下尽管任务重了(每人平均维护约27台),但工作效率不仅没有降低,反而提高了.泊松分布设随机变量X所有可能取的值为0,1,2,...,而取各个值的概率为其中>0是常数.则称X服从参数为的泊松分布,记为X~p().易知,P(X=k)0,k=0,1,2,...,且有泊松定理知,泊松分布常被应用于研究稀有事件(即每次试验中事件A出现的概率p很小)§2.2随机变量的分布函数对于非离散型随机变量X,由于其可能取的值不能一个一个地列举出来,因而就不能像离散型随机变量那样可以用分布律来描述它.另外,通常所遇到的非离散型随机变量取任一指定的实数值的概率都等于0.再者,在实际中,对于这样的随机变量,例如误差,元件的寿命T等,我们并不会对误差=0.05(mm),寿命T=1251.3(h)的概率感兴趣,而是考虑误差落在某个区间的概率,寿命T大于某个数的概率.因而我们转而去研究随机变量所取的值落在一个区间的概率,P{x1<Xx2}.由于

P{x1<Xx2}=P{xx2}-P{xx1}.

所以我们只需知道P{xx2}和P{xx1}就可以了.由此引出分布函数的概念.

(一)定义设X是一个随机变量,x是任意实数.函数F(x)=P{Xx}

称为X的分布函数.

对于任意实数x1,x2(x1<x2),有

P{x1<Xx2}=P{xx2}-P{xx1}=F(x2)-F(x1), (3.1)

称为X的分布函数.分布函数是一个普通的函数,正是通过它,我们能用数学分析的方法来研究随机变量.

如果将X看成是数轴上的随机点的坐标,则分布函数F(x)在x处的函数值就表示X落在区间(-,x]上的概率.

分布函数F(x)具有以下的基本性质:

1,F(x)是一个不减函数.

事实上,由(3.1)式对于任意实数x1,x2(x1<x2)有

F(x2)F(x1)=P{x1<Xx2}0.2,0F(x)1,如图,将区间端点x沿数轴无限向左移动(即x-,则"随机点X落在x左边"这一事件趋于不可能事件,从而其概率趋于0,即有F(-)=0;又若将点x无限右移,(即x),则"随机点X落在x左边"这一事件趋于必然事件,从而其概率趋于1,即有F()=1.3F(x+0)=F(x),即F(x)是右连续的(例1设随机变量X的分布律为X-123pk1/41/21/4解X仅在x=-1,2,3三点处其概率0,而F(x)的值是Xx的累积概率值,由概率的有限可加性,知它即为小于或等于x的那些xk处的概率pk之和.X-123pk1/41/21/4由此得F(x)的图形为一般,设离散型随机变量X的分布律为P{X=xk}=pk,k=1,2,

由概率的可列可加性得X的分布函数为这里和式是对于所有满足xkx的k求和的.分布函数F(x)在x=xk(k=1,2,...)处有跳跃,其跳跃值为pk=P{X=xk}.重点:已知分布函数F(x)求分布律{pk},已知分布律求分布函数作业第二章习题请提问§3连续型随机变量及其概率密度§3。1引入例2一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离.试求随机变量X的分布函数.

解若x<0,则{Xx}是不可能事件,于是

F(x)=P{Xx}=0.

若0x2,由题意,P{0Xx}=kx2,k是某一常数,为了确定k的值,取x=2,有P{0X2}=22k.但已知P{0X2}=1,故得k=1/4,即于是若x2,由题意{Xx}是必然事件,于是 F(x)=P{Xx}=1.综上所述,即得X的分布函数为它的图形是一条连续曲线如图所示另外,容易看到本例中的分布函数F(x)对于任意x可以写成形式其中这就是说,F(x)是非负函数f(t)在区间(,x)上的积分,在这种情况下我们称X为连续型随机变量.对照f(x)和F(x)图形(一)定义:如果对于随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称概率密度.连续型随机变量的分布函数是连续函数.在实际应用中遇到的基本上是离散型或连续型随机变量.本课程只讨论这两种随机变量.(二)概率密度f(x)性质:由性质2知道介于曲线y=f(x)与Ox轴之间的面积等于1.由性质3知道X落在区间(x1,x2]的概率P{x1<Xx2}等于区间(x1,x2]上的曲线y=f(x)之下的曲边梯形面积.由性质4在f(x)的连续点x处有看出概率密度的定义与物理学中的线密度的定义相类似,这就是为什么称f(x)为概率密度的原因.由(4.2)式知道,若不计高阶无穷小,有 P(x<Xx+dx)f(x)dx. (4.3)例1设随机变量X具有概率密度解f(x)的曲线形状如图所示(2)X的分布函数为F(x)与f(x)的对照图X的分布函数为对于连续型随机变量X来说,它取任一指定实数值a的概率均为0,即P{X=a}=0.事实上,设X的分布函数为F(x),x>0,则由

{X=a}{a-dx<Xa}得

0P{X=a}P{a-dx<Xa}=F(a)F(a-dx).

在上述不等式中令x0,并注意到X为连续型随机变量,其分布函数F(x)是连续的,即得P{X=a}=0. (4.4)因此,在计算连续型随机变量落在某一区间的概率时,可以不必区分该区间是开区间或闭区间或半闭区间.例如有

P{a<Xb}=P{aXb}=P{a<X<b}.

在这里,事件{X=a}并非不可能事件,但有P{X=a}=0.这就是说,若A是不可能事件,则有P(A)=0;反之,若P(A)=0,并不一定意味着A是不可能事件.

注意:以后当提到一个随机变量X的"概率分布"时,指的是它的分布函数;或者,当X是连续型时指的是它的概率密度,当X是离散型是指的是它的分布律.介绍三种重要的连续型随机变量均匀分布设连续型随机变量X具有概率密度则称X在区间(a,b)上服从均匀分布,记为X~U(a,b).如X~U(a,b),则它落在(a,b)中任意子区间内的概率只依赖于子区间的长度而与子区间的位置无关.任给长度为l的子区间(c,c+l),ac<c+lb,有由(4.1)式得X的分布函数为例2设电阻值R是一个随机变量,均匀分布在900~1100.求R的概率密度及R落在950~1050的概率.

解按题意,R的概率密度为指数分布设连续型随机变量X的概率密度为其中>0为常数,则称X服从参数为的指数分布.容易得到X的分布函数为f(x)的图形:如X服从指数分布,则任给s,t>0,有

P{X>s+t|X>s}=P{X>t} (4.9)

事实上性质(4.9)称为无记忆性.指数分布在可靠性理论和排队论中有广泛的运用.正态分布)定义设连续型随机变量X的概率密度为其中,(>0)为常数,则称X服从参数为的正态分布或高斯(Gauss)分布,记为X~N(2).显然f(x)0,下面来证明令(x-m)/s=t,得到2)f(x)的图形:f(x)具有的性质:

1,曲线关于x=对称.这表明对于任意h>0有

P{-h<X}=P{<X+h}.

2,当x=时取到最大值x离越远,f(x)的值越小.这表明对于同样长度的区间,当区间离越远,X落在这个区间上的概率越小.3,在x=处曲线有拐点.曲线以Ox轴为渐近线.4,固定(位置参数),(精度参数)越小,图形越陡,因而X落在附近的概率越大,若固定,改变图形平移,形状不变由(4.10)式得X的分布函数为3)标准正态分布当=0,=1时称X服从标准正态分布.其概率密度和分布函数分别用表示,即有易知 (4.15)人们已经编制了的函数表,可供查用(见附表2).引理若X~N(,2),则证:由此知Z~N(0,1).若X~N(,2)则它的分布函数F(x)可写成:则对于任意区间(x1,x2],有例如,设X~N(1,4),查表得设X~N(,2),由的函数表还能得到:

P{<X<+}=(1)(1)

=2(1)1=68.26%

P{2<X<+2}=(2)(2)=95.44%

P{3<X<+3}=(3)(3)=99.74%

我们看到,尽管正态变量的取值范围是(,),但它的值落在(-3,+3)内几乎是肯定的事.这就是人们所谈的"3"法则.例3将一温度调节器放置在贮存着某种液体的容器内.调节器整定在d°C,液体的温度X(以°C计)是一个随机变量,且X~N(d,0.52).(1)若d=90,求X小于89的概率.(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?

解(1)所求概率为(2)按题意需求d满足设X~N(0,1),若z满足条件

P{X>za}=a, 0<a<1, (4.18)

则称点za为标准正态分布的上a分位点.

由的对称性知z1-a=--za§4随机变量的函数的分布在实际中经常对某些随机变量的函数更感兴趣.例如,在一些试验中,所关心的随机变量往往不能直接由测量得到,而它却是某个能直接测量的随机变量的函数.比如我们能测量圆轴的直径d,而关心的却是截面积A=pid2/4.这里,随机变量A是随机变量d的函数.一般地,设X,Y是两个随机变量,y=g(x)是一个已知函数,如果当X取值x时,Y取值为g(x),则称Y是随机变量X的函数,记作Y=g(X).下面讨论如何由已知的随机变量X的概率分布去求得它的函数Y=g(X)(g()是已知的连续函数)的概率分布.一离散型随机变量函数的分布例1设随机变量X具有以下的分布律,试求Y=X+2,的分布律.X-1012pk0.20.30.10.4解Y所有可能值为1,2,3,4,由P{Y=1}=P{X+2=1}=P{X=-1}=0.2,P{Y=2}=P{X=0}=0.3P{Y=3}=P{X=1}=0.`P{Y=4}=P{X=1}=0.4写出Y的分布律Y=X+21234pk0.10.30.10.4步骤:1、确定Y的取值y1,y2,…yi…这里yi=g(xi)2、求概率P{Y=yi}=piP{X=xi}=pi3、列出概率分布表一般地,若X的分布列为Xx1x2……xk……Pp1p2……pk……则Y=g(X)的分布列为Yg(x1)g(x2)……g(xk)……Pp1p2……pk……如果g(xk)中有一些是相同的,把它们作适当并项即可.例1设随机变量X具有以下的分布律,试求Y=(X-1)2的分布律.X-1012pk0.20.30.10.4解Y所有可能值为0,1,4,由P{Y=0}=P{(X-1)2=0}=P{X=1}=0.1,P{Y=1}=P{X=0}+P{X=2}=0.7,P{Y=4}=P{X=-1}=0.2,Y014pk0.10.70.2二连续型随机变量函数的分布例2设随机变量X具有概率密度求变量Y=2X+8的概率密度.解分别记X,Y的分布函数为FX(x),FY(y).下面先来求FY(y).将FY(y)关于y求导数,得Y=2X+8的概率密度为例3设随机变量X~N(,2).试求X的线性函数Y=aX+b(a¹0)的概率密度.

1.当y=g(x)是单调函数定理设随机变量X具有概率密度fX(x),<x<,又设函数g(x)处处可导且恒有g'(x)>0(或恒有g'(x)<0),则Y=g(x)是连续型随机变量,其概率密度为其中=min(g(-),g()),=max(g(-),g()),h(y)是g(x)的反函数.证先设g'(x)>0.此时g(x)在(¥,¥)严格单调增加,它的反函数h(y)存在,且在()严格单调增加,可导.分别记X,Y的分布函数为FX(x),FY(y).

因Y在()取值,故当y£时,FY(y)=P{Y£y}=0;当y³时,FY(y)=P{Y£y}=1.

当<y<时,

FY(y)=P{Y£y}=P{g(X)£y}

=P{X£h(y)}=FX[h(y)].FY(y)=FX[h(y)].

将FY(y)关于y求导数,即得Y的概率密度对于g'(x)<0的情况同样可以证明,有合并(5.3),(5.4)式得证.如fX(x)在有限区间[a,b]以外等于零,只需成立在[a,b]上恒有g'(x)>0(或恒有g'(x)<0),上述定理依然成立,但此时有

=min[g(a),g(b)],=max[g(a),g(b)].例3设随机变量X~N(,2).试证明X的线性函数Y=aX+b(a¹0)也服从正态分布证明:见教材p54用公式法证明2.当y=g(x)是非单调函数对于分区间分段单调函数,可以分段利用公式求出密度函数,再求和例3设随机变量X具有概率密度fX(x),-<x<,求Y=X2的概率密度.

(思路:先求分布函数,再求导得概率密度)解分别记X,Y的分布函数为FX(x),FY(y).由于Y=X20,故当y0时FY(y)=0.当y>0时有将FY(y)关于y求导数,即得Y的概率密度为例题已知随机变量X~U[0,p],求Y=sinX的概率密度fY(y)从上述两例中可以看到,在求P(Y≤y)的过程中,关键的一步是设法从{g(X)≤y}中解出X,得一个与{g(X)≤y}等价的X的不等式这样做是为了利用已知的X的分布,从而求出相应的概率..总结:求随机变量函数Y=g(X)的概率密度的方法:法一:求分布函数法(先求分布函数,再求导得概率密度)法二:公式法(若严格单调或分段严格单调,):第三章多维随机变量及其分布3.1二维随机变量在很多实际问题中,需要考虑两个或两个以上的随机变量。先看两个随机变量:二维随机变量(X,Y)的性质不仅与X及Y有关,而且还依赖于这两个随机变量的相互关系。定义:设E是一个随机试验,他的样本空间是S,设XY是定义在同一样本空间S上的两个随机变量,则称X,Y为S上的二维随机向量(变量),简记(X,Y)注意:还可以类似推广到n维随机向量或随机变量(X1,X2,…XN)一维随机变量X——R1上的随机点坐标;二维随机变量(X,Y)——R2上的随机点坐标;……n维随机变量(X1,X2,…,Xn)———Rn上的随机点坐标。多维随机变量的研究方法也与一维类似,用分布函数、概率密度、或分布律来描述其统计规律。一联合分布函数1.定义设(X,Y)是二维随机变量,对任意的实数x,y,令F(x,y)=P({X£x}∩{Y£y})=P{X£x,Y£y}.则称F(x,y)为(X,Y)的联合分布函数。即F(x,y)为事件{X£x}与{Y£y}同时发生的概率。分布函数的几何意义如果用平面上的点(x,y)表示二维随机变量(X,Y)的一组可能的取值,则F(x,y)表示(X,Y)的取值落入下图所示的角形区域的概率即:随机点(X,Y)落在区域-∞<X≤x,-∞<Y≤y中的概率xyxy(x,y)2.F(x,y)的性质性质1对于x和y,F(x,y)都是单调不减函数,即若x1<x2,对任意的实数y,则有F(x1,y)£F(x2,y);若y1<y2,对任意的实数x,则有F(x,y1)£F(x,y2)性质2对于任意的实数x,y,均有0£F(x,y)£1,性质3对于x和y,F(x,y)都是右连续的,即对任意的实数x0和y0,均有F(x,y)=F(x0F(x,y)=F(x0,y),F(x,y)=FF(x,y)=F(x,y0)性质4若x1<x2,y1<y2,则P{x1<X£x2,y1<Y£y2}=F(x2,,y2)-F(x2,y1)-F(x1,y2)+F(x1,y1)>=0几何意义如下:(x(x2,y2)(x1,y1)xxy二.二维离散型随机变量及其联合分布律1定义如果二维随机变量(X,Y)全部可能取到的不同的值是有限对或可列无限多对,则称(X,Y)是离散型的随机变量.设二维离散型随机变量(X,Y)所有可能的取值为(xi,yj),i,j=1,2,...,取这些值的概率为pij=P{X=xi,Y=yj}i,j=1,2,……称上式为(X,Y)的联合分布律.2性质(1)pij³0,i,j=1,2,…(2)问:如何用表格表示(X,Y)分布情况?YXy1y2...yj...x1p11p12...p1j...x2p21p22...p2jxipi1pi2...pij答:见书例题3.1例3.2袋里有5个编号的球,其中1个球编号为1,有2个球编号均为2,有2个球编号均为3。每次从中任取两个球,以X和Y分别表示这两个球中编号最小的号码和最大的号码。求X和Y的联合分布律。解(X,Y)的全部可能取值为(1,2),(1,3),(2,2),(2,3),(3,3),5个球从中任取2个,共有C52=10种取法。试验样本点总数为10,YX2310.20.220.10.4300.1三.二维连续型随机变量及其联合概率分布1定义设二维随机变量(X,Y)的分布函数为F(x,y)。若存在非负函数f(x,y),对任意实数x,y有则称(X,Y)为连续型二维随机变量,且称函数f(x,y)为二维随机变量(X,Y)的联合密度函数,简称为联合密度或概率密度。可记为(X,Y)~f(x,y),(x,y)ÎR22性质:1)非负性2)归一性3)若f(x,y)在点(x,y)处连续,则4)设G是xOy平面上的一个区域,则有在几何上z=f(x,y)表示空间的一张曲面。由性质(2)知,介于该曲面和xy平面之间的空间区域的体积是1。由性质(4)知,的值等于以G为底,以曲面z=f(x,y)为顶的曲顶柱体的体积。例3.3设二维随机变量(X,Y)的联合概率密度函数为(1)求常数k;(2)求概率P(X+Y≤1)。···解得k=15确定积分区域例题3.4见教材p67四.常用的二维均匀分布和二维正态分布(一维推广)1.二维均匀分布设D为平面上的有界区域,D的面积大于零.若二维随机变量(X,Y)的联合密度为则称(X,Y)在D上服从均匀分布向平面上有界区域D上任投一质点,若质点落在D内任一小区域B的概率与小区域的面积成正比,而与B的形状及位置无关.则质点的坐标(X,Y)在D上服从均匀分布.例5设(X,Y)在圆域D={(x,y):x2+y2£r2}上服从均匀分布,其联合密度为求(1)P(r2/8£X2+Y2£r2/4);(2)(X,Y)的边缘密度函数2.若二维随机变量(X,Y)具有概率密度其中均为常数,其中均为常数,且则称(X,Y)为服从参数为的二维正态分布.二维正态分布的重要性质: 则由此性质看到,(X,Y)的边缘分布都与r无关,说明r不同,得到的二维正态分布也不同,但其边缘分布相同。因此边缘分布是不能唯一确定联合分布的,即使X,Y都是服从正态分布的随机变量,(X,Y)不一定是服从二维正态分布。二维正态分布的边缘分布必为一维正态分布,反之不真。3.2边缘分布函数一、二维随机变量的边缘分布函数1定义:二维随机变量(X,Y)作为一个整体,具有联合分布函数F(x,y),而X和Y都是随机变量,各自也有它们的分布函数,记X的分布函数为FX(x),称为随机变量(X,Y)关于X的边缘分布函数;Y的分布函数为FY(y),称为随机变量(X,Y)关于Y的边缘分布函数。由分布函数的定义可得到联合分布函数和边缘分布函数的关系2边缘分布的几何意义FX(x)的函数值表示随机点(X,Y)落入如下左图所示区域内的概率;FY(y)的函数值表示随机点(X,Y)落入如下右图所示区域内的概率。3联合分布函数与边缘分布函数的关系FX(x)=P{X£x}=P{X£x,-¥<Y<+¥}=F(x,+¥),FY(y)=P{Y£y}=P{-¥<X<+¥,Y£y}=F(+¥,y)例1:设求(X,Y)的边缘分布函数。例3.6设二维随机变量(X,Y)的联合分布函数为其中A,B,C为常数,x∈(-∞,+∞),y∈(-∞,+∞)(1)试确定A,B,C;(2)求X和Y的边缘分布函数;(3)求P(X>2)解(1)由联合分布函数性质2可知解得(3)由X的分布函数可得二.二维离散型随机变量的边缘分布律1若(X,Y)为离散型随机变量,则X,Y均为离散型随机变量。由(X,Y)的联合分布律P(X=xi,Y=yj}=pij,i,j=1,2,… i=1,2,…j=1,2,…它们分别是事件(X=xi)和(Y=yj)的概率,且有pi.≥0,p.j≥0称pi.=P{X=xi},i=1,2,…p.j=P{Y=yj},j=1,2,…两式分别为(X,Y)关于X和Y的边缘分布律,简称为(X,Y)的边缘分布律。以表格形式表示为YXy1y2…yj…P(X=xi)x1p11p12…p1j…

x2p21p22…p1j…

…xipi1pi1…pij…

…P(Y=yj)

…1例题3.6p69注意:联合分布律不同,而边缘分布律相同,仅有边缘分布律一般不能得到联合分布律。即联合分布律可以确定边缘分布律,而边缘分布律不一定能确定联合分布律。2联合分布律与边缘分布律的关系设二维离散型随机变量(X,Y)的联合分布律为pij=P{X=xi,Y=yi}i,j=1,2,…则三.二维连续型随机变量的边缘密度函数1.定义若(X,Y)为连续型随机变量,则X,Y均为连续型随机变量2.若(X,Y)是二维连续型随机变量,其联合密度函数是f(x,y),此时X和Y也是连续型随机变量,分别称X和Y的概率密度函数fX(x)和fY(y)为(X,Y)关于X和Y的边缘密度函数,简称为边缘密度。且有(3)f(x,y)与fX(x),fY(y)之间的关系例3.7设随机变量X和Y具有联合分布求X和Y边缘密度(可见书)(我们分析被积函数在xy平面上不为0的区域如下:)1)2)3.4随机变量的独立性一、两个随机变量的独立性定义设F(x,y)是二维随机变量(X,Y)的分布函数,FX(x),FY(y)分别是X与Y的边缘分布函数,若对一切x,y∈R,均有P(X≤x,Y≤y)=P(X≤x)•P(Y≤y)即F(x,y)=FX(x)•FY(y)则称随机变量X与Y是相互独立的。随机变量X与Y是相互独立的充要条件是事件(X≤x)与事件(Y≤y)相互独立。1若(X,Y)是二维离散型随机变量,其分布律为P(X=xi,Y=yj)=pij,i,j=1,2,…,则X与Y相互独立的充分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论