概率论与数理统计讲义稿_第1页
概率论与数理统计讲义稿_第2页
概率论与数理统计讲义稿_第3页
概率论与数理统计讲义稿_第4页
概率论与数理统计讲义稿_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Last revision on 21 December 2020 第一章随机事件与概率 随机事件 随机试验与样本空间 概率论约定为研究随机现象所作的随机试验应具备以下三个特征: (1) 在相同条件下试验是可重复的; (2) 试验的全部可能结果不只一个,且都是事先可以知道的; (3) 每一次试验都会出现上述可能结果中的某一个结果,至于是哪一个结果则事 前无法预知。 为简单计,今后凡是随机试验皆简称试验,并记之以英文字母E。称试验的每个可 能结果为样本点,并称全体样本点的集合为试验的样本空间,分别用希腊字母血和。表 示样本点及样本空间。 必须指出的是这个样本空间并不完全由试验所决定,它部分地取决

2、于实验的目的。假 设抛掷一枚硬币两次,出于某些目的,也许只需要考虑三种可能的结果就足够了,两次 都是正面,两次都是反面,一次是正面一次是反面。于是这三个结果就构成了样本空间 G。但是,如果要知道硬币出现正反面的精确次序,那么样本空间G就必须由四个可能 的结果组成,正面-正面、反面-反面、正面-反面、反面-正面。如果还考虑硬帀降落的 精确位置,它们在空中旋转的次数等事项,则可以获得其它可能的样本空间。 经常使用比绝对必要的样本空间较大的样本空间,因为它便于使用。比如,在前面的 例子中,由四个可能结果组成的样本空间便于问题的讨论,因为对于一个“均匀的硬帀 这四个结果是“等可能的。尽管这在有3种结果

3、的样本空间内是不对的。 例 E,:从最简单的试验开始,这些试验只有两种结果。在抛掷硬币这一试验中岀 现“正面”或“反面”;在检查零件质量时,可能是“合格”或“不合格* ;当用来模拟电子产 品旋转的方向时,结果是“左边”或者“右边”;在这些情况下样本空间c简化为:0 = 正 面,反面。 (l-p)2(B) 6p(l-p)2 (C) 3/72(1-77)2(D)6/异(I ) 12、设 48 是两个随机事件,且 0 P(A) 0, P(B I A) = P(B I A),则必有() (A) P(A I B) = P(A I B)(B) P(A I B) h P(A I B) (C) P(AB) =

4、 P(A)P(B)(D) P(AB) h P(A)P(B) 二、填空题 1、A, 3 是两随机事件,P( A) = 0.5 , P(B) = 0.7 ,则 P(AB) 。 2、A, 3 是两随机事件,P(A) = 0.3, P(AuB) = 0.5,则P(AB)=。 3、A, 3 是两随机事件,P(AB) = P(AB), P(A) = p ,则P(B) =。 4、一袋中有10件产品,其中3件次品,7件正品,从中不放回地取3次,则 “至少有两件次品的概率”为o 5、从5双不同的鞋子中任取4只,则此4只鞋子中至少有两只鞋子配成一双的 概率为o 6、设有“个人,每个人都等可能的被分配到N个房间中的

5、任意一间去住nN, 求(1)、指定的“个房间各有一个人住的概率为- (2)、恰有“ 个房间各有一个人住的概率为o 7、从(0,1)中任取两个数x和则满足条件的0,是常数)内掷一点,则原 点和该点的连线与x轴的夹角小于兰的概率为。 4 9、从长度为“的线段内任取两个点,将其分成三段,求它们可以构成一个三角形的概 率为- 10、试证对任意两个事件A与8.如果P(A)0,则有 P(B) 丽 11、设尸(如0, mo,证明若月与方相互独立,则力与方不互斥. 若力与万互斥,则月与尸不独立. 12、设两两相互独立的三事件力,B, C,满足:ABC= 0 ,尸(/)=尸(万)=尸(。0, k = l,2,(

6、2)为几=1。 jt-i 【例】若离散型随机变量X的概率分布为 求常数“的值。 解由概率分布的性质,有 所以 0 = 1/3。 二、三种常见离散型随机变量的分布 1(0-1)分布(或两点分布) 定义设随机变量X只可能取0、1两个值,它的概率分布为 PX = = p, =0 = 1-/? (0 /?1) 即PX =k = pK - pyk,k =0.1, (0 /? 1) 或 1 0 1 则称X服从参数为的(0-1)分布或两点分布。 只有两种可能结果的随机试验的概率分布都可用两点分布表求,如产品的“合格与 “不合格”;新生儿的“男”、“女”性别;射击目标“命中与“没命中”;以及掷硬帀的“出现正

7、面”与“出现反面”等等。 2二项分布 定义设随机试验E只有两种可能的结果:人或入,在相同条件下将E重复进行“ 次,各次试验结果互不影响,则称该“次试验为叶重独立试验,又称为重贝努利试 验。 若试验E中,事件A发生的概率P(A) = p ,(0p0是常数,则称X服从参数为几的泊松分布,记为可以证明其满足 分布律的两个条件。 般地,泊松分布可以作为描述大量重复试验中稀有事件出现的频数的概率分布情 况的数学模型,即当很大(n 20), 很小(5005),而乘积2 = np大小适中时,二 项分布b(n.p)可以用泊松分布作近似 C:P(l p)”“ 皿7P ,仏=0,1,2,) k 随机变量的分布函数

8、 般情况下,人们只对某个区间内的概率感兴趣,即研究下列四种可能的区间的 概率 只要利用一维坐标轴就分容易得出下列结论 PxX x2 = PX x2-PX x PXlXx2PX x2-PXXl-s Px,X x2 = PX x2-PXx-X PxjXx2 = PX x2-s-PX x, 所以,我们只须定义一个PXx形式就可以了,其他区间形式都可以用它表示出 来。 于是定义:|F(x) = PXx为X的分布函数它就是X落在任意区间(川上的概 率,本质上是一个累积函数,对于离散点,采用叠加,对于连续点,使用一元积分。 定义设X是随机变量,X是任意实数,函数 称为X的分布函数。 分布函数是一个普通的函

9、数,其定义域是整个实数轴在几何上,它表示随机变量 X的取值落在实数X左边的概率 分布函数具有性质: 1. 0 F(x) -KC 4. F(x + 0) = F(x),即 F(x)是右连续的。 上述全部可能的表示中.只有F(x-0),但F(x-O)hF(x),因为假如 F(-O) = F(xJ,那么,当离散型在旺点的概率不为零时,等式 PXx2 = PXlXx2就会出现矛盾,故F(x)不可能左连续。其中, P(X=xo) = F(xo)-F(ao-O)=F(a()- lim F(x)是计算离散型分布函数的重要公式。 又,上式中根本不可能出现F(x+O)的形式,F(x+O) = F对上述5种关系没

10、有任 何影响,即卩右连续F(兀+0)=尸(兀);且F(xo-O)F(xo)J。当然,由于连续 型在一点的概率恒为零.所以,连续型分布函数左连续和右连续同时成立。正是要求 F(x)右连续,才使F(x)成为分布函数的普适定义。 里园分布函数可以描述任何类型的随机变量,不仅可以描述连续型,还可以描述离散 型及其其他非连续型,但不同的随机变量可以有相同的分布函数。对连续型任一点的概 率等于零,而对非连续型任一点的概率不一定等于零。我们要重点掌握离散和连续两类 随机变量的分布规律。注意,存在既非离散型又非连续型的分布函数,如 0,x0 F(x) = gx, 0 x1 例设厅(X),对(x)为两个分布函数

11、,其相应的概率密度是连续函数,则必 为概率密度的是() (A) (C) /l(x)坊(x) (B) 2厶百 (D) fx)F2(x)+f2(x)Fx) 【例】设斤(x),爲(X)都是分布函数,常数0“0, + ” = 1,证明 F(x) = aFx)+bF2(X)也是分布函数,并举例说明分布函数不只是离散与连续两种。 证明:分布函数的三个基本条件: (1) F()F(x2) (2) limF(x) = O, lim F(x) = l xT-xt+x (3) F(x+O) = F(x) 所以,F(x)也是分布函数。 取:d = b = * ,并令 由于p(x)是不连续的分段函数,故即不是离散型,

12、又不是连续型。 0, xv-l 0 4-1 r 1 例设X的分布函数为F(x) = PXx=-.求X的概率分布。 0.O,1 S X 3 解:由于F(x)要求右连续,故等号必须加在号上。又由于每一区间的F(x)为常数, 故X具有离散型特征。F(x)在x = -l, 1, 3处有第一类跳跃间断点,即X在这些点的概 率不为零,即正概率点存在。计算如下 X的概率分布(即离散分布律)为 1 3 连续性随机变量及其概率密度 一、连续性随机变量及其概率密度 定义对随机变量X的分布函数F(x),如果存在非负函数fM ,使对任意实数匚 则X称为连续型随机变量.其中/(X)称为X的概率密度函数,简称概率密度。显

13、然, 改变概率密度/(X)在个别点的函数值不影响分布函数F(x)的取值。 概率密度/(对具有性质: 1. f(x) 0 ; 3对于任意实数Xx2, Aj X,有 Pxx X x2) = F(x2) - F(xJ = f(x)dx ; 4.若/(x)在点x连续,则有Fx) = f(x) o 概率密度f(x)表示的不是随机变量X取值x的概率,而是X在x处概率分布的密集 程度,/(x)的大小能反映出X在x领域内取值概率的大小, Px X x + Av a f (x)zlv o 【例】设连续型随机变量X具有概率密度 35 (1)确定常数R ; (2)求X的分布函数F(x) ; (3)求P-X0为常数,

14、则称X服从参数为几的指数分布,记为XE)。可以证明它满足 概率密度的两个最基本性质。 它的分布函数为 例 指数分布的特点是:“无记忆性” .BPP(x0Xx0) = P(Xx)o试证明 之。 P(A0 X )= P(x0 X x0) P(xX x0) P(Xx)=P(X 如) 例(2013数一)设随机变量Y服从参数为1的指数分布,a为常数且大于零,则 PYa=o 例设随机变量X服从参数为入的指数分布,且X落入区间(1,2)内的概率达到最大, 贝IJ入二- 3正态分布 定义设连续型随机变量X的概率密度为 -2吁 /(x) = t e 2b t -oox0)为常数 则称X服从参数为“b的正态分布,

15、记为x 。可以 证明它满足概率密度的两个最基本性质。 它的分布函数为 w dt, -oox+oo 当“ = 0,b = 1时,称X服从标准正态分布,记为XN(O,1),其概率密度和分布函 数分别为 易知 O(-X)= l-0(X)o 对于一般正态分布和标准正态分布,有以下关系: 引理 若XN(d),则Z =兰二 N(O,1)。由此得 b 【例】已知 XN( 求概率PX0, 15、设随机变量X的概率密度为f(x) = 0,x 2)维随机变量的情形. 二维随机变量的联合分布 定义:设(X, 丫)是二维随机变量,对于任意实数X、儿 称二元函数 为二维随机变量(X, X)的分布函数或随机变量X和Y的联

16、合分布函数,它表示随机事件 X x与Y S y同时发生的概率. 图31 图32 将二维随机变量(X, 丫)看成是平面上随机点的坐标,那么分布函数Fg y)在点 g y)处的函数值就是随机点(X, 丫)落在直线的左侧和直线K = y的下方的无穷 矩形区域内的概率(如图3-1) 有了分布函数F(as V),借助于图3-2,容易算出随机点(X,门落在矩形区域 内的概率为: Pxi Xxv Y y2 = F(xv y2)-F(xP y2) -F(x2, yJ + F(勺 y). 根据概率的定义和二维随机变量的定义,可得: 二维分布函数F(x, y)具有以下基本性质: (1) 0 F(x, y) ; (

17、2) F(x, y)关于变量x和y均单调非减,且右连续; (3) 对于任意固定的 y, F(yo y) = lim F(x, y) = 0 对于任意固定的也F(x,-oo)= lim F(x, y) = 0 F(s, oo) = 0: F(+s, + s) = 1 ; 对于任意xt x2, yt y2恒有: 二维离散型随机变量及其分布 定义:如果二维随机变量(X,门可能取的值为有限对或可列无穷对实数,则称 (X,门为二维离散型随机变量. 显然,(X, 丫)为二维离散型随机变量,当且仅当X和F均为离散型随机变量. 设二维离散型随机变量(X, 丫)所有可能的取值为(“,儿)(/, j = L 2,

18、-),且对应的概 率为 P(X = a;., Y = yj = p沪i, J = 1,2,. 则称上式为二维随机变量(X,门的概率分布或X与Y的联合概率分布. 由概率的定义可知:(1)心AO, i, ) = 1, 2.(2) “=1. 联合分布也常用表格表示,并称为X与丫联合概率分布表. 根据定义,离散型随机变量(X,门的联合分布函数 即对一切满足不等式A.x, y的心求和. 例盒子里有2个黑球、2个红球、2个白球,在其中任取2个球,以X表示取得的黑球 的个数,以丫表示取得的红球的个数,试写出X和Y的联合分布表,并求事件 X+Y的概率. 解:X、丫各自可能的取值均为0、1、2,由题设知,(X,

19、 丫)取(1, 2)、(2, 1)、 (2, 2)均不可能取其他值的概率可由古典概率计算.从6个球中任取2个一共有 C;=15种取法.(X,门取(0,0)表示取得的两个球是白球,其取法只有一种,所以其概率 为 px=o,r = o=l,类似地(X,门取其他几对数组的概率为如下: (X,门的联合概率分布表为 P/所取两个球中至少有一个白球匸P 所取两个球中黑球和红球的和不超过一 个=PX + Y,由于事件(x + r0 ; (2) f Xf *y)dxdy = ;(艮卩F(+=o, + s) = l) J x J 3C 反过来,如果一个二元函数fix. y)同时满足性质(1)、(2),则它一定是

20、某个二 维随机变量的概率密度函数. (3) 若八兀、刃在点(x、刃处连续,则有台=/(刃; (4) 设D是“y平面上任一区域,则点(xy)落在D内的概率为 P(X, n e ) = /Cv,刃db. I) 在几何上,P(X, r)eD的值等于以Q为底,曲面Z = f(x. y)为顶的曲顶柱体的体 积. 与一维随机变量相似,有如下常用的二维均匀分布和二维正态分布 二维均匀分布:设D是平面上的有界区域,其面积为A,若二维随机变量(XV)具 有概率密度函数 则称(X)在D上服从均匀分布. 二维正态分布:若二维随机变量(X, 丫)的概率密度为 (-00 A- +00, - 00 y 0, a20, |

21、/?|1,则称(X, Y)服从参 数为仏,6, 6及Q的二维正态分布,记作(X, F)N(“,于,ah p). 如图3-3所示,二维正态分布以(如“2)为中心,在中心附近具有较高的密度,离 图3-3二维正态分布密度函数图象 中心越远,密度越小,这与实际中很多现象相吻合. 例设二维随机变量(X,门的概率密度函数为 求:(1)常数 C; (2) (X, 丫)的分布函数 F(xf y) ; (3) PXY. 解:(1)由八x, y)的性质2可知: 二 C 厂 e-2xdxX e3ydy = C 丄 JoJo6 所以:C = 6 (2) F(a, y) = fK f V /(as y)dxdy J X

22、 J x (3) PX v訂7(3)如宀叫y 耳 .ty 例设二维随机变量(X, X)的密度函数为 D为xoy平面内由X轴、y轴和不等式x + y . 解:如图3-4所示: 例设(X,Y)在圆域+2上服从均匀分布,求 (1)(x,r)的概率密度; poxi,ori 解:(1)圆的面积为A = 4tt,故(X,Y)的概率密度为 (2)用G表示不等式0 vxvl,Ovyvl所确定的区域,由分布函数的性质4有 POXl,Or 1= J“(x, y)d.xdy = 土 (注意概率密度/(x,刃在圆以外的区域都 等于零) 边缘分布 二维随机变量(X, Y)作为一个整体,它具有分布函数Fix, y).而分

23、量X和y也都是 随机变量,也有其各自的分布函数记X和Y的分布函数为匕和耳(刃,分别称它们 为二维随机变量(X,门关于X和关于丫的边缘分布函数边缘分布函数可以由(X, 丫)的 联合分布函数F(x, y)来确定: 即:R(x) = F(x,+8);同理竹(对=尸(+8, y). 下面分别讨论二维离散型随机变量和二维连续型随机变量的边缘分布 3. 2.1二维离散型随机变量(X, X)的边缘分布 设(X, 丫)是二维离散型随机变量,设其概率分布为 则X的边缘分布律为: pX =x.=px Y = y+Px =xif y =力+px =兀,K = yj+- - 一,2,.的边缘 分布函数为 Fx(x)

24、= F(x,+s) =工工心 j 若将PX=xi=fjPtj记为p“=)、则X的边缘分布可写成表格形式 7-1 X P 且满足乞卩卜=1 同理,丫的边缘分布律为: 写成表格形式有 Y P 满足Pj =1 i 丫的边缘分布函数为 例设(X, Y)的概率分布由下表给出,求X和丫的边缘分布. px = 0 = px = 0, Y=o+Px =0, y = 1+Px =0, Y = 2 同理可求得:PX =1 = 0.05 + 0.12 + 0.03 = 0.20 =0 = 0.20, PY = l = 042 , 砒=2 = 0.38 通过该例,可以很明显地看出,边缘分布几和几分别是联合分布表中第j

25、行和第丿列 各兀素之和. 二维连续型随机变量(X, Y)的边缘分布 设(X,门是二维连续型随机变量,它的概率密度函数为/(A; V),则X的边缘分布 函数为:Fy(x) = F(x, + x)=y)dy dx 其密度函数为:fx (x) = F; (x) = Fx, + oo) = f*7(x, y)dy -a 同理Y的边缘分布函数为Fy (y) = F(+co, y) = J:f (x,y)dx dy 其密度函数为A(y) = F; (,) =匚“v, y)dx 通常分别称人(x)和几(刃为二维随机变量(X, Y)关于X和Y的边缘密度函数. 例设随机变量(X, X)的密度函数为 试求参数k的

26、值及X和Y的边缘密度. 解:根据联合密度函数的性质,有匚匚/(x,心= 1 所以:R=8 X的边缘密度函数fx (%) =y)dy 当0l时,f (x, y)都等于零,所以此时fx (x) = 0 当 OKI 时,且 xVySl 时,/(x, y) = Sxy ,所以 fx (x) = J Sxydy = 4a(1 - x2) fx (x)= 4x(1 0, 0_l 其它 同理可得: 0 Vl时,/(儿刃都等于零,所以此时A(x) = 0 当 0SM1 时,且 OSySl 时,f(x, y) = 4x),所以 fx (x) = xydy = 2x 2x, 0 x 1 0,其它 同理可得:fY(

27、y) = 2y, 0 y 1 0, 其它 例求二维正态随机变量(X,穴,犬;p)的边缘密度. 解:记x和Y的边缘密度函数分别为几(切和人(刃 由于(工_“】a “ y _ Y 十(y _“2) =(。亠尸+仆一小(二)2 6“5 十1如0十一Lu比-4 所以:皿)丄心刃心纭kF域*心6心 令一 J (、一山汇一性 Jl-266 则心古F P_( F 广 +3C 2, e 2 dt = e 1( -x x +oc ) V2F). 以上对二维正态分布的讨论说明: (1) 二维正态分布的边缘分布是一维正态分布,由二维联合分布可以唯一确定其每个 分量的边缘分布; (2) 已知X与Y的边缘分布,并不能唯

28、一确定其联合分布,还必须知道参数的值. 譬如两个二维正态分布(0, 0, 1, 1: 1/2)和N (0, 0, 1, 1; 1/3),它们的联合分布不同,但其 边缘分布都是标准正态分布引起这一现象的原因是二维联合分布不仅含有每个分量的 概率分布,而且还含有两个变量X与Y之间相互关系的信息,而后者正是人们研究多维 随机变量的原因联合分布中的参数Q的值,反映了两个变量X与Y之间相关关系的密 切程度. 从以上几个例题可知,联合密度决定边缘密度,但反过来知道边缘密度并不能唯一确 定联合密度 在前面我们已经知道,随机事件的独立性在概率计算中起着很大的作用在多维随机 变量中,它们的分量的独立性在概率论和

29、数理统计的研究中占有十分重要的地位。 我们用随机事件X a与/-的独立性来定义X与Y的独立性. 定义:设X、丫是两个随机变量,如果对于任意的实数x和有 Px x, Yy=PXx-PYy,即 F(x,刃=心(劝0)则称随 机变量x与y是相互独立的. 对于二维离散型随机变量(XV),则x与丫相互独立的充要条件是: px =xY = yj=Px =xj-py = 3. i, j = , 2, . 即 Pq = Pj P.j,fj = l, 2,. 对于二维连续型随机变量(x,y),则x与Y相互独立的充要条件是: 对一切的X和),有 这里/(x, y)为(X, X)的概率密度函数,fx (x)和fy

30、(刃分别为关于X和丫的边缘概率密 度 前面已讨论过联合密度与边缘密度的关系:联合密度决定边缘密度,反过来,知道 边缘密度一般来说并不能唯一确定联合密度而当随机变量X和Y相互独立时,边缘密 度齐(兀)和人(刃的乘积就是联合密度fg y),即当x与r相互独立时,可由边缘密度确 定联合密度. 例如果二维随机变量(X,门的概率分布用下列表格给出 那么当 0取什么值 时,X与丫才能相互独 立 解:先计算x和y 的边缘分布 (1) 1 + a 2 14 px = 0, y = 3=px =O pY = 3=*( + 0 12 1 12 由(1)、(2)两式可解出:丄,0 =丄 12 例设随机变量X与丫相互

31、独立,且都服从参数2 = 1的指数分布, 求X与丫的联合概 率密度,并计算P(X)G砒其中D = (x,y)|oyxflx0 0, x0 丫的密度函数为A(y)= 0 0 y = Jj f(x, y)dxdy = J!6/y = 1 + _L-1. 条件分布 我们由条件概率很自然地引出条件概率分布的概念 设(X, Y)是二维离散型随机变量,其分布律为 (X, Y)关于X和关于y的边缘分布律分别为 设心0,我们来考虑在事件Y二儿已发生的条件下事件X=,)发生的概率,也就 是来求事件 X=x,|y = yJ,/ = l,2.I 的概率,由条件概率公式,可得 易知上述条件概率具有分布律的性质: 1、

32、PX=xlY = yJ0; xx p.1p. 2、E二叩二 ;二齐內二丁二 1 ;=1;=1 PJ M Pj 于是我们引入以下的定义 定义设(X . Y)是二维离散型随机变量.对于固定的j,若Py = yj 0, 则称 PXp 为在Y二y,条件下随机变量X的条件分布律. 同样,对于固定的i 若PX二x, 0 .则称 PY = yjX=xi = PX=xi,Y = yj pl PX=“ 为在X二x,条件下随机变量Y的条件分布律 现设(X, Y)是二维连续型随机变量,这时由于对任意x, y有PX=x)=O? PY=y=0,因此就不能直接用条件概率公式引入“条件分布函数”了 . 设(X . Y)的概

33、率密度为f(x, y). (X . Y)关于Y的边缘概率密度为齐(y).给定y, 对于任意固定的0,对于任意x,考虑条件概率 PX x,yYy + Py Y y + s 设PyY(),则有 PXWx I yvYWy+w) 匸/心)fy) 苏(y) fv(y) 在某些条件下,当2 ,很小时,上式右端分子、分母分别近似于 px xyY 0,则称伴U为在Y二y的条件下x的条件概率密 fr(y) 度. fXY(xy)= A(y) 条件概率密度满足条件:= 如(加)厶=匸二爲匚弘,y)dx = 1 称匚办|心卜皿二匚芈斗丘为在丫二y的条件下X的条件分布函数记为PXWx | Y二y或代|心卜).即 F (

34、外,)二 PXWx | Y二y二匸些詁血0 jYy) 类似地,可以定义加(,|宀籍 和耘(肿訂:陽A 由知道,当很小时,有 PXWx | yvYWy+g 匸办|卩(尤卜)厶=巧屮(巾), 上式说明了条件密度和条件分布函数的含义 例设G是平面上的有界区域,其面积为A 若二维随机变量(X, Y)具有概率密度 则称(X, Y)在G上服从均匀分布.现设二维随机变量(X, Y)在圆域x2+y2上服从 均匀分布,求条件概率密度人|丫卜) 解由假设随机变量(X . Y)具有概率密度 且有边缘概率密度 于是当-lvyvl时有 Ai/4v)= 丄 0, J1 x上, 其他. 例设数X在区间(0, 1)上随机地取

35、值,当观察到X=x(0vxvl)时,数Y在区间(x, 1)上随机地取值求Y的概率密度A(y). 解按题意X具有概率密度 对于任意给定的值x(Ovxvl),在X=x的条件下Y的条件概率密度为 由式得X和Y的联合概率密度为 于是得关于丫的边缘概率密度为 二维随机变量函数的分布 设z = g(x,y)是一个二元函数,是二维随机变量,则z*(x, 丫)也是一个随机变 量,我们称之为二维随机变量函数下面我们就来讨论二维随机变量函数的分布情况。 显然若(X, 丫)是二维离散随机变量,那么二维随机变量函数Z = g(X,门也是离散型 随机变量. 如,设(X, Y)只取有限对实数组(0,1),(1,2),(0

36、,2),(1,1),那么二维随机变量函数 Z = X-Y也就只取-1,-2,0,显然有 pz = -i=px =o,y = i+px =i,r = 2, 解:由(x, 丫)的分布可得 P 0 (T, (-1, (-1, (2, (2, (2, 0) 1) 3) 0) 1) 3) -1 0 2 2 3 5 -1 -3 -7 2 0 -4 去掉概率为0的值,并将相同函数值对应的概率求和,从而得到: (1)乙=X+Y的分布为 -1 0 2 3 P Z2=X-2K的分布为 -7 -3 -1 0 2 P 般地,如果(XY)的概率分布为Px=xr Y = yi=Pij Ci, j = l, 2,.),记

37、z左伙= 1,2,)为Z = g(X, Y)的所有可能的取值,则Z的概率分布为: pZ = zk=Pg(X, r)= Z,=才X= Y = y. k = ,2,. gg刀F 二维连续型随机变量函数的分布. 设(X, 丫)是二维连续型随机变量,其概率密度函数为/(x, y),若其二维随机变量函 数Z = g(X,Y)仍然是连续型随机变量,则可类似于求一维连续型随机变量函数的分布来 求Z = g(X, 丫)的概率分布,其方法是: (1)先求分布函数巧= PZz=Pg(X, y)z=P(X, r)eDz 其中 Dz=(X,Y)g(X,Y)z; (2)根据= F;(z)求出概率密度函数. 下面我们来讨

38、论两个具体的随机变量函数的分布. 一、Z=X+Y的分布 设(X, Y)的概率密度为/(x, y),则Z = g(X,Y)的分布函数为 Fz=PZ 2 fz(z) = j e 2 e 2 dx = e 4 J e 2 dx. 设/ = X _ ,得 2 即Z服从正态分布N(0,2). 二、Z = X/Y的分布 设(X, X)的概率密度为f(x, y),则Z = X/Y的分布函数为 令=”卩=x / y,即工=uv, y =.这个变换的雅可比行列式丿=-it. 于是,代入可得 从而有 特别当X和Y相互独立时,有 其中fx ,齐(刃分别为(X,Y)的关于X和Y的边缘概率密度 例3.设X、Y分别表示两

39、只不同型号的灯泡的寿命,X、Y相互独立,它们的概率密度 依次为 求Z = X/Y的概率密度函数 解:当z0时,Z的概率密度为 当注0时,/() = 0,于是 三.M = nnx( X、Y)及N = nin( X,Y)的分布 (1) . M=imx(X,y)aV = mn(X,r)的分布 设X和丫是两个相互独立的随机变量,则有 (2.)推广: 设XX2,X”是相互独立的随机变量,则M=max(X|,X2,X”)及 N = min(X|,X2,X的分布函数分别为: 特别地,当X-X2,X”相互独立且具有相同的分布函数F(x)时有: 第三章习题 1、如下四个二元函数,哪个不能作为二维随机变量(X,

40、Y)的分布函数 (1 一 严)(1 一 f i ),0 v x v +oo,0 y -ho, (A) F(x,y) = 0,其他. 化(兀刃=丄 7T / x + arctan 2 兀y + arctan 23丿 , (C) F3(x.y) = 0, x + 2y . *l-2x -2_y +2x-y,0 x d,0 y 0,其他 2.(9 *( + ) =砖+ E; (3) 设、相互独立,则E(G) =砖励, 其中上面各式中的c为常数,所提及的数学期望都存在,定理的证明从定义出发直 接验证,证明从略. 根据定理1,运用归纳法,易得如下推论: 推论 1 E(C +C22 +/“ +b)=C碼

41、+C2 砖 2 + + C “碼 + 其中g.,C均是常数,特别有 E(Mi+2+ + ) = +Eg”. 推论2若為,戍相互独立,则 Eg b,b;Q),求 E(2f-3 + 1). 解因为(,) N(a,b:;Z?,b;Q),所以 N(d,b:), N(,b;),从而 E)= a、E5)=b.因此,按数学期望的性质,得 E(2 3 + l) = 2E3E + l=2“ 3b + l. 例2设纟的分布列为 1 2 3 P 求(1) = ?=孑+2的数学期望. 解按公式(3),得 (1) Eji = E(丄)=1 x 0.1 + 丄 x 0.7 + 丄 x 0.2 总 0.52. g23 (2

42、) E/j = E(孑 +2)=仆2 + 2)x0.1 + (22 +2)x0.7 + (32 + 2)x0.2 = 6.7 例3掷20个骰子,求这20个骰子出现的点数之和的数学期望. 解设纟为第i个骰子出现的点数,=12,20,那么20个骰子点数之和纟就等于 易知,J有相同的分布列=) = , = 1,2,3,4,56所以 o 1?! E (2) 若疳、相互独立,贝IJU + 77)= Z + D; (3) (切比雪夫不等式)若纟的方差存在,则对任何50,成立 切比雪夫不等式是一个重要的不等式,它利用数学期望和方差估计随机变量落在 区间(Ey,E$ + )内的概率,指出这个概率不小于1-佟.

43、这一点下章将要用到.这种对 概率的估计在实际应用中也是很有价值的. (4) 若 D+ DE? + + D (2)纟与不相关; (3)E(切)=砖励; (4)( + ) =/ + 4极限理论简介 在第十四章我们曾讨论了事件发生的频率具有稳定性,即随着试验次数的增加, 频率会逐渐稳定于某一常数(即概率),这是概率定义的基础,但当时我们并未给出严 格的数学表达,本节我们仅作简要介绍. 一、大数定律 通常,把叙述在什么条件下一随机变量序列的算术平均值(按某种意义)收敛于 某数的定理称为“大数定律”. 定义1设点是一随机变量序列,E)S1)存在,令 若对任意$0,有 或等价地有 塑P(陆一如V ) =

44、1, (10) 则称乞服从大数定律也称随机变量序列 % 依概率收敛于心,并记作久 定理6 (马尔可夫大数定律)设点是一随机变量序列,若成立 (11) 则金服从大数定律. 此定理只需利用切比雪夫不等式,验证满足定义1的条件(9)或(10)即可. 定理中条件式(11)称为马尔可夫条件. 定理7 (伯努利大数定律)设儿是n重伯努利试验中事件A发生的次数,而 是A在每次试验中发生的概率,则对任意的0,都有: limP(4- 8fl 伯努利大数定律从理论上回答了第十四章提到的通过试验来确定概率的方法:做 n次独立的重复试验,以儿表示n次试验中事件A发生的次数,那么我们可以以很大的 概率确信:p上. n

45、上述大数定律都是建立在切比雪夫不等式的基础上的,因此都要求方差存在但在 独立同分布的场合,并不需要这个要求,这就是着名的辛钦大数定律. 定理8 (辛钦大数定律)设蔬为一相互独立同分布的随机变量序列,且数学期 望存在,() = ,则对任意的0,成立 显然伯努利大数定律是它的特例. 辛钦大数定律在应用中十分重要. 第四章 习题 、填空选择题。 1、设随机变量x和Y的相关系数为,若Z = X-0.4,则Y与Z的相关系数为 2、设随机变量X服从参数为2的指数分布,则PX 4DX =_ 3、设随机变量X服从参数为1的泊松分布,则PX = EX2= 4、设二维随机变量(X,Y)服从N(“,“;b2 10

46、设随机变量 XF(n,n)且 P(|X|A) = 0.3, A 为常数,则 P(X1) = 1 H 11若刍,烷是取自正态总体(“, (n-)S2 1 b 14设随机变量X和Y相互独立且都服从正态分布 W32),而XzX和冷必分别 Y +斗Y 是来自总体X和Y简单随机样本,则统计量U =二丄、= 律服从分布。 J即+ + ? 二、选择题 1 设总体X服从正态分布NQ2、其中b为未知参数,(XrX2,X3)是取自总体X 的一个容量为3的样本,下列不是统计量的是 () A. X,+X2+X3 B. niax XrX,X3) C.丄(X,+X,+X3) D.丄(X】+ X, + X3) b4 _16

47、4 V _ Q 2 设X|,X,X是来自正态总体N(2 A X _ p b X 一 p c X _ p X - “ S / fn 1S2 / J 口 _ S3 / S (2)心+3“ ; (3) X (4) “X; maxXJ ;(7) b + X?; 2. 设XPX2,.XZI是取自总体X的一个样本在下列三种情形下,分别写出样本 XX2,.,X”的概率函数或密度函数: (1)X5); (2) X Exp(A); (3) X ”(0,0),; 2Jx; + xi+x; 9. 设Xv X2,.Xn,Xn+l是取自正态总体N(,a2)的一个样本,记 试证:统计量f迅-X心_); V 77 + 1

48、片 10. 设总体X服从正态分布从中抽取简单随机样本X,/,.,/”其样本均值 _1 2n_ 为X =亍亍E,求统计量Y = t(Xi + Xg -2X)2的数学期望。 2川 /-Ir-l 上一章,我们讲了数理统计的基本概念,从这一章开始,我们研究数理统计的重要 内容之一即统计推断。 所谓统计推断,就是根据从总体中抽取得的一个简单随机样本对总体进行分析和推 断。即由样本来推断总体,或者由部分推断总体。一一这就是数理统计学的核心内容。 它的基本问题包括两大类问题,一类是估计理论;另一类是假设检验。而估计理论又分 为参数估计与非参数估计,参数估计又分为点估计和区间估计两种,这里我们主要研究 参数估

49、计这一部分数理统计的内容: 参数估计的概念 统计推断的目的,是由样本推断出总体的具体分布,一般来说,要想得到总体的精 确分布。是十分困难的,由第六章知道:只有在样本容量力充分大时,经验分布函数 Fx)tF(以概率1),但在实际问题中,并不容许力很大。而由第五章的中心极限定 理,可以断定在某些条件下的分布为正态分布,也就是说,首先根据样本值,对总体分 布的类型作出判断和假设,从而得到总体的分布类型,其中含有一个或几个未知参数; 其次,对另外一些并不关心其分布类型的统计推断问题只关心总体的某些数字特征,如期望、方差等,通常把这些数字特征也称为参数。这时,抽样的目的就是为了解出这 些未知的参数。 例:设某总体X 陀),试由样本(X|,X2,X”)来估计参数几。 例2 :设某总体x试由样本(X|,X2,X”)来估计参数N 在上述二例中,参数的取值虽未知,但根据参数的性质和实际问题,可以确定出参 数的取值范围,把参数的取值范围称为参数空间,记为o 女W :例 : 0 = 2120例2 : 0 =(/,o-2)lo-0,/0 1 定义所谓参数估计,是指从样本(/,X2,X”)中提取有关总体X的信息,即构造 样本的函数一一统计量g(XX2,X“),然后用样本值代入,求出统计量 g(X|,X2,X”)的值,用该

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论