第04章概率随机变量_第1页
第04章概率随机变量_第2页
第04章概率随机变量_第3页
第04章概率随机变量_第4页
第04章概率随机变量_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4章概率随机试验:对随机现象的客观观测。随机试验具有(1)可重复性;(2)可观测性;(3)随机性。样本空间:随机试验的所有结果的集合称作样本空间。概率的统计定义:在不变的一组条件下,重复进行n次试验。当n充分大时,若事件 A发生的频率稳定地在某个常数p附近摆动,且一般来说,n越大,摆动幅度越小,则称常数p为事件A的概率,记为P(A) = p 。(如,投硬币,求正面朝上的概率。)概率的古典定义:若Ai, A2,A构成一个等可能完备事件组,而事件B是由其中m个基本事件构成,则事件B的概率用下式表示。P(B) = m / n(投色子中求某个点的概率。)客观概率:由可重复试验定义的概率为客观概率。(

2、如投硬币时,正面朝上的概率,某次火车晚点的概率,某校学生每年通过英语 4级的概率,某段公路上车辆发生交通事故的概 率等。)概率的统计定义和古典定义都指的是客观概率。主观概率:是对概率的主观解释。常用于不可重复试验的事件。(某学生来年能考上大学的概率,某市某天下雨的概率。)相互独立:若两个事件积的概率等于这两个事件概率的积,即P(A B) = P(A) P(B)则称事件A , B相互独立。(例A、B表示两粒麦种各自发芽的概率。显然A、B相互独立,且相容。)互不相容:若事件A , B不能同时发生则称事件 A , B为互不相容事件。(投色子中“ 1 点”和“ 2点”是互不相容事件。但“1点”和“奇数

3、点”是相容事件。)注意:“相互独立”和“互不相容”是两个不同的概念,不要混淆。互不相容事件一般不是相互独立事件。因为对于两个相互独立事件 A , B,有P(A) >0 , P(B) >0。贝U P(A B) = P(A) P(B) > 0。当A , B为互不相容事件时,必有P(A B) = 0 ,不能满足相互独立的条件。见61页例1。条件概率:在事件A已经发生的条件下,事件B发生的概率称作事件B在给定事件 A下的条件概率。表示为P(B | A)。利用概率的古典定义求概率时,完备事件组内的基本事件必须是等概的。下面介绍一种基本事件不一定是等概的求概率问题。贝努里试验过程若一个随

4、机试验只含有两种相互对立的可能结果,则称作贝努里(Bernoulli)试验。如一个篮球运动员投篮命中率为0.7,非命中率为0.3,投篮一次,结果可能是“投中”也可能是“未投中”。这就是一次贝努里试验。观察一个灯泡使用寿命低于还是高于100小时也是一次贝努里试验。实际中,常常不是只考察一次贝努里试验,而是连续考察多次。把这样的序列称作贝努里试验序列。贝努里试验过程:在n次贝努里试验中,假设每次试验结果与其他各次试验结果无关, 且每次试验中该试验结果出现的概率都是p,( 0 < p < 1),则称这样的过程为 n重贝努里试验过程。例1: 一批小麦种子的发芽率为0.95,取10粒种子做发

5、芽试验。求结果有8粒种子发芽的概率。解:每粒种子种下后是否发芽都是一次贝努里试验。若取10粒种子做发芽试验,则每粒种子是否发芽是相互独立的。10粒种子中有8粒发芽的可能结果的概率是P(A1, A2,A10) = P(A” P(A2)P(Aw) = 0.958 0.052 = 0.00165855。10粒种子中有8粒发芽的可能结果共有 C80种。因为C10种结果相互独立,所以10粒种子中有8粒发芽的概率是P(8) = Cw 0.00165855 = 0.07463第5章随机变量及其数字特征在上一章,介绍的事件概率都是对某一事件而言。人们自然想到,对整个样本空间内各个事件的概率取值又如何呢?这就是

6、随机变量的概率分布问题。随机变量及其分布的研究是以事件及其概率的研究为基础展开的。它是统计推断的理论基础。随机变量就是随机试验中被测量的量。随机试验每出现一个基本事件,随机变量就相应取一个实数值。从数学意义上讲,随机变量就是定义在样本空间上的函数。随机变量取各种可能值的概率称作随机变量的概率分布。随机变量定义(1):按一定的概率取不同实数值的变量称为随机变量,用x, y等表示。随机变量定义(2):样本空间内每一个可能结果都唯一地对应着一个实数 x( ),则称 实数值变量xf )为随机变量。常用x, y等表示。如(1)天津站每日的客流人数。(2)某商场日销售电视机台数。(3)某储蓄所的日存款余额

7、。(4)某地区居民的日用水量。(5)高速公路上单位时间内通过的机动车数量。(6)流水线上生产的罐装啤酒的净重值。若随机变量x可能取的值为有限个或可列个,则称x为离散型随机变量。若随机变量x可能取的值是整个数轴,或数轴上的某个区间,则称x为连续型随机变量。 连续型随机变量的概率分布是通过随机变量在一切可能区域内取值的概率定义的。最常用和最简便的形式是通过概率密度函数表示。对于随机变量x,若存在非负可积函数 f (x),(-旳< x < °o),使对任意实数 a, b, (a < b) 有Pa ex 乞 b=ba f (X)dX则称X为连续型随机变量。f (X)为X的概

8、率密度函数(简称概率密度或密度)。由上式知f (X) 在a, b区间上的积分等于随机变量 X在a, b区间取值的概率。研究经济问题为什么还要学习随机变量?因为许多经济问题都符合随机变量的要求。通过随机变量把经济问题上升到统计理论高度进行研究,有利于找到经济变量变化的一般规 律。(例:勾三股四弦五。周朝的商高发现了勾股定理。)5.1随机变量的数学期望对于离散型随机变量 x,若有概率分布PX = Xi = pi,(i = 1,2,)则称二 Xi pii为x的数学期望,简称为期望或均值。记作E(x)。 对于连续型随机变量 x,若密度函数为f (X),则称bxf (x)dx为X的数学期望。记作E(x)

9、。期望属于位置特征。用来描述随机变量取值的集中位置。体现了随机变量取值的平均大小。期望就是随机变量取一切可能值的加权平均。其中的权数就是概率值。数学期望的性质如下:(1) 常量的期望就是这个常量本身。E(k) = k(2) 常量与随机变量和的期望等于这个随机变量的期望与这个常量的和。E(x + k) = E(x) + k(3) 常量与随机变量乘积的期望等于这个常量与随机变量期望的乘积。E(k x) = k E(x)(4) 随机变量的线性函数的期望等于这个随机变量期望的同一线性函数。E(k X + c) = k E(x) + c(5) 两个随机变量和(或差)的期望等于这两个随机变量期望的和(或差

10、)。E(x y) = E(x) E(y)(6) 两个相互独立随机变量乘积的期望等于这两个随机变量期望的乘积。E(x y) = E(x) E(y)5.2随机变量的方差、标准差 随机变量X对其均值的离差平方的数学期望,2Ex - E(x)称作随机变量x的方差。记作Var(x)。. Var(x)则称作x的标准差。方差和标准差用来描述 随机变量的离散特征。它们反映了随机变量取值离散程度的大小。对于离散型随机变量X,方差的定义是 2Var(x) = _ (Xi - E(x) ) pii其中Pi表示X取Xi值时的概率。对于连续型随机变量X,方差的定义是:2Var(x) = x - E(x) f (x) d

11、x其中f (x)是x的概率密度函数。注意:(1)Var(x)的量纲是x的量纲的平方。(2)Var(x)的量纲与x的量纲相同。随机变量方差的性质:(1) 常量的方差为零。Var(k) = 0(2) 随机变量与常量之和的方差等于这个随机变量的方差。Var(x + k) = Var(x)其中x为随机变量,k为常量。(3) 常量与随机变量乘积的方差等于这个常量的平方与随机变量方差的乘积。2Var(k x) = k2 Var(x)其中k为常量。证明:由方差定义2 2 2 2 2Var(k x) = E k x - E(k x) = Ek x - k E(x) = k Ex - E(x) = k Var(

12、x)(4) 随机变量的方差等于这个随机变量平方的期望减其期望的平方。2 2Var (x) = E(x) -E(x)证明:由方差定义2 2 2 2 2Var(x) = Ex - E(x) = Ex -2 x E(x) + E( x) = E(x) -2 E(x) E(x) + (E(x)2 2=E(x) -(E(x)(5) 两个相互独立随机变量之和(或差)的方差等于这两个随机变量方差的和。Var (x 二 y) = Var (x) + Var (y)下面证明随机变量之差情形。证明:由方差定义2 2Var (x - y) = E(x - y) -E (x - y) = Ex - y -E(x) -

13、 E (y)=E(x -E(x) ) - (y - E (y) ) 22 2=E(x -E(x) + (y - E (y) -2 (x -E(x) (y - E(y)=Var (x) + Var (y) -2 E(x -E(x) (y - E(y)其中E (x -E(x) (y - E(y)是随机变量x与y的协方差。因为x与y相互独立,所以E (x -E(x)(y - E(y) = 0 (见下面第3小节,随机变量的协方差)。上式的结果是Var (x - y) = Var (x) + Var (y)注意:两个相互独立随机变量差的方差不等于这两个随机变量方差的差。(6) 由性质(5)有如下结论:若

14、两个随机变量是相互非独立的,其和与差的方差公式是,Var (x + y) = Var (x) + Var (y) + 2 Cov(x, y)Var (x - y) = Var (x) + Var (y) - 2 Cov(x, y)其中Cov(x, y)表示x与y的协方差(协方差概念见下)。5.3随机变量的协方差协方差定义:随机变量x, y分别对其均值的离差乘积的数学期望E (x - E(x) (y - E(y)称作随机变量x, y的协方差,记作Cov(x, y)。其中E(x), E(x)分别表示x, y的期望。协方差用 来描述两个随机变量关系的紧密程度。对于离散型随机变量x, y,协方差定义为

15、Cov(x, y) = 一 一 (xi - E(x) (yj - E(y) p(Xi, y)i j其中P(Xi,yj) = P(x =Xi,y =yj)表示x =xi, y =yj条件下的概率。上式是协偏差人-E(x) yj -E(y)的加权平均。对于连续型随机变量x, y,协方差定义为Cov(x, y) = I (x - E(x) ) (y - E(y) ) p (x, y) dx dy其中p(x, y)是x, y的概率密度函数。当x, y相互独立时,Cov(x, y) = 0。协方差的大小与 x, y的量纲有关。一般来说,改变 x, y的量纲,则x, y协方差的值也要改变。因此协方差所提供

16、的主要信息是正值、负值还是 零。注意:虽然两个变量相互独立,意味着协方差为零,但反过来不一定成立,即协方差 为零,该两个变量未必独立(但肯定不存在线性相关)。第6章 随机变量的概率分布6.1离散型随机变量的概率分布离散型随机变量的一切可能取值及其取值的相应概率称作离散型随机变量的概率分布。可用表格法和作图法表示。表格法疋:xX1X2X3Xi pp1p2p3pi 例2 :仍以例1为例。10粒种子中发芽粒数的样本空间是x = 0, 1,2, 3,1C用表格法和作图法表示离散型随机变量的概率分布如下。Xp计算公式00.000p(0) = C100 0.95° 0.051010.000p(1

17、) = C101 0.9510.05920.000p(2) = C1020.9520.05830.000p(3) = C1030.9530.05740.000p(4) = C1040.9540.05650.000p(5) = C1050.9550.05560.00096p(6) = C1060.9560.05470.01047p(7) = C107 0.957 0.05380.07463p(8) = C1080.9580.05290.31512p(9) = C1090.9590.051100.59873p(10) = C1010 0.9510 0.050合计1.00000概率分布图(文件名st

18、at02)离散型随机变量的概率分布有如下性质:(1) Pi 工0(2) 匕 Pi = 1二项概率分布:n个独立的、同分布的贝努利随机变量之和用x表示,x = X 1 + X 2 + +Xn则称X为二项随机变量。二项概率函数为,p(x) = CnXp X (1- p) nX X = 0, 1,2,n其中CnX =土 。则称x的分布为 二项概率分布。(分布图形见88页)。p = 0.5时,为x! (n _x)!对称分布;p > 0.5时,为左偏分布;p < 0.5时,为右偏分布。E(x) = n pVar(x) = n p (1- p)离散型随机变量的累计概率分布:列出随机变量值的累计

19、概率。图形成阶梯形(见68页),为右连续函数。6.2连续型随机变量的概率分布(正态分布、t分布、2分布和F分布)6.2.1正态分布与标准正态分布正态分布定义:若连续型随机变量x的概率密度函数为f (X)=1血xp(-(X)22;211E(x)=其中h U为常量,CT > 0,则称X服从正态分布。记作 Xe N(P, O2 )。卩,口分别是X的数学期望 和标准差。可以证明:-1(X - ")x f (x) dx = xexp(-) dx = .!_:匚2Var (x) = (x - J) f (x) dx =(x - ")2J &2换2d2(x)2exp(-WV

20、ar(x)=-三种不同参数的正态分布曲线见图1。概率密度函数f (x)呈钟形。最大值点在x =处。曲线以X =丄对称。在X = _;处密度函数曲线有拐点。当X)二:时,f (x)以X轴为渐近线。当二较大时,f (X)曲线较平缓;当 二较小时,f (X)曲线较陡峭。已知和二的值, 就可以完全确定正态分布密度函数。对某产品的物理量测量常服从于正态分布。标准正态分布 定义:对于正态分布密度函数f (x),当=0,二=1时,即f0 (X)=1.2 7:2X exp(-歹)称连续型随机变量 x服从标准正态分布。记作* N(0, 1 )。对于标准正态分布E(x) = 0, Var(x) = Var(x)

21、=1。标准正态分布曲线见图2。标准正态分布密度函数f0(x)有如下性质:(1) f0(x)以纵轴对称;(2) x = 0时,f0(x)的极大值是1八2二=0.3989 ; (3) f°(x)在x = -1处有两个拐点;(4) plim fo (x) = 0。图1正态分布曲线图2标准正态分布曲线正态分布随机变量的标准化若XeN(A, cr2 ), a, b为任意实数,且a < b,则Pa _x _ b=(x)22;2)dxbJ1Z2,2 二 exp(-云)dZ设Z = (x)/ g则(参见微积分中换元积分法)Pa _x _b = P_Z _ =<JCT显然Z是一个服从标准正

22、态分布的随机变量。当x -N(0, 1 )可见对一般正态分布随机变量x做变换Z = (x-)/ ;二则可以把x转化为服从标准正态分布的随机变量Z。对一般正态分布随机变量 x计算概率非常不方便。通过标准化变换,利用标准正态分布 累计概率表,则很容易计算出x取任意两个值之间的概率。正态分布的线性性质: 若Xi、N (“,Ci2), (i = 1,2,n ),且相互独立,则n送Xi - N (送片,送巧2 )i =1ai芒0为常数,则2 若Xi 、n (, q ), (i = 1,2,n )且相互独立,2 2ai xi - N (ai H , ai )连续型随机变量的累计概率分布:用积分法计算连续型

23、随机变量的累计概率。连续型随机变量的累计概率分布函数用F(x)表示。定义为F(x) = P(x 乞Xi),(- : < Xi < :)曲线从0变化到1 (76页)。0.80.60.40.20图3正态累计概率分布练习查正态分布表。例:PZ ::: - Zo.95= 0.05,求 Zo.95。Z0.95 = 1.64, - Uo.95 = -1.64。6.2.2 t分布f (x)=如果随机变量x有如下密度函数,<2、(n卅)/21 n其中常量n只与n有关(而不是与x有关)n = 1,2,则称连续型随机变量 x服从自由度 为n的t分布。t分布是连续型的概率分布,并具有一个参数n。n

24、称作自由度。n可以取所有正整数,构成一个t分布族。服从自由度为n的t分布的随机变量用t(n)表示。t(n)的取值范围是(-:, :)。t分布密度曲线见图 4。t分布以纵轴对称,也呈钟形。当n为有限值时,t分布的峰值小于正态分布的峰值,而尾部要比正态分布的厚,即t分布呈低峰厚尾特征。当:, t分布趋近于标准正态分布。实际中,当n > 30 , t分布就很近似于标准正态分布。t分布的均值和方差分别为E(t(n) ) = 0Var(t(n) = n / (n -2), n > 2图4 t分布密度曲线图52分布密度曲线注意:(1)当n乞2时,方差无定义。 的方差相同。t分布的百分位数可以通

25、过(2)当nr 时,Var(t(n) ) = 1,与标准正态分布 t分布表(附录2)查到。练习查t分布表(p.427)。to.95(30) = 1.706232分布如果随机变量x有如下密度函数,f (x)=0,x < 015其中常量:-n只与n有关(而与x关)n = 1,2,则称连续型随机变量 x服从自由度为n的 2分布。2 (读作“开方”, 是希腊字母)分布是连续型的概率分布,并具有一个参数n。n是2分布的自由度。n可以取所有正整数,从而构成一个 2分布族。n的不同值对应着 2分布 族中不同的具体的 2分布曲线。服从自由度为 n的2分布的随机变量用 2 (n)表示。2 (n)的 取值范

26、围是(0, °o) °2,2,2 (5)的分布密度曲线见图 5 °2分布密度曲线是单峰的,右偏倚的。随着自由度n的加大,偏倚程度变小。当n增大时,2分布的形状趋近于正态分布。可以证明(略),2分布的均值和方差分别为E( 2 (n) ) = nVar(F (n) ) = 2 n, n > 2由上两式知,当n增大时,2分布的均值和方差也分别增大。 注意:2分布的百分位数可以在2分布表(附表3)中查到。练习查2分布表(p.426) °例:已知 P 2 . 2 10) = 0.05,求 2 :。沪0.95( 10) = 1831例:P 2 2: .(18)

27、 = 0.01,求 2 :。0.99( 18) = 34.81例:P 2 2:(18) = 0.95,求 2 :。.05(18) = 9.396.2.4 F分布如果随机变量x有如下密度函数,f (x)n2)x(n1 匸)/2xn -n2)/2 , X > 0其中常量P(n1, n2)只与n1和n2有关(而与x无关)n = 1,2,则称连续型随机变量 x服从 第1自由度为n1,第2自由度为n2的F分布。F分布是连续型的概率分布,并具有两个参数ni和 匕。ni和n2是F分布的两个自由度。ni称作第1自由度(或分子自由度),n2称作第2自由度(或分母自由度)。ni和匹可 以取所有正整数,从而构

28、成一个F分布族。每个(ni, n2)对应着F分布族中一个不同的具体的分布曲线。服从自由度为ni和n2的F分布的随机变量用F(ni, n2)表示。F(ni, n2)的取值范围是(0, oo)。服从F分布的密度曲线见图6。F分布密度曲线是单峰的,右偏倚的。随着自由度ni和n2的加大,F分布的众数趋近于 ioF分布的分布密度曲线随二个自由度的不同而不同。F分布表给出了左侧概率:-=0.9 ,:-=0.95 时,对应 F :.(临界值。的值,即 P ( F < F-.(ni, n2) ) = : oF分布的均值为E(F(ni, n2) = n / (n2 - 2),门2 > 2注意:(i)

29、当n2 < 2时,均值无定义。F分布的方差为(2)当n2增大时,E(F(ni, n2)趋近于i oVar(F(ni, n2)=22n2 (ni 亠n2 -2)2ni (n2 2) (n2 4)n2 > 4注意:(i)当n2 < 4时,方差无定义。(2。当ni, n2增大时,Var(F(M, n2)趋近于零。 因为F分布有两个自由度,所以F分布是以不同的百分位数分别编表的。附表c-4给出F分布第95, 99百分位数表(相对于 :-=0.95和:-=0.99 )已知F分布第95, 99百分位数,可利用下式求其第5, i百分位数。Fi-:z( ni, n2) = i / ( F :

30、-(n2, ni)注意:在上式的分母中ni, n2对调了位置。练习查F分布表(p.428) o例:已知 P ( FEFo.95(4, 6) = 0.95,求 Fo.95(4, 6)= ?。查 F 分布表,F°.95 (4, 6) = 4.5例:P ( F_Fo.05(6.4) ) = 0.05 时,求 F 0.05( 6.4) ) = ?oL_iF0.05 (6, 4) =F 0.95(4,6)i4.53=0.22例:已知P ( F 一 Fo.99 (8, 25)=0.99,求 F 0.99 ( 8, 25) = ? o查 F 分布表(p.430), F0.99(8, 25)= 3.

31、32注意:t分布、2分布、F分布是统计推断中常用到的三个统计量。6.3随机变量Z、t、2与F的关系1. Z2 = F(i,:)22. t( n) = F(i, n)3. ( n) / n = F (n,:)第7章中心极限定理第4章介绍过随机事件发生的频率具有稳定性, 例如投硬币。在实践中人们还认识到大 量观测值的算术平均数也具有稳定性。 无论个别随机现象的结果如何,大量随机现象的平均 结果实际上与每一个个别随机现象的特征无关。这种平均结果几乎不再是随机的了。7.1大数定律设随机变量Xi, X2,xn相互独立,服从同一分布,且分别具有相同的期望和方差(有 限值),E(Xi)=丄,Var(xi)=

32、:二(i = 1, 2,,则对于任意正数;有Lim P .IX- := 1(7.1)n_.n其中又=丄7 Xi。1 X-:是一个随机事件。定律表明当n.时,这个事件的概率趋n i 1近于1。随着n的增加,X依概率收敛于亠设随机变量X1, X2,. 2E(xi) = J Var (xi)=二,7.2中心极限定理 X n相互独立,服从同一分布,且有相同的期望与方差(有限值)Lim P :a :n:- n :二:b / =2du(7.2)(i = 1,2, n);,则对于一切实数a : b有nnn因为Ep' xi ) = nJ Var (、 xj = n;2,所以只要n充分大,无论Xi服从何

33、种分布; xii 1i =1i =1n P近似服从正态分布,即E XiT N (n», nb2)。i dn、' Xi -nJ当id的分子和分母同除n时,(2)式也可写成,:2LimPf 乂一' _z;=n ,. n- n:(7.3)即x服从正态分布,X »服从标准正态分布。当n充分大时,x近似服从正态分布。7.3 李雅普诺夫 (Liapunov)定理设随机变量xi, X2,Xn相互独立,具有有限的数学期望与方差E(Xi)=J , Var (xi) = c2,n(i = 1,2, n),且每个Xi对和式v Xj影响都不大,则7Xi八叫u219du其中Z为一切实

34、数。这说明一个随机现象有众多随机因素引起,且每一因素都不在变化中n起显著作用,那么,当n充分大时,描述这个随机现象的随机变量xi近似服从正态分布。i 4例1 :一个螺丝重量是一个随机变量Xi , E(Xi) = 0.1公斤,Var(xi) = 0.01公斤2,求一盒(100个)螺丝重量超过 12公斤的概率。100100E(' xi ) = 100 0.1=10, Var(' Xi )Vi An解:依据中心极限定理,V Xi近似服从正态分布。i 1100 0.01 = 1100p4 Xi 12 / =i生100二 Xi -1012 10=P二1 = 1 - P(Z - 2) = 1 - 0.9773 = 0.02271 1例2某一部件包括10部分,每部分的长度 X是一个随机变量,它们相互独立,服从同一分布E(X) = 2(cm), . Var(X) = 0.05,若规定总长度为 20_0.1cm时为合格品,求该部件为合格品的概率。解:已知XiN(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论