版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、概率论与数理统计第二章 随机变量及其分布 随机变量 离散型随机变量及其分布律随机变量的分布函数连续型随机变量及其概率密度随机变量的函数的分布p (l)E(q)N (m, s2)b (n, p) 在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念.1 随机变量 一、随机变量概念的产生 1、有些试验结果本身与数值有关(本身就是一个数). 例如,掷一颗骰子面上出现的点数; 七月份西安的最高温度.每天从西安下火车的人数;昆虫的产卵数;例抛掷一枚硬币可能出现的两个结果, 可以用一个变量来描述 2、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是
2、说,把试验结果数值化. 正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系. 再如将一枚硬币抛掷三次, 观察出现正面和反面的情况, 样本空间是S=HHH, HHT, HTH, THH, HTT, THT, TTH, TTT. 令X表示三次投掷得到正面H的总数, 那么X是定义在S上的一个实单值函数e.X(e)R 称这种定义在样本空间上的实值函数为随量机变简记为 r.v.(random variable) 定义: 设S=e是试验的样本空间, 如果量X是定义在S上的一个实值单值函数, 即对于每一个eS,有一实数X=X(e)与之对应, 则称X为随机变量. 随机变量通常用大写字母X
3、, Y, Z或希腊字母、等表示,而表示随机变量所取的值时,一般采用小写字母x, y, z等. 这种实值函数与在高等数学中大家接触到的函数一样吗?(2) 随机变量的取值具有随机性,它随试验结果的不同而取不同的值,试验之前仅知道它可能取值的范围,而不能预知它取什么值。它与普通函数的区别在于随机变量取某一个值或在某个区间内取值均为随机事件。 (1) 随机变量是定义在样本空间S上的实值单值函数,S中的元素不一定是实数,而普通函数只是定义在实数轴上。 (3) 随机变量的取值具有统计规律性。由于试验结果的出现有一定的概率,因而随机变量取各个值也有一定的概率。 例如,从某一学校随机选一学生,测量他的身高.
4、我们可以把可能的身高看作随机变量X, 然后可以提出关于X的各种问题.如 PX1.7=? PX1.5=?P1.5X1.7=? 随机变量概念的引入是概率论走向成熟的一个标志,它弥补了随机试验下的随机事件种类繁多, 不易一一总结它们取值规律的缺陷, 因为如果知道随机变量的分布, 随机试验下任一随机事件的概率也随之可以得到;另外引入随机变量后,可以使用高等数学的方法来研究随机试验. 二、引入随机变量的意义事件及事件概率随机变量及其取值规律例:引入适当的随机变量描述下列事件:将3个球随机地放入三个格子中, 事件A=有1个空格, B=有2个空格, C=全有球进行5次试验,事件D=试验成功一次, F=试验至
5、少成功一次, G=至多成功3次思考 将一枚硬币抛掷3次, 用X表示3次抛掷出现H的总次数, 那么对样本空间S中的每一个样本点, X都有一个数与之对应, 即那么 PX=1=? PX2=?样本点HHHHHTHTHTHHHTTTHTTTHTTTX 的值 3 2 2 2 1 1 1 0 一般,若L是一个实数集合, 将X在L上取值写成XL. 它表示事件B=e| X(e)L, 此时有PXL=P(B)=Pe| X(e)L.上例 PX=1=P(A), A=HTT, THT, TTH PX2=P(B), B=HTT, THT, TTH, TTT 三、样本点和随机变量之间的关系随机变量离散型随机变量连续型随机变量
6、非离散型随机变量奇异型随机变量所有取值可以逐个一一列举全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间. 四、随机变量的分类 离散型随机变量: 随机变量所有可能取的值是有限个或可列无限多个. 为了掌握随机变量 X的统计规律性 ,我们不仅需要知道随机变量X的取值,而且还应知道X取每个值的概率.2 离散型随机变量及其分布律 如X:取到次品的个数,Y: 收到的呼叫数 是离散型随机变量但Z: 电视机的寿命 不是离散型随机变量 这样,我们就掌握了X这个随机变量取值的概率规律.从中任取3 个球取到的白球数X是一个随机变量X可能取的值是0,1,2取每个值的概率为例1且 1、定义 设离散型随机变量
7、X的所有可能取值为xk (k=1, 2 , ), 称X取各个可能值的概率, 即事件X=xk的概率, PX=xk=pk, (k=1, 2, ) 为X的分布律或概率分布. Xx1 x2xkpkp1p2pk一、离散型随机变量概率分布的定义也可以表示为用这两条性质判断一个函数是否是概率分布(1) pk 0, k1, 2, ;(2) 2. 分布律的性质例2.设随机变量X的概率分布为:k =0,1,2, ,试确定常数a .解: 依据概率分布的性质:PX =k0, a0从中解得欲使上述函数为概率分布这里用到了幂级数展开式k =0,1,2, ,3. 利用分布律求事件概率 离散型随机变量的分布律不仅给出了X=x
8、k 的概率,而且通过它可以求事件发生的概率. 由概率的有限可加性有例3 设袋中有5只球,其中有2只白3只红。现从中任取3只球(不放回),求抽得的白球数X为k的概率.解 k可取值0,1,2求抽得白球数至少为的概率。?例4. 某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的分布律.解: X可取0、1、2为值 PX =0=(0.1)(0.1)=0.01 PX =1= 2 (0.9)(0.1) =0.18 PX =2=(0.9)(0.9)=0.81 且 PX =0+ PX =1+ PX =2=11. (0-1)分布 若随机变量X只取0和1, 其分布律为PXkpk(1p)1k, k0, 1
9、 (0p1)则称X服从(01)分布(两点分布) .二、常见的离散型随机变量的概率分布其分布律也可以写成 凡是随机试验只有两个可能的结果,常用0 - 1分布描述,如产品是否格、人口性别统计、系统是否正常、电力消耗是否超负荷等等应用场合 200件产品中,有196件是正品,4件是次品,今从中随机地抽取一件,若规定例 5.X=1, 取到合格品0, 取到不合格品 则 PX=1=196/200=0.98, PX=0=4/200=0.02, 故 X服从参数为0.98的两点分布 . 若以X表示n重伯努利试验事件A发生的次数,则称X服从参数为n, p的二项分布.记作Xb(n, p), 其分布律为:2.伯努利试验
10、、二项分布 设将试验独立重复进行n次,每次试验都只有两种可能的结果A和A,设事件A发生的概率为p,则称这n次试验为n重伯努利试验. 例6. 从某大学到火车站途中有6个交通岗, 假设在各个交通岗是否遇到红灯相互独立, 并且遇到红灯的概率都是1/3.(1)设X为汽车行驶途中遇到的红灯数, 求X的分布律.(2)求汽车行驶途中至少遇到5次红灯的概率.解:(1)由题意, X b(6,1/3), 于是X的分布律为: 例7 某人射击的命中率为0.02,他独立射击400次,试求其命中次数不少于2的概率.解 设X表示400次独立射击中命中的次数,则Xb(400, 0.02),故, PX2=1-PX=0-PX=1
11、=1-0.98400-(400)(0.02)(0.98399)=0.9972.例8,见P35例2注: 伯努利概型对试验结果没有等可能的要求,但有下述要求:(1)每次试验条件相同; 二项分布描述的是n重伯努利试验中出现“成功”次数X的概率分布.(3)各次试验相互独立.(2)每次试验只考虑两个互逆结果A或A, 且P(A)=p , P(A)=1-p ; 二项分布 b(n,p) 和0-1分布之间的关系 1. 若X服从0-1分布,则Xb(1, p) 2. 把试验E在相同条件下, 相互独立地进行n次, 记X为n次独立试验中结果A出现的次数, Xi为第i次试验中结果A出现的次数, 则 Xi b(1, p),
12、 且X= X1+X2+Xn b(n, p) 设试验E只有两个结果: A和A记p=P(A),0p13.泊松(Poisson)分布定义 若离散型随机变量X的分布律为PXk , k0, 1, 2, (0),则称X服从参数为l的泊松分布,记为Xp(l).易见 例 某一无线寻呼台,每分钟收到寻呼的次数X服从参数 =3 的泊松分布. 求:(1)一分钟内恰好收到3次寻呼的概率. (2)一分钟内收到2至5次寻呼的概率. 解:因为 Xp(3),所以X的分布律为 PX=k=(3k/k!)e-3 , k0, 1, 2, .则, (1) PX=3=(33/3!)e-30.2240 (2) P2X5 =PX=2+PX=
13、3+PX=4+PX=5 =(32/2!)+(33/3!)+(34/4!)+(35/5!)e-3 0.7169解: 例10某一城市每天发生火灾的次数X服从参数为0.8的泊松分布. 求:该城市一天内发生3次以上火灾的概率. PX3=1- PX3 =1-PX=0+ PX=1+PX=2 =1-(0.8 0/0!)+(0.81/1!)+(0.82/2!)e-0.8 0.0474 泊松分布的图形特点:Xp(l) 历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的 .泊松定理:对于二项分布b(n,p),当n充分大,p又很小时,则对任意固定的非负整数k,有近似公式对例用泊松定理, 取 =
14、np(400)(0.02)8, 故近似地有 PX21 PX0P X11(18)e80.996981. 由泊松定理,n重伯努利试验中稀有事件出现的次数近似地服从泊松分布. 我们把在每次试验中出现概率很小的事件称作稀有事件. 如地震、火山爆发、特大洪水、意外事故等等 对于离散型随机变量,如果知道了它的概率分布,也就知道了该随机变量取值的概率规律.在这个意义上,我们说离散型随机变量由它的概率分布唯一确定. 两点分布、二项分布、泊松分布作业:552、 对非离散型随机变量, 其取值不是离散的, 有时可以充满整个区间, 对于这种更一般的随机变量, 我们感兴趣的就不是它取到某个具体的数的概率, 而是它的取值
15、落在某一个区间上的概率, 比如: Px1a.Px1a=1-PX a.为此我们引入随机变量分布函数的概念.3 随机变量的分布函数 设X是随机变量,对任意实数x, 事件Xx的概率PXx称为随机变量X的分布函数, 记为F(x), 即 F(x)P Xx. 易知,对任意实数a, b (ab), PaXbPXbPXa F(b)F(a).一、分布函数的概念1. 这里分布函数的定义对任何随机变量都适用.2. 分布函数F(x)P Xx 是一个普通的函数, 它的自变量是全体实数. 掌握了X的分布函数就掌握了X在(, +)上的概率分布情况. 注: 1、单调不减性: 若x1x2, 则F(x1)F(x2);3、右连续性
16、:对任意实数x,二、分布函数的性质2、归一 性: 对任意实数x,0F(x)1,且这三个性质是分布函数的充分必要性质例1 设随机变量X具分布律如右表,试求出X的分布函数及PX1, P0.5X1.5, P1X2.解 X012Pk0.10.60.3PX1=F(1)=0.7, P0.5X 1.5=F(1.5)-F(0.5)=0.7-0.1=0.6,P1 X 2=F(2)-F(1)+PX=1=1-0.7+0.6=0.9 一般地,对离散型随机变量 XPX= xkpk, k1, 2, 其分布函数为 例2. 向0,1区间随机抛一质点,以X表示质点坐标.假定质点落在0,1区间内任一子区间内的概率与区间长成正比,
17、求X的分布函数.当x1时, Xx=S, 故F(x)=1.用分布函数描述随机变量不如分布律直观,对非离散型随机变量,是否有更直观的描述方法??ab4 连续型随机变量 1. 定义 对于随机变量X,若存在非负函数f(x), (-x+),使对任意实数x,都有则称X为连续型随机变量, f(x)为X的概率密度函数,简称概率密度或密度函数. 常记为X f(x) , -x+一、概率密度注:连续型随机变量的分布函数是连续函数. (1) 非负性 f(x)0,(-x); (2) 归一性EX设随机变量X的概率密度为求常数a.答:2.密度函数的性质这两条性质是密度函数的充要性质(3) 若x是f(x)的连续点,则EX 设
18、随机变量X的分布函数为:求f(x). 故 X的密度 f(x) 在 x 这一点的值,恰好是X落在区间 上的概率与区间长度 之比的极限. 这里,如果把概率理解为质量, f (x)相当于线密度.对 f(x)的进一步理解: 若x是 f(x)的连续点,则:f(x) =若不计高阶无穷小,有: 它表示随机变量 X 取值于(x , x+Dx的概率近似等于 f(x)Dx .f(x)Dx在连续型r.v理论中所起的作用与PX=xk 在离散型r.v理论中所起的作用相类似.(4)对任意实数a, 若X f(x), (-x), 则 PX=a0. 于是可见,由P(A)=0, 不能推出由P(B)=1, 不能推出 B=S令Dx0
19、, 由于X是连续型r.v, 所以它的分布函数连续, 从而, PX=a=0.推导密度函数的几何意义为 例 已知随机变量X的概率密度为1) 确定常数k. 2) 求X的分布函数F(x). 3) 求PX(0.5,1.5).解:1)2)所以, k=13) PX(0.5,1.5)= 或 =F(1.5)-F(0.5)= .作业:5720、21、23若 r.v. X的概率密度为:则称X在区间( a, b)上服从均匀分布,记作: X U(a, b)1、均匀分布(Uniform)三种常见连续型随机变量 在区间( a, b)上服从均匀分布的随机变量X,具有如下意义的等可能性, 即它落在 ( a, b)区间任意等长度
20、的子区间内的可能性是相同的.若X U(a, b),则对于满足ac0)的指数分布.若 X其分布函数为三种常见连续型随机变量例. 电子元件的寿命X(年)服从参数为3的指数分布(1)求该电子元件寿命超过2年的概率。(2)已知该电子元件已使用了1.5年,求它还能使用至少两年的概率为多少?解 指数分布常用于可靠性统计研究中,如元件的寿命. 正态分布是应用最广泛的一种连续型分布. 正态分布在十九世纪前叶由 高斯(Gauss)加以推广,所以通常称为高斯分布.德莫佛 德莫佛(De Moivre)最早发现了二项分布的一个近似公式,这一公式被认为是正态分布的首次露面.3、正态分布三种常见连续型随机变量高斯 (I)
21、、正态分布的定义 若r.v. X 的概率密度为记作 f (x)所确定的曲线叫作正态曲线.其中m和s都是常数, m任意, s 0, 则称X服从参数为 m和s的正态分布. (Normal)图形关于直线x= 对称: f ( + x) = f ( - x) 在 x = 时, f (x) 取得最大值在x= 时,曲线y = f(x)在对应的点处有拐点曲线 y = f (x) 以x轴为渐近线曲线 y = f (x) 的图形呈单峰状(II)、正态分布 的图形特点-6-5-4-3-2-10.050.10.150.20.250.3f (x) 的两个参数: 位置参数即固定 , 对于不同的 , 对应的 f (x)的形
22、状不变化,只是位置不同 形状参数 固定 ,对于不同的 ,f (x) 的形状不同 由于 f (m) 所以 越小, f(x)变得越尖, 而X落在附近的概率越大.大小下面是我们用某大学大学生的身高的数据画出的频率直方图。红线是拟合的正态密度曲线可见,某大学大学生的身高应服从正态分布。 人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。 除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪
23、声等等,都服从或近似服从正态分布.应用场合 若随机变量 X 受到众多相互独立的随机因素的影响, 而每一个别因素的影响都是微小的, 且这些影响可以叠加, 则 X 服从正态分布.可用正态变量描述的实例非常之多:各种测量的误差; 人的生理特征;工厂产品的尺寸; 农作物的收获量;海洋波浪的高度; 金属线的抗拉强度;热噪声电流强度; 学生们的考试成绩;(III) 、设X ,X的分布函数是(IV)、标准正态分布的正态分布称为标准正态分布.其密度函数和分布函数常用 j(x) 和 F(x) 表示:它的依据是下面的定理: 标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布. 根
24、据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,则 N(0,1) 设定理1 书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.(V)、正态分布表表中给的是x0时, (x)的值.当-x0时1. 若 XN(0,1),2. 若N(0,1) 那么EX1.设随机变量XN(-1,22),则 P-2.4X3s的值. 如在质量控制中,常用标准指标值m3作两条线,当生产过程的指标观察值落在两线之外时发出警报.表明生产出现异常.例:已知XN(d,0.52),问d至少为多少时,解:由题意d需满足因为所以例. 一种电子元件的使用寿命(小时)服从正态分布(
25、100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率. 解:设A为使用的最初90小时内元件损坏;Y为A发生的元件数.故则Yb(3,p),其中 例 (1)假设某地区成年男性的身高(单位:cm) XN(170,7.692),求该地区成年男性的身高超过175cm的概率。 解: (1) 根据假设XN(170,7.692),则故事件X175的概率为P X175=0.2578解: (2) 设车门高度为h cm,按设计要求PX h0.01或 PX h 0.99,下面我们来求满足上式的最小的h.(2)公共汽车车门的高度是按成年男性与车门顶头碰头机
26、会在0.01以下来设计的,问车门高度应如何确定?因为XN(170,7.692),故 PX0.99所以 =2.33,即 h=170+17.92188设计车门高度为188厘米时,可使男子与车门碰头机会不超过0.01.PX h 0.99求满足的最小的h .(VII)标准正态分布的上 分位点z 设 X N (0,1) ,0 1,称满足的点 z 为X的上 分位点 常用的几个数据z0.10.20.30.4z1-= -z 作业:5825、26、30一、问题的提出 在实际中,人们常常对随机变量的函数更感兴趣.求截面面积 A= pd2/4的分布.5 随机变量的函数的分布例如,已知圆轴截面直径 d 的分布,又如:
27、已知t=t0 时刻噪声电压 V的分布,求功率 W=V2/R (R为电阻)的分布等. 一般地、设随机变量X 的分布已知, Y=g (X) (设g是连续函数), 如何由 X 的分布求出 Y 的分布? 这个问题无论在实践中还是在理论上都是重要的.二、离散型随机变量函数的分布例1:已知XPk-1 0 1求: Y=X2的分布律.YPk0 1 解:Y的所有可能取值为0,1. 由PY=0=PX2=0=PX=0=1/3PY=1=PX2=1=PX=1+PX=-1=1/3+1/3=2/3得Y的分布律为 如果g(xk)中有一些是相同的,把它们作适当并项即可.一般,若X是离散型 r.v ,X的分布律为X则 Y=g(X
28、)三、连续型随机变量函数的分布解:设X、Y的分布函数为FX(x)、 FY(y),则例2设 X 求 Y=2X+8 的概率密度.FY(y)=PYy = P2X+8 y 将FY(y)关于y求导数, 可得Y=2X+8的密度函数故知当即8 y 0 时, 注意到 Y=X2 0,故当 y0时,解: 设Y和X的分布函数分别为FY (y) 和FX (x), 若则 Y=X2 的概率密度为:称Y服从自由度为1的c2分布 从上述两例中可以看到,在求PYy 的过程中,关键的一步是设法从 g(X) y 中解出X,从而得到与 g(X) y 等价的X的不等式 .例如,用 X 代替 2X+8 y 用 代替 X2 y 这样做是为
29、了利用已知的 X的分布,从而求出相应的概率. 这种方法叫分布函数法, 是求r.v的函数的分布的一种常用方法. 下面给出一个定理,在满足定理条件时可直接用它求出随机变量函数的概率密度 .定理 设r.v X具有概率密度 fX(x), -x0或恒有 g (x)0 或 g(x)0, 且有反函数由前述定理得注意取绝对值已知X在(0,1)上服从均匀分布,代入 fY (y)的表达式中得即Y服从参数为2的指数分布. 对于连续型随机变量,在求Y=g(X) 的分布时,关键的一步是把事件 g(X) y 转化为X在一定范围内取值的形式,从而可以利用 X 的分布来求 P g(X) y .这一讲我们介绍了随机变量函数的分布.作业:5933、35(1)(2)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北文理学院《软件应用》2023-2024学年第一学期期末试卷
- 湖北水利水电职业技术学院《兽医药理学实验》2023-2024学年第一学期期末试卷
- 2025年度社区公共场地使用权租赁合同2篇
- 桥梁施工技术方案
- 宁波2025年浙江宁波市镇海区招聘事业编制教师69人(中学岗位)笔试历年参考题库附带答案详解
- 天津2025年天津中医药大学第一附属医院第四批人事代理制人员招聘笔试历年参考题库附带答案详解
- 2025年度购销合同:农产品批发交易(2025版)2篇
- 2025年河北张家口市蔚县汇景文旅产业发展有限公司招聘笔试参考题库附带答案详解
- 临汾2024年山西临汾市事业单位招聘95人笔试历年参考题库附带答案详解
- 上海2025年上海电机学院教师招聘100人笔试历年参考题库附带答案详解
- 子宫内膜癌业务查房课件
- 社会学概论课件
- 华为经营管理-华为的研发管理(6版)
- C及C++程序设计课件
- 带状疱疹护理查房
- 公路路基路面现场测试随机选点记录
- 平衡计分卡-化战略为行动
- 国家自然科学基金(NSFC)申请书样本
- 湖南省省级温室气体排放清单土地利用变化和林业部分
- 材料设备验收管理流程图
- 培训机构消防安全承诺书范文(通用5篇)
评论
0/150
提交评论