




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 随机变量及其分布,第一节 随机变量,为了全面地研究随机试验的结果,揭示随机 现象的统计规律性,我们将随机试验的结果与实 数对应起来,将随机试验的结果数量化,从而引 入随机变量的概念。,在随机试验完成时,人们常常不是关心试验 结果本身,而是对于试验结果联系着的某个数感 兴趣。,一、随机变量概念的产生,在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念.,1、有些试验结果本身与数值有关(本身就是一个数).,例如,掷一颗骰子面上出现的点数;,四月份哈尔滨的最高温度;,每天进入一号楼的人数;,昆虫的产卵数;,2、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量
2、来表示它的各种结果.也就是说,把试验结果数值化.,正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系.,这种对应关系在数学上理解为定义了一种实值单值函数.,e.,X(e),R,这种实值函数与在高等数学中大家接触到的函数不一样!,(1)它随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值.,(2)由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率.,称这种定义在样本空间S上的实值单值函数X= X(e)为,随,量,机,变,简记为 r.v.,随机变量通常用大写字母 X,Y,Z,W,N 等表示,
3、有了随机变量, 随机试验中的各种事件,就可以通过随机变量的关系式表达出来.,引入随机变量的意义,如:单位时间内某电话交换台收到的呼叫次数用X表示,它是一个随机变量.,事件收到不少于1次呼叫,没有收到呼叫, X 1,X= 0,随机变量概念的产生是概率论发展史上的重大事件. 引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.,事件及 事件概率,随机变量及其 取值规律,我们将研究两类随机变量:,如“取到次品的个数”, “收到的呼叫数”等.,随机变量,离散型随机变量,连续型随机变量,例如,“电视机的寿命”,实际中常遇到的“测量误差”等.,随机变量的
4、分类,这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处;但因其取值方式不同,又有其各自的特点.,学习时请注意它们各自的特点和描述方法.,例如,,连续掷一颗骰子两次,观察两次出现的点数 之和。其样本空间为S=(i, j), i, j =1,2,3,4,5,6.,我们关心的并不是第一次、第二次出现的点 数,而是两次出现的点数之和是多少。,如果以 X 表示两次出现的点数之和,则对于每个 样本点e = (i, j) , X都有一个值与之对应, X= i+ j, 其可能的取值为2,3,4,5,6,7,8,9,10,11,12.,X取不同的值,代表着不同的随机事件。 (X是离散型),再如,在
5、一批灯泡中任取一只,测试其寿命。,其样本空间为,如果用X表示灯泡的 寿命值, 则每一个灯泡的测试结果即每一个样本 点都对应着 X 的一个值,且X取不同值对应着不 同的事件。如,X=1000(小时)表示“灯泡的寿命为1000小 时”, (小时)表示“灯泡的寿命为小于 或等于1500小时”。(X是连续型),在上述两例中,试验的结果本身就是数量性 质的随机现象,可直接用某一变量来表示。但还 有一些试验的结果不能直接用数量表示。,例如考察一台机器在一年内是否发生故障这一随 机现象,可能的结果共有两个,“完好”或“故障”。 它们并不表示为数量;又如掷硬币的试验也一样。,对这些试验的结果,我们可以把它们数
6、量化, 如引入一个只取两个值 (1或0) 的变量X,用“X=1” 表示机器完好这一随机事件,用“X=0”表示机器发 生故障这一随机事件。(X是离散型的),解:分析,再如 一报童卖报,每份0.15元,其成本为0.10元. 报馆每天给报童1000份报,并规定他不得把卖不出的报纸退回. 设X为报童每天卖出的报纸份数,试将报童赔钱这一事件用随机变量的表达式表示.,当 0.15 X1000 0.1时,报童赔钱,故报童赔钱 X 666(X是连续型的),由此可知,随机试验的结果往往可以用一个变 量来表示,变量取什么值由试验的结果决定,而试 验结果又是样本空间的一个子集。为此,我们给出 随机变量的定义。,定义
7、:,设随机试验的样本空间为S=e。X=X(e)是 定义在样本空间S上的实值单值函数。 称 X=X(e) 为随机变量。,随机变量一般用大写的字母如X, Y, Z 等表示, 而随机变量的取值一般用小写的字母如x, y, z表示。,随机变量X 常常简记为 r.v. X。,随机变量与一般的变量用着本质的区别, 主要表现在:,取值的随机性-即X取哪个值在试验之前无法 知道. (但在试验之前X的所以可能取值是已知的),(2) 取值的统计规律性-即X取某个值或在某个区 间内取值的概率是完全确定的。,随机变量的引入,使我们能用其来描述各种 随机现象,使我们有可能利用数学分析的方法对 随机试验的结果进行深入广泛
8、的研究和讨论。,在实际中,常用的随机变量有如下两类:,(1) 离散型随机变量,这类随机变量的主要特征是 它们可能取的值是有限个或无限可列个;,除了离散型随机变量以外 的随机变量。,(2) 非离散型随机变量,非离散型随机变量的情况比较复杂,在实用 中, 常遇到的是它的一个特殊情形-连续型随机 变量。,这类随机变量的主要特征是它们可能的取 值充满了某个有限或无限的区间。,第二节 离散型随机变量及其分布律,离散型随机变量只可能取有限个或无限可列个 值。为了全面地描述离散型随机变量,我们不仅要 知道它可能取的值是哪一些,而且还要知道它取这 些值的概率是多少。只有这样,才能确切地掌握离 散型随机变量的统
9、计规律性。,设离散型随机变量X所有可能的取值为,X取各个可能值的概率,即事件,的概率为,则称上述一系列等式为离散型随机变量X的分布律。,离散型随机变量X的分布律也可以用表格形式给出:,由概率的定义可知,离散型随机变量的分布律具 有以下两个性质:,例1:设一汽车在开往目的地的道路上需经过四组 信号灯, 每组信号灯以1/2的概率允许或禁止汽车 通过。以X表示汽车首次停下时,它已通过的信号 灯的组数(设各组信号灯的工作是相互独立的), 求X的分布律。,解:,以p表示每组信号灯禁止汽车通过的概率,则,以p=1/2代入并列成表格,得,例2:一袋中装有5只球,编号为1,2,3,4,5.在袋中同 时取3只,
10、以X表示取出的3只球中的最大号码,写 出X的分布律。,解:,列成表格,得,几个常用的离散型随机变量的分布,(一) 两点分布(贝努利分布),如果离散型随机变量X只取a,b两个值,且其分布律为,则称离散型随机变量X服从两点分布(贝努利分布),或称离散型随机变量X的分布为两点分布。,当 a=0,b=1 时,又称(0 1)分布,则称E为贝努利试验。,(二) 贝努利试验、二项分布,则称E为贝努利试验。,将贝努利试验独立重复地进行n次,则称这一串重复的独立试验为n重贝努利试验。,若在n重贝努利试验中,事件A发生的次数为 X,则X的可能的取值为0, 1, , n。,而人们所关心的问题是:事件A恰好发生k次的
11、概率是多少?,则:,则有,显然,,- 二项概率公式,如果离散型随机变量X可能取的值为0, 1, 2, , n。 且其分布律为,则称离散型随机变量X服从二项分布,记为,特别地,当n=1时,,即为 (0 - 1)分布。,事件A至少出现m次的概率为,例1:某人进行射击,设每次射击的命中率为0.02, 独立射击400次,试求至少击中两次的概率。,解:,将一次射击看成是一次试验(贝努利试验),设击中的次数为X,则,X的分布律为,所以所求概率为,例2:某人进行射击,设每次射击的命中率为 0.02, 问至少必须进行多少次独立射击,才能使至少击中 一次的概率不少于0.9。,解:,设 X 为n次射击中射中的次数
12、,则,例3:某店内有4名售货员,据以往经验,每名售 货员平均在一小时内只用秤15分钟。问该店应配 置几台秤较为合理?,解:,观察一名售货员是否用秤作为一次试验 (贝努利试验),X的分布律为,则观察四名售货员在某一时刻是否都在用秤 就是4重贝努利试验,设某一时刻需用秤的售货员人数为X,则,则,由此可见,配置2台秤较为合理。,例4:从某工厂的产品中进行重复抽样检查,共取出200件样品,经检查后发现其中共有4件次品。 问能否相信该厂出次品的概率不超过0.005?,解:,先假设该厂出次品的概率为 0.005,那么200件 样品中的次品数 X 服从,则200件样品中有4件次品的概率为,这说明,当该厂出次
13、品的概率为0.005时,检查200 件产品发现有4件次品的事件是小概率事件, 因为 小概率事件在一次试验中几乎不可能发生,但现在 居然发生了。因此,我们有理由怀疑原来的假设有 问题。即该厂出次品的概率不超过0.005不可信。,例5 已知100个产品中有5个次品,现从中有放回 地取3次,每次任取1个,求在所取的3个中恰有2个次品的概率.,解: 因为这是有放回地取3次,因此这3 次试验 的条件完全相同且独立,它是3重贝努里试验.,依题意,每次试验取到次品的概率为0.05.,设X为所取的3个中的次品数,,于是,所求概率为:,则,X b(3,0.05),,若将本例中的“有放回”改为”无放回”, 那么
14、各次试验条件就不同了, 此试验就不是伯努 利试验 . 此时, 只能用古典概型求解.,请注意:,(三) 泊松分布,如果离散型随机变量X可能取的值为0, 1, 2, , 且其分布律为,则称离散型随机变量X服从泊松分布,记为,在现实生活中有许多随机现象服从泊松分布,这种情况特别集中在两个领域中,一是社会生活中的服务领域,如电话交换台在一段时间内来到的呼叫数;公共汽车站在一段时间内来到的乘客数;某地区在一天内邮递遗失的信件数;某一医院在一天内的急诊人数;某一地区在一段时间间隔内发生的交通事故数等。另一领域是物理学,如在一段时间内由放射性物质发出的、落在某区域内的质点数;在一段时间内由显微镜观察得到的落
15、在某区域内血球数等。它们都服从泊松分布。,例2 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?,解:,设该商品每月的销售数为X,已知X服从参数=5的泊松分布.,设商店在月底应进某种商品m件,进货数,销售数,查泊松分布表得P383,PXm 0.05,也即,于是得 m+1=10,m=9件,或,例3 (15题)利用泊松逼近二项分布,练习题,第三节 随机变量的分布函数,对于非离散型随机变量X,由于其取值不能 一个一个地列举出来,因而就不能像离散型随机 变量那样可以用分布律来刻画
16、它。另外,我们通 常所遇到的非离散型随机变量取任一指定的实数 值的概率都等于0(这一点在下一节将会讲到)。 再着,在实际问题的讨论中,对有些随机变量, 例如误差 ,元件的寿命T等,我们并不会对误 差 ,寿命T=1251.3(h)的概率感兴趣, 而是考虑误差落在某个区间的概率,寿命大于某 个值的概率,因而我们现在考虑随机变量所取的 值落在一个区间的概率:,为此,现引入随机变量的分布函数的概念。,定义:,设X是一个随机变量,,x是任意实数,函数,称为X的分布函数。,分布函数具有以下几个性质:,(1) F(x) 是x的不减函数,,(4) F(x) 至多有可列个间断点,且在其间断点处是 右连续的。,对
17、离散型随机变量X,若其分布律为,则其分布函数为,(1) 在分布函数的定义中, X是随机变量, x是参变量.,(2) F(x) 是r.v X取值不大于 x 的概率.,(3) 对任意实数 x1x2,随机点落在区间( x1 , x2 内 的概率为:,P x1X x2,因此,只要知道了随机变量X的分布函数, 它的统计特性就可以得到全面的描述.,=P X x2 - P X x1 ,= F(x2)-F(x1),请注意 :,分布函数是一个普通的函数, 正是通过它,我们可以用高等数 学的工具来研究随机变量.,设离散型 r .v X 的分布律是,P X=xk = pk , k =1,2,3,F(x) = P(X
18、 x) =,即F(x) 是 X 取 的诸值 xk 的概率之和.,一般地,则其分布函数,例1:设随机变量X的分布律为,求X的分布函数 ,并求,解:,即分布函数F(x)为,例3:一个靶子是半径为2米的圆盘,设击中靶上 任一同心圆盘上的点的概率与该圆盘的面积成正 比,并设射击都能中靶, 以X表示弹着点与圆心 的距离。试求随机变量X的分布函数。,解:,故得 k=1/4,,于是,上面两个例子是离散型的。,即分布函数F(x)为,容易看出,对上述的F(x),,存在 f (t),使得,这就是说, F(x)恰是非负函数 f (t) 在区间 上的积分。,在这种情况我们称X为连续型随机变量。,第四节 连续型随机变量
19、及其概率密度,如果对于随机变量X的分布函数F(x),存在非 负函数f (x), 使对于任意实数 x 有,则称X为连续型随机变量,其中函数f (x)称为X的 概率密度函数,简称概率密度。,可以证明连续型随机变量X的分布函数 F(x)是连续函数。,概率密度函数 f (x)的性质:,概率密度的性质,利用概率密度可确 定随机点落在某个 范围内的概率,(3)对于任意实数 x1 , x2 , (x1 x2 ) ,对 f(x)的进一步理解:,若 x 是 f(x) 的连续点,则,故 X的密度 f(x) 在 x 这一点的值,恰好是X 落 在区间 上的概率与区间长度 之比的极 限. 这里,如果把概率理解为质量,
20、f (x) 相当于线密度.,也表明f (x)不是 X 取值 x 的概率,而是 X 在 x 点概率分布的密集程度。由 f (x)的大小可反映出X 在 x 点附近取值的概率大小。,由上式,还可得:,对连续型随机变量X,有,因此,如A是不可能事件,则 P(A) = 0, 但反之不然。,另外有:,请注意与离散型的不同,要注意的是,密度函数 f (x)在某点处a的高度,并不反映X取值的概率. 但是,这个高度越大,则X取a附近的值的概率就越大. 也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度.,a,以后当我们提到一个随机变量X的 “概率分布”时,指的是它的分布函数; 或者,当 X 是连续型随
21、机变量时指的是它的概率密度,当 X 是离散型随机变量时指的是它的分布律。,例:设连续性随机变量X的概率密度为,解:,几个常用的连续型随机变量的分布,(一) 均匀分布,如果连续型随机变量 X 的概率密度为,则称连续型随机变量X在区间 (a,b) 上服从均匀分布。,记为,在区间 (a,b) 上服从均匀分布的随机变量 X,具 有下述意义的等可能性:即它落在区间 (a,b) 中任意 等长度的子区间内的可能性是相同的。,如果 X在区间 (a,b) 上服从均匀分布。,则其概率密度为,其分布函数为,公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.,均匀分布常见于下列情形:,如在数值计算
22、中,由于四舍五 入,小数点后某一位小数引入的误差;,(二) 指数分布,如果连续型随机变量 X 的概率密度为,则称连续型随机变量 X 服从指数分布。,其分布函数为,在实际生活中,常用指数分布作为各种“寿 命” 分布的近似。如电子元件的寿命、动物的寿 命等都假定服从指数分布。,服从指数分布的随机变量X具有一个很有趣 的性质:无记忆性。,事实上,,无记忆性的理论解释:,已知某一元件已使用了s小时,则它总共能 使用至少s+t小时的条件概率, 与它从开始使用 时算起它至少能使用t小时的概率相等。,例1 某公共汽车站从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30, 7:45 等时刻有汽
23、车到达此站,如果乘客到达此站时间 X 是7:00 到 7:30 之间的均匀随机变量, 试求他候车时间少于5 分钟的概率.,解,依题意, X U ( 0, 30 ),以7:00为起点0,以分为单位,为使候车时间X少于 5 分钟,乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30 之间到达车站.,所求概率为:,即乘客候车时间少于5 分钟的概率是1/3.,(三) 正态分布,正态分布是概率论中最重要的一种分布。一方面,正态分布是自然界最常见的一种分布, 如测量时的误差、农作物的收获量、炮弹弹落点的分布、人的生理特征的尺寸(身高、体重等)、学生成绩的分布等都近似服从正态分布;一般说来,
24、如影响某一数量指标的随机因素很多,而每个因素所起的作用又不太大,且它们是相互独立的,而影响又是可以相互叠加的,则这个指标服从正态分布。这一点可以用概率论中的中心极限定理加以证明。(在第五章里将会介绍),另一方面,正态分布具有很多良好的性质,它的分布 具有“两头小,中间大”的特点,许多分布可用正态分布来 近似;另外一些分布又可以用正态分布来导出。因此在理 论研究中,正态分布又有十分重要的地位。,如果连续型随机变量 X 的概率密度为,则称连续型随机变量 X 服从参数为,的正态分布,或高斯(Gauss)分布,,记为,x,f(x),0,f (x) 具有的性质:,X 的概率密度为,X 的分布函数为,X
25、的概率密度特别记为,X 的分布函数特别记为,标准正态分布。,引理:,证:,由此知,证毕,于是,,则其分布函数F(x)可写成,由于正态分布在概率计算中的重要性,再加上正态分布可化为标准正态分布来处理,因此人们已编制好了标准正态分布的分布函数值表(见书后附表2)。,x,这说明,X的取值几乎全部集中在-3,3区间 内,超出这个范围的可能性仅占不到0.3%.,例1:将一温度调节器放置在贮存着某种液体的容器 内。调节器整定在 液体的温度X ( 以 计 ) 是 一个随机变量,且 求X 小于89的概率;(2) 若要求保持液体的温度至少为80 的概率不底于0.99,问d至少为多少?,解:,(1) 所求概率为,
26、(2) 按题意需求d满足,即,亦即,例2:设测量从某地到某一目标的距离时带有的随 机误差X具有概率密度为,求误差的绝对值不超过30的概率; 如果接连测三次,各次测量是相互独立的。求 至少有一次误差的绝对值不超过30的概率。,解:,(2) 三次中至少有一次误差的绝对值不超过30的逆事件即三次的误差的绝对值都超过30。,故所求的概率为,解,P(X h)0.01,或 P(X h) 0.99,,下面我们来求满足上式的最小的h .,看一个应用正态分布的例子:,例 公共汽车车门的高度是按男子与车门顶头碰头机会在 0.01 以下来设计的.设男子身高XN(170,62),问车门高度应如何确定?,设车门高度为h cm,按设计要求,因为 XN(170,6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 古诗词诵读8《卜算子·送鲍浩然之浙东》教学设计-2023-2024学年统编版语文六年级下册
- 统计学实战技巧教学试题及答案
- 汽车美容技能提升考试试题及答案
- 高考屈服性测试题及答案
- 员工内部竞聘上岗管理制度
- 绩效面谈记录存档管理制度
- 高中历史 1.1 统一中国的第一个皇帝秦始皇教学设计 新人教版选修4
- 施工单位项目2025年终总结(4篇)
- 技术文件外发登记备份管理制度
- 五年级数学(小数四则混合运算)计算题专项练习及答案汇编
- 太乙课堂游戏最终版
- 大数据分析和可视化平台使用手册
- 2025年杭州医学院考研试题及答案
- 2025年骨科入科考试题及答案
- 2025年山西工程职业学院单招职业倾向性测试题库含答案
- 术前预防感染
- 生产设备设施-射线探伤-安全检查表
- 2024重组胶原蛋白行业白皮书
- 临床药物治疗学知到智慧树章节测试课后答案2024年秋湖南中医药大学
- 【MOOC】压力与情绪管理-四川大学 中国大学慕课MOOC答案
- 政治理论应知应会100题
评论
0/150
提交评论