版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、现代物流与仿真,郭武斌 电话欢迎沟通!,第三讲 随机数与随机变量,5.1 学习目标,1理解随机变量的性质和随机分布的种类 2掌握随机数的生成方法 3掌握随机变量的生成方法,物流仿真中存在大量的随机分布,货物订单到来:爱尔朗分布 人员服务时间:正态分布 机械故障时间:威布尔分布 班轮到达时间:爱尔朗分布,知识关联图,产生均匀分布的伪随机数,确定符合数据的概率分布,产生特定分布的随机变量,逆变换法 函数变换法 卷积法 组合法 取舍法 近似法,平方取中法 线性同余法 ,贝努里分布 泊松分布 均匀分布 指数分布 爱尔朗分布 正态分布 韦伯尔分布等,随机变量的产生算法树,随机数
2、的产生(0-1均匀分布),产生伪随机数,独立性检验,否,是,可以使用,均匀性检验,否,是,5.2 随机系统中的随机变量和随机分布,5.2.1随机变量的定义和性质 (1)确定性活动与随机活动 确定性活动:是可以事先预言的,即在准确地重复一定的条件下,其变化的结果总是确定的,或者根据其过去的状态,相同的条件下可以预言将来的发展变化。确定性活动可以用一个确定的数学形式来描述:f(t) 等。 随机性活动:其变化的结果是事先不可预言的,即在相同的条件下进行重复实验,每次结果未必相同,或者是知道其过去的状况,在相同的条件、未来的发展事先都不能确定。随机性活动可通过数学统计的方法描述。 (2)随机变量的定义
3、 定义:对于随机活动的不同结果我们可以用不同的数值与其对应。这样,就可以用一个变量来描述随机活动,变量按一定的概率取某个值对应于随机活动按一定的概率取某个结果。这类变量称为随机变量。 离散型随机变量:若随机变量只取有限个数值或可列无穷多个数值。 连续型随机变量:若随机变量可以取值于某个区间中的任一数。,(3)离散型随机变量的定义 定义:如果一个随机变量 x 的一切可能取值为x1,x2,xn,并且X 取值xn的概率为 Pn,则 X为一个离散型随机变量,p1,p2,.,pn,. 称为 X 的概率函数。其中 Pn必须满足下列两个条件: Pn0,n=1,2, Pn0,n=1, 2,(4)离散型随机变量
4、的概率分布函数 离散型随机变量 X 的累积分布函数定义,当 X 小于或等于某个给定值 x 的概率函数,记为 P(Xx) = F(x)。设随机变量 X 可能取值x1,x2,xn,则 X 的累积分布函数为 其中Pi为 X 取值 Px 的概率。 由定义可见,F(x) 1,当 xy 时,F(x)F(y),即 F(x) 是个单调增加的函数。,(5)连续型随机变量的定义 定义:若存在非负函数 f (x),使得随机变量 X 取值于任一区间 (a,b)的概率为 则称 X 为连续型随机变量,f(x) 称为X的密度函数。 对于密度函数 f (x) 有 f (x)0,(6)连续型随机变量的概率密度函数和累计分布函数
5、 连续型随机变量的累积分布函数F(x)定义为随机变量小于或等于x的概率。 由累积分布函数定义可知,F(x)1,当x1x2时,F(x1)F(x2),即F(x)是个单调增加的函数。 概率密度函数和累积分布函数的关系: 随机变量X落入区间(a,b)内的概率是F(b) F(a)。,5.2.2 随机变量的数字特征,(1)离散型随机变量的数字特征 平均值(数学期望值):设 X 为离散随机变量,根据前面的定义,当X= xi 时的概率为 Pi,则: X 的数学期望值 数学方差,(2)连续型随机变量的数字特征 平均值:设X为随机变量,其概率密度函数为 f (x),则该随机变量的平均值为: 数学方差为:,设 X
6、为一随机变量,则:E(X)= E(X) 设X ,Y为两个相互独立的随机变量,则: E( X+Y )= E(X)+ E(Y) 设X 为一随机变量,则: D(X)= 2D(X) 设X 为一随机变量,则: D(X +)= D(X) 设X ,Y 为两个相互独立的随机变量,则: D( X+Y )= D(X)+ D(Y),(3)数理统计中的基本运算规则,(4)协方差与相关系数,协方差 协方差用来描述两个随随机量X i、Xj之间的相关程度,表示为Cij或Cov(Xi,Xj)。 协方差是对称的,即:Cij=Cji。i=j时,有: 如果Cij=0,Xi和Xj不相关; Cij0(0),Xi和Xj正(负)相关;,相
7、关系数 用相关系数来描述两个随机量X i、Xj之间的相关程度: ,在接近于1或-1时,说明X i、Xj正(负)相关。,协方差与相关系数的含义,不相关的情形,协方差与相关系数的含义,正相关的情形,协方差与相关系数的含义,负相关的情形,5.2.3常用随机变量的分布,(1)贝努里分布 概率分布函数: 累计分布函数: 平 均 值: 数学方差:,概率分布函数: 累计分布函数: 平 均 值: 数学方差:,(2)泊松分布 Poisson( a ),(3)均匀分布 U(a,b),概率密度函数(pdf):,概率分布函数(cdf):,平 均 值:,数学方差:,(4) 指数分布 EXPON(a),概率密度函数(pd
8、f):,概率分布函数(cdf):,平 均 值:,数学方差:,Mean= a,(5)正态分布 N(u, ),概率密度函数(pdf):,概率分布函数(cdf):,平 均 值:,数学方差:,(6)爱尔朗分布 Erlang(a, k),概率密度函数(pdf):,平 均 值:,数学方差:,当k=1时,Erlang分布为指数分布Expon(a):,(7)威布尔分布 Weibull(a,b),概率密度函数(pdf):,概率分布函数(cdf):,平 均 值:,数学方差:,(7)威布尔分布 Weibull(a,b),概率密度函数(pdf):,(8)伽马分布 Gamma(a,b),概率密度函数(pdf):,概率分
9、布函数(cdf):,平 均 值:,数学方差:,(8)伽马分布 Gamma(a,b),概率密度函数(pdf):,(9)三角分布 TRIA(a,m,b),概率密度函数(pdf):,平 均 值:,数学方差:,5.3 随机数的产生,5.3.1随机数的性质 随机数(random number):随机数就是随机变量的样本取样值。 均匀分布的随机数:随机变量x在其可能值范围中的任一区间出现的概率正比于此区间的大小与可能值范围的比值。 (0,1)均匀分布随机数:在各种分布的随机数中,最常用和最重要的是在(0,1)区间上的均匀分布随机数。其他许多分布的随机数都可以由(0,1)均匀分布随机数经过变换和计算来产生。
10、,随机数的产生(0-1均匀分布),产生伪随机数,独立性检验,否,是,可以使用,均匀性检验,否,是,(0,1)均匀分布随机数的定义,(0,1)均匀分布随机变量x的概率密度函数pdf为: 其期望值: 其方差是: 累积分布函数:,5.3.2伪随机数的产生方法,(1)伪随机数(pseudo random number)的产生 产生随机数的目的,是为了发生0,1之间的一组数的序列,使之尽可能的模仿具有类似于均匀分布随机变量的独立取样值性质的数。由于随机数是利用计算机程序按照一定的算法计算出来的,会有一定的周期性,因而被称为伪随机数。 利用随机数来对随机活动的统计分析,只要伪随机数的数理统计性质能够满足实
11、际需要即可。一般计算机上产生随机数的函数为(0,1)均匀分布的随机数。,(2)计算机产生随机数的要求,伪随机数具有一定的周期性。对随机数值序列的要求有: 分布的均匀性、抽样的随机性、试验的独立性以及前后的一致性 足够长的周期,以满足的实际需要 产生的速度要快,占用的内存空间要小,(3)计算机产生随机数的算法,计算机产生随机数的通常方法是利用一个递推公式: 给定了第k个初始值,就可以利用这个递推公式推算出第k+1个数Xk+1; 递推公式有多种形式,其中最常见的有两种: 平方取中法, 同余法。,(4)平方取中法,首先给出一个初始数,或称种子。把这个数平方,然后取中间位的数,再放上小数点就得到一个随
12、机数。这个中间位的数再平方取中得到第二个随机数。 其递推公式为: 初值为x0,其中,x0为2k位的非负整数,x表示取x的整数部分,NmodM为对N进行模为M的求余运算,即:,平方取中法例题,任取一4位正整数:5497。即,k=2,x0=5497。 x0=5497,平方x1=x0 x0=30217009,取中x1=2170,R1=2170/104=0.2170 x1=2170,平方x2=x1x1=04708900,取中x2=7089,R2=7089/104=0. 7089 x2=7089,平方x3=x2x2=50253921,取中x3=2539,R3=2539/104=0. 2539 该方法的问
13、题:产生的随机数可能产生退化,得到的Ri值趋于0或者重复相同的Ri值 平方取中法有许多改进型,如: 乘积取中法; 常数乘子法; Fibonacci法等。,(5)同余法,同余法是将一组数据通过一系列特定的数字运算,最后利用一个数字的整除求余,所得的数值就是一个伪随机数。因为这个计算过程,则称该求随机数的方法为同余法。 同余法的有三种:加同余法(Linear Congruence Generator)、乘同余法和混合同余法。其中以混合同余法产生的随机数统计性质较好,因而应用最为广泛。混合同余法的递推公式: 其中:m为模数(为随机数的周期),a为乘子(乘数或乘法因子),c为增量(加数或加法因子),且
14、x0,m,a均为非负整数,c0。 同余法产生(0,1)均匀分布的随机数的基本条件: c和m互质,即没有大于1的公因子。 m的每个质数因子也是a-1的因子。 若4是m的因子,则4也是a-1的因子。 为延长随机数的周期,通常取m=2b。,(5)同余法(续),混合同余法例题 取m=8,a=3,c=1,x0=1,迭代结果如下表。,可见平方x1=x5=4,从n=5开始xn及un循环取x1到x4的值。周期m。如=m,则称为满周期。 同余法具有计算简便的优点。,5.3.3随机数的检验,用任何一种方法产生的随机数序列在把它用到实际问题中去之前都必须进行一些统计检验,看它是否能够令人满意地作为随机变量的独立取样
15、值(显著性检验),是否有较好的独立性和均匀性。从理论上说,统计检验并不能得出完全肯定的结论,但是却可以使我们有较大的把握获得具有较好统计性质的随机数序列。 五种随机数检验方法: a)频率检验(用于检验均匀性) b)趋势检验(用于检验独立性) c)自相关检验(用于检验独立性) d)间隙检验(用于检验独立性) e)扑克检验(用于检验独立性),5.3.3随机数的检验(续)检验假设,均匀性检验中,有如下假设: H0: Ri U0,1 H1: Ri U0,1 独立性检验中,有如下假设: H0: Ri 独立 H1: Ri 独立 对每一个检验,必须说明显著性水平的 值, 值 E(X)和与的平均值 E(X2)
16、之差异是否显著,从而决定能否把 x1,x2,xN看作是(0,1)均匀分布随机变量 X的 N个独立取样值。 =P(拒绝H0|H0属真) 对任一检验,必须设定 值。 值常取0.01或0.05。,5.3.4分布均匀性检验,(1)频率检验 分布均匀性检验又称频率检验,是对经验频率和理论频率之间的差异进行检验。 均匀性检验有两种方法: 卡方检验( Chi-Square Test ) 柯尔莫哥洛夫-斯米尔洛夫检验(Kolmogorov-Smirnov Test),卡方检验(2 检验,),卡方检验利用样本统计量 式中,Qi是第i组观察到的次数,Ei是出现在第i组的期望次数,n是组数。 对均匀分布来说,当各组
17、尺寸相同时,每一组中数的期望次数 Ei由下式给出: 式中,N是总观察次数。 卡方样本统计量分布渐近地服从自由度为 n-1 的卡方分布。,(3)卡方检验步骤如下,卡方检验步骤如下: 第一步:将0,1)区间分成 n-1个不相容的小区间 (i=1,2,n); 第二步:由均匀性假设,xi落入第i个小区间 概率为1/n,计算, (i=1,2,m),称之为理论频数; 第三步:计算xi 序列落在区间 中的个数ni (i=1,2,m),称之为经验频数;,第四步:由于样本统计量渐近地服从自由度为n-1的卡方分布,对给定水平,查卡方分布表得临界值:,第五步:计算出卡方的值,如果,可以得出结论:经验频数与理论频数之
18、间没有检测出明显的差异。如果,拒绝假设。,某随机数发生器发生100个数如下: 0.34,0.90,0.25,0.89,0.87,0.44,0.12,0.21,0.46, 0.67,0.83,0.76,0.79,0.64,0.70,0.81,0.94,0.74, 0.22,0.74,0.96,0.99,0.77,0.67,0.56,0.41,0.52, 0.73,0.99,0.02,0.47,0.30,0.17,0.82,0.56,0.05, 0.45,0.37,0.18,0.05,0.79,0.71,0.23,0.19,0.82, 0.93,0.65,0.37,0.39,0.42,0.99,0
19、.17,0.99,0.46, 0.05,0.66,0.10,0.42,0.18,0.49,0.37,0.51,0.54, 0.01,0.81,0.28,0.69,0.34,0.75,0.49,0.72,0.43, 0.56,0.97,0.30,0.94,0.96,0.58,0.73,0.05,0.06, 0.39,0.84,0.24,0.40,0.64,0.40,0.19,0.79,0.62, 0.18,0.26,0.97,0.88,0.64,0.47,0.60,0.11,0.29, 0.78 给定显著性水平=0.05,试检验其均匀性。,卡方检验例题,xi序列落在10区间的个数(经验频数),以
20、0.1位单位统计xi序列落在各区间(a,b的个数,即经验频数。,直方图的制作,20 18 16 14 12 10 8 6 4 2 0,0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0,解:,第一步:将 0,1) 区间分成10个小区间,即 n =10; 第二步:计算理论频数, ; 第三步:计算xi序列落在10区间的个数,即经验频数,分别为7,9,8,9,14,7,10,15,9,12。 第四步:样本统计量 对给定水平 =0.05,查卡方分布表得临界值: ; 第五步: =716.92,可以得出结论:经验频数与理论频数之间没有检测出明显的差异。即该随机数均匀地分布在
21、0,1区间上。,卡方检验的缺点,可能随分组方法不同得出不同结论 样本较少时,不能采用卡方检验,柯尔莫哥洛夫-斯米尔洛夫检验,该检验把均匀分布的连续 cdf,F(x),与 N次观察的样本的经验 cdf,S(x)进行比较。有定义: F(x) = x,0 x1 如果随机数发生器产生的样本是x1,x2,xN,则经验经验 cdf,SN(x)由下式定义: 只要零假设属真,则 N 值越大,SN(x) 应更好地逼近 F(x)。 柯尔莫哥洛夫-斯米尔洛夫检验是基于在随机变量范围内 F(x)与 SN(x)之间偏差的最大值来检验的。即基于下式: D=max|F(x) - SN(x)|,柯尔莫哥洛夫-斯米尔洛夫检验步
22、骤:,第一步:将数据从小到大排列,x1x2xN 第二步:计算 , 第三步:计算 第四步:在指定的显著性水平和给定的样本量N之下确定临界值D 。 第五步:如果 ,拒绝数据来自均匀样本的零假设。 如果 ,可以得出结论:在x1,x2,xN的真实分布与均匀样本之间没有检测出明显的差异。,柯尔莫哥洛夫-斯米尔洛夫检验例题,当 = 0.05和 N= 5 时,查表得D =0.565,于是 D D 。 因此,不拒绝真实分布与均匀样本之间无差异假设。,有5个数为0.44,0.81,0.14,0.05,0.93,取显著性水平=0.05,检验其均匀性。,5.3.5分布独立性检验,(1)自相关检验 自相关检验利用相关
23、系数进行随机数的独立性检验。相关系数反映了随机变量之间的线性相关程度。一个序列可以是均匀分布,但却不一定是独立。如果它们相互独立,那么它们的相关系数应为0(反之不一定)。所以可以用相关系数来检验随机数的独立性。 设给定N个随机数 x1,x2,xN,假设 j 阶自相关系数为j=0(j =1,2,m)。考虑样本的 j 阶自相关系数 (j=1,2,m) 当 n-j 充分大,且j=0 成立时, (j=1,2,m)渐近地服从N(0,1) 分布。在实际检验中,常取 n = 10-20。利用统计量vj进行检验,给定水平 ,如果 ,可以接受相关系数j=0的假设;否则,拒绝假设。,(2)趋势检验(连贯性检验),
24、趋势检验通过一个随机数序列中的数值的排列来检验独立性假设。包括:趋势向上或趋势向下,在均值之上和均值之下的趋势,趋势长度的检验。 在对随机数序列进行趋势检验时,要关心两件事:趋势的个数,趋势的长度。 1趋势向上或趋势向下检验 设给定N个随机数 x1,x2,xN,令 vi= xi-xi-1,(I=1,2,N),把 vi按正负分为两类,表示随机数的增减及长度的变化规律,组成升降两类连。如以下序列: 0.41,0.68,0.89,0.74,0.55,0.36,0.54,0.72,0.75,0.08 + + - - - + + + - 该序列共有4个升降连(顺序为升连,降连,升连,降连),其长度分别为
25、2,3,3,1 用T表示一个随机数序列的连的总数,当 x1,x2,xN 独立服从 U(0,1)分布时, 有 , ; 统计量 渐近地服从N(0,1)。 于是,可以利用统计量T 对随机数序列进行检验。,升降连法检验例题:,例题 对前例中的前40个随机数,给定水平 =0.05,试检验其独立性。 解 该序列的升降连如下: + - + - - - + + + + - + - + + + - - + + + - - - - + + + - + - - + - - + - - + - 该序列共有22个升降连,即T=22,n=40; 统计量 而 Z0.025=1.96。 |Z| Z0.025 ,所以不能拒绝独
26、立性假设。 于是, ,,2)正负连检验 目的: 判定给定样本中是否每隔一些数字就出现连续在均值之上或在均值之下的趋势。 作法: 大于均值的样本用+号表示,其总数为n1 小于均值的样本用-号表示,其总数为n2 用这些+-号组成的符号串中最大可能的连数为N=n1+n2(N为样本个数),最小连数为1 设b为一个样本序列的连的总数(连续发生的+或-事件构成一个连),(3)间隙检验,间隙检验用来确定同一个随机数重复出现之间间隔的显著程度。长度为 的间隙指同一个随机数重复出现之间的数的个数。下面的例子说明数字3的间隔长度。 4,1,3,5,1,7,2,8,2,0,7,9,1,3,5,2,7,9,4,1,6
27、,3,3,9,6,3,4,8,2,3,1,9,4,4,4,6,8,4,1,3,8,9,5. 间隔长度10 7 2 3 9 第一个间隙的概率为: P(间隔长度10)=P(不出现3)* P(不出现3)*P(出现3)=(0.9)10(0.1) 共10个(=间隔长度) 用间隙检验来分析一组数的独立性,每一个数字0,1,2,9都应当予以分析。记下所有数字的观察频数,并利用离散数据的柯尔莫哥洛夫-斯米尔洛夫检验,把它和理论频数进行比较。 对随机排列的数序来讲,其理论频数分布由下式决定:,(3)间隙检验步骤,第一步:依选定的区间宽度,计算出理论频数分布的 F(x)和 cdf; 第二步:用相同的分组,将观察到
28、的间隙样本整理成累计分布的形式; 第三步:计算柯尔莫哥洛夫-斯米尔洛夫检验中的 F(x)和 SN(x)之间的极大偏差D; 第四步:在指定 值和样本容量N之下,确定临界值D 第五步:如果D D ,则接受独立性零设假;否则拒绝零设假。,用于检查随机数样本中重复数字出现的频率,从而检查该组样本的组合规律性。如,三位数: 三个数字相同出现的概率为: P(三个数字相同)=0.1*0.1=0.01 三个数字不同出现的概率为: P(三个数字不同)=0.9*0.8=0.72 有两个数字同时出现的概率为: P(两个数字相同)=C(3, 2)(0.1*0.9)=1-0.01-0.72=0.27 以此作为理论频率与
29、实际频数作比较,然后对其进行X2检验。在给定的显著水平下,找出临界值,根据临界值确定差距是否显著。,组合规律性检验-Poker检验,Poker检验示例,5.4随机变量的产生,5.4.1 随机变量的产生方法概述 前提:已经得到服从独立同分布的U(0,1)随机数 任务:进一步构造所需的某随机变量 条件:所生成的随机变量X符合其概率分布函数F(X)。 (1)递增函数 (2)0-1范围,5.4.1 随机变量的产生方法概述,随机变量的产生方法: 逆变换方法,函数变换法,卷积法,接受-拒绝方法,合成法等。 这里所有方法都假定:在区间(0,1)中的随机数x1,x2,xN是随时可用的,这里,每个xi的pdf是
30、 每个xi的cdf是 所有分布的随机变量的产生都是从符合均匀分布U(0,1)的随机数x,或xi开始。其他分布的随机变量的产生过程由下图列出的随机变量的产生算法的树结构表示。,随机变量的产生算法树,5.4.2逆变换方法(inverse transform),由前可知,如果UU(0,1),而F-1(.)是分布函数F(x)的反函数,则: 利用上述公式,可以由U(0,1) 随机数xi,直接生成规定分布F(x)的随机数ui的方法叫做逆变换法或反函数法。 逆变换法的步骤为: 第一步:产生独立的U(0,1)随机数xi; 第二步:令 ,i=1,2,n,则 x1,x2,xi,xN,就是给定分布F(x)的随机数序
31、列。,用逆变换法产生各种离散分布的随机变量,(1)均匀分布随机变量的产生 a,b区间上均匀分布Ua,b的概率密度函数为 分布函数为 ( ), 其反函数F-1(.)的抽样公式 采用逆变换法生成U(a,b) 随机数的步骤: 第一步:产生独立的U(0,1)随机数 x1,x2,xi,xN; 第二步:令 ,i=1,2,n,则ui 就是U(a,b)的随机数。,(2)负指数分布,负指数分布E(1/)的概率密度函数为 其中,0,分布函数为 ,x0,其反函数F-1(.)公式 由于U与1-U均为服从U(0,1) 的随机变量,抽样公式为 采用逆变换法生成负指数分布E()的随机数的步骤: 第一步:产生独立的U(0,1
32、)随机数 xi; 第二步:令 ,i=1,2,n,则ui 就是负指数分布E()的随机数。,(3)威布尔分布,威布尔分布W(,)的概率密度函数为 分布函数为 ,其反函数F-1(.)公式 由于U与1-U均为服从U(0,1) 的随机变量,抽样公式为 采用逆变换法生成威布尔分布W(,)的随机数的步骤: 第一步:产生独立的U(0,1)随机数 xi; 第二步:令 ,i=1,2,n,则ui 就是威布尔分布 W(,)的随机数。,(4)任意离散分布,设随机变量X的概率分布为 设 ,X的分布函数为 设UU(0,1)。若 ,令X=x1;否则当 ,(i=2,3,)时,令X=xi ,则XF(x)。 (i=2,3,) 故,
33、XF(x) 。 由此得具体算法 第一步:产生独立的U(0,1)随机数 xi; 第二步:若up1, 令u=xi; 否则当 ,(i=2,3,)时,令u=xi ,则u为F(x) 随机数。,5.4.4 函数变换方法(自学),函数变换法是关于随机变量的函数(仍为随机变量)的抽样法。通过随机变量间的关系式可导出其分布函数间的关系式,故可用常用分布的随机数生成某个确定分布的随机数。该方法的理论依据依据下述定理。 定理4-1 设随机变量X具有密度函数f(x),Y=g(x)是随机变量X的函数,又设:x= g-1(y) = h(y)存在且有一阶连续导数。则Y=g(X)的密度函数为: 设常用随机变量X的分布函数为F
34、(x),X的函数Y=g(x)也是随机变量,其分布函数为 利用逆变换法可得函数变换法的抽样公式为 Y=g(X) 于是由F(x) 的随机数生成G(x)的随机数的方法为: 第一步:产生独立的F(x)随机数 x1,x2,xi,xN,; 第二步:令 ,i=1,2,n,则 y1,y2,yi,yN,就是G(x)的随机数序列。 由此可知,逆变换法是一种特殊的函数变换法,相当于取XU(0,1)的随机变量U。,(1)正态分布 正态分布的概率密度函数为, (-0) 当XN(0,1)时,Y=X+N(,2)。 以下介绍标准正态分布N(0,1)的生成方法。 对于上式要直接求F-1(y)是很困难的,可利用函数变换等方法。
35、设u1和u2是两个独立的U(0,1)均匀分布随机数,令 则x1,x2为两个独立的N(0,1)分布随机数。,5.4.5 用函数变换法产生各种分布的随机变量,正态分布随机数N(,2)的生成步骤,生成正态分布XN(,2)随机数的具体算法如下: 第一步:产生两个独立的均匀分布U(0,1)随机数 x1,x2 ; 第二步:计算 ; 第三步:返回 y=z+,则 y就是正态分布N(,2)随机数。,(2)对数正态分布,若XN(,2),则称Y=eX所服从的分布为对数正态分布LN(,2)。 利用正态分布和对数正态分布的关系可以生成LN(,2)随机数,具体算法如下: 第一步:产生独立的标准正态分布N(0,1)随机数
36、x1,x2,xi,xN,; 第二步:计算 yi=xi+,i=1,2,n; 第三步:产生独立的F(x)随机数 x1,x2,xi,xN,; 第四步:令 ,i=1,2,n,则 y1,y2,yi,yN,就是对数正态分布LN(,2)随机数。,5.4.6 卷积法,一些重要概率分布的随机变量,可以表示为两个或多个独立随机变量之和。由于新构成的随机变量的概率密度函数是原始变量的概率密度函数的卷积,因此用这种方法生成随机变量的方法称为卷积法(convolution)。 卷积法是一种特殊的函数变换法,相当于取抽样公式,卷积法应用对象:爱尔朗分布,泊松分布,二项分布,近似正态分布。,(1)爱尔朗分布(Erlang)
37、,n阶爱尔朗分布En()的概率密度函数为 (x0;0) 若X1,X2,Xi,XN,独立且同服从指数分布E(), 令Y = X1+X2+Xi+XN,则Y服从n阶爱尔朗(Erlang)分布。 于是,利用该性质:即一个平均值为T的n阶爱尔朗分布的随机数等价于n个独立的并且具有平均值为T/n的指数分布随机数之和,可以得到Erlang分布的随机数生成方法: 第一步:产生独立的U(0,1)随机数随机数 x1,x2,xi,xN; 第二步:令x = x1+x2+xi+xN,i=1,2,n; 第三步:令y = -(1/)ln(x) ,则y就是n阶爱尔朗分布的随机数,(2)泊松分布(自学),泊松(Poisson)
38、分布P() 的概率分布为 (k=0,1,2,) 设X1,X2,Xi,XN表示相继到达的随机事件的间隔时间,假定它们独立服从指数分布E(),则在0,1时间内到达的随机事件数X服从泊松分布P()。 设Yk = X1+X2+Xi+Xk,由Yk服从k阶爱尔朗分布,可得 所以,XP(),于是,可以得到泊松分布随机数的生成方法: 第一步:产生独立的U(0,1)随机数随机数 x1,x2,xi,xN; 第二步:若 ,令x=0; 第三步:若整数k满足: ,令x= k,则x为泊松分布的随机数。,5.4.7 组合法(自学),当希望抽样的分布函数 F(x)可以表成若干个其他分布函数F1(x),F2(x),的凸组合,即
39、 ,其中 , ,且Fj(x)的随机数易于抽取时,常采用组合法由Fj(x) 的随机数来生成F(x)的随机数。 具体算法如下: 第一步:随机产生一个正整数J,使得 (j=1,2,3,) 第二步:生成一个分布为Fj(x) 的随机数x,x就是F(x)的随机数。 重复上述步骤,即可产生F(x)的随机数序列x1,x2,xi,xN;可以证明XF(x)。,5.4.8 取舍法(自学),上述几种方法都是随机抽样法。取舍法是一种非直接抽样法。该方法对于已知的随机数,须通过某个检验条件决定取舍,才能得到F(x)的随机数 设 f(x) 为所求随机数的概率密度函数,取舍法要求选定一个覆盖函数t(x)满足 令 , ,故 r
40、(x) 是一个概率密度函数。 如果Xr(x),UU(0,1),且X与U相互独立,当 时,令Y=X,则Y F(x) 。 由定义及假设可知, 利用取舍法生成 F(x)的随机数的算法如下: 第一步:生成 r(x) 的随机数x; 第二步:生成 U(0,1) 随机数u,且 x 与 u 独立; 第三步:若 ,令 y=x;否则,转到第一步重新抽样,则 y就是F(x)的随机数,(1)伽玛分布,伽玛(Gamma)分布(, )的概率函数为 ,(x0;a0;b0) 其中, ,(a0)为伽玛函数。 伽玛函数的特性, 。 如果X(a,1),令Y=X/b,则Y(a,b)。我们只需讨论(a,1) 随机数的抽样方法。 当a=
41、1时,(1,1)就是指数分布E(1)(抽样方法见前面的介绍)。 当a1时且为整数时,(n,1)就是n阶Erlang分布(抽样方法如前介绍)。 对于当a1但不是整数,0a1情况下的(a,1)的随机数抽样方法可另见参考文献。,(2)贝塔分布,贝塔(Beta)分布(a, b)的概率函数为 ,(00; b0) 其中, 为贝塔函数,与伽玛函数有关系式 计算可知,当x=(a-1)/(a+b-2)时,f(x)取得最大值M, 取 t(x) = M,显然则 r(x) 为 U(0,1) 分布的密度函数。 抽样方法如下: 第一步:生成独立的 U(0,1) 的随机数 x1,x2,xn; 第二步:如果 ,令 u = x
42、1是分布为(a, b)的随机数;否则转第一步重新抽样。,5.4.9 近似法(自学) 前述的抽样方法从理论上讲所用的分布都是精确的。当分布函数比较复杂,上述的抽样方法又难以实现时,可以采用近似法生成随机变量。 (1)利用中心极限定理生成N(0,1)随机数 由中心极限定理,若U1,U2,Un独立且同服从U(0,1)分布,则 从而得到N(0,1) 随机数的近似抽样公式为 实际应用中,常取n=6或12。N=12时, 这样,可以生成12个U(0,1) 随机数,即可得到一个N(0,1)随机数。,(2)一般分布的近似解法,设 F(x)为任一分布函数,首先把(-,+)用分点 - = a0,a1,a2,an-1
43、,an=+ 分成n个连续的小区间,在区间(ai-1,ai)上利用 F(x)定义函数 Fi(x)为 (i=1,2,.,n) 显然,Fi(x)为分布函数,可将F(x)组合成 其中,pi= Fi(ai)- Fi(ai-1)。在每个小区间用线性函数近似Fi(x),即 (ai-1aai) 于是,Fi(x)的近似抽样过程如下 第一步:随机产生一个正整数J,使得 (i=1,2,3,n) 第二步:生成 U(0,1) 随机数 x,令 u = ai-1+(ai-ai-1)x,则 u 近似为 F(x) 的随机数。 实际应用中,常取 a0 = a,使 F(a) = 0;an=b,使 F(b)=1。,(3)经验分布抽样
44、法,在对实际系统仿真过程中,常出现随机变量的分布未知,而仅有一些观测数据的情况。这时可由观测数据求出经验分布函数 Fn(x),并用 Fn(x) 近似代替分布函数F(x)。于是,将用 Fn(x) 生成的随机数近似看成 F(x) 的随机数。这种生成 F(x) 随机数的方法称为经验分布抽样法。 以下分两种情况说明经验分布抽样法: 已知原始观测数据, 已知分组观测数据。,已知原始观测数据,设已知观测数据:x1, x2, xn-1, xn 来自某总体,其分布函数为F(x)。将x1, x2, xn-1, xn 由小到大排序,得:x (1), x(2), x(n-1), x(n)。n个点将 x (1), x
45、(n) 分为 n-1个小区间,假定数据落入每个小区间的概率均为 1/(n-1),且在每个小区间是均匀分布的。 F(x)的抽样过程如下: 第一步:生成 U(0,1) 随机数 x,记 p= (n-1)x,令 I= p+1; 第二步:令 u= x(I) +(p-p)(x(I+1) - x(I),则 u为近似服从 F(x)的随机数。 注意,该方法生成的随机数限制在区间 (x(1), x(n)上。在上述步骤中,所用的利用的经验分布函数为 (i=1,2,.,n-1),已知分组观测数据,设已知n个观测数据在m个连续的小区间内: a0, a1, a1, a2 , am-1, am 内的观测数据为n1, n2,
46、 nm-1, nm,其中,n1+ n2+ nm=n 用这些观测频数近似代替理论频数,可以给出经验分布函数 F(x),则生成 F(x)随机数 的过程为: 第一步:生成 U(0,1)随机数x,若 Fn(aj-1) Fn(aj),则取 I = i; 第二步:令 ,则 u为近似服从F(x)的随机数。 注意,该方法生成的随机数限制在区间(a0, am)上。当经验分布函数具体给定以后,上述算法即可确定。如果假定数据落入小区间a i-1, ai)的概率为ni/n (i=1,2,.,n-1),且在每个 小区间是均匀分布的。经验分布函数为 (i=1,2,.,m) 其中,n0= 0。此时,上述算法的近似抽样公式为
47、: 第一步:生成U(0,1)随机数x; 第二步:若 nx ,则取 I = I 第三步:令 ,则 u 为近似服从F(x)的随机数。,5.4.10随机数产生方法的比较,用反函数法产生随机数时,需要对给定的概率密度函数f(x)进行积分求得 F(x),然后再对累积分布函数求反函数 F-1(y)。这些变换处理往往比较困难,有的还不可能做到。 而舍去法只用到了概率密度函数f(x),所以比较方便简单。舍去法的缺点是效率低,每产生所需分布的一个随机数至少要产生两个(0,1)均匀分布的随机数,而且还有相当一部分的随机点被丢弃了。,5.4.11随机向量的生成,在很多系统仿真过程中,需要生成随机向量X=(X1,X2
48、,Xn)T。若X的各分量相互独立,可使用前述说明的不同抽样方法,对分量X1,X2,Xn分别独立地进行抽样。但在实际问题中,X的各分量经常是相关的,所以要考虑这种情况下随机向量的生成方法。 以下介绍几种方法: 条件分布法 取舍法 多维正态随机向量的抽样方法,(1)条件分布法,设随机向量X=(X1,X2,Xn)T的联合概率密度函数为f(x1,x2,xn),则有 f(x1,x2,xn)= f1(x1) f2(x2|x1) fn (xn |x1,x2,xn-1) 其中,f1(x1)是X1的概率密度函数,f2(x2|x1),fn (xn |x1,x2,xn-1)均为条件概率密度函数,分别表示在X1=x1的条件下X2的概率密度函数,.,在X1=x1,X2=x2,, Xn-1=xn-1的条件下Xn的概率密度函数。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业物联网(IoT)行业相关项目经营管理报告
- 纱线成条和梳理机项目营销计划书
- 为第三方提供会计服务行业营销策略方案
- 医用蓖麻油产业链招商引资的调研报告
- 生物识别锁项目运营指导方案
- 农业作物病害化学防治行业经营分析报告
- 草料混合机产品供应链分析
- 健康技术智能药盒行业相关项目经营管理报告
- 自行车曲轴项目运营指导方案
- 电信业用收款机市场发展前景分析及供需格局研究预测报告
- 人教版九年级初三上册期中考试化学试卷
- 电加热管制作工艺的设计
- 双港垃圾焚烧发电厂工艺介绍
- 放射性物质安全使用和防护
- 植物体的结构层次通用课件
- 编带包装检验判定标准
- 建设施工扬尘污染治理监理实施细则
- 新译林版六年级上册英语知识点归纳总结
- lovestory(爱情故事)歌词中英文对照
- OKR工作法介绍PPT课件
- SMT检验标准(作业指导书)
评论
0/150
提交评论