04.第四讲输入数据建模_第1页
04.第四讲输入数据建模_第2页
04.第四讲输入数据建模_第3页
04.第四讲输入数据建模_第4页
04.第四讲输入数据建模_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、现代物流与仿真郭武斌 :欢送沟通!上次内容回忆随机分布的种类随机数的生成方法随机变量的生成方法物流仿真中存在大量的随机分布货物订单到来:爱尔朗分布人员效劳时间:正态分布机械故障时间:威布尔分布班轮到达时间:爱尔朗分布5.2.3常用随机变量的分布 1贝努里分布概率分布函数:累计分布函数:平 均 值:数学方差:概率分布函数:累计分布函数:平 均 值:数学方差:2泊松分布 Poisson( a )3均匀分布 Ua,b概率密度函数pdf: 概率分布函数cdf: 平 均 值: 数学方差:(4) 指数分布 EXPONa概率密度函数pdf: 概率分布函数cdf: 平 均 值: 数学方差:Mean= a5正态

2、分布 Nu, 概率密度函数pdf: 概率分布函数cdf: 平 均 值: 数学方差:6爱尔朗分布 Erlang(a, k) 概率密度函数pdf: 平 均 值: 数学方差:当k=1时,Erlang分布为指数分布Expona:7威布尔分布 Weibull(a,b)概率密度函数pdf: 概率分布函数cdf: 平 均 值: 数学方差:7威布尔分布 Weibull(a,b)概率密度函数pdf: 8伽马分布 Gamma(a,b)概率密度函数pdf: 概率分布函数cdf: 平 均 值: 数学方差:8伽马分布 Gamma(a,b)概率密度函数pdf: 9三角分布 TRIA(a,m,b)概率密度函数pdf: 平

3、均 值: 数学方差:知识关联图产生均匀分布的伪随机数 确定符合数据的概率分布 产生特定分布的随机变量 逆变换法函数变换法卷积法组合法取舍法近似法平方取中法线性同余法贝努里分布泊松分布均匀分布指数分布爱尔朗分布正态分布韦伯尔分布等随机变量的产生算法树5.3 随机数的产生5.3.1随机数的性质随机数(random number):随机数就是随机变量的样本取样值。均匀分布的随机数:随机变量x在其可能值范围中的任一区间出现的概率正比于此区间的大小与可能值范围的比值。(0,1)均匀分布随机数:在各种分布的随机数中,最常用和最重要的是在(0,1)区间上的均匀分布随机数。其他许多分布的随机数都可以由(0,1

4、)均匀分布随机数经过变换和计算来产生。随机数的产生0-1均匀分布产生伪随机数 独立性检验 可信否?否是可以使用 均匀性检验 可信否?否是 5.3.2伪随机数的产生方法 1伪随机数(pseudo random number)的产生2计算机产生随机数的要求 伪随机数具有一定的周期性。对随机数值序列的要求有:分布的均匀性、抽样的随机性、试验的独立性以及前后的一致性。足够长的周期,以满足的实际需要。产生的速度要快,占用的内存空间要小。3计算机产生随机数的算法计算机产生随机数的通常方法是利用一个递推公式:给定了第k个初始值,就可以利用这个递推公式推算出第k+1个数Xk+1;递推公式有多种形式,其中最常见

5、的有两种:平方取中法,同余法。4平方取中法首先给出一个初始数,或称种子。把这个数平方,然后取中间位的数,再放上小数点就得到一个随机数。这个中间位的数再平方取中得到第二个随机数。其递推公式为:初值为x0其中,x0为2k位的非负整数,x表示取x的整数局部,NmodM为对N进行模为M的求余运算,即:平方取中法例题任取一4位正整数:5497。即,k=2,x0=5497。x0=5497,平方x1=x0 x0=30217009,取中x1=2170,R1=2170/104=0.2170 x1=2170,平方x2=x1x1=04708900,取中x2=7089,R2=7089/104=0. 7089x2=70

6、89,平方x3=x2x2=50253921,取中x3=2539,R3=2539/104=0. 2539该方法的问题:产生的随机数可能产生退化,的到的Ri值趋于0或者重复相同的Ri值平方取中法有许多改进型,如:乘积取中法;常数乘子法;Fibonacci法等。5同余法同余法是将一组数据通过一系列特定的数字运算,最后利用一个数字的整除求余,所得的数值就是一个伪随机数。因为这个计算过程,那么称该求随机数的方法为同余法。同余法的有三种:加同余法Linear Congruence Generator、乘同余法和混合同余法。其中以混合同余法产生的随机数统计性质较好,因而应用最为广泛。混合同余法的递推公式:其

7、中:m为模数为随机数的周期,a为乘子乘数或乘法因子,c为增量加数或加法因子,且x0,m,a均为非负整数,c0。同余法产生0,1均匀分布的随机数的根本条件:c和m互质,即没有大于1的公因子。m的每个质数因子也是a-1的因子。假设4是m的因子,那么4也是a-1的因子。为延长随机数的周期,通常取m=2b。5同余法续混合同余法例题 取m=8,a=3,c=1,x0=1,迭代结果如下表。n123456789103xn+1413161413161413xn4501450145un0.50.62500.1250.50.62500.1250.50.625可见平方x1=x5=4,从n=5开始xn及un循环取x1到

8、x4的值。周期m。如=m,那么称为满周期。同余法具有计算简便的优点。5.3.3随机数的检验用任何一种方法产生的随机数序列在把它用到实际问题中去之前都必须进行一些统计检验,看它是否能够令人满意地作为随机变量的独立取样值(显著性检验),是否有较好的独立性和均匀性。从理论上说,统计检验并不能得出完全肯定的结论,但是却可以使我们有较大的把握获得具有较好统计性质的随机数序列。五种随机数检验方法:a)频率检验用于检验均匀性b)趋势检验用于检验独立性c)自相关检验用于检验独立性d)间隙检验用于检验独立性e)扑克检验用于检验独立性5.3.3随机数的检验续检验假设均匀性检验中,有如下假设: H0: Ri U0,

9、1 H1: Ri U0,1独立性检验中,有如下假设: H0: Ri 独立 H1: Ri 独立对每一个检验,必须说明显著性水平的 值, 值 E(X)和与的平均值 E(X2)之差异是否显著,从而决定能否把 x1,x2,xN看作是(0,1)均匀分布随机变量 X的 N个独立取样值。=P(拒绝H0|H0属真)对任一检验,必须设定 值。 值常取0.01或0.05。5.3.4分布均匀性检验1频率检验 分布均匀性检验又称频率检验,是对经验频率和理论频率之间的差异进行检验。均匀性检验有两种方法:卡方检验 Chi-Square Test 柯尔莫哥洛夫-斯米尔洛夫检验(Kolmogorov-Smirnov Test

10、)卡方检验2 检验,卡方检验利用样本统计量式中,Qi是第i组观察到的次数,Ei是出现在第i组的期望次数,n是组数。对均匀分布来说,当各组尺寸相同时,每一组中数的期望次数 Ei由下式给出: 式中,N是总观察次数。卡方样本统计量分布渐近地服从自由度为 n-1 的卡方分布。3卡方检验步骤如下卡方检验步骤如下:第一步:将0,1)区间分成 n-1个不相容的小区间 i=1,2,n;第二步:由均匀性假设,xi落入第i个小区间 概率为1/n,计算, (i=1,2,m),称之为理论频数;第三步:计算xi 序列落在区间 中的个数ni (i=1,2,m),称之为经验频数;第四步:由于样本统计量渐近地服从自由度为n-

11、1的卡方分布,对给定水平,查卡方分布表得临界值:第五步:计算出卡方的值,如果,可以得出结论:经验频数与理论频数之间没有检测出明显的差异。如果,拒绝假设。某随机数发生器发生100个数如下:0.34,0.90,0.25,0.89,0.87,0.44,0.12,0.21,0.46,0.67,0.83,0.76,0.79,0.64,0.70,0.81,0.94,0.74,0.22,0.74,0.96,0.99,0.77,0.67,0.56,0.41,0.52,0.73,0.99,0.02,0.47,0.30,0.17,0.82,0.56,0.05,0.45,0.37,0.18,0.05,0.79,0.

12、71,0.23,0.19,0.82,0.93,0.65,0.37,0.39,0.42,0.99,0.17,0.99,0.46,0.05,0.66,0.10,0.42,0.18,0.49,0.37,0.51,0.54,0.01,0.81,0.28,0.69,0.34,0.75,0.49,0.72,0.43,0.56,0.97,0.30,0.94,0.96,0.58,0.73,0.05,0.06,0.39,0.84,0.24,0.40,0.64,0.40,0.19,0.79,0.62,0.18,0.26,0.97,0.88,0.64,0.47,0.60,0.11,0.29,0.78给定显著性水平=

13、0.05,试检验其均匀性。卡方检验例题xi序列落在10区间的个数(经验频数) 以0.1位单位统计xi序列落在各区间(a,b的个数,即经验频数。区间频数区间频数0.0-0.170.5-0.670.1-0.290.6-0.7100.2-0.380.7-0.8150.3-0.490.8-0.990.4-0.5140.9-1.02直方图的制作201816141210864200 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0解:第一步:将 0,1) 区间分成10个小区间,即 n =10;第二步:计算理论频数, ;第三步:计算xi序列落在10区间的个数,即经验频数,分别为

14、7,9,8,9,14,7,10,15,9,12。第四步:样本统计量对给定水平 =0.05,查卡方分布表得临界值: ;第五步: =716.92,可以得出结论:经验频数与理论频数之间没有检测出明显的差异。即该随机数均匀地分布在0,1区间上。卡方检验的缺点可能随分组方法不同得出不同结论样本较少时,不能采用卡方检验柯尔莫哥洛夫-斯米尔洛夫检验该检验把均匀分布的连续 cdf,F(x),与 N次观察的样本的经验 cdf,S(x)进行比较。有定义: F(x) = x,0 x1如果随机数发生器产生的样本是x1,x2,xN,那么经验经验 cdf,SN(x)由下式定义:只要零假设属真,那么 N 值越大,SN(x)

15、 应更好地逼近 F(x)。柯尔莫哥洛夫-斯米尔洛夫检验是基于在随机变量范围内 F(x)与 SN(x)之间偏差的最大值来检验的。即基于下式: D=max|F(x) - SN(x)|柯尔莫哥洛夫-斯米尔洛夫检验步骤:第一步:将数据从小到大排列,x1x2xN第二步:计算 ,第三步:计算第四步:在指定的显著性水平和给定的样本量N之下确定临界值D 。第五步:如果 ,拒绝数据来自均匀样本的零假设。 如果 ,可以得出结论:在x1,x2,xN的真实分布与均匀样本之间没有检测出明显的差异。柯尔莫哥洛夫-斯米尔洛夫检验例题当 = 0.05和 N= 5 时,查表得D =0.565,于是 D D 。因此,不拒绝真实分

16、布与均匀样本之间无差异假设。有5个数为0.44,0.81,0.14,0.05,0.93,取显著性水平=0.05,检验其均匀性。步骤公式123451从小到大排列xi 0.050.140.440.810.932i/N 0.200.400.600.801.003D+ = i/N-xi 0.150.260.16-0.010.07D- = xi (i-1)/N 0.05-0.060.040.210.134D = max(D+,D-)0.260.215D 0.26 5.3.5分布独立性检验1自相关检验自相关检验利用相关系数进行随机数的独立性检验。相关系数反映了随机变量之间的线性相关程度。一个序列可以是均匀

17、分布,但却不一定是独立。如果它们相互独立,那么它们的相关系数应为0反之不一定。所以可以用相关系数来检验随机数的独立性。设给定N个随机数 x1,x2,xN,假设 j 阶自相关系数为j=0j =1,2,m。考虑样本的 j 阶自相关系数 j=1,2,m当 n-j 充分大,且j=0 成立时, j=1,2,m渐近地服从N(0,1) 分布。在实际检验中,常取 n = 10-20。利用统计量vj进行检验,给定水平 ,如果 ,可以接受相关系数j=0的假设;否那么,拒绝假设。 2趋势检验连贯性检验趋势检验通过一个随机数序列中的数值的排列来检验独立性假设。包括:趋势向上或趋势向下,在均值之上和均值值下的趋势,趋势

18、长度的检验。在对随机数序列进行趋势检验时,要关心两件事:趋势的个数,趋势的长度。1趋势向上或趋势向下检验设给定N个随机数 x1,x2,xN,令 vi= xi-xi-1,I=1,2,N,把 vi按正负分为两类,表示随机数的增减及长度的变化规律,组成升降两类连。如以下序列:0.41,0.68,0.89,0.74,0.55,0.36,0.54,0.72,0.75,0.08+ + - - - + + + - 该序列共有4个升降连顺序为升连,降连,升连,降连,其长度分别为2,3,3,1用T表示一个随机数序列的连的总数,当 x1,x2,xN 独立服从 U(0,1)分布时,有 , ;统计量 渐近地服从N(0

19、,1)。于是,可以利用统计量T 对随机数序列进行检验。升降连法检验例题:例题 对前例中的前40个随机数,给定水平 =0.05,试检验其独立性。解该序列的升降连如下:+ - + - - - + + + + - + - + + + - - + + + - - - - + + + - + - - + - - + - - + -该序列共有22个升降连,即T=22,n=40;统计量而 Z0.025=1.96。|Z| Z0.025 ,所以不能拒绝独立性假设。于是, , 3间隙检验间隙检验用来确定同一个随机数重复出现之间间隔的显著程度。长度为 的间隙指同一个随机数重复出现之间的数的个数。下面的例子说明数字3

20、的间隔长度。4,1,3,5,1,7,2,8,2,0,7,9,1,3,5,2,7,9,4,1,6,3,3,9,6,3,4,8,2,3,1,9,4,4,4,6,8,4,1,3,8,9,5. 间隔长度10 7 2 3 9 第一个间隙的概率为:P(间隔长度10)=P(不出现3)* P(不出现3)*P(出现3)=(0.9)10(0.1) 共10个=间隔长度用间隙检验来分析一组数的独立性,每一个数字0,1,2,9都应当予以分析。记下所有数字的观察频数,并利用离散数据的柯尔莫哥洛夫-斯米尔洛夫检验,把它和理论频数进行比较。对随机排列的数序来讲,其理论频数分布由下式决定: 3间隙检验步骤第一步:依选定的区间宽

21、度,计算出理论频数分布的 F(x)和 cdf;第二步:用相同的分组,将观察到的间隙样本整理成累计分布的形式;第三步:计算柯尔莫哥洛夫-斯米尔洛夫检验中的 F(x)和 SN(x)之间的极大偏差D;第四步:在指定 值和样本容量N之下,确定临界值D第五步:如果D0,分布函数为 ,x0,其反函数F-1(.)公式由于U与1-U均为服从U(0,1) 的随机变量,抽样公式为采用逆变换法生成负指数分布E()的随机数的步骤:第一步:产生独立的U(0,1)随机数 xi;第二步:令 ,i=1,2,n,则ui 就是负指数分布E()的随机数。 3威布尔分布威布尔分布W(,)的概率密度函数为分布函数为 ,其反函数F-1(

22、.)公式由于U与1-U均为服从U(0,1) 的随机变量,抽样公式为采用逆变换法生成威布尔分布W(,)的随机数的步骤:第一步:产生独立的U(0,1)随机数 xi;第二步:令 ,i=1,2,n,那么ui 就是威布尔分布W(,)的随机数。5.5 小结1系统仿真中常见的随机变量分布有贝努里分布、泊松分布、均匀分布、指数分布、爱尔朗分布、正态分布、韦伯尔分布等。2随机数就是随机变量的样本取样值。最常用和最重要的随机数是(0,1)区间上的均匀分布随机数。其他分布的随机数都可以由(0,1)均匀分布随机数经过变换和计算来产生。3产生随机数是为了发生0,1之间的一组数的序列。由于是利用计算机程序产生出来的,会有

23、一定的周期性,因而被称为伪随机数。4计算机上产生的随机数的一般要求有:独立性、均匀性。 5计算机产生随机数的通常方法是利用递推公式进行。递推公式有多种形式,其中最常见的有两种:平方取中法,同余法。平方取中法有乘积取中法,常数乘子法,Fibonacci法等。同余法同余法的有三种:加同余法、乘同余法和混合同余法。其中以混合同余法较好。5.5 小结续6随机数序列在使用之前都必须进行统计检验。五种随机数检验方法:频率检验,趋势检验,自相关检验,间隙检验,扑克检验。均匀性检验有两种方法:柯尔莫哥洛夫-斯米尔洛夫检验,卡方检验。 7所有分布的随机变量的产生都是从符合均匀分布的随机数x,或xi开始。其他分布

24、的随机变量由随机变量产生算法的树结构图表示。8随机变量的产生方法包括:逆变换法或反函数法,函数变换法,卷积法,组合法,取舍法,近似法。5.6研究问题1复习随机变量,随机变量的数字特征,在系统仿真中常见的随机变量分布有贝努里分布、泊松分布、均匀分布、指数分布、爱尔朗分布、正态分布、韦伯尔分布等。2说明计算机上产生随机数的特点和要求。3随机数发生方法有哪些。试采用某种方法发生随机数序列并进行检验见实验一。4.随机数的检验及检验方法有哪些?5.说明随机变量的产生方法。6试采用某种方法生成正态分布的随机变量并进行检验见实验二。第四讲 输入数据建模本章内容 概述数据的收集分布的识别 参数估计 拟合度检验

25、 相关性分析 本章学习目标1.理解数据收集的作用和步骤2.掌握数据的收集的方法3.掌握理解分布识别的方法4.了解参数估计的方法5.理解拟合度检验的方法6.理解相关性分析的方法7.1 概述输入数据是仿真试验的动力。系统名称典型的输入数据排队系统 顾客到达的间隔时间 顾客被服务时间的分布库存系统 需求顾客的分布 顾客需求量的分布 物料订货的提前期分布生产系统 作业到达的间隔时间 作业类型的概率 每种作业每道工序服务时间的分布可靠性系统 生产无故障作业时间系统仿真运行依赖于输入数据。7.1 概述收集原始数据 根本统计分布的辨识 参 数 估 计 拟合度检验 可信否?否是是输入数据分析的根底,需要分析的

26、经验,对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。通过统计的数学手段计数统计、频率分析、直方图制作等,得出统计分布的假设函数如:正态分布、负指数分布、Erlang分布等根据统计特征,计算确定系统的假设分布参数。运用统计分布的检验方法,对假设的分布函数进行可信度检验。通常采用的是2检验。确定输入数据的 根本方法正确输入数据 7.2 数据的收集(Data Collection) 什么是数据收集?数据收集是针对实际问题,经过系统分析或经验的总结,以系统的特征为目标,收集与此有关的资料、数据、信息等反映特征的相关数据。数据收集的意义? 数据的收集是一项工作量很大的工作,也

27、是在仿真中最重要、最困难的问题。即使一个模型结构是正确的,但假设收集的输入数据数据不正确,或数据分析不对,或这些数据不能代表实际情况,那么利用这样的数据作为决策的依据必将导致错误,造成损失和浪费。数据收集的根本态度?数据收集工作应该具有科学的态度、忠于现实的工作作风。应该将数据收集工作、仿真工作的意义让参与者明确,得到参与者的支持和理解。数据收集过程中的本卷须知 做好仿真方案,详细规划仿真所需要收集的数据在收集数据过程中要注意分析数据数据的均匀组合收集的数据要满足独立性的要求先作独立性判别数据自相关性的检验 根据问题的特征,进行仿真的前期研究。分析影响系统的关键因素。从相关事物的观察入手,尽量

28、收集相关的数据。为此可以事先设计好调研表格,并注意不断完善和修改调研方式,使收集的数据更符合仿真对象的数据需要。数据的收集与仿真的试运行是密切相关的,应当是边收集数据、边进行仿真的试运行。然而系统仿真是一项专业性很强的工作,要正确认识“仿真的含义,抓住仿真研究的关键,防止求全、求精。确信所收集的数据足以确定仿真中的输入分量,而对仿真无用或影响不显著的数据就没有必要去多加收集。针对仿真所收集的各个数据需要进行相关性检验。为了确定在两个变量之间是否存在相关。要建立两个变量的散布图。通过统计方法确定相关的显著性。尽量把均匀数据组合在一组里。校核在相继的时间周期里以及在相继日子内的一时间周期里的数据的

29、均匀性。当校核均匀性时,初步的检验是看一下分布的均值是相同。考察一个似乎是独立的观察序列数据存在自相关的可能性。自相关可能存在于相继的时间周期或相继的顾客中。例如,第i个顾客的效劳时间与(i+n)个顾客的效劳时间相关。 7.3 分布的识别(Identifying distribution)7.3.1 直方图(Histograms)对于离散系统的统计分析中,一般用频率统计的分析方法来计算分布函数。其图形描述用的就是直方图。直方图构筑方法取值区间划分水平 区坐 间标 标轴 注的计 区算 间确 内定 的每 发一 生 数垂直 标坐 注标 频轴 数上绘 上制 的各 发个 生区 频间 数绘制直方图区间中的

30、次数。落在inNnPiii=;直方图分组区间数量的选取分组区间的组数依赖于观察次数以及数据的分散或散布的程度。一般分组区间组数近似等于样本量的平方根。即: 如果区间太宽m太小,那么直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。如果区间太窄,那么直方图显得凹凸不平不好平滑 适宜的区间选择m值是直方图制作,分布函数分析的根底。 直方图分组区间数量的选取适宜的区间选择m值是直方图制作,分布函数分析的根底。 对直方图进行曲线拟合,所得到的曲线应该就是该随机变量的概率密度函数。 通常,我们通过标准函数的假设,将概率分布假设成标准分布函数形式。如:负指数分布、泊松分布、正态分布等。What?设现

31、在的数据符合某一标准分布。Why?假设现在的数据是某个标准分布的采样。例7-1 直方图的制作下表是一个交通路口的上午7点到7点零5分的5分钟周期内所到达的车辆数的统计,试以此制作直方图。每周期内到达的车辆数频数每周期内到达的车辆数频数0126711075219853179341010358111例7-1 直方图的制作201816141210864200 1 2 3 4 5 6 7 8 9 10 117.3 参数估计的作用 上一节通过对随机过程的样本值的直方图分析,我们已经得到了随机过程的分布假设,即假设随机过程的概率分布符合某一种标准随机分布。这是一种定性分析的结果。 在给定了一种随机分布函数

32、后,需要进一步获取这一分布函数的特征参数,这一标准分布函数的参数需通过参数估计(Parameter Estimation)来求得。 因此,参数估计求得随机分布函数的参数的工具。样本统计量:样本均值和样本方差 设某一个随机过程X,其n个抽样样本为x1,x2,xn,该样本的均值为该样本的方差为如果离散数据已按频数分组,那么k是X中不相同数值的个数即分组数,f是X中数值Xj的观察频数 例7-2 对例7-1的数据进行分析由表可知,n=100, k=12i123456789101112fi12101917108755331Xi01234567891011Xi20149162536496481100121

33、fiXi01038514040423540273011fiXi201076153160200252245320243300121建议使用的参数估计量仿真中常用的一些分布参数建议值(Suggested Estimators)分 布参 数建议使用的估计量泊 松指 数(0,b)上的均匀分布正 态例7-3 对例7-1进行分布参数分析对泊松分布,但这里,样本均值3.64不等于样本方差(7.63)。由直方图,可假设它是具有未知参数 的泊松分布。由前表,对泊松分布, 的估计量是X的样本均值。这意味着什么?7.4 拟合优度检验 将前面讲过的随机数的假设检验应用于输入数据分布形式的假设的检验。 拟合优度检验(G

34、oodness-of-Fit Tests)用来检验总体是否符合一个事先给定的分布。卡方检验(Chi-Square Test)柯尔莫哥洛夫-斯米尔诺夫检验(Kolmogorov-Smirnov Test) 卡方2拟合度检验为了测试随机样本量为n的随机变量X服从某一特定分布形式的假设,常用2拟合度检验。这种检验方法首先是把n个观察值分成k个分组区间或单元。k=6检验的统计量为(k为分布的阶数)Ei 是在该分组区间的期望频数。每一分组区间的期望频数是 Ei = n pi, 这里的pi是理论值,是对应第i个分组区间的假设概率。式中,Oi是在第i个分组区间的观察频数。 Oi = ni /n 拟合度检验假

35、设可以证明:02近似服从具有自由度 f = k-s-1的2分布。这里 s 表示由采样统计量所估计的假设分布的参数个数。我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数,根据设定的显著性指数以及2分布的自由度数f = k-s-1,可以查2表得到,f2 。假设检验:H0:观察值Xi是一组属于分组分布函数F的独立同分布的随机变量。如果 那么检验未通过,H0不成立。如果 那么检验通过, H0成立。2分布介绍Gamma分布族有两个重要子族:如令a = 1,即得指数分布,如令 a = n/2, B = 1/2,即得自由度为 n 的 2 分布。其中, 函数为: 2分布为 (Gamma)分布族的子族,

36、 分布的概率密度函数(pdf): 2分布介绍2自由度为 n 的 2 分布2(n)= 概率密度函数pdf: 拟合度检验的步骤1、首先将数轴划分k个区间a0,a1), a1,a2), , ak-1,ak);2、计算各组的理论频数nPi i=1,.,k;3、计算样本观察值x1,x2,xn落在区间ai-1,ai)中的数目fi,即观察频数;4、计算 02 ;5、根据设定的显著性指数,查2表得到,f , f = k-s-16、比较,如果 02 ,f ,那么拒绝假设,否那么,接受假设。使用时数据分组区间要求样本量 n分组区间数 k20不用卡方检验505-1010010-20100 到 n/5同时,要求每一个

37、fi值都不小于 5。 例7-4用2 检验对例7-1进行拟合优度检验由例7-3,算出泊松分布的参数估计:有如下假设H0:随机变量是泊松分布。H1:随机变量不是泊松分布。对泊松分布,概率密度函数xP(x)xP(x)00.02660.08510.09670.04420.17480.02030.21190.00840.192100.00350.140110.001例7-4(续1)由上结果,可构造下表。xi观察频数期望频数QiEi01234567891011121019171087553312.69.617.421.119.214.08.54.42.00.80.30.17.870.150.804.412.570.2611.62合计100100.027.68E1 = n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论