系统仿真 第 6 章 输入数据的分析_第1页
系统仿真 第 6 章 输入数据的分析_第2页
系统仿真 第 6 章 输入数据的分析_第3页
系统仿真 第 6 章 输入数据的分析_第4页
系统仿真 第 6 章 输入数据的分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management第六章 输入数据的分析 6.1 6.1 数据的收集数据的收集6.2 6.2 分布的识别分布的识别 6.3 6.3 参数估计参数估计 6.4 6.4 拟合度检验拟合度检验 6.5 6.5 相关性分析相关性分析 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management引引 言言输入数据是仿真实验的动力输入数据是仿真实验的动力系统名称系统名称典型的输入数据典型的输入数据排队系统排队系统 顾客到达的间隔时间顾客

2、到达的间隔时间 顾客被服务时间的分布顾客被服务时间的分布库存系统库存系统 需求顾客的分布需求顾客的分布 顾客需求量的分布顾客需求量的分布 物料订货的提前期分布物料订货的提前期分布生产系统生产系统 作业到达的间隔时间作业到达的间隔时间 作业类型的概率作业类型的概率 每种作业每道工序服务时间的分布每种作业每道工序服务时间的分布可靠性系统可靠性系统 生产无故障作业时间生产无故障作业时间 系统的仿真依靠这些原型系统的运行数据,缺乏这系统的仿真依靠这些原型系统的运行数据,缺乏这些数据的实验和实验值的提取,仿真也就毫无意义。些数据的实验和实验值的提取,仿真也就毫无意义。 工工 业业 工工 程程 与与 管管

3、 理理 系系Industrial Engineering & Management引 言收集原始数据收集原始数据 基本统计分布基本统计分布的辨识的辨识 参参 数数 估估 计计 拟合度检验拟合度检验 可信否?可信否?否是是输入数据分析的基础,需要分析的经验,是输入数据分析的基础,需要分析的经验,对收集的方法、数据需要做预先的设计和估对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。算。因此这是一个关键的、细致的工作。通过统计的数学手段(计数统计、频率分析、通过统计的数学手段(计数统计、频率分析、直方图制作等),得出统计分布的假设函数直方图制作等),得出统计分布的假

4、设函数(如:正态分布、负指数分布、(如:正态分布、负指数分布、Erlang分布分布等)等)根据统计特征,计算确定系统的假设分布参根据统计特征,计算确定系统的假设分布参数。数。运用统计分布的检验方法,对假设的分布函运用统计分布的检验方法,对假设的分布函数进行可信度检验。通常采用的是数进行可信度检验。通常采用的是 2检验。检验。输入数据模型确定的 基本方法正确输入数据正确输入数据 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management数据的收集 什么是数据收集?什么是数据收集? 数据收集的意义?数据收集的意义? 数据收集的基本态

5、度?数据收集的基本态度?数据收集是针对实际问题,经过系统分数据收集是针对实际问题,经过系统分析或经验的总结,以系统的特征为目标,析或经验的总结,以系统的特征为目标,收集与此有关的资料、数据、信息等反收集与此有关的资料、数据、信息等反映特征的相关数据。映特征的相关数据。数据的收集是一项工作量很大的工作,数据的收集是一项工作量很大的工作,也是在仿真中最重要、最困难的问题。也是在仿真中最重要、最困难的问题。即使一个模型结构是正确的,但若收集即使一个模型结构是正确的,但若收集的输入数据数据不正确,或数据分析不的输入数据数据不正确,或数据分析不对,或这些数据不能代表实际情况,那对,或这些数据不能代表实际

6、情况,那么利用这样的数据作为决策的依据必将么利用这样的数据作为决策的依据必将导致错误,造成损失和浪费。导致错误,造成损失和浪费。数据收集工作应该具有科学的态度、忠数据收集工作应该具有科学的态度、忠于现实的工作作风。应该将数据收集工于现实的工作作风。应该将数据收集工作、仿真工作的意义让参与者明确,得作、仿真工作的意义让参与者明确,得到参与者的支持和理解。到参与者的支持和理解。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management数据收集过程中的注意事项 做好仿真计划,详细规划仿真所需要收集的数据在收集数据过程中要注意分析数据

7、数据的均匀组合收集的数据要满足独立性的要求数据自相关性的检验 根据问题的特征,进行仿真的前期研究。分析影响系统的关键因素。从相关事物的观察入手,尽量收集相关的数据。为此可以事先设计好调研表格,并注意不断完善和修改调研方式,使收集的数据更符合仿真对象的数据需要。数据的收集与仿真的试运行是密切相关的,应当是边收集数据、边进行仿真的试运行。然而系统仿真是一项专业性很强的工作,要正确认识“仿真”的含义,抓住仿真研究的关键,避免求全、求“精”。确信所收集的数据足以确定仿真中的输入分量,而对仿真无用或影响不显著的数据就没有必要去多加收集。针对仿真所收集的各个数据需要进行相关性检验。为了确定在两个变量之间是

8、否存在相关。要建立两个变量的散布图。通过统计方法确定相关的显著性。尽量把均匀数据组合在一组里。校核在相继的时间周期里以及在相继日子内的一时间周期里的数据的均匀性。当校核均匀性时,初步的检验是看一下分布的均值是相同。考察一个似乎是独立的观察序列数据存在自相关的可能性。自相关可能存在于相继的时间周期或相继的顾客中。例如,第i个顾客的服务时间与(i+n)个顾客的服务时间相关。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management直方图 对于离散系统的统计分析中,一般用频率统计的分对于离散系统的统计分析中,一般用频率统计的分析方法

9、来计算分布函数。其图形描述用的就是析方法来计算分布函数。其图形描述用的就是直方图直方图。直方图直方图构筑方法构筑方法取取值值区区间间划划分分水水平平 区区坐坐 间间标标 标标轴轴 注注的的计计 区区算算 间间确确 内内定定 的的每每 发发一一 生生 数数垂垂直直 标标坐坐 注注标标 频频轴轴 数数上上绘绘 上上制制 的的各各 发发个个 生生区区 频频间间 数数绘绘制制直直方方图图区间中的次数。落在inNnPiii; 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management直方图分组区间数量的选取F分组区间的组数依赖于观察次数以

10、及数据的分散或散布的程度。F一般分组区间组数近似等于样本量的平方根。即: Nm 如果区间太宽(m太小),则直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。如果区间太窄,则直方图显得凹凸不平不好平滑 合适的区间选择(m值)是直方图制作,分布函数分析的基础。 0 05 51010151520202525012345678频率13579 11 13 15 17 19 21 23 25 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management直方图分组区间数量的选取024681012频率1357911 13 15 17 19

11、21 23 25x合适的区间选择(m值)是直方图制作,分布函数分析的基础。对直方图进行曲线拟合,拟合所得到的曲线应该就是该随机变量的概率或密度函数。密度函数是一个一般概率函数。通常,我们通过标准函数的假设,将概率分布假设成标准分布函数形式。如:负指数分布、泊桑分布等。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management参数估计的作用 上一节通过对随机过程的样本值的直方图分析,我上一节通过对随机过程的样本值的直方图分析,我们已经得到了随机过程的分布假设,即假设随机过程的们已经得到了随机过程的分布假设,即假设随机过程的概率分

12、布符合某一种标准的随机分布。这是一种通过对概率分布符合某一种标准的随机分布。这是一种通过对随机分布的认识而作出的定性分析结果。在给定了一种随机分布的认识而作出的定性分析结果。在给定了一种随机分布函数后,需要进一步获取这一分布函数的特征随机分布函数后,需要进一步获取这一分布函数的特征参数,这一标准分布函数的参数需通过参数估计来求得。参数,这一标准分布函数的参数需通过参数估计来求得。因此,参数估计在这里是为了对随机分布函数参数求取因此,参数估计在这里是为了对随机分布函数参数求取的一个工具。的一个工具。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering &a

13、mp; Management样本均值和样本方差 设某一个随机过程设某一个随机过程X,其,其n个抽样样本为个抽样样本为x1,x2,xn,该样本的均值为,该样本的均值为 该样本的方差为该样本的方差为 如果离散数据已按频数分组,则如果离散数据已按频数分组,则 niixnX11 212211XnxnSnii kiiixfnX11 212211XnxfnSkiiik是X中不相同数值的个数即分组数,f是X中数值Xj的观察频数 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management参数估计量XX1bmax1xnnb2,X22S分分 布布参

14、参 数数建议使用的估计量建议使用的估计量泊松泊松指数指数在(在(0,b)上)上的均匀分布的均匀分布正态正态,仿真中常用的一些分布参数建议值仿真中常用的一些分布参数建议值 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management 为了测试随机样本量为为了测试随机样本量为n的的随机变量随机变量X服从某一特定分布形服从某一特定分布形式的假设,常用式的假设,常用 2 2拟合度检验。拟合度检验。 这种检验方法首先是把这种检验方法首先是把n个个观察值分成观察值分成k个分组区间或单元。个分组区间或单元。检验的统计量由下式给出(检验的统计量由

15、下式给出(k为为分布的阶数)分布的阶数)式中,式中,Oi是在第是在第i个分组区间的个分组区间的观察频数。观察频数。 Oi = ni /n iiiEEO220 0 02 24 46 68 8101012121 12 23 34 45 56 67 78 89 91010 1111 1212 1313 1414 1515 1616 1717 1818 1919 2020 2121 2222 2323 2424 2525k=6Ei 是在该分组区间的期望频数。每是在该分组区间的期望频数。每一分组区间的期望频数是一分组区间的期望频数是 Ei = n pi, 这里的这里的pi是理论值,是对应第是理论值,是对

16、应第i个个分组区间的假设概率。分组区间的假设概率。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management可以证明:02近似服从具有自由度 f = k-s-1的2分布。这里 s 表示由采样统计量所估计的假设分布的参数个数。假设检验作零假设:H0:观察值Xi是一组属于分组分布函数F的独立相同分布的随机变量。若2太大则拒绝H0,若拟合是好的,则期望值2很小。首先划分区间,定义k值计算各组的观察频数计算0查阅2表,得到该值反映的是假设分布的拟合程度。值202P拟合度检验步骤拟合程度的判定 工工 业业 工工 程程 与与 管管 理理

17、系系Industrial Engineering & Management指定拟合度的检验指定拟合度的检验 我们可以根据拟合度检验的要求,设定一个拟合度的我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数显著性指数 ,根据设定的,根据设定的显著性指数显著性指数 以及以及 2分布的分布的自由度数自由度数f = k- -s- -1,可以查,可以查 2表得到表得到 ,f2 。 如果如果 则检验未通过,则检验未通过,H0不成立。不成立。 如果如果 则检验通过,则检验通过, H0成立。成立。2,20f2,20f在应用这个检验时,如果期望的频数太小,将对检验的有效性有在应用这个检验时,如果期

18、望的频数太小,将对检验的有效性有所影响。一般情况下区间的个数所影响。一般情况下区间的个数k宜在宜在3040以下,并能使最小期以下,并能使最小期望频数望频数Ei5。如果。如果Ei值太小,可以把它和相邻分组区间的期望频值太小,可以把它和相邻分组区间的期望频数相合并,对应的数相合并,对应的Oi值也应该合并起来,同时每当合并一个单元,值也应该合并起来,同时每当合并一个单元,k值应该减去值应该减去1。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management 例题 某事件我们通过长期观察,得到了该事件的观测值20000个,试求该数据集的

19、概率分布函数,并对分布的拟合度进行检验。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management相关性分析相关性分析 系统运行过程中,随机变量有多个,如激励存在多种系统运行过程中,随机变量有多个,如激励存在多种因素的影响;系统参数的变化等。这些随机变量之间因素的影响;系统参数的变化等。这些随机变量之间可能是独立的,也有可能是相互有牵连的,牵连程度可能是独立的,也有可能是相互有牵连的,牵连程度的强弱有所不同。需要进行相关性分析。的强弱有所不同。需要进行相关性分析。 相关性分析的目的相关性分析的目的:更好地了解系统以及系统随机变

20、:更好地了解系统以及系统随机变量的关联性,更正确地把握问题的关键。量的关联性,更正确地把握问题的关键。 相关性分析的方法相关性分析的方法:通常采用的是回归分析的统计方:通常采用的是回归分析的统计方法法 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management单变量线性回归单变量线性回归 假设要估计在自变量假设要估计在自变量x与一个因变量与一个因变量y之间的相关性。之间的相关性。设在设在y与与x之间真实相关是线性关系,这里观察值之间真实相关是线性关系,这里观察值y是随是随机变量。而机变量。而x是数学变量。那么在给定是数学变量。那

21、么在给定x的值之下,的值之下,y的的期望值假设是期望值假设是式中:式中: 0为一未知常数,是为一未知常数,是x取零时,取零时,y的值;的值; 1为斜率,即为斜率,即x变化一个单位所引起的变化一个单位所引起的y的变化,的变化,也是一个待定的未知常数。也是一个待定的未知常数。 xxyE10 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management单变量线性回归单变量线性回归假设假设 y 的每一个观察值可用下式表示的每一个观察值可用下式表示y = 0 + 1 x + 式中式中 是均值为是均值为0,方差为,方差为 2的随机误差。的随机

22、误差。假设存在假设存在n对观察值对观察值(xi ,yi),i=1,2,n,通常采,通常采用最小二乘法来估计上式中的用最小二乘法来估计上式中的yi 。设。设 yi = 0 + 1 xi + i i=1,2,n,则则 i = yi - - 0 - - 1 xi 假设假设 是不相关的随机变量。是不相关的随机变量。 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management随机变量随机变量偏差偏差 的平方和为的平方和为(最小二乘法函数形式最小二乘法函数形式)为了使为了使L(偏差)极小,可求出(偏差)极小,可求出 和和 ,并置它们为,并置

23、它们为0,从而可,从而可以得到以得到 0 、 1的线性代数方程,既有:的线性代数方程,既有: niiL12 niiixy1210 0 L1 L 021100 niiixyL 021101 iniiixxyL 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management niiniixyn1110 niiniiiniixyxx101121 niiniiixxxxyxy121110 niiniiynyxnx111,1 工工 业业 工工 程程 与与 管管 理理 系系Industrial Engineering & Management多变量线性回归多变量线性回归假设假设 y=y1,y2,ymT 的由的由m个变量构成的向量,每一个个变量构成的向量,每一个向量观察值可用下式表示向量观察值可用下式表示y = 0 + 1 x + 式中式中 = 1, 2, mT是均值为是均值为0。 x=x1,x2,xnTn个影响观察值的控制变量。个影响观察值的控制变量。式中式中 0 =

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论