第八章输入数据分析课件_第1页
第八章输入数据分析课件_第2页
第八章输入数据分析课件_第3页
第八章输入数据分析课件_第4页
第八章输入数据分析课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、输入数据的收集第八章输入数据分析二、分布的识别三、参数估计四、拟合度检验五、相关性分析一、输入数据的收集第八章输入数据分析二、分布的识别三、参数?模型的输入数据哪里来?

输入数据分析?模型的输入数据哪里来?输入数据分析生产仿真结果的准确性生产模型的准确建立仿真数据的准确性输入数据是仿真模型的动力GIGO(garbageingarbageout)生产仿真结果的准确性生产模型的准确建立仿真数据的准确性输入数系统名称典型的输入数据排队系统

顾客到达的间隔时间顾客被服务时间的分布自动化物流系统

货物到达间隔时间装载时间卸载时间生产系统

作业到达的间隔时间作业类型的概率每种作业每道工序服务时间的分布可靠性系统

生产无故障作业时间

系统的仿真依靠这些原型系统的运行数据,缺乏这些数据的实验和实验值的提取,仿真也就毫无意义。系统名称典型的输入数据排队系统顾客到达的间隔时间自动化物收集原始数据

基本统计分布的辨识参数估计

拟合度检验

可信否?否是是输入数据分析的基础,需要分析的经验,对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。通过统计的数学手段(计数统计、频率分析、直方图制作等),得出统计分布的假设函数(如:正态分布、负指数分布、Erlang分布等)根据统计特征,计算确定系统的假设分布参数。运用统计分布的检验方法,对假设的分布函数进行可信度检验。通常采用的是

2检验。正确输入数据

收集原始数据基本统计分布的辨识参数估计拟合度检验可一、输入数据的收集

做好仿真计划,详细规划仿真所需要收集的数据在收集数据过程中要注意分析数据数据的均匀组合收集的数据要满足独立性的要求数据自相关性的检验根据问题的特征,进行仿真的前期研究。分析影响系统的关键因素。从相关事物的观察入手,尽量收集相关的数据。为此可以事先设计好调研表格,并注意不断完善和修改调研方式,使收集的数据更符合仿真对象的数据需要。数据的收集与仿真的试运行是密切相关的,应当是边收集数据、边进行仿真的试运行。然而系统仿真是一项专业性很强的工作,要正确认识“仿真”的含义,抓住仿真研究的关键,避免求全、求精。确信所收集的数据足以确定仿真中的输入分量,而对仿真无用或影响不显著的数据就没有必要去多加收集。针对仿真所收集的各个数据需要进行相关性检验。为了确定在两个变量之间是否存在相关。要建立两个变量的散布图。通过统计方法确定相关的显著性。尽量把均匀数据组合在一组里。校核在相继的时间周期里以及在相继日子内的一时间周期里的数据的均匀性。当校核均匀性时,初步的检验是看一下分布的均值是相同。考察一个似乎是独立的观察序列数据存在自相关的可能性。自相关可能存在于相继的时间周期或相继的顾客中。例如,第i个顾客的服务时间与(i+n)个顾客的服务时间相关。数据收集过程中的注意事项一、输入数据的收集根据问题的特征,进行仿真的前二、分布的识别直方图1直方图的构造方法如下:取值区间划分水平区坐间标标轴注的计区算间确内定的每发一生数垂直标坐注标频轴数上绘上制的各发个生区频间数绘制直方图二、分布的识别直方图1直方图的构造方法如下:取水计区垂绘直方图分组区间数量的选取1分组区间的组数依赖于观察次数以及数据的分散或散布的程度。一般分组区间组数近似等于样本量的平方根。即:

如果区间太宽(m太小),则直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。如果区间太窄,则直方图显得凹凸不平不好平滑

合适的区间选择(m值)是直方图制作,分布函数分析的基础。二、分布的识别直方图分组区间数量的选取1分组区间的组数依赖于观察次数以及数二、分布的识别二、分布的识别离散数据—汽车数量(p215)离散数据—汽车数量(p215)连续数据—电子元器件寿命(p217)连续数据—电子元器件寿命(p217)三、参数估计样本均值和样本方差(p221)1设某一个随机过程X,其n个抽样样本为x1,x2,…,xn,该样本的均值为该样本的方差为如果离散数据已按频数分组,则k是X中不相同数值的个数即分组数,fi是X中数值Xj的观察频数三、参数估计样本均值和样本方差(p221)1设某一个随机过程参数估计量(p222)2分布参数建议使用的估计量泊松指数在(0,b)上的均匀分布正态,仿真中常用的一些分布参数建议值

三、参数估计参数估计量(p222)2分布参数建议使用的估计量泊松?理论分布和实际分布的差异程度?

拟合度检验?理论分布和实际分布的差异程度?拟合度检验四、拟合度检验k=6

Ei是在该分组区间的期望频数。每一分组区间的期望频数是Ei=npi,这里pi是理论值,是对应第i个分组区间的假设概率。

2拟合度检验式中,Oi是在第i个分组区间的观察频数。Oi=ni/n四、拟合度检验k=6Ei是在该分组区间的期可以证明:

02近似服从具有自由度f=k-s-1的

2分布。这里s表示由采样统计量所估计的假设分布的参数个数。假设检验:H0:随机变量X服从参数是由参数估计给出的分布假设。H1:

随机变量X不确认若

2太大则拒绝H0,若拟合是好的,则期望值

2很小。拟合程度的判定四、拟合度检验首先划分区间,定义k值计算各组的观察频数计算

0查阅

2表,得到如果,则拒绝H0拟合度检验步骤可以证明:02近似服从具有自由度f=k-s-1的2指定拟合度的检验我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数,根据设定的显著性指数以及

2分布的自由度数f=k-s-1,可以查

2表得到

,f2。如果则检验未通过,H0不成立。如果则检验通过,H0成立。在应用这个检验时,如果期望的频数太小,将对检验的有效性有所影响。一般情况下区间的个数k宜在30~40以下,并能使最小期望频数Ei≥5。如果Ei值太小,可以把它和相邻分组区间的期望频数相合并,对应的Oi值也应该合并起来,同时每当合并一个单元,k值应该减去1。四、拟合度检验指定拟合度的检验我们可以根据拟合度检验的要求,设定一个拟合度四、拟合度检验注意:(1)被检验的分布离散

除非必须合并相邻分组区间以满足最小期望频数的需要,否则随机变量的每个值应该是一个分组区间(2)被检验的分布连续连续分布分组区间数量的推荐值样本容量2050100>100分组区间个数k不使用

2检验5~1010~20四、拟合度检验注意:(1)被检验的分布离散五、输入数据分析例题[1]p215在5分钟周期内的到达数每个周期的到达数频度每个周期的到达数频度0126711075219853179341010358111收集数据1五、输入数据分析例题[1]p215在5分钟周期内的到达数每个分布辨识2五、输入数据分析例题[1]分布辨识2五、输入数据分析例题[1]分布辨识2五、输入数据分析例题[1]分布辨识2五、输入数据分析例题[1]参数估计3五、输入数据分析例题[1]参数估计3五、输入数据分析例题[1]拟合度检验4五、输入数据分析例题[1]假设:泊松分布的概率质量函数:拟合度检验4五、输入数据分析例题[1]假设:泊松分布的概率质五、输入数据分析例题[1]对于α=3.64,不同x值的概率从概率质量函数得到:五、输入数据分析例题[1]对于α=3.64,不同x值的概率从xi观测频度Oi期望频度Ei0122.67.871109.621917.40.1531721.10.8041019.24.415814.02.57678.50.26754.411.62852.0930.81030.310.1合计10010027.682212.2177.6五、输入数据分析例题[1]xi观测频度Oi期望频度Ei0122.67.871109.6计算出:在显著性水平α=0.05下,查表得出(p409):五、输入数据分析例题[1]计算出:在显著性水平α=0.05下,查表得出(p409):五电子元件寿命记录79.9196.769144.6950.6247.0043.08159.8992.6335.3831.7646.20E-021.19217.9673.1481.0051.96134.769.10E-027.0781.1475.8455.0099.00323.960.2193.02718.3870.9410.593.2176.5050.1410.8781.92814.3822.10E-0243.5653.3710.31.0081.30E-0224.422.1572.00E-032.3360.1230.4337.5790.5434.562五、输入数据分析例题[2]p216电子元件寿命记录79.9196.769144.6950.62假设:令k=8,则每个区间p=0.125具有相等概率

2的检验五、输入数据分析例题[2]假设:令k=8,则每个区间p=0.125具有相等概率2的检五、输入数据分析例题[2]五、输入数据分析例题[2]分组区间观测频度Oi期望频度Ei[0,1.590)196.2526.01[1.590,3.425)106.252.25[3.425,5.595)36.250.81[5.595,8.252)66.250.01[8.252,11.677)16.254.41[11.677,16.503)16.254.41[16.503,24.755)46.250.81[24.755,∞)66.250.01合计505039.6五、输入数据分析例题[2]分组区间观测频度Oi期望频度Ei[0,1.590)196.2计算出:在显著性水平α=0.05下,查表得出:五、输入数据分析例题[2]计算出:在显著性水平α=0.05下,查表得出:五、输入数据分六、相关性分析系统运行过程中,随机变量有多个,如激励存在多种因素的影响;系统参数的变化等。这些随机变量之间可能是独立的,也有可能是相互有牵连的,牵连程度的强弱有所不同。需要进行相关性分析。相关性分析的目的:更好地了解系统以及系统随机变量的关联性,更正确地把握问题的关键。六、相关性分析系统运行过程中,随机变量有多个,如激励存在多种六、相关性分析协方差和相关系数1协方差和相关系数是X1和X2之间线性相关程度的度量设X1和X2是两个随机变量,令分别是Xi的均值和方差。X1和X2的协方差的定义为六、相关性分析协方差和相关系数1协方差和相关系数是X1和X2六、相关性分析相关系数ρ越接近于-1或1,X1和X2之间的线性关系就越强六、相关性分析相关系数ρ越接近于-1或1,X1和X2之间的线六、相关性分析样本协方差相关系数六、相关性分析样本协方差相关系数提前期6.54.36.96.06.96.95.87.34.56.3需求量10383116971121041061099296六、相关性分析例题9.20:令X1表示工业机器人交货的平均提前期,X2表示年需求量。下面的数据是过去10年的需求量和提前期:计算得到:提前期6.54.36.96.06.96.95.87.34.5六、相关性分析因此提前期和需求量有很强的依赖性六、相关性分析因此提前期和需求量有很强的依赖性单变量线性回归2假设要估计在自变量x与一个因变量y之间的相关性。设在y与x之间真实相关是线性关系,这里观察值y是随机变量。而x是数学变量。那么在给定x的值之下,y的期望值假设是式中:

0为一未知常数,是x取零时y的值;

1为斜率,即x变化一个单位所引起的y的变化,也是一个待定的未知常数。六、相关性分析单变量线性回归2假设要估计在自变量x与一个因变量y之间的相关假设y的每一个观察值可用下式表示

y=

0+

1x+

式中

是均值为0,方差为

2的随机误差。假设存在n对观察值(xi

,yi),i=1,2,……,n,通常采用最小二乘法来估计上式中的yi

。设

yi=

0+

1xi

+

ii=1,2,……,n,则

i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论