集成电路制造系统模型的参数化方法研究与应用_第1页
集成电路制造系统模型的参数化方法研究与应用_第2页
集成电路制造系统模型的参数化方法研究与应用_第3页
集成电路制造系统模型的参数化方法研究与应用_第4页
集成电路制造系统模型的参数化方法研究与应用_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文(专业学位)集成电路制造系统集成电路制造系统模型的参数化方法研究与应用姓名:姓名:学号:所在院系:电子与信息工程学院职业类型:工程硕士专业领域:控制工程指导教师:教授二〇一三年三月

摘要集成电路制造系统是公认的最复杂生产系统之一,在对其进行建模时往往对某些特征进行简化或初始设定,以保证模型的可建性和运作性,然而模型随之产生由于缺乏准确的、随实际情况变化的参数而不够精确的问题,通过模型获取的性能指标或派工方案可靠性低下,不能准确地指导科学研究和实际生产。参数化方法的主体思路是利用生产系统中存储的大量历史数据和在线数据,利用统计分析、神经网络和灰色理论等方法构建参数化模型,由此获取集成电路制造系统模型参数的潜在知识与模式,以参数化模型的输出作为集成电路制造系统模型的输入参数,为模型的构建与决策分析提供可靠的、有效的数据支撑。首先,本文详细介绍了集成电路制造系统的数学模型、智能算法模型、Petri网模型和仿真模型,从理论角度分析了各类模型特点并介绍了每类模型中参数的存在形式,为参数化方法设计提供基础。其次,给出了模型参数化方法框架和模型参数化方法流程,介绍了主要用到的参数算法如时间序列分析法、神经网络、灰色理论等;根据参数化方法的作用不同,将参数化方法归纳为参数化模型优化方法和参数化建模方法;给出了参数化系统的数据层、用户界面层、参数化模型层三层设计框架并详细介绍了每层的模块功能和实现技术,其中C#和MATLAB混合编程技术不仅为参数化系统实现提供了基础,更为改善系统性能提供了新思路。然后,运用模型参数化方法解决了集成电路制造企业的两个实际需求。根据问题特点,或采用模型参数化优化建模方法提高原有模型准确率以满足企业需求,或将企业需求转化为对参数的分析建立参数化模型,并在结果不满意的情况下再次采用模型参数化优化方法改善上述参数化模型准确率以使问题圆满解决。两个模型参数化应用均搭建了相应的参数化系统,实际生产线操作人员可直接通过界面操作使用,对指导实际生产线调度和提高企业生产率有重要意义。最后,关于进一步工作的方向进行了简要的讨论。关键词:集成电路制造系统模型、参数化模型优化、参数化建模、神经网络、灰色理论ABSTRACTIntegratedCircuit(IC)manufacturingsystemisrecognizedasoneofthemostcomplexproductionsystems,sowhentryingtobuildamodelingtorepresenttheproductionline,wehavetosimplifyorinitialsettingonsomeofitscharacteristicstomakesurethatthemodelcanbebuiltandrun.However,themodelsbuildunderthisconditionisinaccurate,failtodynamicallyreflecttherealitysituation.Inconsequence,theoutputofthemodelsthatusingtoguidetheresearchoractualproductionlinessuchasperformanceindexanddispatchisinaccurate.Themainideaofparametricmethodsistoutilizethelargeamountofhistoricaldataandon-linedatastoredintheproductionsystem,usingstatisticalanalysis,neuralnetworksandgraytheoryorotherintelligentmethodstobuildaparametricmodel,andtherebyacquirepotentialknowledgeandmodeoftheintegratedcircuitmanufacturingsystemmodel.TheoutputofparametricmodelsisastheinputforICmodelsbuildingtoprovidethereliabilityandvaliditydatasupport.Theresearchintroducethemodelingofintegratedcircuitmanufacturingsystemfrommodelingtheoriesindetailssuchasmathematicalmodel,intelligentalgorithmmodel,Petrinetmodelandsimulationmodelandanalyzeeverymodel’sparameters.Nextsection,theresearchcomesupwithmodelparameterizationframeworkandmodelparameterizationmethodsprocess,andintroducethemainparametricalgorithmsuchastimeseries,neuralnetworkandgreytheory.Accordingtodifferentfunctions,themodelparameterizationmodelsaredividedintoparametricoptimizationmodelandparametricmodeling.Thentheresearchdesignsthreelayersparametricsystem,whicharedatalayer,UIlayerandparametricmodellayer.Foreachlayer,modulefunctionsandimplementationtechnologyaredetailedintroduced.NotonlytheC#andMATLABhybridprogrammingtechnologyprovidesrealizingfoundation,butalsoprovidesanewtrainofthoughttoimprovetheperformanceoftheexistingsystem.Thenusethetheoriesandimplementationtechnologytosolverealityproblems.Accordingtoenterpriseproductionlinetwopracticalproblems,wechoosekeyparametersofeachproblems,usestatisticalmethods,timeseriesanalysisandneuralnetworktobuildParameterizedmodelanddevelopParameterizedsystemtoverifytheeffectivenessofthemethods.Theresultsshowthatourmethodssolvetheproblemsabove.AlsotheParameterizedsystemsprovideguidancefortheenterprise.Inthefinality,theproblemsrequiringfurtherstudiesarediscussed.KeyWords:ICsystem,Parametricoptimizationmodel,Parametricmodeling,Neuralnetwork,Greytheory目录TOC\o"1-4"\h\z\u第1章绪论 11.1引言 11.2集成电路制造系统及数据简介 11.2.1集成电路制造简介 11.2.2集成电路制造系统数据分类 21.2.3集成电路制造系统模型数据特点 31.3参数化方法研究现状 31.4论文结构安排 51.5小结 7第2章集成电路制造系统模型与模型参数分析 82.1引言 82.2数学模型与模型参数分析 82.2.1模型介绍 82.2.2模型参数分析 102.3基于智能算法的模型与模型参数分析 102.4基于Petri网的模型与模型参数分析 112.5仿真模型 112.5.1仿真平台介绍 122.5.2模型参数分析 132.6本章小结 13第3章集成电路制造系统模型参数化方法研究 143.1引言 143.2集成电路制造系统模型参数化方法体系结构设计 143.2.1模型参数化优化体系 143.2.2模型参数化建模体系 153.3集成电路制造系统模型参数化流程设计 163.3.1数据预处理 163.3.2参数算法 18K-S检验 18时间序列分析 19人工神经网络 20灰色理论 223.4集成电路制造参数化系统设计及实现 233.4.1数据层模块设计与实现 24数据加载实现 24数据加载优化实现 253.4.2用户界面层设计与实现 263.4.3参数化模型层设计与实现 28参数化模型 28接口实现 363.5本章小结 38第4章模型参数化方法在加工时间参数优化中的应用 394.1问题描述 394.2待优化参数选取 394.3数据层模块设计与实现 424.4用户层模块设计与实现 434.4.1数据加载模块设计与实现 444.4.2评价指标设计与实现 444.5参数优化模块设计与实现 464.5.1K-S检验 464.5.2指数平滑法 464.6优化结果分析 484.7小结 52第5章模型参数化方法在设备故障预测中的应用 535.1某集成电路制造公司设备故障介绍 535.1.1设备故障特点介绍 535.1.2故障预测参数分析 535.2故障预测参数化系统设计与实现 545.3故障预测参数化建模 555.3.1小波神经网络参数化模型实现 555.3.2灰色理论参数模型实现 565.3.3小波神经网络模型和灰色模型结果分析 595.4模型参数优化建模与实现 595.5小结 61第6章总结与展望 626.1论文工作总结 626.2下一步工作的方向 62致谢 64参考文献 65附录AFabSimSys执行率相关表 68个人简历、在读期间发表的学术论文与研究成果 70第1章绪论1.1引言集成电路产业作为国民经济和社会发展的战略性、基础性和先导性产业,具有极强的创新力和融合力,伴随着各种电子产品渗透到人民生活、生产以及国防安全的方方面面。国际金融危机后,世界各国都在努力探寻经济转型之路,加快培育发展战略性新兴产业,力争在后危机时代的全球经济发展和竞争中赢得先机。集成电路制造系统的研究最早在上世纪50年代随着运筹学的发展而兴起。集成电路制造系统研究的核心内容是建模方法和生产过程调度方法,传统的建模方法如基于数学规划的建模方法和仿真建模方法等已取得大量成果,甚至在钢铁、微电子、纺织、机械、石化等行业的生产过程问题建模和优化中得到了成功应用[1-3]。但由于集成电路制造系统实际生产过程中具有的大规模、带复杂约束、不确定等复杂特点,使得传统建模方法在实际应用中受到较大限制。同时,随着制造系统自动化程度的不断提高,制造型企业多采用企业资源计划(EnterpriseResourcePlanning,ERP)、制造执行系统(ManufacturingExecutiveSystem,MES)等先进管理工具对生产线进行调度管理,这些管理工具产生并存储了大量与生产过程相关的数据,这些数据隐含了生产线的生产和调度信息,如何充分利用这些数据对现有的建模方法进行优化是本文研究的目标。1.2集成电路制造系统及数据简介1.2.1集成电路制造简介集成电路制造主要分为IC设计、掩膜版准备、晶圆准备、晶圆加工、晶圆测试、装配与封装及终测等阶段[4],其制造过程如图1.1所示。图1.1集成电路制造过程其中,晶圆加工被称为前端工艺,晶圆测试、装配与封装及终测被称为后端工艺。前端工艺主要在晶圆上完成电路印刷工作,平均要使用上百台设备经过400~600步的加工步骤。前端工艺常常直接被称作半导体硅片加工生产线,简称半导体生产线或FAB,是集成电路制造过程最复杂最关键的部分,同时也是资金投入最高、耗时最长的部分,一直是众多从事集成电路制造系统研究的学者们所关注的重点。由于加工流程复杂多样,集成电路制造过程从整体上看具有高度复杂性、可重入流、大规模和高度不确定等明显特点[5]。1.2.2集成电路制造系统数据分类根据数据在ERP和MES中的作用不同,集成电路制造系统数据分为生产过程数据、资源数据和市场管理数据等。生产过程数据包含了集成电路制造过程中与产品、生产线加工操作过程或过程单元相关的数据,包括产品流程数据、设备基础信息、设备加工菜单、设备状态信息、在制品信息、设备维护数据等,这部分数据是本文后续工作的基石;资源数据是制造过程中与物理设备及生产环境相关的数据,主要包括系统资源数据、用户资源数据和通用资源数据;市场管理数据记载了制造系统外围环境因素,主要为与市场、客户等相关的数据,包括产品需求量、所需产品种类、交货时间等,通常该类数据与顾客个体、地理区域、时间范围、营销策略等直接相关。根据数据更新的频率不同,集成电路制造系统数据分为静态信息和动态信息,其中静态信息包括设备基本信息(Equipment)、流程信息(Process)、产品信息(Product)、加工工艺信息(Recipe)等;动态信息包括:设备状态信息、设备维护信息、在制品信息以及订单信息等。根据时间属性不同,集成电路制造系统数据可分为历史数据和实时数据。历史数据反映了以往的实际生产线状况,主要包括设备的生产信息和系统性能指标等;实时数据反映了当前生产线和产品状态。1.2.3集成电路制造系统模型数据特点集成电路制造系统建模的数据支持通常由企业提供,企业对集成电路制造系统模型的数据支持形式以面向业务的数据为主,企业提高的数据和模型中数据的交互形式如图1.2所示。图1.2企业提供数据支持形式图当研究人员对集成电路制造系统进行建模时,企业数据库管理人员会根据业务需求有针对性的从企业数据仓库中提取数据,这些面向业务的数据存在以下特点:面向业务的数据通常为关系型数据,企业数据库管理人员在提取前期对数据进行了范式设计免除重复冗余性,使得数据之间的关联关系被破坏,不可避免的丢失了部分有用信息。面向业务的数据通常面向某一个或几个具体需求,即数据支持较强的针对性。数据由于受到各种实际生产制造和存储设备的影响而存在较大扰动。数据缺失严重且分布不均匀。1.3参数化方法研究现状国内外学者与研究人员针对复杂生产系统模型参数化方法进行一系列的研究,目前已取得一定的研究成果并应用于实际生产过程中。参数化方法主体思路是基于生产系统中存储的大量历史数据和在线数据,利用统计分析方法和以神经网络及数据挖掘等为代表的人工智能方法构建参数化模型,以已有数据为样本,训练参数化模型以获取潜在的知识与模式,由此获取复杂生产系统模型参数的分布空间或预测值,以参数化模型的输出作为生产决策模型的输入参数,为模型的构建与决策分析提供可靠的、有效的数据支撑。在复杂生产决策模型中,参数化工作主要体现在模型参数的分布分析与预测中,包括加工时间、设备的维护计划等参数的预测,参数法方法可分为统计学方法和人工智能方法。(1)统计学参数化方法研究现状统计学方法的基本思想是根据系统记录中比较完整的历史数据,确定输入输出参数的影响因子以及它们之间大致的关系,建立相应统计分析模型以分析与预测参数变化规律或分布。统计学方法在参数化中的应用主要为回归方法、时间序列分析等。回归分析是应用极其广泛的数据分析方法之一,它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。时间序列分析法是概率统计学科的一个分支,它是运用概率统计的理论和方法来分析随机数据序列,并对其建立数学模型,进行参数估计,对模型定阶,以及进一步应用于预报、预测、自适应控制等各方面[6]。统计学方法的优点是其理论依据较为完善,缺点是对数据分析时需要对数据的分布情况和大致趋势了解,并需要了解输入和输出之间的关系,由于统计学方法对于数据质量要求过于严苛,一般的工程数据难以达到要求。统计学方法在模型参数化方法中已有广泛应用,如Liu等在问题特征分析和提取的基础上,采用工艺、机器、订单等生产数据应用基于迭代分解算法和聚类算法建立了用于全局调度的性能指标预测模型[8];郑玉华等利用已建立的CNC车床故障数据库,检索出每台机床的维修时间,采用极大似然法进行参数估计确定CNC车床可维护性重要指标的分布函数,最终得出了国产CNC车床的产品维修定量评价指标值[9]。(2)人工智能参数化方法研究现状应用于模型参数化方法中的智能化方法主要有人工神经网络、灰色理论、进化算法[20]、模糊和模糊集[21]等。神经网络的重要特点是具有记忆和学习能力,经过一定训练之后,能够对给定的输入做出相应处理[12-14],因此人们越来越广泛的应用神经网络来解决各种实际应用中的数据分析问题。灰色理论是我国控制论专家邓聚龙教授于1982年创立并发展的灰色理论[15]一种研究少数据、贫信息和不确定性问题的新方法,这一理论刚一诞生就受到国内外学术界和广大实际工作者的积极关注,经过三十多年的发展,灰色理论已经在工业、农业、社会、气象等领域解决了大量实际问题[16-18]。智能化方法在模型参数化方面的应用有:沈阳工业大学的张宇献等采用基于Levenberg-Marquardt算法的BP对上将率进行建模,并将模型参数化中的操作参数化设定成功的运用在了纺织浆纱生产仿真过程中[22];印度国家铸造技术制造工程研究所的S.K.Shuck等基于报价的多智能体系统用于求解集成过程规划与调度问题中,提出了考虑动态工具成本的新模型,使用数据挖掘技术工具预测出修复成本与工具故障概率之间的关系[24];美国乔治亚理工学院Michael.D.Baker基于离子刻蚀经历的时间、期望刻蚀的深度、气流速率、Chamber压力以及无线电频率作为BP神经网络的输入,离子刻蚀结束时间作为输出,有效地实现对反应离子刻蚀结束点的在线预测[25]。(3)参数化方法在复杂制造系统领域的研究现状统计学参数化方法和智能算法参数化方法在集成电路制造系统等复杂制造系统领域中有如下研究:日本瑞萨电子公司的Kikuta等将历史数据、人的经验等相关数据整合到知识管理系统中,以分析半导体制造设备的平均故障修复时间,从而提高设备的维修效率[10];Rabenasolo等利用生产历史数据获得释放时间和交货期等参数的概率分布建立了特征指标计算模型[11];Wang等基于订单、工艺等历史生产信息,采用自适应神经模糊推理系统(Adaptiveneuro-fuzzyinferencesystem)构建紧急订单到达信息预测模型[21];Chen分析了影响加工周期的因素,提出了基于模糊神经网络训练样本数据集来获取加工时间的预测模型[7];机械工业自动化研究所徐莹针对复杂生产过程,基于灰色系统建模方法,从生产历史数据中获得各工件的操作加工时间等调度问题关键模型参数[23]。1.4论文结构安排本文各章节安排如图1.3所示。 图1.3论文框架第1章:绪论。本章首先对集成电路制造系统加工流程和数据进行了概述,其次介绍了模型参数化方法的研究现状,最后给出了本论文的结构框架。第2章:集成电路制造系统模型及模型参数分析。本章首先详细分析了当前集成电路制造系统的模型及各模型存在的问题,并分别介绍了各模型中参数的存在形式,为集成电路制造系统模型参数化方法奠定基础。第3章:集成电路制造系统模型参数化方法研究。首先根据参数化方法的建模过程和作用不同,将参数化方法总结为模型参数化优化方法和模型参数建模方法,并分别给出了相应框架,其次归纳总结了模型参数化方法流程,最后,介绍了模型参数化系统的设计,给出了参数化系统的数据层、用户界面层和参数化模型层的三层结构设计并分别详细介绍了每层的功能模块、开发平台和实现技术。第4、5章:参数化方法在解决企业实际问题中的应用。第4章:模型参数化方法在加工时间参数优化的应用实现。分别使用基于K-S检验的参数化方法和时间序列分析方法中的指数平滑法对模型中的僵化参数加工时间进行参数化建模,并将参数化模型输出作为原仿真模型输入,实例证明两类参数化方法均提高了原仿真模型的准确度。第5章:模型参数化方法在设备故障预测中的应用实现。根据企业的故障预测需求,分别使用模型参数化建模方法建立了小波神经网络参数化预测模型和灰色网络预测模型,由于两种参数化方法预测精度不够稳定,提出了灰色网络预测组合模型法,该方法是利用灰色理论对小波神经网络模型进行参数优化,实例证明该预测模型具有更高的预测精度,同时实现了故障预测参数化系统,对指导企业生产具有重要意义。第6章:总结与展望。总结了全文的工作和研究成果,并提出需进一步研究的问题和未来的发展方向。1.5小结本章简要介绍了集成电路制造过程,分析了集成电路制造系统参数的类型,概括了集成电路制造系统模型的数据特点,对参数化方法的研究现状做出总结,最后,给出了论文结构框图。

第2章集成电路制造系统模型与模型参数分析2.1引言对集成电路制造系统进行研究时,需要借助抽象化语言来搭建模型以描述系统的行为特征和变化规律,有效的建模方法是集成电路制造系统进行相关研究的重要前提。许多学者对集成电路制造系统进行研究并提出了多种模型,主要有基于运筹学的数学模型、基于智能化方法的模型、Petri网模型和仿真模型等[27]。本章将分别介绍各模型在集成电路制造系统中的建模原理和参数在各模型中的存在形式,为模型参数化方法提供基础。2.2数学模型与模型参数分析集成电路制造系统的数学模型依托于运筹学理论,在建模过程将建模目的抽象成目标变量,将生产线相关结构抽象成约束和决策变量等,使得建模过程转化成建立“在一定初始条件和约束条件下寻求使某一性能指标最优”的数学表达式的过程。集成电路制造系统数学模型主要有线性规划模型、动态规划模型、排队模型等或是基于动态规划、排队论等理论建立的Markov模型、Fluid模型等。2.2.1模型介绍(1)线性规划模型线性规划模型一般形式为:(2.1)(2.2)线性规划模型的主要建模步骤如下:首先,确定决策变量。线性规划模型建立的是否得当,求解是否方便,取决于决策变量选取得是否得当,模型的决策变量随着目标函数的选取不同而变化;其次,确定约束条件。明确问题中所有的限制条件,并用决策变量的线性等式或不等式表示。集成电路制造系统模型的约束主要包括规模约束、流程约束、工艺约束、调度规则约束等;最后,确定目标函数。目标函数体现了建模目的,在集成电路制造系统模型中,目标函数常为体现生产线的全局或局部指标和状态的参数如在制品数、设备维护情况等。(2)动态规划模型动态规划模型为:(2.3)在使用动态规划建模时,涉及到阶段、状态、决策、策略、状态转移函数和最优值函数等概念。建模步骤为可概括为:将建模过程划分为适当的个阶段;正确选择状态变量,使它既能描述过程的状态,又满足无后效性,同时确定允许状态集合;选择决策变量,确定允许决策集合;给出状态转移方程:(2.4)确定阶段指标及指标函数的形式(阶段指标之和、阶段指标之积、阶段指标为max或min等);给出基本方程,即最优化函数的递归方程2.3。(3)排队模型由于集成电路制造系统中广泛存在工件等待设备加工、设备等待维修人员维修等现象,如何合理的分配,使工件以较少的资源在较短的时间内得到加工成为集成电路制造系统建模的一个难点,而这与排队论方法的解决排队时间和服务设施规模这一矛盾的精髓契合,所以基于排队论的模型在集成电路制造系统中应用广泛。使用排队论求解排队问题的目的是研究排队系统运行的效率,通常通过考虑队长、等待时间和逗留时间等性能指标来估计加工质量和确定系统参数的最优值,以决定系统结构是否合理。排队模型一般由输入过程、服务规则以及服务台三部分构成,如图2.1所示。图2.1排队模型输入过程是指要求服务的客户按怎样的规律到达排队系统的过程,有时也称为顾客流,一般从顾客总体数(分有限和无限两种)、顾客到达方式(分单个到达和成批到达)和顾客流的概率分布三方面进行描述。服务规则是指服务台从队列中选取顾客进行服务的顺序,一般分为等待制度、损失制度和混合制度三大类。服务台一般从服务台数量及构成形式、服务形式以及服务时间分布三方面考虑。排队模型的符号表达为X/Y/Z/A/B/C(2.5)X表示顾客到达时间分布,常见的客户到达时间分布主要为定长时间到达、泊松分布和爱尔朗分布;Y表示服务时间分布;Z表示服务台个数;A表示顾客总体数;B表示客户源数目;C表示服务规则。2.2.2模型参数分析集成电路制造系统的数学模型以“在一定的初始条件和约束条件下寻求使某一性能指标最优”的数学形式表达,模型的参数即为用于描述系统行为特征和变化规律的各个变量。由于数学模型中的参数较少并且含义明确,当模型出现精度不够等问题时,可通过逐个分析变量的物理意义、分布情况以及变量与目标函数之间的关联关系来建立参数化模型方式使得模型更为优化。2.3基于智能算法的模型与模型参数分析近年来智能化方法的发展为集成电路制造系统建模提供了新的思路,目前应用于集成电路制造系统建模中的智能化算法主要包括基于Agent的智能建模方法和基于蚁群系统的智能建模方法[28-29]。下面以建立基本蚁群算法模型求解n个城市的TSP(TravellingSalesmanProblem)问题为例来说明蚁群算法模型并说明模型参数。蚁群算法建模过程为:Step1:初始化。主要为确定蚂蚁数目、每只蚂蚁的初始状态及初始化信息素。在TSP问题中,假设有m只蚂蚁,为城市和城市之间的距离,初始时刻蚂蚁被放置在各城市中,禁忌表用来存放已访问过的城市。相邻两个节点之间的初始信息素通过式2.6确定,(2.6)其中c为一个较大的常数,目的是给最初的信息素一个很小的值;Step2:为每只蚂蚁构建搜索解。对于第k只蚂蚁,从城市到城市的转换概率为:(2.7)其中,为启发因子,其值为。是体现信息素和启发因子相对重要性的参数;Step3:更新信息素。每完成一次旅行,蚂蚁都要在它访问的城市边缘放置信息素,信息素按2.8式更新。(2.8)表示在城市边缘的信息素强度,为系数,1-表示在时间t和t+1之间信息素的蒸发。其中(2.9)表示在时刻t和时刻t+1之间第k只蚂蚁在城市边缘的信息素强度增量。常用的模型有蚁周模型、蚁密模型和蚁量模型。在蚁群算法模型中,参数不仅仅是描述系统行为特征和变化规律的变量及其系数,还有对算法本身影响重大的参数如体现信息素和启发因子相对重要性的参数,这类参数设置是否合理通常对模型性能优劣影响较大[5]。实际上,大部分的智能化算法模型都存在这类与描述系统无关但对算法影响较大的参数,如何合理设置该类参数使得模型性能最高也是参数化方法重点关注的问题。2.4基于Petri网的模型与模型参数分析Petri网模型是20世纪60年代由C.A佩特里提出的,由于具有图形表示和数学描述的双重功能而成为研究集成电路制造系统的强有力工具。普通Petri网可以五元组表示[32],其中:,为有限库所集,用圆圈表示,n为库所的个数;为有限变迁集,用短线或矩形表示,m为变迁的个数;I,为输入函数,定义了从P到T的有向弧的权重的集合;O,为输出函数,定义了从T到P的有向弧的权重的集合。m为PN的初始标识,它表示初始状态托肯(token)在各库所中的分布情况。普通的Petri网模型由于结构简单不便于描述和分析复杂系统中不同资源或信息的流动和变化[30],针对这一状况,学者通过在普通Petri网的基础上增加元组以构建性能更强的Petri网如时间Petri网和着色Petri网来弥补[35]。Petri网可用于系统建模、离散事件仿真、性能分析及调度,尤其对并行和并发行为的系统建模有效,在集成电路制造研究领域已存在大量基于Petri网的模型以及基于Petri网模型的调度研究,如:黄丹等建立了集成电路制造过程生产线的Petri网模型[32];曹政才提出了Petri网技术和遗传算法相结合的优化调度方法[33];乔非等在有色Petri网的基础上,提出了半导体生产线分层调度模型[34]。然而,Petri网描述集成电路制造系统时有以下几个难点[36]:繁多的工序使得网规模膨胀、多次回流造成系统间关系难以表达、多种系统行为造成网络结构复杂和规模扩大。虽然有研究通过简化网模型中对不同种类工件的表达方法来达到缩小网络规模的目的,但却使模型结构更加复杂。参数化方法为上述难点提供了一种解决途径:由于Petri网模型的参数均存在于Petri网的基本组成模块等中,当Petri网模型不能合理对系统进行描述时,可对网模型进行模块分解分析,确定主成分模块及相关参数,利用系统中存储的大量历史数据和在线数据,以统计分析或智能化方法对模块中的参数构建参数化模型,获取模型参数的潜在知识与模式,并以参数化模型的输出作为网模型的参数输入以改善Petri网模型的性能。2.5仿真模型与模型参数分析 当涉及到的研究系统逻辑繁复且研究的问题复杂难解时,通常通过采用建立与实际研究系统特征和变化规律相似的仿真模型的方式进行间接研究,基于仿真模型的研究手段不单纯追求系统的数学解析模型,更侧重于描述系统的整体框架及系统对象之间的逻辑关系,对于规模大、设备昂贵、产品种类繁多的集成电路制造系统,尤其适合通过仿真建模的方式找到其行为模式和变化规律。2.5.1仿真平台介绍随着计算机技术和硬件水平的不断完善,系统仿真技术在许多大规模复杂系统如航天、化工、纺织等得到广泛应用,计算机仿真建模软件的支持和应用更为集成电路制造系统模型仿真提供了高效的解决方案。目前应用于复杂制造系统的仿真软件主要有PlantSimulation和FlexSim。PlantSimulation软件以其在价格、易用性及二次开发接口等性能方面的优势而被广泛应用在集成电路制造系统仿真建模中,并且目前已开展了大量基于该平台环境下的仿真模型调度方法研究[37]。PlantSimulation是以色列的Tecnomatix公司使用高级计算机编程语言C++开发的、面向对象的图形化建模和离散事件系统仿真的软件,可以应用于诸如仿真和优化、物流规划、生产计划的调度等多种场合,目前被广泛应用于集成电路制造过程生产线的建模仿真中。它将系统划分成物流对象、移动对象等进行分析,如在搭建集成电路制造系统仿真模型时,将设备抽象成物流对象,将加工工件抽象成移动对象,这些对象是数据和操作的集合,PlantSimulation中的每个对象都包括属性和事件,属性是对象的一些特性,而事件则是指对象的状态发生显著变化,如工件到达某个工序上的机器,事件可以触发相应的控制,使仿真系统按照控制策略正常运行。同时,PlantSimulation提供了SimTalk语言,SimTalk语言是面向对象语言,可以通过SimTalk语言对仿真模型的运行进行控制和进行调度算法库的编写[38]。使用PlantSimulation搭建集成电路制造系统仿真模型,可以说是将实际生产线在计算机中还原,通过对仿真模型的研究,可以更为总体和宏观的把握实际生产线,并且仿真模型的建立也为将理论研究应用于实际生产打好基础。2.5.2模型参数分析基于PlantSimulation平台下搭建的仿真模型采用的是面向对象的建模方式,面向对象方法是以封装了数据和对数据进行操作的对象以及不同对象之间的相互关系为中心的[38],因而在PlantSimulation平台下搭建的集成电路制造系统仿真模型可划分为两部分:表示生产线物理构件的对象层和表示对象之间相互关系的控制层,对象层是实际生产线特征的抽象,而控制层是实际生产线行为抽象,模型参数因此可分为对象参数和控制参数。集成电路制造系统仿真模型在搭建时将生产线中的一些属性或流程参数简化,使得模型因缺乏准确的、随实际情况变化的参数而不够精确[53],对于模型存在的上述问题,可对模型的对象层和控制层分解分析,选取出对模型影响较大且经过简化的对象参数或控制参数,运用系统中存在的相关信息在不改变模型结构的情况下通过对参数输入进行离线参数化建模,并将参数化模型输出结果作为仿真模型以改善仿真模型参数不准确、不及时的情况。2.6本章小结本章介绍了集成电路制造系统模型:数学模型、基于智能化算法的模型、Petri网模型和仿真模型,分析了每类模型的建模机制和模型的参数存在形式,为参数化方法设计提供了基础。

第3章集成电路制造系统模型参数化方法研究3.1引言模型参数化方法是基于生产系统中存储的大量历史数据和在线数据,利用统计分析、神经网络和灰色理论等智能化方法构建参数化模型,由此获取集成电路制造系统模型参数的潜在知识与模式,以参数化模型的输出作为研究模型的输入参数,为模型的构建与决策分析提供可靠性、有效性的数据支撑。集成电路制造系统的参数化方法是对集成电路制造系统模型的补充与完善,其不仅用于改善已有模型存在的缺陷,也用于分析和解释集成电路执行系统的某些行为特性和变化规律。3.2集成电路制造系统模型参数化方法体系结构设计模型参数化方法有两种应用场景,一为对已搭建模型的优化,在不改变现有模型结构的前提下,对模型存在的僵化参数输入进行离线参数化建模分析,并将参数化输出作为已搭建模型输入,使得已搭建的模型因具有更准确的参数输入而得到优化;二为直接建立参数化模型对集成电路制造系统的某些特征及性能进行分析,即将问题解决过程转化为参数求解过程。根据模型参数化方法应用场景的不同,集成电路制造系统模型参数化体系可分为以已搭建模型为优化对象的参数化优化体系和直接建立参数化模型的参数化建模体系。3.2.1模型参数化优化体系针对第2章阐述的集成电路制造系统各模型存在的问题和缺陷,本文采用模型参数化优化方法进行优化,模型参数化优化方法的思路是通过对现有模型分析,选取出对模型影响较大的但不具实际情况变化的僵化参数进行建模,并将结果以输入形式反馈给现有模型以提高现有模型的准确性。模型参数化优化方法主要是利用系统中存在的历史数据对参数的输入进行建模,而不改变模型原有的参数结构和数量,模型参数化优化体系结构如图3.1所示。图3.1模型参数化优化体系结构图模型参数化优化方法的思路来源于软件工程中的黑箱原理,即将集成电路制造系统模型看作一个黑箱,方法不对模型本身进行修改,而是通过对模型输入端、输出端和结构分析,得到对模型输出结果影响较大并且在建模时简化的参数,利用数据库中存贮的历史数据和模型输出数据对该参数输入离线分析建模,然后将优化后的数据导入到数据库中,模型通过使用优化的输入改善参数僵化的问题,最终达到提高模型准确率的目的。模型参数优化体系用于从参数的角度出发对现有的精度不高的模型进行优化,该体系结构将已搭建的模型和参数化模型通过参数值传递的形式结合。3.2.2模型参数化建模体系模型参数化建模体系实际上是直接从数据的角度出发建立参数化模型发掘参数中隐含的知识和模式,从而对所研究的对象进行分析。模型参数化建模体系如图3.2所示。图3.2模型参数化建模体系模型参数化建模方法是将实际问题的求解过程转化为参数的求解过程,利用系统中存在的数据建立参数化模型以分析集成电路制造系统中的某些特性如设备运行情况等。3.3集成电路制造系统模型参数化流程设计参数化方法建模流程包括关键参数分析及选取、数据预处理、参数优化算法设计与实现和结果分析四大部分。参数化方法建模流程如图3.3所示。图3.3参数化方法建模流程图第一步:参数分析选取。由于集成电路制造系统的复杂特性,参数化建模时首先需要选取问题的主成分进行分析,参数的选取使研究的问题得到简化,也使参数算法更具有针对性;第二步:数据预处理。参数化建模的数据来源于企业,而由企业提供的数据常因为各种因素而存在较大的扰动性,这些扰动可能影响数据所代表的信息,因此对数据进行平稳识别处理是参数化建模必要步骤;第三步:根据选取参数的特点对其进行优化算法设计和建模。本文主要用到的参数化算法为时间序列分析法、神经网络和灰色理论等;第四步:结果分析。通过对性能指标的分析考察选用的参数化方法是否达到预期效果,若没有,则返回第一步重新分析选取参数建模。3.3.1数据预处理企业提供的数据由于受到各种内外界因素的影响而呈现扰动较大、分布不均等特点,这些特点影响了数据中隐含的信息和模式,故在参数化建模前期需对数据进行预处理以保障建模数据质量。数据预处理主要包括离群点检测和归一化处理。(1)离群点检验在一组测定值中,有时会发现一个或几个测定值明显地离群,比其他的测定值明显的偏大或偏小,这些值的存在将影响原始数据的整体特征,需识别出来进行进一步处理。离群点检测方法主要有以下几种:t值检验法将可疑测定值以外的其余测定值当做一个总体,由这些测定值计算平均值与标准差,而将可疑值当作一个样本容量为1的特殊总体。如果与其他测定值同属于一个总体,则它与其他测定值之间不应有显著性差异。检测统计量为:(3.1)若统计量的值大于相应显著性水平下的检验法的临界值,则将判为离群点。Dixon检验法[39]对于按大小排列的观测值,计算临界值和:(3.2)(3.3)确定显著性水平,并查询该水平下的临界值,若,则判定为离群点;若,则判定为离群点;否则没有离群点。分位数检验法[40]分位数检验法采用了如下统计量:(3.4)(3.5)(3.6)(3.7)其中,、分别为样本数据的1/4分位点和3/4分为点。若有样本落在区间以外,则认为这些样本为离群数据,若有样本落在之外,则认为这些样本为极奇异常数据。(2)归一化处理数据归一化处理是参数化处理的重要步骤,归一化处理是把所有的数据转化为[0,1]之间的数,取消各维数据数量级的差别,避免因为输入输出数据的数量级差别较大而造成分析预测的误差较大。数据归一化的方法有两种:(a)平均数方差法。数学表述如下:(3.8)为数据序列的均值;为数据序列的方差。(b)最大最小法。数学表述如下:(3.9)为数据序列最小值,为数据序列最大值。3.3.2参数算法针对不同的参数特点和性质,选取不同的参数算法方法发掘其隐藏的知识和模式,本文用到的参数化算法有统计学方法中的K-S检验法、时间序列法和智能化算法中的人工神经网络和灰色理论。K-S检验学者Kolmogorov对Glivenko定理指出的“经验分布是理论分布的相容估计”这一结论进行了深入的研究,得到了基于上结论的用于描述两个独立统计样本的相似性的分布拟合优度检验方法,该方法就是著名的Kolmogorov-Smirnov检验。在统计学中,Kolmogorov-Smirnov(K-S)检验根据相容估计原理来判断样本是否来自某一特定分布。假设(3.10)且全样本独立,F(x)和G(x)为连续分布函数,我们感兴趣的检验问题为:(3.11)由Glivenko定理知,用经验分布函数来近似理论分布函数是可行的,于是Smirnov用统计量:(3.12)来检验上面的假设问题,其中和分别为X样本和Y样本的经验分布函数,和分别表示X样本和Y样本的顺序统计量,m,n表示样本数;的拒绝域为其取最大值。统计量D所对应的显著性水平p由可靠性分布函数表示:(3.13)其中(3.14)显然,若两独立样本相似,统计量距离时,,反之亦然。K-S检验可用来检测数据是否服从正态分布、对数正态分布、韦伯分布、指数分布和对数分布。时间序列分析时间序列(TimeSeries)可看作是随机数据序列或动态数据序列,其具有长期趋势变动、季节变动、随机变动等一类或几类变动形式耦合或叠加的特点,其中长期趋势变动反映了客观事物的主要变化趋势,它是指时间序列具有持续上升、下降或停留在某一水平上的倾向;季节变动是指序列由于受某种固定周期性因素的影响而呈现出有规律的周期性波动;随机变动是指由于大量的随机因素产生的宏观影响,根据中心极限定理,通常认为随机变动近似服从正态分布。时间序列分析[41]是运用概率统计的理论和方法来分析随机数据序列(或称动态数据序列),并对其建立数学模型,进行参数估计,对模型定阶,以及进一步应用于预报、预测、自适应控制等各方面。时间序列分析常用如下方法进行预测,主要有:1)趋势外推法趋势外推法是利用已知的具有各种变化特性的曲线如线性曲线、指数曲线、包络曲线等拟合时间序列过去和现在的发展趋势的分析方法。趋势外推法适用于精度要求不很高的中长期趋势预测。2)指数平滑法时间序列的态势具有稳定性和规则性,所以时间序列可被合理地顺势推延,过去的态势在某种程度上会持续到未来,且一般说来历史数据对未来值的影响是随时间间隔的增大而减小的,指数平滑法则以递推形式对各期观测值依时间顺序进行加权平均作为预测值[42]。3)自回归移动平均模型自回归移动平均模型通过数据自身的某些滞后序列进行解释,这样形成自回归模型(AR模型);另一方面认为时间序列是若干白噪声序列的某种组合,这样形成移动平均模型(MA模型),而将两种模型进行有机地结合形成自回归移动平均模型(ARMA模型)。这是一种典型的随机型时间序列分析方法,常用于对随机性波动较频繁序列的短期预测。自回归移动平均模型适用于平稳序列的分析,对于非平稳的序列,可以通过差分或季节差分以及各种变换进行平稳化处理后再采用,这样的模型统称为ARIMA模型。人工神经网络近年来,人工神经网络理论[44]随着计算机技术和人工智能技术的发展得以迅速发展。人工神经网络建模是通过学习一个训练数据集并应用所学知识产生预测或分类模型的过程,人工神经网络因具有大规模计算、并行处理、自适应学习、非线性映射和鲁棒容错性等特性,在控制优化、模式识别、智能信息处理以及故障诊断等多个领域得到广泛应用。神经元是神经网络的基本处理单元,一般表现为一个多输入、单输出的非线性通用器件的结构模型,该结构模型是神经网络的设计基础,神经元结构模型如图3.4所示。图3.4神经元结构模型上图表示了基本神经元模型,它由三个基本要素组成:一组连接,连接强度由该连接上的权值表示,权值为正表示激活,为负表示抑制。一个求和器,用于求输入信号对神经元的相应突触加权之和。一个激活函数,也称压制函数,因为它将输入信号压制到一定幅度范围内,一个输出正常的幅度一般在[0,1]之间或者[-1,+1]之间,该函数也起到了非线性映射的作用。以上的神经元模型可以数学表达式表示:(3.15)(3.16)(3.17)式中,为输入信号,为神经元k的权值,为线性组合的结果,为阈值,为激活函数,为神经元k的输出。神经网络就是将大量上述神经元模型通过一定的拓扑结构组织起来的具有群体并行处理能力的计算结构,根据神经元连接方式的不同可将神经网络分为分层网络和互联网络,本文主要采用分层网络结构,典型的神经网络分层网络结构如图3.5所示。图3.5神经网络分层网络结构虽然人工神经网络与真正的生物神经网络有差别,但由于它具备了生物神经网络的众多优点,因此具有一些固有的特性[44]:并行分布式处理。神经网络由很多功能简单的神经元相互连接而成,这些简单的处理单元在计算时采用集体的、并行的计算方式进行,这种并行结构和并行计算方式具有高速寻找优化解的能力。非线性处理。人工神经网络有很强的非线性拟合能力并可映射任何复杂的非线性关系。鲁棒容错性。部分或局部的神经元运作不正常不会对整个网络活动造成很大影响。自适应学习。通过对过去的历史数据的学习,训练出一个具有归纳全部数据模式的特定神经网络,即它的连接权值和连接的结构均通过学习得到。灰色理论长期从事自动化、系统工程和控制研究论研究的我国学者邓聚龙教授于1982首次提出了“灰色系统理论”并发表了灰色系统理论奠基性论文“TheControlProblemofGreySystem”。灰色理论是以“部分信息已知、部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象,通过对“部分”已知信息的生成、开发提取有价值的信息。灰色系统是用灰色参数、灰色方程及灰色矩阵来描述灰色系统的。灰色参数用表示,表示不知道具体数值而只知道部分数据特征的参数,具有灰色参数的方程成为灰色方程,灰色方程如3.18所示。(3.18)行列数确知而含有灰色元的矩阵称为灰色矩阵。一般灰色矩阵用来表示。矩阵中有个元素,则定义为矩阵的灰色度,式中为矩阵中灰元素的个数。将定义为矩阵的白色度。灰色系统理论实质是,运用灰色系统理论的思想和方法,将抽象现象或因素予以量化,对数据进行处理,对未来做出定量预测和决策,并将结构、关系、机制都不十分清楚的对象或系统做预测控制,从而完成系统分析。灰色系统建模思想如图3.6所示。图3.6灰色系统建模思想灰色系统建模是通过对原始信息随机性进行削弱而将原始信息转化为具有灰色特征的时间序列,并应用微分拟合法将该灰色时间序列建立为类似微分方程形式的模型,该模型具有微分、差分、指数兼容等性质,模型的参数、结构随时间的推进而改进[54],因而灰色系统模型是反映系统变化的动态模型。灰色系统建模是一种用不足信息建立信息尽可能充分的模型的途径,是用离散数据建立微分方程的一种方法,可以将抽象系统模型化、实体化[45]。3.4集成电路制造参数化系统设计及实现为了使系统设计层次清晰、可重用性强、程序维护性良好,对集成电路制造参数化系统实行了数据库、用户界面层和参数化模型层三层框架设计,集成电路制造参数化系统三层框架如图3.7所示。图3.7集成电路制造参数系统框架图数据层:存储历史数据、仿真数据和实时数据,其主要作用是为参数化分析提供数据支持,本文选用MicrosoftSQLServer2008作为本地数据库软件。用户界面层:沟通数据层和参数化模型层,用户界面层用来定义对数据的处理方式和对参数化模型进行操作,选用MicrosoftVisualStudio2008作为用户界面层开发平台,编程语言使用C#。参数化模型层:参数化算法的实现。根据对参数的操作方式不同,一般需要VisualStudio2008和MATLAB结合作为参数化模型层开发平台。3.4.1数据层模块设计与实现数据层模块的主要功能是将存储在本地磁盘的信息加载到数据库中,这些存储在本地磁盘的信息包括实时生产线信息和实际生产线历史信息等,这些数据由企业以.CSV文件形式提供,当然,数据也可以其他形式给出。本地数据加载流程如图3.8所示。图3.8本地数据加载流程图数据加载实现(1).CSV到VisualStudio2008加载.NETFramework平台提供了很多对文件进行读写的类,用于解决应用程序之间的数据交换问题。在数据源位置为磁盘文件或网络的某些位置时,常用FileStream或StreamReader类从文件中读取数据[46]。本文的参数化系统采用StreamReader类将数据从.CSV文件读取到VisualStudio2008内存中。(2)ETLETL是Extract,Transform和Load的缩写,即数据提取、转换和加载。ETL是联机分析处理和数据挖掘的基础,首先通过Extract将关系数据、平面数据文件中的分布异构数据抽取到临时中间层中,其次通过Transform对临时中间层中的数据进行清洗、转换、集成,最后Load到数据仓库或数据集市中为下一步的数据分析做准备。ETL是数据分析中是承前启后的必要的一步,相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。ETL整合了数据从分布异构数据源的收集、数据清洗、数据重构的流程和数据加载到目的端数据库、数据集市、数据仓库的流程,是构建数据仓库系统的关键技术[47]。本文采用在VisualStudio中自定义函数完成ETL功能,主要包括默认值补全、数据类型转换、表结构转换、数据一致性检查、数据完整性检查、对特定字段进行计算等。(3)VisualStudio2008到SQLSERVER2008加载本文采用了微软公司提供的开源MDAC接口组件实现两者之间的交互。MicrosoftDataAccessComponents(MDAC)是微软专门为数据访问功能而开发的应用程序开发接口,作为微软的统一化数据访问解决方案的核心组成,其组成组件有ODBC,OLEDB以及ADO。该组件作为开源资源可有网络下载获取,可直接添加到界面层程序项目中调用。ADO.NET是C#和.NETFramework一起使用的类集名称,用于以关系型的、面向表的格式访问数据。ADO.NET集成在VisualStudio2008中可通过添加命名空间的方式进行调用。在界面层中VisualStudio2008和SQLSERVER2008之间的交互均是通过调用该类实现。数据加载优化实现由于每次加载的数据通常为多版.CSV文件,加载时间较长,故本文采用了多线程编程技术和批量加载技术对加载过程进行优化。(1)多线程编程技术多线程编程技术,就是使程序中包含并发执行的多个线程。当多线程程序执行时,在该程序对应的进程中就有多个控制流在同时运行,即具有并发执行的多个线程。C#中线程被封装成对象,使用时将每一张表单的加载设置成一个线程对象。使用时线程个数的设置和主线程的设置对数据加载时间影响较大,且并非线程数越多加载速度越快,在某数据加载程序中,对线程个数遍历设置,在适当的主线程设置的情况下,线程数为3的多线程加载高于线程数为10的多线程加载。同时需注意,设置线程时应注意表单之间的关联依赖关系,避免死锁的产生。(2)批量加载(SqlBulkCopy)应用微软公司提供的开源MDAC接口组件将数据插入到SQLSERVER2008中时,默认使用Insert方式,即将数据从VisualStudio中一条条插入到SQLSERVER中,该方式下的时间开销主要集中在平台之间的通讯中。SqlBulkCopy是.NETFramework2.0新增的类,位于命名空间system.Data.sqlclient下,主要提供把其他数据源的数据有效批量地加载到SQLSERVER表中的功能。SqlBulkCopy可以应用到大批量数据的转移上,节省了平台之间的通讯时间。在某数据加载程序中,联合使用多线程加载方式和批量加载方式对28张表单进行加载,使得加载时间从原来的12分钟左右降到了8分钟左右,两种方式的结合使用对数据加载效率提升效果明显。(3)ODBC数据库中另外一些数据来源于集成电路制造系统仿真模型,仿真运行过程中会产生大量数据,是作为未来研究分析生产线性能指标的重要依据。使用Tecnomatix公司的PlantSimulation平台搭建的仿真模型通过ODBC数据源接口与SQLSERVER数据库建立连接,将仿真结果存储到本地数据库中。3.4.2用户界面层设计与实现用户界面层用来为用户提供友好的操作界面,使用户通过简单的按键操作完成数据加载功能、信息显示功能、参数设置功能及输出分析功能等。用户界面层是在VisualStudio2008平台上进行开发,采用了交互层、逻辑层和显示层三层架构。用户界面层的具体的结构设计如图3.9所示。图3.9用户界面层的三层结构设计交互层:提供VisualStudio2008中数据与SQLSERVER2008数据交互机制。逻辑层:接受用户层的参数,定义不同的处理逻辑,调用交互层提取本地数据库中数据进行处理,返回给表现层执行结果或返回给数据库供仿真使用。在参数化过程中,可将数据操作分析过程甚至优化算法嵌在逻辑层中共用户使用。显示层:根据用户需求提供人机接口供用户选择相应操作,完成数据加载、参数设置、模型选择、结果显示等功能。用户界面层的主要界面如图3.10-3.12所示。图3.10数据自定义加载界面图3.11特殊菜单设置界面图3.12性能指标分析界面3.4.3参数化模型层设计与实现参数化模型本文用到的参数化模型主要有时间序列分析法中的指数平滑法模型、小波神经网络预测模型和灰色理论预测模型。(A)指数平滑法模型指数平滑法(ExponentialSmoothing,ES)由布朗(RobertG.Brown)提出,它是在移动平均法基础上发展起来的一种时间序列分析预测法。指数平滑法的原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均,由于具有稳定性和规则性的时间序列的模式将被推延,过去的趋势会对现在造成影响,并且时间间隔越小的信息对现在或未来的影响越大,故将较大的权数放在最近的信息并且权值随着时间间隔变长而递减。指数平滑法通过合理设置指数平滑权值,配合一定的时间序列预测模型对现象的未来进行预测。使用指数平滑法分析流程如图3.13所示。图3.13指数平滑法分析流程使用指数平滑法进行建模时需要根据实际问题确定模型的结构,主要包括三大步,平滑模型选择、平滑系数选择和初始值确定。平滑模型选择指数平滑法一般有一次指数平滑法、二次指数平滑法和三次指数平滑法。设时间序列为,一次指数平滑法:(3.19)二次指数平滑法:(3.20)三次指数平滑法:(3.21)当时间序列变动出现直线趋势时,一次指数平滑法存在明显的滞后偏差,二次指数平滑法是对一次指数平滑法的修正,即在一次指数平滑法的基础上再进行一次指数平滑,利用滞后偏差规律找出曲线发展方向和发展趋势。三次指数平滑是对二次指数平滑的再一次修正。(2)平滑系数选择当指数平滑法应用与预测时,可按如下标准进行选择:当原序列呈现出比较稳定的水平趋势时,应取得小一些,一般在0.1.~0.3之间;当原序列波动较大时,应选择适中一些的数据,一般在0.3~0.5之间;当原序列波动较大且趋势较明显时,应选取大一些,在0.6~0.8之间。(3)初始值确定当序列数据量较大时,模型的初始值对最终的结果影响较大。在这种情况下,通常选取前几个数的平均值模型作为初始值。(B)小波神经网络相比于传统的神经网络,小波神经网络具有结构更简单、收敛速度更快、精度更高、学习能力更强等优点,并且由于小波神经网络的基元和整个结构是依据小波分析理论确定的,避免了传统神经网络在设计上的盲目性[50],本文采用小波神经网络作为模型参数化方法,小波神经网络建模流程如图3.14所示。图3.14小波神经网络建模流程在使用时需要根据问题特点确定使用哪种结构和训练方法能达到最优化的结果。具体说,神经网络的设计需要决定神经网络的输入节点数目、输出节点的数目、网络的层数、神经元的相互的连接、选择什么样的训练函数,以及网络训练规则。(1)输入层、输出层与网络层数设计输入层和输出层的维数是根据问题的需要来设计的,问题确定后,输入层和输出层的单元数也随之而定。在设计中,应尽量的减少系统的层数,使学习时间和系统的复杂度减小。(2)隐含层节点数的选择隐含层节点的作用是从样本中提取并存储其内在规律,隐含层节点数太少,网络从样本中获取信息的能力就差且容错性差,隐含层节点数过多,有可能把样本中非规律性内容如噪声等也学会记牢,出现所谓“过拟合”问题,反而降低泛化能力,并且,隐含层节点数过多会增加网络训练时间,因而对于多层网络而言,隐含层节点数的确定是网络模型成败的关键。目前确定最佳隐含层节点数的常用方法是试凑法[55],可先设置较少的隐含层节点训练网络,然后逐渐增加隐含层节点数目,使用同一样本进行训练,从中得出网络误差最小使对应的隐含层节点数为最佳隐含层节点数。试凑法的初始隐含层节点数可按经验公式3.22-3.24确定。(3.22)(3.23)(3.24)式中为隐含层节的点数,为输入节点数,为输出层节点,为0~10之间的常数。(3)几个网络参数值的选择各隐含层的学习率和动态参数的大小将决定网络性能的成功与否,所以这几个参数选择的好坏最终关系到网络设计成功与否。动态参数起到平滑的作用,在提高学习率的同时应适当降低动态参数的值,以避免系统出现尖锐的波峰或波谷。(4)训练集的选取训练集选择根据训练集的规模、训练集模式地分布状况等方面确定。网络训练中提取的规律蕴含在样本中,因此样本一定要具有代表性,训练样本集不宜选得过大,但又要足以表征所研究问题的一些主要的或基本特性。(C)灰色理论预测模型灰色预测是将系统行为特征量的变化过程看作为一个灰色过程,利用灰色系统理论的微分方程模型(GreyModel)进行预测。GM(1,1)模型是灰色模型中的一种,也是预测中最为常用的一种模型,其中,(1,1)分别代表一阶方程和一个变量。本文采用GM(1,1)的残差修正模型进行参数化建模。GM(1,1)残差修正模型建模流程如图3.15所示。图3.15GM(1,1)残差修正模型建模流程假定原始数据序列为式中n为样本数。对进行累加生成:(3.25)对建立白化微分方程:(3.26)a和u为待定参数。将上微分方程离散化:取,则式3.26表示为:(3.27)求参数a和u,方程3.27移项:(3.28)令,则有:(3.29)引入符号:(3.30)则有:(3.31)令:(3.32)则公式3.31变为:(3.33)两边左乘则为(3.34)两边左乘则为(3.35)得到(3.36)这里,是的转置矩阵,是的逆矩阵。白化微分方程3.26求解:令,得到微分方程的解为:(3.37)数据还原:(3.38)上式即为GM(1,1)模型。(6)模型精度检验。GM(1,1)模型常用的精度检验法有:残差检验法、后验差检验法和关联度检验法,本文采用后验差检验法进行检验。按照GM(1,1)建模法所求出的如式3.38所示,残差如式3.39所示。(3.39)原始序列和残差序列的方差分别为,则(3.40)(3.41)其中,,后验差比为(3.42)小误差概率为(3.43)指标是后验差检验的两个重要指标,按两个指标,可综合评定预测模型的精度。模型精度由后验差和小误差概率共同决定。一般地,将模型精度分为四级,见表3.1。表3.1精度检验等级参照表模型精度等级均方法比值C小误差概率p1级(好)C<=0.350.95<=p2级(合格)0.35<C<=0.50.80<=p<0.953级(勉强)0.5<C<=0.650.70<=p<0.804级(不合格)0.65<CP<0.70(6)模型修正。若GM(1,1)模型的精度检验不合格时,利用残差对模型进行修正,且当相对误差大于给定误差时对模型进行误差修正。GM(1,1)模型的残差修正过程为:令,其中为模型误差第一次大于给定误差的时刻,利用上述序列建立GM(1,1)模型,得到残差模型对原模型的修正模型:(3.44)其中,(3.45)对GM(1,1)的修正模型进行精度检验,若不合格,则再次进行残差修正,直至精度达到要求。接口实现由于MATLAB强大的数据分析功能和自带的各种智能化算法工具箱支持,参数化模型常在MATLAB平台下进行开发,为使参数化系统界面友好使用方便,需将在MATLAB下开发的参数化模块与C#混合编程通过组件化的形式嵌入到操作显示模块中,使整个系统具有统计分析的能力。C#和MATLAB联合编程,使得原有基于其他平台开发的仿真模型具有数据分析处理能力,极大的提高了模型性能并使仿真系统更为完善。本文采用COM组件技术和MATLAB引擎技术作为MATLAB与C#的接口技术。组件对象模型(ComponentObjectModelCOM)[49],它不是一种面向对象的语言,而是组件之间相互接口的规范,其作用是使各种软件构件和应用软件能够用一种统一的标准方式进行交互。COM所建立的是一个软件模块与另一个软件模块之间的链接,当这种链接建立之后,模块之间就可以通过称之为“接口”的机制来进行通信,应用程序请求创建COM对象并通过COM对象的接口操纵COM对象。MATLAB支持组件自动化(COMAutomation),即允许一个程序或组件去控制另一个程序或组件。本文将MATLAB参数化模型以组建的形式嵌入到VisualStudio中供用户界面调用。MATLAB与C#联合编程流程如图3.16所示。图3.16MATLAB与C#联合编程流程MATLAB与C#联合编程步骤如下:Step1:环境配置。当使用由MATLAB和C#联合编程的软件在客户机运行时,需要.NETFramework和MCR两个组件提供支持。可通过直接安装VisualStudio和MATLAB的形式安装,或直接下载安装这两个组件;Step2:在MATLAB下以M文件形式编写参数化模型。通过MATLAB编译器将M文件转化成.NETAssembly类库或COM对象。COM对象形式为DLL动态链接库文件;Step3:在VisualStudio2008开发的界面项目下添加DLL文件的引用,对项目编译,M文件中定义的方法将以类的形式存在于VisualStudio2008中,在VisualStudio2008平台下调用参数化模型与调用自身类相似,在VisualStudio2008下调用MATLAB中类调用方式如图3.17所示。图3.17VisualStudio2008平台下调用MATLAB函数C#语言具有界面良好、执行速度快和易维护等优点,但是在复杂算法实现方面由于编程难度过高而难以深入应用,MATLAB语言提供了强大的数值计算并提供了很多工程领域的实用工具箱但界面开发能力较差。因此实现C#与MATLAB混合编程,提高了软件开发效率,扩展了所开发软件的性能。也为科学研究和工程问题结合提供更强的技术支持。3.5本章小结本章首先根据模型参数化方法的不同作用,归纳了两种集成电路制造系统模型参数化方法体系结构——模型参数化优化体系结构和模型参数化建模体系结构,然后设计了模型参数化方法流程,详细介绍了模型参数化方法中使用到的算法,最后,给出模型参数化系统的数据层、用户界面层和模型层框架,详细说明系统各层的模块功能,介绍了在不同平台下模块的实现技术和优化技术,并分别予以实现。

第4章模型参数化方法在加工时间参数优化中的应用4.1问题描述上海某半导体制造企业目前使用的生产调度排程系统FabSimSys是一款基于PlantSimulation搭建的集成电路制造系统仿真模型,该系统通过对实际生产线进行仿真得到工件派工单来指导生产线操作工人进行调度。由于该企业的生产规模较大且加工流程复杂,在建模初期对很多重要参数进行了简单设定,使得模型的仿真准确率受到影响,企业希望在不改变现有模型构架的情况下尽可能高的提高模型的准确率从而提高派工单的可靠性,这是一个典型的模型参数化优化建模应用场景。本章将首先对FabSimSys进行分析,找到对模型影响较大的且设定简单的待优化参数,通过对该参数的输入离线建模优化而改善模型。4.2待优化参数选取企业级应用系统FabSimSys是模拟企业实际生产线加工过程的仿真模型,通过仿真得到派工单指导生产线操作人员对加工工件派工。显而易见,模型中工件的派工逻辑与实际生产线的工件派工逻辑越相似,模型中设备状态与实际生产线设备状态越相似,则模型的仿真准确程度越高,产生的派工单越可靠。但在模型结构已确定的情况下,修改模型逻辑不仅工作量大,而且复杂的耦合效应可能使结果得不偿失,而已搭建的仿真模型中存在许多在实际加工过程中有重要物理意义、但仅为简单设定的属性参数,如设备的维护周期等,这些参数与实际情况的符合程度影响着模型的准确性。本章从这些属性参数入手,利用历史数据对其输入进行参数化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论