版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
焦化工序能耗预测与优化模型的研究与实现焦化工序能耗预测与优化模型的研究与实现摘要由于能源资源的日趋紧张和工业发展所需能源的日益增加,人们越来越重视对能源的合理使用。作为工业能耗大户的钢铁企业,也把能源管理问题视为重点。其中焦炭作为冶金、机械、化工等行业的主要原料和燃料,其在钢铁制造流程中的作用非常重大。作为焦炭的生产单元,焦化工序是整个钢铁制造流程中的重点工序,其能源消耗也深受重视,其中焦炉炼焦所消耗的能源占整个焦化工序能源净消耗量的92%左右,所以对其能耗进行预测与优化对降低焦化工序乃至整个钢铁制造流程都具有重大意义。本文旨在对焦化工序中的焦炉炼焦生产过程的能耗预测与优化进行研究。首先,对采集到的原始样本数据进行预处理,结合实际生产情况与数据规律,对数据进行一些分析和单位化处理;然后,应用模糊逻辑推理技术,建立以大焦、洗精煤(配合煤)质量指标为输入,焦炉煤气(产出)、高炉煤气、电、蒸汽为输出的预测模型;最后,以能耗最低为目标函数,使用多元回归的方法建立能耗优化模型的约束条件,建立能耗优化模型,使在已知洗精煤(配合煤)质量指标的条件下,求取能耗的最优解,并得出此时各消耗能源之间的配比。本文以某钢铁企业焦炉炼焦生产过程为研究对象,对上述主要的研究给予实例分析验证。关键词:焦化、能耗预测、能耗优化TongjiUniversityMasterofScienceinEngineeringAbstractTongjiUniversityMasterofScienceinEngineeringAbstractIIABSTRACTDuetotheshortageofenergyresourcesandtheincreasingrequirementonenergyinindustrialdevelopmentdaybyday,thereisagrowingemphasisontheeffectiveutilizationofenergy.Asthebigenergyconsumers,steelenterprisesalsofocusattentionontheenergymanagementproblem.Coke,asthemainrawmaterialandfuelinthemetallurgy,machinery,chemicalindustry,playsanimportantroleonthesteelmanufacturingprocess.Asproductionunitofcoke,coking-processisthekeypointprocessinthewholesteelmanufacturingprocess,itsenergyconsumptionalsoveryseriously.TheenergyconsumedinCokeovenunitaccountsforabout92%ofentirecoking-processenergyconsumption,therefore,energyconsumptionpredictionandoptimizationaregreatsignificancetoreducetheenergyconsumptionofcoking-process,andeventheentiresteelmanufacturingprocess.Thispapermainlyfocusesonenergyconsumptionforecastandoptimizationofcoking-process.First,wecollectoriginalsampledatafromtheinformationsystem,andthencombinedwiththeactualproductionconditionsanddataregularity,takesomeanalysisandunitingoftheoriginalsampledata.Secondly,establishapredictionmodelwhoseinputsincludethequalityindexesofthecokeandthecleanedcoal,andoutputsincludecokeovengas(output),blastfurnacegas,electricityandsteam,byfuzzylogicreasoningtechnology.Finally,thepaperestablishestheenergyconsumptionoptimizationmodelwiththelowestenergyconsumptionastheobjectivefunction,andtheconstraintswhichisobtainedbythemethodofmultiple-regressionusingmultipleregressionmethod.Then,underthedeterminedconditionsofthequalityindicatorsofthecleanedcoal,weobtaintheoptimalsolution,andwiththeratiobetweenthevariousenergy-consumingisachievedperformance.Thispaperstudiesoncokeovenofonesteelenterprise,andgiveanexampleanalysisandtestingontheabovemainresearch.KeyWords:coking,energyconsumption,prediction,optimization同济大学硕士学位论文目录同济大学硕士学位论文目录目录第1章绪论 11.1本文研究的背景和意义 11.2焦化工序流程和能耗概况 31.2.1焦化工序流程概况 31.2.2焦化工序能耗概况 41.3焦化工序能耗优化模型的研究现状以及发展趋势 51.3.1研究现状 51.3.2焦化工序能耗优化模型的发展趋势 61.4本文的研究内容和安排 71.4.1主要的研究内容 71.4.2文章的结构安排以及内容框架 8第2章数据预处理 102.1单位化处理 102.1.1 单位化处理意义 102.1.2 实际生产数据的单位化处理 102.2离群点检测概述 112.2.1离群点检测的意义 112.2.2离群点检测技术 122.3离群点检测实例分析 132.3.1多元线性回归的数学模型 132.3.2实例分析 142.4本章小结 29第3章于模糊逻辑的焦化工序能耗预测模型 303.1模糊逻辑概述 303.1.1模糊理论概念 303.1.2模糊逻辑概念以及应用领域 313.2基于实际生产数据的模糊逻辑预测模型 313.2.1输入输出分配以及数据模糊化 313.2.2建立模糊推理机制 333.2.3模糊规则的确定 343.3建立预测模型 403.3.1 建立模糊逻辑预测模型 403.3.2 结果分析 423.4本章小结 43第4章焦化工序能耗优化模型 454.1优化模型概述 454.2焦化能耗优化模型的建立 454.2.1 确定目标函数与决策变量 454.2.2 确定约束条件 464.2.3 模型求解 474.2.4 结果分析 484.2.5 与预测值相比较 494.3本章小结 50第5章总结与展望 515.1全文总结 515.2研究展望 51致谢 53参考文献 54附录 56个人简历、在读期间发表的学术论文与研究成果 59同济大学硕士学位论文焦化工序能耗预测与优化模型的研究与实现第1章绪论绪论本文研究的背景和意义目前能源紧缺与环境恶化已经成为全球面临的最大问题。近些年来,全球社会发展普遍存在对矿产资源、水资源等自然资源过度利用的问题。全球经济持续高速增长,但经济增长的同时也引发了全球范围内的能源供应紧张并对环境保护造成了巨大的压力。在2009年12月7日至18日举行的哥本哈根世界气候大会,反复强调了节能减排的重要性。在大会到来之前,各国纷纷推出自己的减排计划,我国决定,到2020年我国单位国内生产总值二氧化碳排放比2005年下降40%~45%[1],作为约束性指标纳入国民经济和社会发展中长期规划。“十一五”期间,我国单位国内生产总值能耗累计下降钢铁制造是能源高度集中、高度消耗的过程,能源成本约占制造成本的30%左右,节能已成为钢铁企业在日益残酷的市场竞争中不得不面对的严峻问题。特别是经历了2008年底的金融危机和几次铁矿石等原材料价格的高涨后,钢铁企业的利润空间大幅度缩小,节能越来越受重视,已逐渐成为钢铁企业提升市场竞争力的有效手段之一。1987年开始,我国钢铁工业从进入了系统节能阶段。在节能工作中,拥有先进的生产设备和单体节能技术只是钢铁企业保持先进性的基础,然而,仅仅靠孤立的单向节能改造是不行的,需要的是综合治理。一方面应用数学方法以及系统工程的思想和方法对能耗进行优化,同时得到能源使用最优配比以及物料最优配置;另一方面应合理的回收和利用二次能源;这些才是节能减排的关键。钢铁制造流程是一个复杂的连续流程,是众多工序和设备有机地组合在一起的一个整体。在钢铁制造流程中能源消耗最大的工序是炼铁系统,包括焦化、烧结、球团和高炉炼铁等工序,本文主要针对的是整个炼铁工序的首个大工序—焦化工序节能降耗。焦化工序的主要生产目的是为高炉炼铁提供所需的燃料以及原料--焦炭,其重点生产过程是焦炉炼焦过程,焦炉炼焦过程的实质是洗精煤经过加热燃烧转换成焦炭、焦炉煤气以及各种化学产品的过程,或认为是碳素流转化为固态焦炭和气态碳--氢化合物、液态碳--氢化合物的过程。整个焦化工序所消耗的能源约约90%都是该过程消耗的。其中图表1.1所示的是2008年我国主要钢铁企业焦化工序能耗的基本情况。其中,下图中命名为“某钢企”的钢铁企业为本论文研究工作的提供数据资料,后文均以“某钢企”代替。图表1.12008年主要钢铁企业焦化工序能耗(纵轴坐标单位:kgce/t焦电力折算系数取0.1229kgce/kWh)由图表1.1可见,虽然该企业焦化工序能耗与一些企业相比较低,但与国内其他较先进企业相比还有较大差距。2008年,该企业老区焦化化工序能耗为140.08kgce/t焦,新区为137.95kgce/t焦,全年焦化工序平均为139.1kgce/t焦。2009年上半年老区焦化工序能耗为138.77kgce/t焦,新区焦化工序能耗为138.20kgce/t焦,上半年平均工序能耗为138.52kgce/t焦【3】。与2008年相比,其2009年焦化工序能耗略有降低,可见该企业本身对节能降耗的重视,但是相比钢企2平均能耗86.44kgce/t焦,还是相去甚远。经实地考察与资料分析得知,该企业焦化工序工艺与设备在国内均属先进行列,如有优良的能耗模型进行指导,使操作运行稳定,同时合理分配能源以及合理回收二次能源,其能耗水平定会步入领先水平。综上所述,针对马钢焦化工序建立能耗优化模型是非常必要的。为此本文以实际生产数据为研究对象,分别应用模糊逻辑推理和多元回归方法,为焦化工序中焦炉炼焦过程建立基于数据的能耗预测模型和能耗优化模型,最终目的是在确定洗精煤质量指标的前提下,并且焦炭质量满足要求时,能耗最低情况下各种能源消耗的最优配比。焦化工序流程和能耗概况焦化工序是高炉炼钢的前道工序,经高温炼焦所得到的焦炭可供给高炉炼铁作为燃料和原料;炼焦过程中得到的干馏荒煤气经回收、精制可得到各种芳香烃和杂环混合物,如粗苯,供合成纤维、医药、染料、涂料和国防等工业做原料;经净化与化学产品回收后的得到的净煤气为焦炉煤气,既是高热值燃料,也是合成氨、合成燃料和一系列有机合成工业的原料。因此,炼焦过程不仅是高炉炼铁的重要前提工序,也是整个冶金工业的重要组成成分。焦化工序流程概况焦化工序整个流程如图表1.2所示。原料煤一般以汽车、火车、货船等方式从各地运输过来,在备煤车间,根据已制定的配煤比例,把不同类型的煤配在一起,而后经粉碎后送往煤塔。装煤车按照作业计划从煤塔内取煤,经计量后装入焦炉的炭化室内。煤料在炭化室内经过一个结焦周期的高温干馏制成焦炭并产生荒煤气。一个结焦周期后,炭化室内的焦炭成熟,用推焦车推出,经拦焦车导入熄焦车内,并由电机车牵引熄焦车到熄焦塔内进行熄焦,熄焦分为干熄焦和湿熄焦,本文研究的焦化工序以干熄焦为主,湿熄焦为辅。熄焦后的焦炭卸至凉焦台上,冷却一定时间后送往筛焦工段,经筛分后得到冶金焦和焦粉、焦丁。在干熄焦过程,冷却焦炭的循环气体,在干熄炉冷却段与红焦进行热交换后温度升高,并经环形烟道排出干熄炉;高温循环气体经过一次除尘器分离粗颗粒焦粉后进入干熄焦锅炉进行热交换,锅炉产生蒸汽,温度降至约160℃的低温循环气体由锅炉出来,经过二次除尘器进一步分离细颗粒焦粉后,由循环风机送入给水预热器冷却至约130℃,再进入干熄炉循环使用。经除盐、除氧后约104℃的锅炉用水由锅炉给水泵送往干熄焦锅炉,经过锅炉省煤器进入锅炉锅筒,并在锅炉省煤器部位与循环气体进行热交换,吸收循环气体中的热量;锅炉锅筒出来的饱和水经锅炉强制循环泵重新送往锅炉,经过锅炉鳍片管蒸发器和光管蒸发器后再次进入锅炉锅筒,并在锅炉蒸发器部位与循环气体进行热交换,吸收循环气体中的热量,产生蒸汽外送。产生的饱和蒸汽外送的CDQ发电单元,进行发电。这里需要说明的是,有些钢铁企业,对于焦化工序能耗的计算,是把CDQ发电单元作一个独立的单元来计算能耗的,如马鞍山钢铁公司,这样就使得该公司焦化工序的能耗偏高。图表1.2焦化工序流程焦化工序能耗概况图表1.2焦化工序流程焦化工序消耗的能源有8种:洗精煤、高炉煤气、焦炉煤气、电、蒸汽、压缩空气、氮气和工业净水;产出的能源有6种:冶金焦、焦炉煤气、蒸汽、焦粉焦丁、焦油和粗苯。其流程可分为五个生产单元:备煤、炼焦、化产、熄焦以及CDQ发电,各个生产单元对应能耗情况如图表1.3所示。其中在“某钢企”中焦化工序能耗并不把CDQ发电的能源消耗与产出计算在内。焦化工序能耗焦化工序能耗备煤化产A(kece/t焦)B(kece/t焦)C(kece/t焦)D(kece/t焦)产品焦炭湿熄焦干熄焦焦炉CDQ发电电图表1.3焦化工序各工段能耗情况焦化工序的主要生产目的是为高炉炼铁提供所需的燃料以及原料--焦炭,炼焦过程的实质是洗精煤转换成焦炭、焦炉煤气以及各种化学产品的过程,或认为是碳素流转化为固态焦炭和气态碳--氢化合物、液态碳--氢化合物的过程。从钢铁制造流程整体考察,焦化过程实质是根据铁素流这一被加工主体的要求(为高炉冶炼提供优质焦炭)而发生的碳素流转换和耗散过程,或称为能源转换过程。焦化工序能耗是指生产一吨焦炭时备煤、焦炉、熄焦和化产四个生产单元的净消耗和,即消耗能源扣除产出能源。其中干熄焦过程中进行热交换,产生高压饱和蒸汽,整个过程基本不消耗能源,所以D一般为负值。其中焦炉这一生产设备的能耗最多,占总能耗的比例最大,约为整个焦化工序净能耗的90%左右,同时焦炉又是焦化工序的重点设备,对应的是焦炉炼焦单元,所以本文主要研究工作是针对焦炉炼焦过程开展的。焦化工序能耗优化模型的研究现状以及发展趋势研究现状对于焦化工序而言,实际生产过程涉及到多个局部生产过程,主要是:炼焦配煤过程、焦炉炼焦过程、熄焦过程、化产过程以及CDQ发电过程。其中焦炉炼焦过程是整个焦化工序的主要耗能过程,目前鉴于工艺的复杂性,国内外研究的主要是集中在工艺以及工艺参数对能耗的影响,一些操作参数如焦炉作业计划与调度等对能耗的影响等方面,针对某些质量参数对能耗进行优化分析的比较少见。工艺以及工艺参数方面,国内的主要技术有:中南大学吴敏,雷琪【4】【5】等人提出一种焦炉火道温度的复杂工艺分析与智能集成优化控制技术,实现了焦炉炼焦燃烧过程复杂工况的实时判断和焦炉火道温度的优化控制,由此建立了焦炉加热燃烧过程控制系统。安徽工业大学严文福、郑明东【6】等人利用焦炉炭化室传热的一维、二维传热过程,从满足焦炭质量要求的角度出发,得到目标火道温度线性模型等。焦炉作业计划与调度方面,现有的主要技术有:文【7】中提出焦炉自动化管控一体化技术,包含了焦炉生产过程的自动控制以及相应的管理功能如质量分析、设备诊断和统计以及计划编制等。中南大学吴敏,蔡雁,朱华琦【8】【9】等人提出一种基于动态分批自适应的多座焦炉作业协同计划与优化调度技术,建立了基于炉况分析的周期性自适应任务模型,通过动态分批优化调度算法,实现了多座焦炉作业协同与优化调度;另外,还有人提出一种基于质量预测模型的炼焦配煤多目标智能优化技术【10】,通过建立的配比计算与配比优化模型获得最优的配比和配煤方案实现炼焦配煤的优化;文【11】中建立了焦炭质量、产量及焦炉能耗的神经网络预测模型和以焦炭质量为约束条件,产量、能耗为目标函数的优化控制模型。本文对于焦化工序能耗优化的研究,主要是针对的是在焦炭质量指标满足要求的基础上,洗精煤质量指标与各种消耗能源之间的关系。这样,仅仅建立某个生产目标的数学模型是不够的,需要综合定性描述的知识模型,从集成建模的角度建立多目标优化模型。焦化工序能耗优化模型的发展趋势焦化工序生产过程工艺复杂,能源产出与消耗种类繁多,对其能源消耗进行优化需要综合考虑各个方面的因素,其中影响能源消耗的因素非常多,可分为物料因素、操作因素以及工艺因素三类。本文所做研究工作是在采集到的实际生产数据基础上进行了,但是同时也是由于数据方面的限制,本文将要建立的能源优化模型是一种质量指标与各种能源之间的集成,以能源消耗为目标函数,建立一定的约束条件,编程求解得到能耗最优解,同时得到能耗最优时的各种能源消耗的配比。本文所建立模型仅仅考虑到的影响能耗的参数是物料参数中的小部分,而目标是焦炭质量满足要求,生产计划得以完成和综合能耗最低,这是一个多目标优化问题。随着科技的发展,我们在建立能耗优化模型时,所要考虑的因素逐渐增加,这是一个多元化问题,所以对于焦化工序能耗优化模型的研究必将朝多元化、多目标化发展。本文的研究内容和安排主要的研究内容本课题主要从数据的角度出发,本文研究工作所用样本数据是实际生产的离线数据,所以要综合考虑实际生产情况,对能源、物料等相关参数以及各参数之间的关系进行分析和处理,而后建立能耗预测与优化模型。在焦炭质量满足要求和满足生产计划需求的前提下,使用预测模型能够预测焦化工序的各种能耗量,而优化模型能够寻优得到能耗的最优值,同时得到能耗最优时的各种消耗能源的最优配比。本课题最主要研究以下三个方面的内容:1)数据预处理通过调研和相关数据的采集,得到某钢企焦化工序大量的能耗相关离线数据,这些数据是本课题研究的基础。在建模之前,首先要考虑的是所选取的数据的质量,有无异常数据。通过分析数据知,各指标的波动范围较大,这些数据不能直接用来分析,需要对数据进行预处理,本课题拟采用的数据预处理技术是离群点检测技术。该技术在本课题里的应用主要表现在:a)改写或剔除能耗数据中明显错误的数据,以保证所建立的焦化工序能耗模型的可靠性更高;b)把异常数据作为研究对象,分析可能存在的潜在较优的生产模式。2)焦化工序能耗预测模型(炼焦过程)对于整个焦化工序的能耗,从工艺角度看,即为一定的原料(能源、物料)经过特定的设备和不同的操作,得到新的能源和物料的生产过程中,消耗能源与生成能源的差值;而从数学角度看,则是一定的原料参数(能源、物料配比),在一定的设备参数和操作参数下,经过数学算子或映射的作用而得到新的能源和物料参数,消耗能源参数与生成能源参数之差获得了目标函数。本文所建立预测模型主要针对的是炼焦过程,其出发点在于洗精煤和焦炭的质量指标,通过模糊逻辑推理的过程使这些指标与炼焦过程所消耗的各项能源之间建立一种特定的模糊推理关系,进而预测出各项能源的消耗(其中输入为各项指标,输出为所消耗能源)。3)焦化工序能耗优化模型对于焦化工序能耗优化模型,本文两方面考虑:一方面,将预测模型的结果带入到优化模型中去验证对比预测模型的可靠性;另一方面,以能耗最低为目标函数,应用多元回归方法建立输入输出关系,其中以焦炉煤气(产出量)、高炉煤气、电和蒸汽为输入量,给以一定的上下限限制得到预测模型的约束条件,通过本文中的优化模型,可以计算得到目标函数的最优解,同时得到此时的最优能源配比。文章的结构安排以及内容框架本文将按研究工作的关联顺序逐步展开。第二章主要介绍了数据处理方面的研究工作,首先是数据预处理方面的理论知识,紧接着对实验数据在不改变相互之间耦合关系条件下进行单位化处理,而后提出离群点检测技术,对实验数据进行离群点检测。第三章主要是应用模糊逻辑推理方面的知识,对实验数据建立模糊推理预测模型,本章中对模糊逻辑理论知识、模糊推理规则的产生以及预测模型的建立进行了详细的阐述。第四章的主要内容是确定目标函数,使用多元回归方法得到约束条件,建立能耗优化模型。对所建立能耗优化模型进行编程实现寻优,得到能耗最低时,各种能源的消耗配比的最优方案。第二、三、四章都是是以理论结合实例的模式展开的,这样,理论为实例分析进行指导,实例分析则是理论知识的验证。最后,对本论文所做的工作进行总结并对下一步工作做出展望和规划。本论文研究工作的结构框架如图表1.4所示。图表1.4图表1.4论文内容框架能耗优化模型模糊预测模型数据预处理原始数据单位化样本数据离群点检测与改写模糊推理机制模糊推理规则模糊化模糊推理预测模型能耗预测值确定目标函数确定约束条件建立优化模型最优解(包含质量指标参数与能源值)质量指标比较预测值与最优值各种能源值预测值最优解第2章数据预处理数据预处理建模是系统工程方法中的分析基础和工具,是研究大规模复杂的工程系统问题重要的科学方法【12】。本文是在数据的基础上,并结合实际生产情况与合理设定的条件,对焦化工序能源消耗过程进行建模并进而对所消耗的能源进行配比优化,最终是能耗降低,对此首先需要做的工作就是对数据进行一定的预处理。本章对数据的处理分为两个方面:一是,对数据的单位化处理;二是,对单位化处理后的数据进行离群点检测,以供后续建模需要。单位化处理由于研究工作所针对的是实际的生产过程,而所分析的数据也是实际采集到的生产数据,一般来说这些数据都具有很重要的意义,如果处理不当甚至会对企业造成很大的影响。出于数据的保密性考虑,且实际数据数值较大,应对原始数据进行一些初步的处理。本文对原始数据进行的初步处理是本人根据数据的实际情况和生产过程的实际情况,本着客观、全面的态度制定的。单位化处理意义单位化处理的想法起因于单位能耗的概念,如焦化工序单位能耗即为生产出一吨焦炭的能源总消耗量。因原始数据中不存在焦炭的产量数值,且若以单位能耗的原型进行单位化则起不到数据保密的效果,本文中选取的是以洗精煤(配合煤)的消耗量进行单位化。因为炼焦过程实际为碳素的转换过程,洗精煤与焦炭的主要区别在于,洗精煤是整个工序的输入量,而焦炭为输出量,应用洗精煤进行单位化与用焦炭进行单位化相比,并不会影响物料与消耗能源之间的关系,所以选择用洗精煤的消耗量进行单位化。单位化处理的意义主要在于两方面:1)数据的保密性;2)缩小数值,简化计算。这种单位化处理类似于简单的归一化处理,也是一种无量纲处理手段使物理系统数值的绝对值变成某种相对值关系。且本文单位化的数据是单一参照的相对值,不会改变数据之间的耦合关系。实际生产数据的单位化处理本文建模对象是某钢铁公司焦化工序中一座焦炉(某厂1#焦炉),采集的原始样本数据如附表A所示,包括大焦的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%)、消耗量(t/天),焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,MWh),蒸汽(饱和蒸汽,t)。用洗精煤的日消耗量作为单位化的相对量,对原始样本数据进行初步的处理后,得到研究所需的样本数据。同时,从所给出的大焦和洗精煤(配合煤)的各个质量指标的数据计算得,大焦的Mad(%)标准偏差为0.03,说明该组数据的变化较小,对后续将要建立的预测和优化模型的影响较小,所以不予适用;另外,根据安徽工业大学能源与环境研究所给出的“焦化工序解析及余热资源诊断研究”知【13】,在焦炉炼焦过程中的水分使用量很少,同样不予适用。最后经单位化以及上述分析后得到的样本数据如附表B所示,其中包括大焦的灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%),焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)。离群点检测概述一般说来,理论研究的研究对象都是来源于实际生活、生产过程中的数据,而后也是要应用到这些实际的过程中去进而实现其理论研究的价值。然而这些实际采集到的数据集,其中往往会存在一些异于其它数据规律的数据,这些数据的存在会使对实际问题的认知模糊不清,更是会影响所建立模型的准确性,离群点检测技术就是对这些数据进行挖掘和处理,是数据预处理的一种方式。上述数据集中,存在的一些异于其它数据规律的数据被称作离群点(outlier),也可以称作孤立点。因此,可以这样理解离群点检测(outlierdetection),即根据某些特定的方法,从大量的数据中分析查找出与其他数据显著偏差的数据,是数据挖掘的基本任务之一。其目的是消除杂质或发现潜在的、有意义的信息。关于离群点的定义有很多种,目前为止学术界能够接受的关于离群点本质的定义是Hawkins【14】给出的定义。他认为:“anoutlierisanobservationwhichdeviatessomuchfromotherobservationsastoarousesuspicionsthatitwasgeneratedbyadifferentmechanism”,即离群点是在数据集中与众不同的数据,使人怀疑这些数据并非随机偏差,而是产生于完全不同的机制。离群点检测的意义离群点数据产生的原因有多种,主要可以分为以下三种:1)离群点数据相比正常数据来源于不同的类别。例如,进行网络入侵的人(即离群点数据),与合法登陆网络的人相比,属于不同的类别;2)数据的固有变化。观测数据在样本总体中发生了变化,这种变化是样本总体自然发生的;3)数据测量和采集错误。人为操作错误、测量仪器的缺陷或故障也可能导致部分数据成为离群点。对于上述三种类型的离群点的检测都具有非常大的意义,尤其是第一中离群点的检测跟生活最是息息相关,例如电信和信用卡欺骗、药物研究、气象预报、电子商务、贷款审批、客户分类、金融领域、网络入侵检测等,这些情况下有关例外情况的信息比常规模式更有价值。目前在数据挖掘中,对这种例外信息情况的数据的研究,也即离群点数据挖掘的研究正得到越来越多的重视。本论文将对样本数据进行离群点检测,主要具有两方面的意义。第一,平稳,去噪。采集到的实际生产数据通常会存在不稳定数据点,这些数据点的存在对描述模型的建立起到一个类似于误导的作用,为使所建立的模型更合理的描述实际生产情况,这些数据必须剔除或改写。第二,离群点的潜在模式。作为离群点被“挑”出来的数据,仅仅可以表明这些数据是异于普通数据的,并不能确定的认为离群点所处的模式就是有弊端的模式,反而有可能是存在某种更优异的模式,本文亦将针对这方面作为预测优化模型的辅助研究。离群点检测技术目前用于检测离群点的技术众多,主要有以下几个类别。使用时应考虑实际情况选择适用的离群点技术。基于信息理论离群点检测技术:信息理论技术使用不同的信息度量方法来分析数据集中的信息内容,信息理论离群点检测技术主要是基于“离群点会导致数据集中的信息被误读”的假设,即前文提到的语义孤立点【15】。基于统计的离群点检测技术:该技术所遵循的基本原理是“离群点是被认为部分或者全部不相关的观测值,因为它不是假定的概率模型产生的”。常见的基于统计的离群点检测技术有:基于回归模型离群点检测技术【16】【17】等。基于分类的离群点检测技术:分类是通过学习被标记的数据用例而形成的一个分类模型,然后运用这个模型,把一个测试用例归到某一类别中,主要用于区分属于不同类别的实例。基于分类的离群点检测技术主要有:基于神经网络的分类检测技术、基于支持向量机制的分类检测技术、基于规则的分类检测技术等。基于近邻的离群点检测技术:该类技术都是基于“正常数据通常出现于高密度的数据区,而离群点一般远离它们的最近的邻居。”这一假定,它的最大优势在于是纯数据驱动的。基于近邻的离群点检测技术主要有:基于第k个近邻距离检测技术【18】、基于相对密度的离群点检测技术【19】。基于聚类的离群点检测技术:聚类将相似的数据聚集在一个聚类内,而离群点挖掘是找出与其他对象不紧密相关的对象,该技术可以在无人工干预下进行。一些聚类算法有线性的或接近线性的时间和空间复杂性,因此基于聚类算法的离群点挖掘技术【20】也是高效的。本文选用的离群点检测技术是基于多元回归方法的离群点检测技术【21】,这种离群点检测技术是基于统计的离群点检测技术方法之一,适用于低维数据集。选用该技术的主要原因在于,研究对象数据样本是采集的实际生产过程的离散数据,数据本身具有一定的关联性,且样本数据集中数据维数不高,所以选用多元回归方法。离群点检测实例分析多元线性回归的数学模型设随机变量QUOTE随着m个自变量x1,x2,…,xm变化,并有如下线性关系式:y=β0+β1×式(2.1)称为回归方程.其中β0,β1,…,βm称为回归系数,是m+1个待估计参数,ε是随机变量(剩余参数)。回归分析的主要问题是根据x1,x2,…,xm,y的QUOTE组观测数据{(xk1,xk2,…,xkm,yk)k=1,2,…,n}给出各回归分析系数βi的估计值βiQUOTE,同时对βiQUOTE作统计检验,该方法在MATLAB软件中可以很好的实现,多元回归分析的命令regress的调用格式如下:b=regress(y,X);[b,bint,r,rint,s]=regress(y,X,alpha)其中,QUOTE,X,alpha是输入量。QUOTE,是因变量(列向量);X,是1与自变量组成的矩阵;alpha,显著水平QUOTE(缺省时设定为0.05)QUOTE,bint,r,rint,s为输出量。QUOTE=(β0,β1,…βm);bint,b的置信区间;QUOTE,残差(列向量);rint,QUOTE的置信区间;QUOTE,返回三个统计量:决定系数R2,F值,F(1,n-2)分部大于F值的概率p。rcoplot(r,rint)可以绘制出残差及其置信区间杠杆图。应注意的是:残差与置信区间杠杆图,在0点附近比较均匀的分布,且不呈现一定的规律性,则说明回归分析做的比较理想;s返回的三个统计量中,决定系数R2越大,说明回归方程越显著;概率p<α时,回归模型有效。实例分析经过本章第一节单位化以及相关分析后得到的样本数据如附表B所示,其中包括大焦的灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%),焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)。需要说明的是对于焦化工序中焦炉炼焦工段,主要消耗能源为洗精煤、高炉煤气、焦炉煤气、外供电力与低压蒸汽,其中洗精煤、外供电力为一次能源,高炉煤气、焦炉煤气、与低压蒸汽为二次能源。对于二次能源,本文采用钢铁研究总院在《重点工序能源优化应用技术研究-结题报告》【3】中提出的定义,即,二次能源是一次能源经加工转换生成的能源产品,它包括的范围很广,在本例中,二次能源冶金焦和生产过程中的副产煤气和各种余热、余能。基于回归模型离群点检测技术是较常用的基于统计的离群点检测技术。其检测离群点主要有三个步骤。第一步,回归模型必须拟合数据集(例如,本次工作的样本数据),拟合数据集所建立的方程组,是以大焦的灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%)为输出变量,以焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)为输入变量;第二步,用所建立的模型分析残差值,对于每个测试数据,其残差值可以用来确定该数据是否为离群点。第三步,对已经确定的离群点进行一定的处理,使数据趋于平稳,为后续建模工作做准备,一般的处理方法为剔除和改写,由于本文的样本数据量较少,若用剔除的方法,可能会对后续工作影响较大,所以本文采取的是对离群点进行改写的方法。改写的对象是大焦灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%)数据组中的数据。改写的原则是:用与离群点较接近的正常数据根据实际情况进行替代。存在两种情况:a)若数据偏大,则用数据组中仅次于该数据的非离群点数据替代;b)若数据偏小,同样的,用数据组中稍大于该数据的非离群点数据替代。(数据偏大还是偏小,在残差与置信区间杠杆图可以看出)。下面本文将分别对大焦的灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%)建立与焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)之间的回归关系,下面将对比给出离群点检测前后的残差与置信区间杠杆图,以及离群点的处理方法。1)大焦灰分Ad(%)拟合大焦灰分Ad(%)与焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)之间的数据集合,得到的残差与置信区间杠杆图如图表2.5所示,从图中可以很容易观察出离群点数据组别,然后根据前文制定的改写原则对这些离群点进行改写,然后对改写过离群点数据的数据集进行拟合,若仍有离群点则继续改写,直至最后拟合数据集后不存在离群点数据为止,此时所得到的残差与置信区间杠杆图如图表2.6所示。图表2.5残差与置信区间杠杆图(大焦灰分Ad(%))图表2.6改写离群点后的残差与置信区间杠杆图(大焦灰分Ad(%))由图表2.5显然可见,离群点数据为第五、十二、十八组数据,改写的对象是大焦灰分Ad(%)数据组中的数据,改写情况见表格2.1。更改后继续拟合数据集,出现离群点数据为第十三组数据,更改情况同样见表格2.1。继续对离群点进行改写,并拟合数据集,此时不存在离群点数据,所得到的残差与置信区间杠杆图如图表2.6所示。表格2.1离群点更改情况(大焦灰分Ad(%))离群点批次离群点数据组别更改前数据值偏离情况更改后数据值第一次拟合第五组13.12偏大12.92第一次拟合第十二组13.06偏大12.88第一次拟合第十八组12.65偏小12.75第二次拟合第十三组12.33偏小12.452)大焦挥发份Vdaf(%)拟合大焦灰分Vdaf(%)与焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)之间的数据集合,得到的残差与置信区间杠杆图如图表2.7所示,从图中可以很容易观察出离群点数据组别,然后根据前文制定的改写原则对这些离群点进行改写,然后对改写过离群点数据的数据集进行拟合,若仍有离群点则继续改写,直至最后拟合数据集后不存在离群点数据为止,此时所得到的残差与置信区间杠杆图如图表2.8所示。图表图表2.7残差与置信区间杠杆图(大焦挥发份Vdaf(%))图表图表2.8离群点改写后残差与置信区间杠杆图(大焦挥发份Vdaf(%))由图表2.7显然可见,离群点数据为第二、二十八组数据,改写的对象是大焦挥发份Vdaf(%)数据组中的数据,改写情况见表格2.2。更改后继续拟合数据集,出现离群点数据为第十四组数据,更改情况同样见表格2.2。对离群点进行改写后拟合数据集,不存在离群点数据,所得到的残差与置信区间杠杆图如图表2.8所示。表格2.2离群点更改情况(大焦挥发份Vdaf(%))离群点批次离群点数据组别更改前数据值偏离情况更改后数据值第一次拟合第二组1.18偏小1.24第一次拟合第二十八组1.37偏大1.35第二次拟合第十四组1.35偏小1.333)洗精煤(配合煤)的水分Mad(%)图表2.9残差与置信区间杠杆图(洗精煤(配合煤)的水分Mad拟合洗精煤(配合煤)的水分Mad(%)与焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)之间的数据集合,得到的残差与置信区间杠杆图如图表2.9所示,从图中可以很容易观察出离群点数据组别,然后根据前文制定的改写原则对这些离群点进行改写,然后对改写过离群点数据的数据集进行拟合,若仍有离群点则继续改写,直至最后拟合数据集后不存在离群点数据为止,此时所得到的残差与置信区间杠杆图如图表2.9残差与置信区间杠杆图(洗精煤(配合煤)的水分Mad图表2.10离群点改写后残差与置信区间杠杆图(洗精煤(配合煤)的水分Mad)由图表2.9显然可见,离群点数据为第六组数据,改写的对象是洗精煤(配合煤)的水分Mad(%)数据组中的数据,改写情况见表格2.3。更改后继续拟合数据集,出现离群点数据为第二十五、二十八组数据,更改情况同样见表格2.3。更改后继续拟合数据集,出现离群点数据为第二十组数据,更改情况同样见表格2.3。最后对离群点进行改写后拟合数据集,不存在离群点数据,所得到的残差与置信区间杠杆图如图表2图表2.10离群点改写后残差与置信区间杠杆图(洗精煤(配合煤)的水分Mad)表格2.3离群点更改情况(洗精煤(配合煤)的水分Mad(%))离群点批次离群点数据组别更改前数据值偏离情况更改后数据值第一次拟合第六组1.69偏大1.05第二次拟合第二十五组1.28偏大1.04第二次拟合第二十八组0.63偏小0.88第三次拟合第二十组1.14偏大1.034)洗精煤(配合煤)灰分Ad(%)拟合洗精煤(配合煤)的灰分Ad(%)与焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)之间的数据集合,得到的残差与置信区间杠杆图如图表2.11所示,从图中可以很容易观察出离群点数据组别,然后根据前文制定的改写原则对这些离群点进行改写,然后对改写过离群点数据的数据集进行拟合,若仍有离群点则继续改写,直至最后拟合数据集后不存在离群点数据为止,此时所得到的残差与置信区间杠杆图如图表2.12所示。图表2.11图表2.11残差与置信区间杠杆图(洗精煤(配合煤)的灰分Ad)图表图表2.12离群点改写后残差与置信区间杠杆图(洗精煤(配合煤)的灰分Ad)由图表2.11显然可见,离群点数据为第十九、三十组数据,改写的对象是由图表2.11显然可见,离群点数据为第十九、三十组数据,改写的对象是洗精煤(配合煤)的灰分Ad(%)数据组中的数据,改写情况见表2.4。更改后继续拟合数据集,出现离群点数据为第四组数据,更改情况同样见表2.4。最后对离群点进行改写后拟合数据集,不存在离群点数据,所得到的残差与置信区间杠杆图如图表2.12所示。表格2.4离群点更改情况(洗精煤(配合煤)的灰分Ad(%))离群点批次离群点数据组别更改前数据值偏离情况更改后数据值第一次拟合第十九组10.30偏大10.18第二次拟合第三十组9.31偏小9.55第二次拟合第四组10.18偏大10.135)洗精煤(配合煤)挥发份Vdaf(%)拟合洗精煤(配合煤)的挥发份Vdaf(%)与焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)之间的数据集合,得到的残差与置信区间杠杆图如图表2.13所示,从图中可以很容易观察出离群点数据组别,然后根据前文制定的改写原则对这些离群点进行改写,然后对改写过离群点数据的数据集进行拟合,若仍有离群点则继续改写,直至最后拟合数据集后不存在离群点数据为止,此时所得到的残差与置信区间杠杆图如图表2.14所示。图表2.13残差与置信区间杠杆图(洗精煤(配合煤)挥发份图表2.13残差与置信区间杠杆图(洗精煤(配合煤)挥发份Vdaf)图表图表2.14离群点改写后残差与置信区间杠杆图(洗精煤(配合煤)挥发份Vdaf)由图表2.13显然可见,离群点数据为第十组数据,改写的对象是洗精煤(配合煤)的挥发份Vdaf(%)数据组中的数据,改写情况见表格2.5。更改后继续拟合数据集,出现离群点数据为第四、二十二组数据,更改情况同样见表格2.5。最后对离群点进行改写后拟合数据集,不存在离群点数据,所得到的残差与置信区间杠杆图如图表2.14所示。表格2.5离群点更改情况(洗精煤(配合煤)的挥发份Vdaf)离群点批次离群点数据组别更改前数据值偏离情况更改后数据值第一次拟合第十组26.14偏小26.98第二次拟合第四组26.81偏小27.01第二次拟合第二十二组26.98偏小27.12本节开始时就介绍了离群点可能产生的多种原因,考虑到本例中样本数据组产生在同一个生产过程,且时间、环境等都相同,符合本例的离群点产生的原因应为后两种,即数据的固有变化和数据测量、采集误差。若想降低离群点数据出现的概率,则要多注意减少数据测量和采集方面的误差,因为数据的固有变化是不受人为控制。换一个角度来看,如果排除人为造成的数据测量和采集误差这一原因,数据的固有变化产生的离群点可能反映着一种未被发现的潜在的高效生产模式,这个问题还需要进一步研究。本章小结本文主要研究工作就是针对焦化工序建立能耗预测模型以及能耗优化模型,而建模的重要准备工作就是对数据的处理,样本数据是否被妥当处理,对后续建模的合理性与准确性有很大影响。本章主要对样本数据的预处理进行阐述,由于数据值较大且有保密性要求,本章首先对样本数据进行一种无量纲处理手段,使物理系统数值的绝对值变成某种相对值关系,数据值变小使计算量变小,又隐藏了单位化处理的相对量达到保密效果;然后对初步处理过的数据进行离群点检测,对于检测出来的离群点数据,出于样本数据量的关系,本文未采用剔除离群点非方法,而是采取改写的方法使之非离群点化。经过本章的工作,样本数据可以用于建立能耗预测和能耗优化模型。第3章于模糊逻辑的焦化工序能耗预测模型于模糊逻辑的焦化工序能耗预测模型模糊逻辑概述控制论的创始人维纳教授在谈到人胜过最完美的机器时说:“人具有运用模糊概念的能力”【22】。这清楚地指明了人脑与电脑有着本质的区别,人脑具有善于判断和处理模糊现象的能力。“模糊”是与“精确”相对的概念。模糊性普遍存在于人类思维与语言交流中。模糊理论概念模糊理论是指用到了模糊集合的基本概念或连续隶属度函数的理论[]。它可分类为模糊数学,模糊系统,模糊决策,不确定性和信息,模糊逻辑这五个分支,它并不是完全独立的,它们之间有紧密的联系。例如,模糊控制就会用到模糊数学和模糊逻辑中的概念。从实际应用的观点来看,模糊理论的应用大部分集中在模糊系统上,尤其集中在模糊控制上。也有一些模糊专家系统应用于医疗诊断和决策支持。图表3.1中,详细描述了模糊理论的分类与各类的应用,以及相互之间的关系。图表3.1模糊理论分支与应用模糊逻辑概念以及应用领域模糊逻辑是以模糊理论为基础,允许用语言和文字表示操作和控制规律,是一种能解决不精确,不充分信息问题的方法。模糊逻辑和模糊数学虽然只有短短的及十余年历史,但其理论与应用的研究已取得了丰硕的成果,尤其是随着模糊逻辑在自控领域的成功应用,模糊控制理论和方法的研究引起了学术界和工业界的广泛关注。自从1974年英国的马丹尼(Mamdani)首次将模糊逻辑用于蒸汽机的控制后,模糊控制的工业过程控制、机器人、交通运输等方面得到了广泛而卓有成效的应用。与传统控制方法如PID控制相比,模糊控制利用人类专家控制经验,对于非线性、复杂对象的控制显示了鲁棒性好、控制性能高德有点。模糊逻辑除了在自动控制领域的广泛有效的应用外,还应用于聚类分析、故障诊断、专家系统和图像识别等领域。同样,模糊逻辑在预测方面也有一定的应用,多应用于复杂度较高,相关性比较不确定的问题,如在事故的预测【23】【24】、负荷预测【25】【26】、流量预测【27】、等。基于实际生产数据的模糊逻辑预测模型前文提到模糊逻辑在预测方面也有一定的应用,本章主要工作就是为焦炉炼焦过程建立相应的能耗预测模型。本文所建立预测模型的出发点是洗精煤(配合煤)和大焦的各项质量指标与各项消耗能源量之间的关系,这是复杂度比较高的耦合关系,遂选用模糊逻辑方法为焦炉炼焦过程建立能耗预测模型。模糊逻辑预测模型的建立一般有以下四个步骤:输入输出分配以及数据模糊化;制定模糊推理机制;确定模糊推理规则;建立模糊逻辑预测模型。输入输出分配以及数据模糊化经过第二章的工作,原始的样本数据已经被稳妥处理,数据本身已经相对稳定,为预测模型的建立做好了充分的准备。对于样本数据,输入为5个,即为大焦的灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%),输出为4个,即为焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)。输入输出分配以及字段定义如表格6所示。建立模糊逻辑预测模型首先要对各个能源的实际消耗情况,以及各个质量指标数值进行模糊化,等级分配如表格3.1所示。表格3.1模糊化与输入输出分配输入输出分配各项指标与能源字段定义等级分配输入大焦灰分AdDaJ_Ad小,中,大输入大焦挥发份VdafDaJ_Vdaf小,中,大输入洗精煤(配合煤)水分MadPeiHM_Mad小,中,大输入洗精煤(配合煤)灰分AdPeiHM_Ad小,中,大输入洗精煤(配合煤)挥发份VdafPeiHM_Vdaf小,中,大输出焦炉煤气(产出量)COG_P少,中等,多输出高炉煤气BFG少,中等,多输出电(有功总量)Elec少,中等,多输出蒸汽(饱和蒸汽)ZhengQ少,中等,多对各个能源以及各个质量指标进行模糊化描述,主要是按表格3.1中所分配好的等级,分析出各个对象其所属等级,然后进行归类,建立描述模型。本文是应用高斯函数对各组数据建立相应的描述模型,在MATLAB中编程实现,得到如图表3.2所示的描述模型,图中分别给出了大焦的灰分Ad(%)、挥发份Vdaf(%),洗精煤(配合煤)的水分Mad(%)、灰分Ad(%)、挥发份Vdaf(%),输出有4个,即为焦炉煤气(产出量,km3),高炉煤气(km3),电(有功总量,KWh),蒸汽(饱和蒸汽,t)模糊化后的隶属函数图。图表3.2各种能源与指标去模糊化建立模糊推理机制图表3.2各种能源与指标去模糊化为了从数据集中找寻到合理的模糊逻辑推理规则,需要一个给出一定规范、约定或者限制的推理过程,这个推理过程是因本研究工作的需要才制定的,在文献中没有遇到过类似定义,所以本文定义其为模糊推理机制。模糊逻辑预测模型的建立需要从数据集中找到合理的模糊推理规则,而对于模糊推理规则的制定不是凭空捏造的,这时则需要一个合理的模糊推理机制,给予指导与约束。模糊推理机制虽然仅仅是一个推理过程,但是模糊推理规则的却是在其基础上建立的,考虑到模糊推理规则的准确性与合理性,模糊推理机制的建立,既要考虑稳定性,也要考虑实现性。模糊推理机制是对输入输出情况的一个规范,起到一个确定性作用。对于输入情况一致,同时输出情况也一致,则只有此一种规则情况;对于输入情况一致,输出不一致时,大致可分为以下三种情况,分别给出解决方法。假定对每一等级出现的次数进行统计,分别为t1、t2、t3,则:1)若三个等级都存在,且每一等级的统计值都相同,即为t1=t2=t3,则取中间等级;2)若有两个等级的统计值相同,且大于余下等级的统计值,则取相同统计值中的较高等级(尽量满足最大生产需求),若t1=t2>t3,则取t2对应等级;3)若有两个等级的统计值相同,且小于余下等级的统计值,则取余下的那一等级,若t1=t2<t3,则取t3对应等级,4)若各个等级的统计值都不相同,则取统计值最大的所对应的等级,若t1<t2<t3,则取t3对于等级。举例说明该机制如何确定模糊推理规则例如:111111111111112123111112332111111322111113121111113321所以,根据所定推理机制所得模糊规则为111112321。模糊规则的确定模糊推理规则的确定是建立模糊推理预测模型的重中之重,只有在合理的模糊推理规则下建立的模糊推理预测模型才能更有效的描述输入与输出的关系,才能有效的预测各个能源的消耗情况。若要确定模糊推理规则,首先要注意的是样本的选择,本文研究工作中所要建立的预测模型,其输入为5,输出为4,若在全部情况不重复出现的情况下,按照输入需要最少样本为243组,按照输出需要样本为81组,但是现有的样本只有30组,远远达不到要求,这个问题应当怎样解决?本文对于解决样本数据量少这一问题,拟定了两个方案。第一个方案:根据已有数据集,随机抽取样本。本例是按正态分布式抽取,以各个对象数据组中数据平均值为μ,以标准差为σ,共抽取15000组样本。第二个方案:取样本数据集的20组数据为样本数据。第二种方案中选取20组数据后余下的10组数据用于验证两个方案的准确性。应用前文中制定的模糊推理规则,对两种方案所选取的样本进行推理,从而得出相应的模糊推理规则。经编程实现两种方案下所得的模糊推理规则如下:第一种方案:随机生成15000组样本。一共生成207条模糊推理规则o=207Q=1111131111111112311211111133212111112131131111122332111111233111111113113231111132233111111331323111121111211111212123211112133123111122133211111222311111112233321111123133211111232333111112333322111132122221111322311211113233223111133221131111333222311121113112111211233231112113232211121213122111212213111112123332111121313212111213233111112133311111122112121111221223311112213212311122213323111222213111112223331111122313333111223233131112233332111123113133111231222221112321123211123223322111232331121112332221111123333311111311133211113112333311131132323111312131111113122311111131233321111313131211113132321311131333313111321123111113212311211132131111111322111231113222311111132231111111323111221113232313111132333121111331233131113321331111133223123111332332331121111112311211123113112111333111121121231311211223111112112331111121131312211211321121112113313211121211311111212123111112121332221121221112311212223111112122311211
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论