控制工程专业硕士论文34985.doc_第1页
控制工程专业硕士论文34985.doc_第2页
控制工程专业硕士论文34985.doc_第3页
控制工程专业硕士论文34985.doc_第4页
控制工程专业硕士论文34985.doc_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 密 级 u d c 学 位 论 文电熔镁炉熔炼过程的建模作 者 姓 名 :指 导 教 师 : 东北大学自动化研究所申请学位级别:硕士学 科 类 别 :专业学位学科专业名称:控制工程论文提交日期:论文答辩日期:学位授予日期:答辩委员会主席:评 阅 人 :期:- v -摘 要电熔镁炉熔炼过程的建模摘 要节能减排是现代工业的发展趋势,提高能量的利用率符合人类发展的长远利益。然而,限于当前的技术条件,一些必不可少的工业过程却是高污染高能耗的,这样迫使人们不得不对这些工业过程进行研究和改造。电熔镁砂是一种耐高温,结构致密的高级耐火材料,被广泛地应用于冶金航天工业等诸多领域,是国民经济的重要材料。本课题研究的背景是电熔镁砂的生产过程。三相交流电熔镁炉是生产电熔镁砂的重要工具。它属于矿热电弧炉的一种,通过炉料电阻和电弧产生的热能来对菱镁矿粉或轻烧镁粉进行加热,这是一个高耗能的生产过程。此外,该过程又有着时变,多变量,强耦合等特点。针对这些问题,本文进行了如下几个方面的研究:(1)研究了正常工况下炉内的物理化学变化过程,对电熔镁炉物料批次间热量传递的原理进行了深入的分析; (2)根据热学原理和实际现场情况,建立了电熔镁炉熔炼过程的能量模型。通过热量传递计算得出了节能的电流设定方案,并计算了相应的能耗;(3)采用偏最小二乘方法和迭代学习控制算法,加入了约束条件,利用粒子群优化算法对目标设定值进行跟踪,仿真结果说明了算法的有效性。关键词:节能;电熔镁炉;偏最小二乘法;迭代学习控制abstractmodeling of electrical smelting furnace for magnesia smelting processabstractenergy conservation is one of the trends of modern industrial development. improving energy efficiency accords with the long-term interests of human development. however, limited to the current technical conditions, a number of industrial processes are essential to high pollution and high energy consumption, forcing people to study and improve the industrial processes.electrical-smelted magnesia is a sort of sophisticated fireproof material which has the properties of high temperature resistibility and dense structure. it is an important material. the objective of this research is the production of electrical-smelted magnesia. it is widely used in metallurgy and aerospace industry and other fields. the three-phase ac electrical smelting furnace for magnesia (esfm) is an important equipment for producing the electrical-smelted magnesia. it belongs to a kind of mine hot electric arc furnace. the magnesite powder and light-burning magnesium powder are heated by the furnace charge resistance and the electrodes arc, this is a high energy consumption process. in addition, the process has features such as time-varying, multivariable, strong coupling.facing the problems, researches include the following related parts in this thesis:(1) the physical and chemical changes of furnace in normal operating conditions are researched. and the principle of heat transfer between material batches in esfm is analyzed deeply in this thesis;(2) according to thermal principle and the actual site conditions, a current set approach is proposed through heat transfer calculating, which can conserve the energy. and the value of the consuming energy can be gottern;(3) combining pls and iterative learning control (ilc), adding constraints, and then using particle swarm optimization (pso) to tracke the set-point value. and the simulation results show that the algorithm is effective.key words:energy conservation; electrical smelting furnace for magnesia (esfm); partial least squares; iterative learning control目 录目 录独创性声明i摘 要iiabstractiii第1章 绪论11.1课题研究的背景及意义11.2偏最小二乘法简介21.2.1偏最小二乘法的背景和特点21.2.2偏最小二乘法的发展、研究现状以及与控制的结合31.3电熔镁炉的相关情况及控制简介51.3.1电熔镁炉的相关情况51.3.2电熔镁炉的熔炼过程控制61.4本文的主要工作及安排6第2章 偏最小二乘法的基本理论92.1数据表的基本知识和数据预处理92.1.1数据表的基本知识92.1.2数据的预处理102.2偏最小二乘法理论122.2.1多元线性回归分析方法122.2.2典型相关分析142.2.3主成分分析法152.2.4偏最小二乘法172.3本章小结20第3章电熔镁炉熔炼原理及节能模型213.1电熔镁炉的熔炼原理和控制系统213.1.1原料的性质及化学物理变化213.1.2电熔镁炉结构和工作原理233.1.3电熔镁炉的控制系统及存在的问题263.2电熔镁炉节能模型的建立283.2.1相关的物理化学知识283.2.2节能模型的推导293.3电流设定值及结论403.4本章小结42第4章 pls回归建模及仿真实验434.1pls回归模型的建立434.2 ilc算法简介454.3pls-ilc算法484.4仿真实验504.4.1pls回归建模的仿真实验504.4.2pls-ilc算法的仿真实验534.5本章小结54第5章 结论与展望555.1结论555.2展望55参考文献57致 谢61攻读硕士学位期间发表的论文63第1章 绪论第1章 绪论1.1课题研究的背景及意义在过去的长期发展中,人们一直将研究和生产注意力重点放在了产品质量上面,很少的关注人类的活动给自然环境带来的负面效果。近些年来,许多极端天气和恶劣自然现象的出现,迫使人们开始思考社会发展和生态环境间的关系。在我国,由于国情的原因,过去采取的是先发展后治理的模式。随着国力的增强,人民生活水平的日益提高,我国政府也开始关注生态环境的问题,在研究和治理生态环境问题上面的投入也越来越多,尤其是“十一五”期间我国制定了单位国内生产总值能耗降低20左右、主要污染物排放总量减少10的计划,逐渐走上了科学发展的道路。环境问题的根本是耗能和排放,节能减排是解决这类问题的本质手段。能源的合理利用,洁净新能源的开发,工业排放物的处理,环境质量的监控等研究方向应运而生。控制领域中,在保证产品质量的前提下,将节能减排也作为约束条件的最优化控制问题已经成为学者的一个研究热点。工业是能源消耗和污染排放的大户,如机械,化工,冶金等部门更是需要改造的对象。但是由于现代工业的复杂性高,规模大,变量多,强耦合等特点,这是工艺和精度要求越来越高的结果,是能够保证好的产品质量和性能的前提,但是同时也给分析和设计工业系统,建立最优的带有环保条件约束的模型带来了很大的困难。随着计算机、通信和控制等技术的发展,使得解决在获得优良的产品质量的同时达到节能减排的多目标优化问题成为了可能。本课题的研究背景是耐火材料电熔镁砂的生产过程。当前,三相交流电熔镁炉是电熔镁砂生产行业中应用最广泛的工具,它通过电极产生的电弧和热能来对菱镁矿粉或轻烧镁粉进行加热。这是一个高耗能的生产过程,同时由于炉体的开放性和其中分解反应产生大量的二氧化碳气体,这又是个温室气体和粉尘高污染的一个生产过程。现场操作人员在这种高温高危高污染的环境下工作,对他们的健康和生命都是一个巨大的威胁。另外,由于是夜间工作,在人的疲劳和精神状况等因素的作用下,对产品的质量波动影响很大,这也不达产品质量的标准。因此,对电熔镁炉的生产过程的研究是有很大的意义和使用价值的。本课题的目的是通过对加料批次间和生产过程的研究,采用pls方法进行建模,进而提出合理的控制策略来控制产品质量,并计算最优的电流目标值以期达到节能标准。1.2偏最小二乘法简介1.2.1偏最小二乘法的背景和特点pls方法的应用最早出现在化学研究领域,由s.wold和c.albano1于1983年提出,用以解决光谱分析中多重相关性的问题。由于该方法的有效性和简洁性,很快就被学者推广到其他领域。在控制界,对输入输出的大量数据的处理也正是pls的展示空间。基于pls方法的建模已经成功地应用到了很多生产的过程监控当中。又由于其易于与其他优化算法相结合2,进而pls方法也在最优控制方面得到应用,还可以用于对产品质量数据的在线预报3。pls方法是一种处理两组变量之间关系的多对多线性回归建模的方法,特别当两组变量的个数很多并存在多重相关性,同时观测数据的数量(样本量)又较少时,用pls建立的模型具有传统的经典回归分析等方法所没有的优点,被称为第二代回归方法。它将输入组(自变量)x和输出数据组(因变量)y之间的协方差最大化,保留重要的特征信息,摒除冗余信息,进而达到使系统降维的目的。pls方法在建模过程中集中了线性回归分析方法,典型相关分析和主成分分析法的特点,于是在分析结果中,除可以提供一个更为合理的回归模型外,还可以完成一些类似于主成分分析和典型相关分析的研究内容,反映出更丰富和深入的对象信息。也就是:偏最小二乘回归多元线性回归分析典型相关分析主成分分析4由此看来,pls方法更像是一种集成的算法。目前,pls在化学、经济学、生物医学、社会学等领域都有很好的应用。与pca相比,其共同优点在于在处理高维数据上面的强大能力,它们都能够通过特征提取实现降维。不同点在于,pca使得输入变量组x中的方差最大化,对于输出变量组y没有使用,而pls使得输入组x和输出变量组y间的协方差最大化,通过变化输出使其包含相关信息,来计算pls向量,这方面它能够提供比pca更好的效果。另外,由于包含了对输出变量的信息,可以实现它对输入和输出间的回归建模,适合对输入输出的被控系统进行分析。总结起来,pls方法的特点是:(1)能够在输入变量x存在严重多重相关性的条件下进行回归建模;(2)允许在样本点个数少于变量个数的条件下进行回归建模;(3)pls在最终模型中将包含原有的所有输入变量;(4)pls模型更易于辨识系统信息与噪声(甚至一些非随机性的噪声);(5)在pls模型中,每一个自变量的回归系数将更容易做出解释;(6)算法清晰明确,易于编写计算机程序。1.2.2偏最小二乘法的发展、研究现状以及与控制的结合(1)偏最小二乘法的发展pls方法的思想早在上个世纪30年代就已经产生,但是在上世纪三十年代至六十年代中期这段时间,pls方法尚未形成系统、完整的理论与算法。在1966年h. wold 发表了一种pls的雏形版本,但当时pls在统计理论上还有很多问题没有完全解决,在应用领域也没有取得大的进展,因此没有引起统计学界和应用领域研究人员的足够重视。直到1983年s.wold和c.albano正式提出该方法并成功运用后,首先被化学计量学和社会经济学的研究者所关注并加以完善和推广。1996年10月,在法国高等商业教育组织的组织和资助下,于巴黎召开了一次有关pls方法理论与实践的学术研讨会议。吸引了来自世界各的专家,在会上专家学者们介绍了pls方法的最新进展以及在化工、金融、市场等领域的应用,该会议极大地激起了统计学家及其他应用领域专家对pls的研究热情,促进了pls的理论和算法的进一步地深入发展,并使得该方法步入全新的高速发展时期4。如今,有关pls方法国际研讨会每两年举办一次,2005年9月在西班牙巴赛罗纳举办了pls的第五次会议。在国外,研究者将有关pls方法的理论、算法、性质及典型应用等方面取得的前沿成果一般发表在journal of chemometries和chemometrics and zntelligent laboratory systems等专业期刊上。在中国,虽然学者们在有关pls的方法上面的研究起步比较晚,但是发展较快,成绩也是非常突出的。许青松和梁逸剖等人提出了广义plsr算法5;李寿安、张恒喜、郭基联和孟科给出了一种基于主成分选择的pls方法6;2005年吴喜之提出了一种改进的pls方法7。随着科研的进步和工业生产的发展,各个领域还会对pls方法还会提出更多的挑战,学者们也会对其做出更加适合实际生产需要的改进,并促进这种方法的进一步发展。(2)偏最小二乘法的研究现状pls算法经过几十年的发展和改进,自身的算法的改良有了更好的适用范围和性能,到目前为止,该理论已经较为成熟,在生产生活中已经得到了实践的检验。对于其当下的研究成果和现状,主要集中在pls理论的进一步探讨、 pls模型中自变量筛选、复杂的偏最小二乘回归的线性方法以及 pls的非线性方法等问题上面,具体如下:pls方法包括校正与预测两个阶段。针对校正阶段的参数计算,p. geladi 和 b. m. wise 等人进行了研究,提出了一种被称为非线性迭代偏最小二乘法 (nonlinear iterative partial least squares, 简写为 nipals)8,9,该算法的另一个好处就是它是一种适合计算机编程的算法;在预测方面,结合现有的控制方法,采用推理模型,pls也可以用来对产品质量进行预测10;针对在线和离线两类数据在建模上的问题,有人提出了动态pls算法,将离线数据也列入到输入输出矩阵之中,并对扩展的矩阵进行回归11,12;在处理非线性的数据方面,有学者提出了非线性偏最小二乘法(nonlinear partial least square,npls)13,该算法可以用于非线性系统的建模,尤其是对于具有极大值、极小值或较大曲率的问题,其建模效果要好于采取普通pls方法建立的模型,另外,还有学者对其改进,提出了通过采用二次函数来表示其得分模型的二次偏最小二乘法(quadratic partial least squares,qpls);由于pls的空间映射性质使得核方法能够很容易和它结合,并用于解决非线性问题,于是有人将核方法引入到pls领域,形成了核偏最小二乘法(kernel partial least squares,kpls),该方法是将初始输入变量组映射到高维特征空间,然后在高维的特征空间中计算其主成分,之后利用普通的pls方法进行处理,实验和仿真也证明了该方法在处理非线性问题上是行之有效的14; 在输入数据更新方面,qin s. j.提出了一种称为递归偏最小二乘法(rpls)的算法15,在不增大输入输出变量组维度的前提下,根据新数据更新系统模型,该方法可以有效地解决时变系统或存在大量数据时建立系统模型的问题,该方法得到了很好地应用,尤其是在线生产过程中数据实时性更新中更为明显;对于输入输出变量的特点,有人将数据按有一定规律的块划分,形成了被称为多块偏最小二乘法(mbpls)的算法16;在针对间歇过程的研究中,多向偏最小二乘法17被提出来,在该算法中通常会将输入变量组x分解成一个三维()的矩阵,经过分解得到多个方向,这相当于pls技术到多向技术中的推广,因此多向技术在监控间歇过程时特别有帮助。在pls理论应用方法,anjali krishnan18等将pls方法用于神经影像学;gang l.19等用t-pls和贡献图的方法用于故障诊断;wu w.j.20等采用了pls路径建模的方法对北京地价进行了研究;hojjat a21将pls方法应用到了夫妻心理健康的研究并与ols进行了对比;adam smoliski22等利用pls-ep方法对在贝斯基德山地区土壤铝含量进行了预测;maria font i furnols23等人利用pls回归方法对猪肉的瘦肉含量进行了分析;d. laur24等提出了一种pls-ph的方法证明了模型预测控制;a.j. willis25用了kpls对振动离心机进行了状态监测。此外,还有大多数研究者借用一些现成统计软件进行pls的研究26。(3)偏最小二乘法与控制算法的结合在控制领域,pls也有很好的应用。通常采取用pls方法建立系统模型,然后嵌入控制算法对输出变量进行控制。但是,由于其与控制方法结合的研究起步较晚,针对控制策略的设计研究仍处在发展阶段。目前为止,基于pls方法的控制框架主要有三种:(l)全内嵌控制结构,即完全在隐变量空间内进行控制器设计,在此框架下可以灵活应用各种成熟的控制策略;(2)半内嵌控制结构,用pls方法进行解耦,但控制器的设计不在隐变量空间内部;(3)非嵌入控制结构,即在其他的控制框架下使用pls方法,利用pls进行建模、预测或者降维和消除相关性。其他的基于数据驱动的控制方法多数讨论的是单变量系统,尤其是针对非线性过程,控制器的设计就显得十分复杂。pls方法可以通过负载变量相互独立和自动匹配的特点,将多输入多输出强耦合系统的复杂控制问题转化为负载变量空间中的单输入单输出回路的控制问题,从而大大的简化对控制器的设计。从数据来源的角度也可以分为三类:基于在线数据的pls控制方法、基于离线数据的pls控制方法和在线数据与离线数据相结合的pls控制方法。由于pls是针对数据的方法,因此这种分类主要是依据控制器的设计而划分的。本文所用的方法是将pls方法与迭代学习控制 (iterative learning control,ilc) 方法相结合的方法,该方法可以归结到第三类。迭代学习控制方法首先是由arimoto等人于1984年正式提出27,它是指不断重复一个同样轨迹的控制尝试,并以此修正控制律,以得到非常好的控制效果的控制方法。它通过反复应用先前试验得到的信息来获得能够产生期望输出轨迹的控制输入,以改善控制质量。与传统的控制方法不同的是,迭代学习控制能以非常简单的方式处理不确定度相当高的动态系统,且仅需较少的先验知识和计算量,同时适应性强,易于实现;更主要的是,它不依赖于动态系统的精确数学模型,是一种以迭代产生偏差输入信号,使系统输出尽可能逼近理想值的算法。它的研究对那些有着非线性、复杂性、难以建模以及高精度轨迹控制问题有着非常重要的意义。将pls与ilc两种方法相结合,对于解决带有批次的生产过程的目标跟踪和质量预测等问题是十分有效的。但是,该方法体系尚未成熟,仍处在萌芽期,因此还有许多需要进一步研究和发展的地方。1.3电熔镁炉的相关情况及控制简介1.3.1电熔镁炉的相关情况电熔镁是优质菱镁矿石在电熔镁炉中经高温熔融后形成的高纯氧化物,又称电熔氧化镁,是用于钢铁工业生产特殊耐火材料的主要原料。高纯度的氧化镁则更是高新科技所不可或缺的原料,在光学、航空航天等领域的作用无可取代。因此,氧化镁是从基础工业到高新技术各个领域的重要资源,氧化镁的产量和质量关系到国家的经济和国防。电熔镁炉是电熔镁砂的关键性设备, 从生产原理上讲,电熔镁炉属于矿热炉,也是电弧炉的一种。从电气原理上讲,它是一种利用电流热效应和高温电弧产生能量来对矿砂进行熔化的电炉。从电流的角度来划分,可以分为直流电熔镁炉和交流电熔镁炉。直流方式受到功率和变电设备的限制采用的很少,目前,电熔镁生产国内外普遍采用三相交流电熔法的生产工艺,它依靠电极的埋弧电热和物料的电阻电热来熔炼物料28。在国内电熔镁炉的控制大多数是人工手动操作,响应速度慢,控制精度低,三相电流波动大、不平衡,大电流时容易跳闸,造成不必要的电能消耗和停机,产品产量、电耗及产品品质直接受操作人员的影响。 在熔炼过程中,电流变化速度快,操作人员精神高度紧张,劳动强度大,并且熔炼的过程较长(约10小时左右),操作人员极易疲倦。操作人员疲倦以后,精力不集中,就容易出现过流跳闸或长时间小电流运行以及喷炉等情况,造成熔炼不充分、耗电大、产量低、品质差的问题。因此,对现有设备进行自动化改造是电熔镁企业急切需要解决的议题。另外,现在运营的电熔镁生产中普遍存在着能耗高、污染重、产量低、品级差的缺点,这种落后的生产方式既破坏了生态环境又令企业缺乏竞争力,不符合时代的发展需要,对其进行技术改造势在必行。1.3.2电熔镁炉的熔炼过程控制电熔镁炉的生产过程具有多变量、时变、强耦合、非线性、大时滞等综合复杂性,这些性质给分析和设计控制器带来很大的挑战。数据驱动方法的应用给建模和控制器设计带来了一个新的思路。又由于电熔镁炉自身的特点,间隔一定时段对其进行填料,该过程又可以看成是批到批的熔炼过程。这样就可以将前面所介绍的pls方法与ilc方法相结合,来进行模型的建立和产品质量控制。在电熔镁炉生成过程中生成了大量的二氧化碳,但是这部分气体不是需要的产品而且会导致喷料等故障的发生,因此必须将气体排放出去,排放的同时也带走了很大一部分热量,然而目前还没有什么办法将这部分热量进行系统的回收。另外,随着生产过程的进行,系统对环境的散热也浪费了一部分电能,而且回收起来困难很大。在不对现有厂房和设备进行大规模改造的情况下,节能的策略只能在其他方面进行。前面提到电熔镁炉的生产过程是可以近似成批次的过程,同时一个批次生产完毕并不从炉中提取出来,这样考虑到热能的传递的发生,前几批次的产品对当前的物料有预热作用,这部分能量可以代替电能。基于这种考虑,然后对电能的利用制定一个节能标准是可行的。1.4本文的主要工作及安排本文的主要工作是:(1)对电熔镁炉的运作机理进行了深入的分析,研究了正常工况下炉内的物理化学变化,并对两种原料的电流参数进行计算,得到最初次填料时的电流设定值。发现了批次间的节能关系,根据传热学,计算了所节约的能量,从而计算出了后续批次的电流设定值。进而给出了一种节能的电流设定值方案。(2)由于系统的复杂性和不确定性,采用pls方法的输入输出变量进行回归建模,并讨论了模型的精度和适用性;(3)将pls方法与ilc算法结合,以归类的数据作为输入变量,以计算出的节能的目标设定值为最优标准进行跟踪控制,并将所建立的模型用于其中进行仿真研究,并对仿真结果做出了合理的解释。本文的章节安排:第一章说明课题背景和研究的意义,通过查阅相关文献,对仿真建模所用的pls方法和现状以及电熔镁炉的相关内容做了简单而系统的介绍;第二章对pls所用到的数学方法包括多元回归方法,典型相关分析,和主成分分析法作了介绍和研究,进而自然地得出pls的原理和相关公式;第三章介绍了电熔镁炉的具体工作机理,根据相关物理化学知识,建立电熔镁炉熔炼过程的能量模型,详细讨论和计算了内部热能的传递过程,进而得出了一种节能的电流设定值方案;第四章建立pls模型,并对模型进行检验。在电流目标跟踪方面,结合了ilc算法,并加入了约束条件,在最后对仿真结果进行了讨论。- 69 -东北大学硕士学位论文第2章偏最小二乘法的基本理论第2章 偏最小二乘法的基本理论pls方法来源于对实际问题,而它的发展却离不开数学。各种各样的数据是pls处理的对象,因此pls是多元统计方法的一种,是对一元最小二乘法的推广。其思想虽然较为简单,易于理解,但是其中难免会有较为复杂的数学推导和运算。为了便于系统地理解和应用该算法,本章将从数据表的基本知识入手,然后介绍与pls相关的回归算法,最后详细地推导了pls的理论。2.1数据表的基本知识和数据预处理2.1.1数据表的基本知识对于多维输入变量x,如果有m个观察变量,并对每个变量进行n次测量或采样,并将这些数据按规则放入表中,就形成了数据表。这个数据表可以用如下的矩阵x来表示: (2.1)x就是一张数据表,再将x写成如下形式: (2.2)其中,被称为第个样本点,于是输入变量组x中包含了n个样本点。,通常被称为第个变量。同样,对于输出变量y也是如此定义。数据表中,的所有样本点所在的空间被称为样本空间f。则f是一个欧氏空间,在其中定义如下内积: (2.3)和如下的p-范数: (2.4)对于变量,将其n个采样进行如下运算: (2.5)得到的被称为该变量的样本均值。样本均值用来描述该样本所处的平均水平,但是并不能描述各个样本点距离该平均水平的波动情况和离散情况,样本方差是用来描述该现象的统计量,样本方差的公式被定义为: (2.6)由上述公式可以看出,样本方差越大,说明该样本的数据波动越大,样本方差越小的样本,数据的波动小。在统计中,为了保证变量在量纲上面的一致性,对式(2.6)进行开方运算,得到的统计量被称为标准差,它和方差一样都是对数据波动程度的表征。变量的均值和样本方差,都是对该变量内部数据特征的描述和统计,对于变量间的数据关系则没有涉及。为了更好的对数据表中各个变量的内在关联进行描述,引入了协方差和相关系数的概念。首先介绍变量间的协方差。变量和变量的协方差定义如下: (2.7)若将其记成矩阵的形式, (2.8)称为协方差矩阵。将变量和变量的协方差与变量和变量各自的方差进行如下运算得到的结果称为相关系数, (2.9)其中,是个无量纲的数,可以更好更准确的描述两个变量的相互关联程度。2.1.2数据的预处理前面讲述了数据表的一些基本的知识和相关的统计量。有了这些基本知识就可以进行下一步的数据预处理了。首先要说明为什么要进行数据的预处理,其次将说明如何进行数据的预处理。(1)中心化处理。中心化处理就进行一个如下的平移变换, (2.10)即用每个变量分别减去样本的平均值,因为我们的目的是获取每个样本点相对于样本均值的变化量。通过该变换可以使新坐标系的原点与样本的重心相重合,既不会改变样本点间的相对位置,也不改变变量间的相关性,同时给处理数据带来了很大的便利。(2)数据的无量纲化处理。如果各个变量的测量单位是一致的,可以用欧氏距离来测定样本点空间f中点与点之间的距离,有, (2.11)但是,在实际的问题中,不同变量的量纲往往是不相同的。常用的消除量纲的方法是对不同变量进行压缩处理,使每个变量的方差都变为1,即: (2.12) 除此之外文献4还介绍了如下几种方法, (2.13) (2.14) (2.15) (2.16)(3)标准化处理。标准化处理就是将中心化处理后的数据的每个变量再除以该变量的标准差,即前面提到的中心化和压缩处理的复合。即, (2.17)将得到的新的数据表记作。数据预处理后,给统计算法的应用铺平了道路。此外,可以证明经过预处理的数据具有如下性质:(1)所有新的变量的方差均等于1, (2.18)(2)任意两个新的变量的协方差恰好等于它们的相关系数, (2.19)对于标准化处理后的数据,它的协方差矩阵v等有它的相关系数矩阵p,记作: (2.20)由于,有。其中表示标准化变量与的协方差。而与的相关系数和处理前的原始变量和的相关系数是相等的。2.2偏最小二乘法理论在绪论中提到过,pls方法集中了线性回归分析方法、典型相关分析以及主成分分析法的特点。这三种方法本身就是统计学中的常用方法,对这三种方法的讲解是理解pls方法的钥匙。2.2.1多元线性回归分析方法(1)高斯-马尔科夫模型设影响因变量y的自变量个数为p,并分别记为所谓多元线性模型是指这些自变量对y的影响是线性的,即, (2.21)其中和是与无关的未知参数,称y为对自变量的线性回归函数记有m个自变量和1个因变量,对其进行n次采样,将得到的数据组成样本分别是,则, (2.22)其中相互独立,且,这个模型称为多元线性回归的数学模型。令,和 则式(2.22)表示成矩阵的形式就是: (2.23)其中是n维随机向量,满足如下条件: (2.24)是n维的单位矩阵,该条件是对随机误差作无偏、等方差和互不相关的假定。一般将式(2.23)和式(2.24)合并起来,即, (2.25)该模型称为高斯-马尔科夫模型,并记作。在经典的多元回归分析中,只有当总体服从该模型分布时,有关参数估计以及各种模型的假设检验方法才会有效,因此在进行本文所用的统计方法时,都是以总体服从高斯-马尔科夫模型的假设为前提的。幸运的是,统计学家发现,对客观世界的观察数据表明自然界中绝大部分的过程数据都是服从该模型的,这也为pls和其他相关方法的广泛应用做了客观上的准备。 另外,还有两个前提假设对多元线性回归的建模是十分重要的,即(1)是确定型的变量,其中不含有随机成分,(2)之间不可以存在完全的相关性。 (2)最小二乘法估计采用最小二乘法估计参数,引入偏差平方和为: (2.26)式中,称为误差平方和,它反映了y与之间在n次观察中的总的误差程度,越小越好。最小二乘估计就是求,使得: (2.27)因为是的非负二次型,故其最小值一定存在。这种寻找使达到最小值时的值作为的点估计的方法就是最小二乘法。根据多元微积分的极值原理,令, (2.28)上述方程组称为正规方程组,可用矩阵表示为: (2.29)在系数矩阵满秩的条件下,可解得: (2.30)即为回归方程: (2.31)的回归系数。y的最小二乘估计量为: (2.32)2.2.2典型相关分析多元线性回归模型中自变量有个基本的要求:在模型中应该包括所有对因变量有重要解释意义的因素,并且在用于反映该因素的自变量进不存在多重相关性。所谓多重相关性(也称为多重共线性),它是指在自变量之间存在着线性相关的现象。典型相关分析的功能即在求出自变量x和因变量y间是否有显著性的关系,同时可以通过典型相关分析进行降维工作,使得建立的估计模型达到更精简、更有效的目的。本节考虑的多元相关分析指的是自变量和因变量都是多元的,为了使讨论具有普遍性,假设两组变量,根据前面所讲述的协方差矩阵的定义,则的协方差矩阵为: (2.33)其中各个子块如下, (2.34)并假定和满秩。典型相关分析的基本思想是:首先分别在每组变量中找出第一对线性组合, (2.35)目标是求使其具有最大相关性的系数和,即, (2.36)然后再在每组变量中找出第二对线性组合, (2.37)使其分别与本组内的第一线性组合不相关,同时第二对本身具有次大的相关性,并求出满足下式的相应的系数和,有, (2.38)和相互独立,如此继续下去,直至进行到()步,两组变量的相关性被提取完为止。从而达到了找出变量间的相关性以及使变量降维的目的。2.2.3主成分分析法通过pca理解pls是一种可行的途径。pca作为一种线性降维技术,它确定了一系列的相互正交的向量,称为负载向量或负荷向量,并按照这些向量方向的方差大小来排序,并选取最具代表性的若干个方向来代替整个自变量集合,从而达到降维的目的。主成分分析法的一般步骤是:(1)设m个观察变量的n次观察的矩阵如式(2.1)所示,对该数据组做预处理,并计算处理后的数据组的协方差矩阵,此时的协方差矩阵又是该数据组的相关系数矩阵,如式(2.20);(2)计算该相关系数矩阵的前k个特征值以及对应的特征向量(或称为负荷向量)并要求他们是标准正交的; (3)主元数目k的确定。其确定的一般方法如下: 首先定义每一个主成分贡献率为,及前k个主成分的累计贡献率为,一般取累计贡献率达85-95的前k个特征值,即求出满足的k值;(4)求第i个主成分(也称作得分),有, (2.39)其中,是主轴的第j个分量。所以,主成分是原变量的线性组合,组合系数恰恰是。特征值排序的原因是基于文献4提及的理论:对于预处理后的数据,现要求出一个综合变量,将表示为的线性组合,即, (2.40)要使得能携带最多的缘变异信息,即要求的方差取得最大值。按照前面给出的方差公式,得到的方差为, (2.41)其中,是数据组x的协方差矩阵或相关系数矩阵。这样,该问题的实质就是一个优化的问题,写成数学表达式为, (2.42)由于,所以式(2.42),简化为, (2.43)采用拉格朗日(lagrange)乘数法来求解这个最优化的问题,构造如下的拉格朗日函数(或拉格朗日乘数), (2.44)根据微积分的相关定理可知,在一般情况下,最优值是在偏导数为零的时候取得的。因此,对l分别求关于和的偏导数,并且令偏导数为零。于是有, (2.45) (2.46)由式(2.45)得: (2.47)由此可知,是的一个标准化的特征向量,它所对应的特征值是。再由式(2.45)式(2.46)和式(2.47)得: (2.48)因此,当是最大的特征值的时候,能取得最大值。也就是说,我们所要求的是矩阵的最大特征值所对应的特征向量。被称为第一主轴。因此被称为第一主成分。接下来,可以类似的求第二主轴,与是标准正交的,即,并且仅次于第一主成分。第二主成分是携带信息量第二多的成分。依此类推,可以求得第k主轴,第k个主成分为,因此,有, (2.49)即, (2.50)经过主成分分析,可以将原始的数据x的相关变量降维成一组线性无关的正交变量,这组变量保存了x的绝大部分信息,最小化了随机噪声对分析数据造成的影响。在有些参考文献中,将k个主成分组成一个k维空间,即,称为得分空间,相应的t称为得分矩阵,将k个特征向量组成的k维矩阵称为负荷矩阵。于是根据前面的推导,x观测到低维空间的投影就包含在得分矩阵中,即, (2.51)并且,t返回到k维的观测空间的投影为: (2.52)于是,就是降维后的变量组,用它来代替原始的观测数据。相应的误差就是残差矩阵e,表示如下: (2.53)2.2.4偏最小二乘法偏最小二乘法(pls)又称为部分最小二乘法或特种结构投影法。它是一种降维技术,将自变量组x通过pca的方法进行主成分提取,然后使提取主成分后的低维变量组与因变量组y间的协方差最大化,从而建立因变量组y与低维的自变量组x间的回归模型。pls最主要的功能是在回归上面,但是它又不同于多元线性的最小二乘回归。这是因为,在多元线性的最小二乘回归中,对于式(2.32)中,虽然是y的一个较好的估计量,但是说明了必须是可逆矩阵,也就是说应该是满秩的,但是如果x中的某些向量是线性相关的或者存在多重的相关性,再或者x中的样本点较少以至于明显少于变量数目而导致不满足方阵的条件,则会导致这个估计量失效。它也不同于典型的相关分析和pca,典型相关分析是用来分析两组变量间的相关程度,而pca是对一组高维变量进行提取主成分并进行降维处理。它们没有对自变量和因变量进行回归建模。pls集成了这些优点,通过对自变量和因变量进行处理,并分析自变量与因变量间的关联性,最后得到两组变量间的回归关系。下面详细讲述pls的运作机理和建模方法4。采用典型相关分析中的变量,并假设两组变量x和y,自变量,和因变量,并对每个自变量都进行n次采样,即和。首先分别对和提取第一个得分和,为了满足回归分析的需要,和应该满足如下两个条件: (1)和应尽可能多地携带各自变量组中的变异信息;(2)和的相关程度能够达到最大。由于统计回归算法是一个对实际函数进行一种数值上的逼近,而不是完全的再现,因此在用pls回归算法前应该设置一个满意的精度,即达到该精度的区域内,就可以认为回归模型已经达到要求。在第一个得分被提取后,pls将分别实施x对的回归和y对的回归。若回归方程能够对达到预先设置的精度,则算法将可以终止;否

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论