材料设计原理_第1页
材料设计原理_第2页
材料设计原理_第3页
材料设计原理_第4页
材料设计原理_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、 什么是材料设计材料设计(materialsdesign),是指通过理论与计算预报新材料的组分、结构与性能,或者说,通过理论设计来“订做”具有特定性能的新材料。这当然说的是人们所追求的长远目标,并非目前就能充分实现的。尽管如此,由于凝聚态物理学、量子化学等相关基础学科的深人发展,以及计算机能力的空前提高,使得材料研制过程中理论和计算的作用越来越大,直至变得不可缺少。1995年美国国家科学研究委员会(NRC)邀请众多专家经过调查分析,编写了《材料科学的计算与理论技术》这一专门报告,其中说:“materialsbydesign”(设计材料)一词正在变为现实,它意味着在材料研制与应用过程中理论的份量不断增长,研究者今天已处在应用理论和计算来“设计”材料的初期阶段。关于材料设计,或者设计材料这类研究,迄今在国际上还没有统一的流行术语或提法。日本学者1985年就提出了“材料设计学”一词,俄国学者把材料设计包括在“材料学”中。美国学者在《90年代材料科学与工程》报告中称这类工作为材料“计算机分析与模型化”。我国1986年开始实施“863计划”时,对新材料领域提出了探索不同层次微观理论指导下的材料设计这一要求,因此,从那时起在“863”材料领域便设立了“材料微观结构设计与性能预测”研究专题。由此可见,虽然用语有所差别,但基本含义是共同的。从广义来说,材料设计可按研究对象的空间尺度不同而划分为三个层次:微观设计层次,空间尺度在约1nm量级,是原子、电子层次的设计;连续模型层次,典型尺度在约l^m量级,这时材料被看成连续介质,不考虑其中单个原子、分子的行为;工程设计层次,尺度对应于宏观材料,涉及大块材料的加工和使用性能的设计研究。二、 材料设计的发展概况1、 前期研究的回顾“材料设计”设想始于20世纪50年代。在50年代初期,前苏联便开展了关于合金设计以及无机化合物的计算机预报等早期工作。那时前苏联卫星上天,说明其使用的材料是先进的。苏联人于1962年便在理论上提出人工半导体超晶格概念,不过当时他们没有提出如何在技术上加以实现的建议。后来到1969年,才正式从理论和实践结合上提出了通过改变组分或掺杂来获得人工超晶格。80年代中期日本材料界提出了用三大材料在分子原子水平上混合,构成杂化材料的设想。1985年日本出版了《新材料开发与材料设计学》一书,首次提出了“材料设计学”这一专门方向。书中介绍了早期的研究与应用情况,并在大学材料系开设材料设计课程。1988年由日本科学技术厅组织功能性梯度材料(functionallygradientmaterials)的研究任务,提出将设计一合成一评估三者紧密结合起来,按预定要求做出材料。为此已连续组织有关这个课题的国际学术讨论会。1989年美国由若干个专业委员会在调查分析美国8个工业部门(航天、汽车、生物材料、化学、电子学、能源、金属和通信)对材料的需求之后,编写出版了《90年代的材料科学与工程》报告,对材料的计算机分析与模型化作了比较充分的论述。该报告认为,现代理论和计算机技术的进步,使得材料科学与工程的性质正在发生变化计算机分析与模型化的进展,将使材料科学从定性描述逐渐进人定量描述的阶段。近10年来,材料设计或材料的计算机分析与模型化日益受到重视,究其原因主要有以下几点。(1) 固体物理、量子化学、统计力学、计算数学等相关学科在理论概念和方法上有很大发展,为材料微观结构设计提供了理论基础。(2) 现代计算机的速度、容量和易操作性空前提高。几年前在数学计算、数据分析中还认为无法解决的问题,现在已有可能加以解决;而且计算机能力还将进一步发展和提高。(3) 科学测试仪器的进步,提高了定量测量的水平,并提供了丰富的实验数据,为理论设计提供了条件。在这种情况下更需要借助计算机技术沟通理论与实验资料。(4) 材料研究和制备过程的复杂性增加,许多复杂的物理、化学过程需要用计算机进行模拟和计算,这样可以部分地或全部地替代既耗资又费时的复杂实验过程,节省人力物力。更有甚者,有些实验在现实条件下是难以实施的或无法实施的,但理论分析和模拟计算却可以在无实物消耗的情况下提供信息。(5) 以原子、分子为起始物进行材料合成,并在微观尺度上控制其结构,是现代先进材料合成技术的重要发展方向,例如分子束外延、纳米粒子组合、胶体化学方法等。对于这类研究对象,材料微观设计显然是不可缺少的并且是大有用武之地的。2、 当前面临的挑战1969年江崎和朱兆祥提出了由两种不同半导体薄层构成超晶格。量子阶的概念。后来借助分子束外延等制备技术,使这一设想得以实现。现在已被证明,这一概念是80年代以来凝聚态物理学和材料科学中最有价值的概念之一,它开辟了人工设计低维材料并对其能带结构进行人工剪裁的先例。2O年来,从量子新到量子线、量子点的研究,一直是最富有生命力的前沿领域之一。事实表明,现代材料科学研究必须深人到微观层次。今天不仅是对材料物性的了解,还是对材料性能的表征,都要求深人到分子、原子以及电子层次。许多先进材料的制备和加工过程,也已进人“原子、级水平”。由单个原子聚合成簇,或形成零维、一维、三维材料,都属于所谓“原子级工程”(atomicallyengineering)。又例如在今天各类关键技术上所使用的材料中,发生在材料表面和界面的现象,都要求从原子水平和化学键水平进行了解,才能阐明其本质。在未来超小型化的器件中起关键作用的材料,是由为数极少的原子所组成,其中增加(或减少)一个原子(或电子)都将使其状态发生明显变化,例如单电子器件就是如此。这是对当今材料科学理论和计算的挑战。可见,原子水平上的材料设计必然受到高度重视,它在现代材料科学技术的发展中将起举足轻重的作用。三、材料设计的主要途径概括地讲,目前材料设计方法主要是在经验规律基础上进行归纳或从第一性原理出发进行计算(演绎),更多的则是两者相互结合与补充。材料设计的主要途径可分为如下几类。1、 材料知识库和数据库技术数据库是随着计算机技术的发展而出现的一门新兴技术。材料知识库和数据库就是以存取材料知识和性能数据为主要内容的数值数据库。计算机化了的材料知识和性能数据库具有一系列优点:如存贮信息量大、存取速度快、查询方便。使用灵活;具有多种功能,如单位转换及图形表达等;已获得广泛应用,并可以与CAD、CAM配套使用,也可与人工智能技术相结合,构成材料性能预测或材料设计专家系统等。与早期数据的自由管理方式和文件管理方式相比,计算机的材料知识库和性能数据库还具有数据优化、数据独立、数据一致,以及数据共享及数据保护等优点。在数据库系统中,还有一个负责数据库管理和维护的软件系统,称为数据库管理系统。它负责数据库的建立、操纵、管理和维护。数据库管理系统又分为层次型、网络型和关系型三种。关系型数据库管理系统的出现,促进了数据库的小型化和普及化,使得在微机上配置数据库系统成为可能。除了数据管理软件外,数据的收集、整理和评价是建立数据库的关键。一个材料数据库通常应包括材料的性能数据、材料的组分、材料的处理、材料的试验条件以及材料的应用和评价等。当前,国际上的材料数据库正朝着智能化和网络化的方向发展。智能化是使材料数据库发展成为专家系统;网络化是将分散的、彼此独立的数据库相联而成为一个完整系统。利用大型知识库和数据库辅助材料设计的一个典型例于是日本三岛良绩和岩田修一等建立的计算机辅助合金设计(ComputerAidAlloyDesign,简称CAAD)系统。这一项目得到日本政府的支持,任务是为未来的可控热核反应炉设计和选择材料。在大型计算机中贮存了各种与合金设计有关的信息,其中包括各种元素的基本物理化学数据,合金相图,合金物性的各种经验方程式,各类合金体系的实验数据,各种合金的性能、用途以及有关文献目录等等。他们以元素的含量(百分数)为坐标,构筑以70多种元素的含量为坐标的多维空间,将上述各种信息记录在该多维空间中,然后按设计步骤来实现计算机辅助合金设计。2、 材料设计专家系统材料设计专家系统是指具有相当数量的与材料有关的各种背景知识,并能运用这些知识解决材料设计中有关问题的计算机程序系统。在一定范围和一定程度上,它能为某些特定性能材料的制备提供指导,以帮助研究人员进行新材料的开发。专家系统的研究始于20世纪60年代中期,近年来应用范围越来越广。最简单(原始)的专家系统包括一个知识库和一个推理系统。专家系统还可以连接(或包括)数据库、模式识别、人工神经网络以及各种运算模块。这些模块的综合运用可以有效地解决设计中的有关问题。最理想的专家系统是从基本理论出发,通过计算和逻辑推理,预测未知材料的性能和制备方法。但由于制约材料结构和性能的因素极其复杂,在可以预见的将来,这种完全演绎式的专家系统还难以实现。目前的专家系统是以经验知识和理论知识相结合(即归纳与演绎相结合)为基础的。材料设计专家系统大致有以下几类。1) 以知识检索、简单计算和推理为基础的专家系统由于材料科学研究需要的知识面广,有关资料极其庞杂,任何一位专家都不可能记住全部有关资料,所以单靠个人就会丧失许多灵活运用这些资料的机会。利用计算机则可以弥补这个缺陷。2) 以计算机模拟和运算为基础的材料设计专家系统材料研究的核心问题之一是材料的结构和性能关系。在对材料以物理、化学性能已经了解的前提下,有可能对材料的结构与性能关系进行计算机模拟或用相关的理论进行运算,以预报材料性能和制备方案。3)以模式识别和人工神经网络为基础的专家系统模式识别和人工神经网络是处理受多种因子影响的复杂数据集。用于总结半经验规律的有力工具。材料设计中两个核心问题是结构一性能关系和制备工艺一性能关系。这两类关系都受多种因素的制约,故可用模式识别或人工神经网络(或二者结合)从已知实验数据集中总结出数学模型,并据此预报未知材料的性能和达到此性能的优化配方及优化工艺。除上述三类外,近年来还发展了以材料智能加工为目标的材料设计专家系统。材料智能加工是材料设计研究的新发展,其目标是通过在位传感器在材料制造过程中采集信息,并输人智能控制以实现控制决策,使制备中的材料能循着最佳途径成为性能优良、稳定以及成品率高的材料。材料智能加工研究始于20世纪80年代中期,已在大直径砷化镓单备、碳纤维增强碳素复合材料制备以及粉末热压和喷射成形等方面得到应用并取得良好效果。3、 材料设计中的计算机模拟利用计算机对真实的系统进行模拟“实验”、提供实验结果、指导新材料研究,是材料设计的有效方法之一。材料设计中的计算机模拟对象遍及从材料研制到使用的全过程,包括合成、结构、性能、制备和使用等。例如,在利用计算机模拟氟化物玻璃的微结构时,可以计算出不同成分的氟化物玻璃的红外吸收光谱,并据此为红外光纤用的氟化物玻璃材料的配方提供依据。随着计算机技术的进步和人类对物质不同层次的结构及动态过程理解的深人,可以用计算机精确模拟的对象日益增多。在许多情况下,用计算机模拟比进行真实的实验要快要省,因此可根据计算机模拟结果预测有希望的实验方案,以提高实验效率。材料设计的计算机模拟,按模拟尺度可以分为三类。①原子尺度模拟计算。所用的方法主要是分子动力学方法和蒙特卡洛方法等。分子动力学方法应用极为普遍,它根据粒子间相互作用势,计算多粒子系统的结构和动力学过程。原则上,可用这些方法计算各种物系的结构和性质。②显微尺度模拟计算。这类计算以连续介质概念为基础。例如,功能梯度材料是物相或化学组成从一方向另一方向连续过渡的复合材料,其最大优点是温度梯度大时热应力分散,适于在航天等领域中用作结构材料。在研制梯度材料过程中可用计算机模拟方法计算热应力分布,为寻找合理的结构提供依据。此外,用热力学方法预测材料的相变过程及相变产物的显微结构,也属于此类方法研究范畴。③宏观尺度模拟计算。此法一般与材料或材料部件的工业生产有关。例如,非晶态合金一般用液态合金经急冷而成。在生产非晶态合金宽带时,必须保证宽带中没有晶化“缺陷”,这就要求所用设备和工艺条件能保证获得均匀高速的冷却条件。采用计算机模拟计算液体合金快冷时的传热传质过程,有助于设计合理的设备和工艺,以保证产品质量。现在回过头来再对原子尺度的计算机模拟作进一步介绍。要对一种材料的电子结构进行第一性原理的计算,无论是用能带理论还是用量子化学方法,都是费时费工的,而且可靠的结果目前还只限于基态,对于激发态迄今计算方法不多,且精度有限。因此,如果能将材料中粒子之间的相互作用势用适当的“有效势”来取代,并在此基础上进行计算机模拟,这样虽然会损失一些细节效应,但仍能大体上反映出由相互作用势所决定的电子结构,以及由电子结构所决定的材料性质,这无疑是一种很好的想法。基于“有效势”的计算机模拟就是建立在这种想法之上的。由于计算机技术的发展,在原子尺度上的这种计算机模拟已得到广泛应用。计算机模拟中原子间“有效势”模型的选择,显然因材料类型而异。早期主要采用纯经验的拟合势,近年来越来越多地考虑从第一性原理计算导出合适的“有效势”,包括采用集团近似的量子化学计算,从几何位形的变化来求出相应的有效势模型。这样做不仅为计算机模拟提供了更为可靠的依据,而且还可以反过来论证基于第一性原理的电子结构计算方法同有效势之间的联系。有了原子间相互作用有效势之后,就可以针对要研究的问题进行计算机模拟。模拟技术除分子动力学方法、蒙特一卡洛方法外,还有能量极小值法。后者最为简单。它是在有效势作用下改变原子分布的几何位形,从而求出对应于能量为极小值的原子位形。分子动力学方法是计算量较大的模拟方法,它是对离散的时步来求解牛顿运动方程,因而在模拟中包括了动能,特别有利于研究物质在高温下的行为,如扩散、相变等问题。计算机模拟方法比第一性原理的电子结构计算省事,而且可以获得与时间有关的物理量和热力学量的信息,这是量子力学所不能得到的。利用计算机技术,不仅可以模拟固体,也可以模拟液体在不同温度下的行为,特别在研究庞大复杂的系统方面具有良好的发展前景。4、 基于第一性原理的计算材料是由许多相互接近的原子排列而成。排列可以是周期的,也可以是非周期的。材料中离子和电子的数目均达到1024/cm3的数量级。这是一个复杂的多粒子系统。虽然原则上可以通过量子力学对系统进行求解,但由于过于复杂,必须采取合理的简化和近似才能用于实际材料的计算。关于第一性原理出发进行材料设计,即用量子理论(第一性原理)阐明和测报“实际材料”性能。即量子理论用于“实际”材料而非“理想”材料。量子力学建立于20世纪20年代,但对于固体的了解仅在过去的30年才开始,原因是固体中存在复杂的电子一离子、电子一电于相互作用。目前,固体量子理论的发展在利用计算机的条件下已经用来探索和预测尚未合成的新材料。C0hen教授所发展的用第一性原理的方法,近年来在预测新材料性能方面有两个突出的成功事例:一是预报存在St的高压金属相及其超导性;二是预报c3n4。超硬材料。第一性原理的计算方法很多,量子化学方法也是基于第一性原理的计算方法,它和固体量子理论是相互补充的,在材料设计中有同样重要的作用。5、基于第一性原理的主要计算方法块状结构和微结构材料的许多基本物理性质是由其电子结构决定的。要确定它们的电子结构,须采用基于第一性原理的计算方法。第一性原理的出发点便是求解多粒子系统的量子力学薛定愕方程。这一系统的非相对论形式的哈密顿量可写成.1、、 1_\y履 -1}'8爪5*Irt-r.I"EqmIr,-R」(1-1)式包括离子和电子的动能项也包括离子之间、电子之间和离子一电子之间的相互作用项。这样复杂的两种粒子多体系统,必须采用合理的简化和近似才能处理,否则寸步难行。由于核的质量比电子质量大得多,因而电子的响应速度极快,不妨将离子视为静止的,这就是有名的玻恩一奥本海默(Born-Oppenheimer)绝热近似,从而可将离子的运动与电子的运动分开来处理。经过上述简化,式(1-1)中前两项可以舍去,式中最后一项,即电子与离子相互作用项,可以用晶格势场 V(尸)来代替。于是得到电子系统的哈密顿量简化形式ii"手+1>(购:手飞二(1—2)这里已采用原子单位,即e2=1,h=1,2m=1。式(1-2)所对应的薛定愕方程实际上仍然很难求解,困难在于存在电子一电子之间和电子一核(离子)之间的库仑相互作用项。系统的状态应该在库仑相互作用能和动能两方面取得均衡,使总能量最小。进一步可以通过哈特利一福克(Hartree—Fock)自洽场近似将多电子的薛定愕方程简化为单电子的有效势方程。在哈特利一福克近似中,包含了电子与电子的交换能。它考虑了费米全同粒子的交换反对称性,即系统总波函数相对于任意交换一对电子应是反对称的。电子系统的真实总能量与哈特利一福克总能量的差值称为关联能。交换能及关联能处理起来较为棘手。常用方法有局域密度泛函理论和准粒子GW方法能够较好地考虑交换能和关联能,而Car—Parrinello方法为研究有限温度下离子和电子的动力学特性提供了一个有力的工具。四、当前材料设计的机遇与展望面临着以下几个方面机遇:(1) 软件并行化将有利于现有理论方法的相互结合,并可能使软件发展得到商业支持;(2) 处理复杂问题的能力增强,从而使理论计算与实验配合的可能性大为提高;(3) 材料计算的精度可能提高到热化学的精度;(4) 处理电子关联效应的理论方法可望取得进步,这对于发展算法和计算机程序具有重要意义;(5) 材料动力学特性研究,可以覆盖从原子尺度直到介观尺度的范围;(6) 计算材料强度的软件可能大为改善;(7) 可望实现各种材料的线性和非线性光学性质的计算;(8) 可望以大为提高的精度实现多类材料的相图及相变点附近的动力学性质的计算;(9) 从电子结构计算中可获得原子间相互作用的唯象势。以上几点机遇可以这样分类:前三点是对整个材料研究而言;第四点涉及理论方法对于发展计算机算法与程序的推动作用;而后面各点则是针对一些具体研究对象所做的预测。五、 关于合金设计广义来说,合金设计(alloydesign)应包括一切合金试制(包括大量“配方炒菜”的现行方式)的脑力活动。但目前讲的合金设计系指狭义定义,即利用计算机人工智能、模式识别和数据库、知识库技术帮助人们寻找新金属材料的尝试。早期的合金设计工作的实例是Woodatt等的相分析工作。他们利用Pauling提出的金属-半金属合金中电子密度和。相形成条件的经验关系,用计算机计算多种元素同时存在时出现。相的极限,从而控制高温合金的质量。Ross利用此方法改善了Udimet700和IN-100两种合金的性能。早期工作的另一实例是Breen等的CHAT系统,用计算机按可硬化性的要求选择成本最低的钢材。定量金相学对合金中合金相的类型、数量、粒度、形状和分布情况作定量描述。由于这类显微结构信息对合计性能极为重要,这类信息的计算机处理应是合金设计的重要一环。Nakada用图象处理方法研究钢的沉淀相,是这方面工作的一个实例。日本东京大学原子能工程系三岛良绩、岩田修一等长期研究合金设计,已形成一套较为完整的合金设计体系——CAAD(计算机辅助合金设计)体系。CAAD系统综合运用了计算机检索、模式识别、数据库、人机对话等多种信息处理技术,初步实现了用计算机辅助研制新合金的目标。他们在大型计算机系统中贮存了各种与合金有关的信息,包括各种元素的基本物理化学数据、相图、经验方程式和各种合金体系的实验数据、特征、用途等。他们用元素的含量为坐标,构筑以70多种元素的含量为坐标轴的多维空间,将各种信息记录在高维空间中,最后实现计算机辅助合金设计。陈念贻基于合金材料研究的大量工作的积累经验和实验数据,找出表征材料性质的参数,以这些参数作为坐标所张成的多维空间,考察已知数据的分布规律,根据这一规律预测材料的性质,达到材料设计的目的。例如,取2005个具有151种晶型的金属间化合物的数据,在Z],Z2(元素价电子数),R(元素原子半径),N①,△①(元素的功函数和及差)张成的五维键参数空间中,总结化合物的形成、配比及晶型规律,据此预报并指导未知化合物的合成,成功发现了LaPd5,PrPd5,EuFe2,EuNi2,NdIr3,GdIr3等一系列新的稀土合金中间相化合物。六、 模式识别-人工神经网络方法作为人工智能的一种方法,模式识别-人工神经网络方法自80年代以来已被广泛地应用于化学、工程和材料等学科中。本章就模式识别和人工神经网络的理论和方法作于简述。6.1模式识别方法在科学研究中,常常遇到要确定或预报一事物或事件的某一隐含特征问题。如果这种隐含特征和测定方法的理论关系还不是完全已知,那么就有可能使用一套数据描述方法。在这种方法中,从已知特征和间接测定方法的收集目标中导出经验关系。这一经验关系可用于预报未知目标的隐含特征。用于描述一个的一套间接测定方法称为模式。隐含特征的确定通常是一种模式归属类别的识别。在科学和人类的许多方面,模式的分类是一个基本过程,因此模式识别的数学方法在各不同的领域都有广泛的应用。模式识别的目的是把观察到的样本按类别归属分类,特别是当直接的和理论方法无能为力的时候,模式识别不失为一种通用的解决工具。模式识别有多种算法,其中包括主成分分析法、偏最小二乘法、Fisher判别分析法、聚类分析法等,本文主要用主成分分析法和偏最小二乘法研究和解决材料设计问题。6.1.1数据的预处理在模式识别中,数据的预处理很重要。因为用于同一分类的各个特征可能差别很大,例如对金属间化合物的分类,有的特征量为原子半径,有的为熔点,有的则为原子电荷密度。数据间不仅量纲不一样,其绝对值大小有时会有几个数量级之差。因此,应用表度化方法使个特征量变化幅度处于同一水平上。最常用的预处理方法是标准化处理(autoscaling),设a^为原始数据

(1)(1)X1nX2n(2)(3)(4)sX1nX2n(2)(3)(4)iAn-1kij1'J=1a—aTOC\o"1-5"\h\zij Six x1112X=X21 X22XX....X1-m1 m2 mn其中%为标准化数据,经过标准化处理的变量权重相同,均值为零,方差为1。6.1.2特征的提取和压缩一种特征提取方法是用数据的统计法来提取最重要的特征。这些特征按其重要性排列,不太重要的特征则可去掉。另一种提取方法是确定每一个特征对一定的分类方法的影响,对分类计算贡献太小的特征将被去掉。虽然在模式识别领域中,特征提取是最经深入研究的一个内容,但至今没有一个统一的理论方法。在模式识别中,在保证分类的前提下,应使特征数减少到最小,也就是进行特征的压缩。特征的压缩一般基于以下两个理由应尽可能删除与分类问题不相干的特征。因为这些特征会干扰分类结果和加大计算工作。同样的理由,相关特征也应删掉。特征数(f)应大大小于样本数(n),最好满足n/f>10,至少满足n/f>3。6.1.3主成分分析法(PCA-PrincipalComponetAnalysis)主成分分析法是一种多元统计分析技术,其目的是将数据降维,以排除众多信息中相互重叠的信息。它是将原变量进行转换,将原变量进行线性组合成新变量,这些变量尽可能地表征原变量的数据结构而不丢失信息。主成分分析法的原理是对多维空间作Karhunen-Loeve变换,即将样本通过一正交线性变换成两两正交的新变量TOC\o"1-5"\h\zT=XP (5)T为主成分(也称得分矢score)变量,X为样本特征变量矩阵,P为正交变换矩阵,由相互正交的矢量p.构成,主成分t.可由下式得到ti=X]pi (6)由T的性质,q满足以下关系E{qT,tj土 i=j (7)E{qT,tj=0 词 (8)具体计算步骤如下:设有m个变量的N的样本观测值,数据矩阵(标准化)为XX....X\o"CurrentDocument"11 12 1nXX XX= 21 22 2n: : :: XX....Xm1m2 mn(1)计算协方差阵£的估计值其中£=($而)=S其中S=—芸[x-jv.|[x-x.|ijn—1Vki 1八kjJJk=1_ 1寸气=n*xkik=1用Jacobi方法求S的特征根人.和相应的特征矢量l.(i=1,...,m)写出各主成分表达式 1 1j=16.1.4偏最小二乘法(PLS-PartialLeastSquare)在主成分分析法中,对矩阵X的本征矢或因子数测试中,所处理的仅为X矩阵,而不考虑目标矩阵Y的信息。事实上,Y中也可能包含非有用信息。偏最小二乘法正是在测试X的同时考虑Y的作用。将样本矩阵X和目标矩阵Y作双线性分解TOC\o"1-5"\h\zX=TPt+E (9)Y=UQt+F (10)其中,T,U分别是X,Y的得分矩阵,Pt,Qt分别是X,Y的负载矩阵,E,F是相应的残差矩阵。这样,在X的分解过程中引入Y的信息,同样在Y的分解过程中也引入了X的信息,即要求X的得分矢量t和Y的得分矢量u有最大重叠,故有u=bt+e (11)(9)和(10)称为外部关系,(11)称为内部关系。具体算法如下:若X和Y均已经过标准化处理。对于每一主成分⑴令Ustart=*对于X块:(2)w’=u’X/u’u⑶W’new=W’o/W’old11 (归一)t=Xw/w’w对于Y块:q’=t’Y/t’t⑶q’new=q’o/q’oid11 (归一)(4)u=Yq/q’q收敛测试:将(4)所得t与前一次迭代相比较,若相等(包括一定的舍入误差),则转到(9),否则到(2)[若Y仅有一变量,则跳过(5)〜(8),并设q=1]。计算X的负载,并重新标准化得分及权重:q’=t’X/t’tq’=叽如侦11 (归一)⑴)t'new=「'old"」1w'new=w’oidllp’oidll,(p’,q’和w’用于预测;t和u用于分类)。计算回归系算b以用于内部关联:b=u't/t't对于主成分h计算残差:Eh=Eh-1-讥’;X=Eo (12)Fh=Fe-«俱’;Y=Fo (13)之后,回到(1),进行下一个主成分。6.1.5降维映照中的逆映射方法用模式识别方法对高维空间的原始训练样本集{R.}进行适当变换,并映射到二维空间可研究样本的特征和分类标准等。同时,也常常希望能用原始变量描述样本的特征和分类标准等,以便了解原始变量与分类特征的直接关系,这就要求从二维映射空间向高维空间的逆映射。为了将优化区上的某个优化点返回原始空间,必须有边界条件。在R]、R2二维空间取一个优化点k,则获得两数据k]、

k2。边界条件的选取有两种---严格解与近似解。严格解方法是在R3,R4,...Rm所构成的子空间中优类点聚集区域中定义边界条件,获得k3,k4,...km,并得到方程组k=*RXi解该方程组可求得优化点kk=*RXi解该方程组可求得优化点k所对应原始特征量。近似解法是在RyR2空间优化点后,令口1"虹E= 乙——土(14)-d* ,」一,ij*d—di>jijj(15)i<j式中i=1,2,...,n,d『为R]、R2空间k点与已知样本点的距离,缶为相应的原始空间特征参数。6.2人工神经网络方法人工神经网络(ANN-ArtificialNeuralNetwork)是由大量类似于神经元的简单处理单元广泛相互联接而成的复杂网络巨系统。它是在现代神经研究成果的基础上提出的,反映了人脑功能的若干特征,但并非神经系统的真实描写,而只是其抽象和模拟。通过连接强度的调整,神经网络表现出类似人脑的学习、归纳和分类特征。6.2.1人工神经网络模型OjTOk—°L:W;i.WikW.il:件EWijOjai(t)=Fi(ai,neti)Lnnet°i0(t)=fi(ai)厂-°ja图2.1一个简单的神经元模型神经元是神经网络中的基本处理单元。图2.1为一个简单的人工神经元模型。O],O2,...,Ok是该神经元接受到的来自其他神经元的输出信息,w..表示从第i个神经元到第j个神经元的连接强度,net.代表神经元的内状态,a,(t)为其在t时刻的激活状态,9,表示其阈值门限。F,和f,分别表示第i个神经元的激活函数和阈值函数。人工神经元处理信息过程分为三个部分,首先完成出入信号与神经元连接强度的内积运算,然后再将其结果通过激活函数,再经阈值函数判决,如果输出值大于阈值门限,则该神经元被激活,否则处于抑制状态。通常,神经网络模型由网络的拓扑结构,神经元特性和学习或训练规则这三个因素所决定。神经网络按拓扑结构可分为分层网络模型和相互联接型网络模型。前者将神经元分成若干层,各层顺序联接,第i层的输入仅与第i-1层输出相关联,如图2.2a所示。后者允许任意两个神经元之间存在相互联接,如图2.2b所示。图2.2网络拓扑结构的两种型态神经元的特性函数是指激活函数与阈值函数的复合函数,通常取图2.3所示的三种形式,它们依次为阈值型、分段线性型和Sigmoid函数型。

图2.3人工神经元特性函数的三种形式神经网络的学习算法分为两种:有监督的和无监督的。有监督学习算法要求同时给出输入和正确的输出。网络根据当前输出与所要求的目标输出的差来进行网络调整,使网络作出正确的反映。无监督学习算法只需给出一组输入,网络能够逐渐演变到对输入的某种模式作出特定的反映。神经网络有两种运行方式:一种是前馈式,它利用联接强度及神经元的非线性输入输出关系,实现从输入状态空间到输出状态空间的非线性映射。另一种运行方式是演化式,在这种网络中输入相当于初态,网络演化的终态是输出。6.2.2反向传播学习算法(B-P算法)1986年,Rumelhart提出了反向传播(back-propagation)学习算法。这个算法除考虑最后一层外,还考虑网络中其他各层权值参数的变化,使得算法适用于多层网络,因此是目前广泛应用的神经网络学习方法之一。也教师信号V输出模式输入模式图2.4反向传播学习算法多层网络如图2.4所示,它是在输入与输出层之间增加若干层神经元,它们与外界没有直接联系,但其状态的改变,则能影响输入与输出之间的关系。设有m层神经网络,如果在输入层加上输入模式P,并设第k层i单元输入总和为uik,输出为Vik,由k-1层的第j个神经元到k层的第i个神经元的结合权值为W..。各个神经元的输入与输出关系函数是f,则各变量之间的关系为1J

(2.2.1)Vk=fu)(2.2.1)uk=zWVk-1i ijjj这个算法的学习过程,由正向传播和反向传播组成。正向传播过程,输入模式从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各神经元的权值,使得误差信号最小。误差函数定义r为期望输出与实际输出之差的平方和(2.2.2)r=—z\ym-y}(2.2.2)2jjj式中y.是输出单元的期望输出,在这里作为教师信号,因此,这个算法是一种有教师的学习算法。V.m是实际的输出,它是输入模式式中y.是输出单元的期望输出,在这里作为教师信号,因此,这个算法是一种有教师的学习算法。V.m是实际的输出,它是输入模式P和权值W的函数。 J这种学习算法实际上是求误差函数的极小值。可利用非线性规划中的最快下降法,使权值沿着误差函数的负梯度方向改变。drAW=-£—ij其权值叫.的更新值AWjj可由下式表示dW则司drdWijLzijdr dudW由于\WVk-1ijj/得AW=-£ijjk dr4=——Vk-1dWdukdWdukjij jij jdr: Vk-1dukjj

dr(2.2.3)du:j则的得此时的学习公式AW=-£dkVk=i

ijjj

式中£是学习步长,取正参数。d.k的求法如下:

dr drdVkdk= = j—j duk dVkdukjjj由(1)式可得,式(5)等号右边第二项为dV(2.2.4)(2.2.5)二=f侦)duk jj为了便于求导数,取连续函数。例如取f(u.k)为非线性S形函数:fC)=—__)j 1+exp妃usj(2.2.6)(2.2.7)则 f'(J=Vk(1-Vk)(2.2.7)jjjdr再求(5)式,等号右边第一项为石厂,对于(5)式可以有两种情况:dVkj⑴如果j是输出层(第m层)的神经元,k=m,则y是整个网络的期望输出,为定值,则由式(2)可得dr (-)dVkj:dVkj(2.2.8)(2.2.9)(2.2.10)dm=Vm-V^Vm—y(2.2.8)(2.2.9)(2.2.10)(2)如果j不是在输出层「而是在中间的隐单元层k,则有(2)8r Y dr duk+1 y,——=J —i——=JWdk+1dVk duk+1dVk jijj1ij1dk=VkV1—Vk宠Wdk+1jjjj1j可以看出,可以看出,k层的误差信号d.k正比于下一层的误差信号d]k+i。综上所述,多层网络的训练方法是将某一样本加到输入层,这时,按前传法则,它将逐个影响下一层的状态,最终得到一个输出V.m,如果这个输出与期望值不符,就产生误差信号,然后通过如下公式改变权值:△W=fdkVk-i

ijjj其中刀uCu)1 )dm=VmV—Vm/Vm—y/dk=Vk(1—VkXWdk+ijjjjljl以上公式说明求本层d.k须用到下一层的d]k+1,因此,误差函数的求取是一个始于输出层的反向传播的递归过程。通过多个'样本的反复训练并朝减少偏差的方向修改权值,最后达到满意的结果,故称为反向传播学习算法。反向传播学习算法是解决多层网络的有效算法,但如果网络的层次较多时,计算量很大,收敛较慢,原则上也存在局部最小问题。为改善收敛特性,可采用权值更新量AW的修正公式:△W。+1)=—sdkVk-1+aAW(t) (2.2.11)ij jj ij即后一次的权值更新适当考虑到上一次的权值更新值。其中a为调整变化量的参数,当学习步长取£=0.1〜0.4时,a可取0.7〜0.9,视实际情况而定。七、富镧Ni-MH电池阴极材料的计算机辅助设计Ni-MH电池由于其高能量密度、循环寿命长、无记忆效应和无污染,成为目前二次电池中最有发展前途的一种。Ni-MH电池的阴极是贮氢材料,上一章曾用人工神经网络研究贮氢合金的P-C-T曲线。本章用偏最小二乘法-人工神经网络法进行富铜Ni-MH电池阴极材料的设计及实验研究。7.1设计方法近年来,模式识别(PR)方法已被成功地运用于化合物的分类和计算机辅助材料设计。同时,BPN也被广泛用作一种新的PR分类法,这种分类法要优于传统的分类法,从原理上说,这种方法在计算机辅助材料设计上是一种更为有效的工具。但是,在运用BPN于材料设计时,必须要解决两个问题,一是所谓的“过拟合”,即只要隐结点足够多,从BPN获得的网络可以非常好地拟合任何连续的非线性函数,但对没有参加BPN训练集的样本的预报却存在很大的误差。另一个问题是“逆运算的不确定性”,即用同一网络结构的无数变量集可与一个确定的目标相对应。PLS-BPN方法,即PLS与BPN结合,将PLS与BPN优缺点互辅。本章将此方法应用于Ni/MH电池阴极材料的实验数据处理和材料设计。7.1.1PLS-BPN的输入元素一般说来,BPN是用于建立以权重描述变量与目标之间非线性关系的网络。广义上说,BPN可被认为是一种特殊的非线性回归分析,其中最重要的一个任务是减少独立变量数,而回归系数变量(对应于BPN权重)随着新变量的引进而增加.BPN的一个特点有利于舍取变量,由于选取的PLS成分在一定义意上描述了因变量,因此对BPN来说可认为是一个很好的输入方法。设X为n个样本和m个特征的标准化训练集,T是X在PLS空间的投影T=XR (5.1)R=(Pt)-1 (5.2)P为nxm正交PLS成分矩阵,Tk的统计噪音小于Tk+1(k=1,...,m-1)。

与通常BPN的一个重要区别是仅有较小噪音的T的一部分被作为BPN的输入元素,而不是原始的特征变量X或方程(5.1)中所有T得成分。事实上,这种处理方法使用了原始变量的一些正交函数,滤出了输入元素的部分噪音,可以有效地改善输入元素的信息。同时,由于减少了输入层的节点数,前面所提到的统计不确定性也减少了,因此,有利于消除过拟合和逆运算的不确定性。7.1.2PLS-BPN的隐节点数一般认为,隐节点数应使网络达到即有最好拟合,而过拟合又最小的“平衡”。但至今为止,对隐节点数的确定主要是凭经验,缺乏理论根据。刘洪霖[11]曾提出一条平衡规则,为简单起见,假设网络只有一个隐层,对k个隐节点,拟合误差函数Ep和期望误差函数Epk分别被定为方程(5.3)和(5.4)号矿予十闰(5.3)j /Ek=1:芝(Y-Yp> (5.4)「n\j'J在方程(5.3)和(5.4)中,y.是第I个训练样本的观察目标值,y.f是除第j个样本外经过网络拟合相应的拟合值,并被用于网络的检验。y.是第j个样本的观察目标值,y.p是相应的期望值,具有最小Epk的k个节点将建立PLS-BPN的网络结构。7.1.3优化样本在由PLS的T1和T2构筑的子空间中,优化样本聚集的区域称为优化区,可以预见,在优化区中某一点所代表的设计样本应具有与邻近相同的优化特点。设计样本的原始特征可通过非线性逆映照[7]方法获得。定义一个误差函数E1 ,-d(5.5)(5.6)=一/田d甲(5.5)(5.6)"djqjqkjd宝Wk-Xjklkdqq WIkd.为设计样本q与所有训练样本在PLS二维子空间内的距离,d.*是设计样本q与所有训练样本在m维原始特征空间的距离,当E达到最小时,获得样本q的原始特征。从原理上说,在优化区的许多代表点都可获取,了选取比训练样本目标值更好的样本,必须预报这些空间点代表的样本的特定目标值。由于PR只能预报样本的类别,不能定量预报目标值,因此,这一任务可由PLS-BPN来完成,即设计样本在PLS子空间的投影输入网络,再通过网络获得输出。由于设计的样本来自PLS的映照优化区,在很大程度上避免了因作为优化样本的劣样本造成的过拟合。这样,具有更好目标值的设计样本可为实验提供参考。7.2镍氢电池阴极材料设计表1为21个镣氢电池阴极材料数据,其中包括4个特征变量,Ni、Co、Mn、Al的含量(其它的化学成分、工艺条件不变,可视为常量)和一个目标一电池的初始容量。按实验要求,初始容量大于280mAh/g的为好样本,否则,为劣样本标。以Ni、Co、Mn、Al的含量为特征变量,以初始容量为目标(C0<280mAh/g为1类,C0>280mAh/g为2类)进行PLS分析。表2为样本集在PLS空间的四个分量,图1为以T1和T2为投影面的PLS映射图。No.样本分类Ni (原子数比)Mn(原子数比)Co(原子数比)Al(原子数比)C0(mAh/g)114.050.50.150.3275213.540.30.70.312563140.150.380.35245413.50.2510.25268513.850.40.150.35236613.60.210.1257713.680.230.70.15271813.60.20.60.35267913.80.280.60.322641013.680.380.490.312731113.60.30.60.22711224.10.320.380.153101323.90.40.380.322861423.40.2510.22891524.030.230.280.3130516240.30.280.233611723.960.380.280.153051823.820.30.490.153121924.10.410.150.182962023.50.380.70.233272123.850.230.490.23320表2PLS空间的组成PLS空间分量组成T’10.667X-0.627X+0.331X+0.229X Ni Co Al Mn—T’2-0.269X+0.018X-0.086X+0.959X”T’3-0.425X' ]:+0.010X[+0.904X:-0.038X:「T’4爵4^,0.7^^0.25^^0.16/;;

2C>280mAh/gC<280mAh/g2C>280mAh/gC<280mAh/gT1图1 21个实验样本的PLS映射图.在图1优化区中通过非线性逆映照方法[7]选出若干按PLS设计的样本(表3),然后,以表2中的T\、T2、T’3做为输入变量进行人工神经网络预报。表3为在优化区中选出两个按PLS-BPN设计和预报的样本。表3按PLS-BPN设计和预报的样本No.NiMnCoAl设计容量(原子数比)(原子数比)(原子数比)(原子数比)(mAh/g)13.920.270.410.2134024.000.330.310.19307按(5.5)式计算误差函数E选取网络,计算结果(表4)表明:1) 对Ek和Efc而言,PLS-BPN的结果总比通常的BPN要好;2) 随着口隐节点数的增加,拟合精度也增加,所以,拟合精度不应作为平衡网络的标准;3) 在某一隐节点数k,Efc有一极小值,PLS-BPN和通常PLS方法的Ek极小值对应的隐节点数为5,即平衡的网络结构应由5个隐节点组成(图2)。表4PLS-BPN和BPN对21个实验样本的预报误差和拟合误差对比PLS-BPN BPN隐节点数E p EfE p Ef40.12470.01350.13560.012950.08290.00900.11560.004960.09570.00620.12860.002970.10400.00450.13340.0018

输出层隐含层输入层输出层隐含层输入层图2PLS-BPB预报网络对两个设计样本进行的材料制备和电极制作的结果表明:设计预报结果与实验结果很符合(表表3由PLS-BPN设计的样本预报值与实验结果对比.No.设计容量(mAh/g)实验值(mAh/g)134032623072937.4.电极性能预报表征电池性能的指标有放电曲线、初始容量、比容量等。本节利用PLS-BPN方法对实验样本的放电曲线、初始容量、比容量等指标的样本数据进行相应的计算机预报。在对表1中21个数据进行以初始容量为目标(。0<280mAh/g为1类,Co>280mAh/g为2类)的PLS分析,并得表3的PLS的四个“主成分”。在PLS的四个“主成分”中,同样舍去了统计噪声较大的T’4,以T’]、T’2、T’3作为BP神经网络的输入变量,采用三层人工神经网络:输入层、隐含层、输出层(如图2)。传递函数为tanhx。7.4.1放电曲线的预报图3为放电实验曲线与预报曲线的比较。\^v(eaar.uvea^nncRD\^v(eaar.uvea^nncRD图3放电实验曲线与预报曲线的比较与预报值的比较八、二元连续固溶体合金交互作用参数与相图的计算机预报8.1、原理和方法1、 固液互溶二元合金相交互作用参数的计算为了计算固液互溶二元系的交互作用参数,设A、B组元组成的液相(1)和固相(s)均为规则溶液。二元系溶液相的过剩自由能"Gv可表为:exGV=^XXQv为交互作用参数(在文中,对具体的固相(s)和液相(1)内组元之间的交互作用参数分别以。?、。,代替此处的。),体系中各相的Gibbs自由能Gv为:GV=XV0Gv+XV0Gv+RT(XV1nx:+x:1nx;)+exGv其中,X,为组元i的成分(克原子分数,%),V代表液相(1)或固相(s),0Gv为纯组元i组成的V相时的自由能,T为热力学温度(K),R为气体常数。当体系达到平衡,组元在各相中化学位相等,即坤1=坤2, 31=3vTOC\o"1-5"\h\z1 1 2 2当液相(1)与固相(s)平衡时有△Gi+RT1n[(1-x)..(1—x)]=x2。-x2。 (1)A l' s ssll△Gs-i+RT1n(xx)=(1-x)2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论