材料设计原理范文_第1页
材料设计原理范文_第2页
材料设计原理范文_第3页
材料设计原理范文_第4页
材料设计原理范文_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

材料设计原理范文材料设计原理范文 1 人工神经网络是如何进行学习和训练 什么是教师信号及应用 答人工神经网络 ANN Artificial NeuralNetwork 是由大量类似于神经元的简单处理单元广泛相互联 接而成的复杂网络巨系统 它是在现代神经研究成果的基础上提出的 反映了人脑功能的若干 特征 但并非神经系统的真实描写 而只是其抽象和模拟 通过连接强度的调整 神经网络表现出类似人脑的学习 归纳和分 类特征 神经网络的学习算法很多 根据一种广泛采用的分类方法 可将神 经网络学习算法归纳为3类一类是有导师学习 一类为无导师学习 还有一类是灌输学习 有导师学习称为为有监督学习 这种学习模式采用的是纠错规则 在学习训练过程中需要不断给网络成对提供一个输入模式和一个期 望网络正确输出模式 称为 教师信号 将神经网络的实际输出同期望输出进行比较 当网络的输出与期望 的教师信号不符时 根据差错的方向和大小按一定的规则调整权值 以使下一步网络的输出更接近期望结果 对于有导师学习 网络在能执行工作任务之前必须先经过学习 当 网络对于各种给定的输入均能产生所期望的输出时 即认为网络已 经在导师的训练下 学会 了训练数据集中包含的知识和规则 可 以由来进行工作了 无导师学习也称为无监督学习 学习过程中 需要不断地给网络提 供动态输入信息 网络能根据特有的内部结构和学习规则 在输入 信息流中发现任何可能存在的模式和规律 同时能根据网络的功能 和输入信息调整权值 这个过程称为网络的自组织 其结果是使网 络能对属于同一类的模式进行自动分类 在这种学习模式中 网络的权值调整不取决于外来教师信号的影响 可认为网络的学习评价标准隐含于网络的内部 在有导师学习中 提供给神经网络学习的外部指导信息越多 神经 网络学会并掌握的知识越多 解决问题的能力也就越强 但是 有时神经网络所解决的问题的先验信息很少 甚至没有 这 种情况下无导师学习就显得更有实际意义 灌输式学习是指先将网络设计成能记忆特别的例子 以后等给定有 关该例子的输入信息时 例子便被回忆起来 灌输式学习中网络的权值一旦设计好了就不再变动 因此其学习是 一次性的 而是一个训练过程 网络的运行一般分为训练和工作两个阶段 训练阶段的目的是为了从训练数据中提取隐含的知识和规律 并存 储于网络中供工作阶段使用 可以认为 一个神经元是一个自适应单元 其权值可以根据它所接 收的输入信号 它是输出信号以及对应的监督信号进行调整 神经元模型如图1所示 图1神经元模型图2网络结构由图2中 设ni为第i个神经元加权输入 ai为第i个神经元输出 i 1 2 s 则有当采用感知器对不同的 输入矢量进行期望输出为0或1的分类时 其问题可转化为对已知输 入矢量在输入空间形成的不同点的位置 设计感知器的权值W和b 感知器权值参数设计目的 就是根据学习法则设计一条W P b 0的 轨迹 使其对输入矢量能够达到所期望的划分 用来计算新的权值矩阵W及新的偏差B的算法 权值的变化量等于输 入矢量假定输入矢量P 输出矢量A 目标矢量为T的感知器网络为如 果第i个神经元的输出是正确的 即ai ti 那么与第i个神经元联 接的权值wij和偏差值bi保持不变 如果第i个神经元的输出是0 但 期望输出为1 即有ai 0 而ti 1 此时权值修正算法为新的权值 wij为旧的权值wij加上输人矢量pj 新的偏差bi为旧偏差bi加上1 如果第i个神经元的输出为1 但期望输出为0 即有ai 1 而ti 0 此时权值修正算法 新的权值wij等于旧的权值wij减去输入矢量p j 新的偏差bi为旧偏差bi减去1 其训练的思想为在输入矢量P的作用下 计算网络的实际输出A 并 与相应的目标矢量T进行比较 检查A是否等于T 然后用比较后的误 差量 根据学习规则进行权值和偏差的调整 重新计算网络在新权值作用下的输入 重复权值调整过程 直到网 络的输出A等于目标矢量T或训练次数达到事先设置的最大值时训练 结束 训练分为四个步骤 一 初始化 权值W B和T 二 表达 计算训练的输出矢量A W P B 以及与期望输出之间的误 差E T A 三 检查 将网络输出误差的平方和与期望误差相比较 如果其值小于期望误 差 或训练已达到事先设定的最大训练次数 则停止训练 否则继 续 四 学习 采用W H学习规则计算新的权值和偏差 并返回到 表达 过程 不同的学习规则对学习信号有不同的定义 从形成各种各样的神经 网络 常用的学习算法有Hebb学习规则 Perceptron学习规则 学习规 则 LMS学习规则 Correlation学习规则 Winner Take All学习规则 Outstar学习规则 如要考虑一个较大的多神经元网络的模式联想的设计问题时 输入 矢量P和目标矢量T可为如下 2 蒙特卡罗方法的核心是什么 答蒙特 卡罗方法于20世纪40年代美国在第二次世界大战中研制原子弹的 曼哈顿计划 计划的成员S M 乌拉姆和J 冯 诺伊曼首先提出 数学家冯 诺伊曼用驰名世界的赌城 摩纳哥的Monte Carlo 来命名这种方法 为它蒙上了一层神秘色彩 在这之前 蒙特卡罗方法就已经存在 1777年 法国数学家布丰 Georges LouisLeclere deBuffon 1707 1788 提出用投针实验的方法求圆周率 这被认为是蒙特卡罗方法的起源 蒙特卡罗法的核心思想是当所求解问题是某种随机事件出现的概率 或者是某个随机变量的期望值时 通过某种 实验 的方法 以 这种事件出现的频率估计这一随机事件的概率 或者得到这个随机 变量的某些数字特征 并将其作为问题的解首先要建立一个随机模 型 然后制造一系列的随机数用以模拟这个过程 最后要作统计出 理 蒙特卡罗方法的解题过程可以归结为三个主要步骤构造或描述概率 过程 实现从已知概率分布抽样 建立各种估计量 1 构造或描述概率过程 对于本身就具有随机性质的问题 如粒子输运问题 主要是正确描 述和模拟这个概率过程 对于本来不是随机性质的确定性问题 比 如计算定积分 就必须事先构造一个人为的概率过程 它的某些参 量正好是所要求问题的解 即要将不具有随机性质的问题转化为随机性质的问题 2 实现从已知概率分布抽样 构造了概率模型以后 由于各种概率模型都可以看作是由各种各样 的概率分布构成的 因此产生已知概率分布的随机变量 或随机向 量 就成为实现蒙特卡罗方法模拟实验的基本手段 这也是蒙特 卡罗方法被称为随机抽样的原因 最简单 最基本 最重要的一个概率分布是 0 1 上的均匀分布 或称矩形分布 随机数就是具有这种均匀分布的随机变量 随机数序列就是具有这种分布的总体的一个简单子样 也就是一个 具有这种分布的相互独立的随机变数序列 产生随机数的问题 就是从这个分布的抽样问题 在计算机上 可以用物理方法产生随机数 但价格昂贵 不能重复 使用不便 另一种方法是用数学递推公式产生 这样产生的序列 与真正的随机数序列不同 所以称为伪随机数 或伪随机数序列 不过 经过多种统计检验表明 它与真正的随机数 或随机数序列 具有相近的性质 因此可把它作为真正的随机数来使用 由已知分布随机抽样有各种方法 与从 0 1 上均匀分布抽样不同 这些方法都是借助于随机序列来实现的 也就是说 都是以产生随 机数为前提的 由此可见 随机数是我们实现蒙特卡罗模拟的基本工具 3 建立各种估计量 一般说来 构造了概率模型并能从中抽样后 即实现模拟实验后 我们就要确定一个随机变量 作为所要求的问题的解 我们称它为 无偏估计 建立各种估计量 相当于对模拟实验的结果进行考察和登记 从中 得到问题的解 用以下的例子来说明蒙特卡罗方法的基本思想 例一 产品合格率的计算某工厂生产一批产品 其合格率表示是 产品的总数产品中合格产品的总量N合格率MP 为了确定合格率 应该检验这批产品的全部 确定其中合格是数目 但是 由于产品数量多 检查全部产品花费的代价大 因此 通常采用抽取部分产品 在这部分产品中确定其合格的数目 然后用这部分产品的合格率来代替所要计算的合格率P 例如 检查某批产品 当被检查的产品长度介于13 60cm 13 90cm内时 则认为是合格的 否则是次品 分别抽取5件 10件 60件 150件 600件 900件 1200件 1800 件来检查 其情况如下表和图3所示 表一产品抽样统计表抽取件数N合格产品数M57合格率P510601506009 001xx800531315488xx91163110 70 8830 8730 9110 9090 9090 906 图3产品抽样统计图上表可看作八次试验 从结果中看出 随着抽取 件数的增多 合格率愈来愈趋于一个稳定值o 9 如果定义随机变量 1 则做了N次试验后 正品个数共为则部分产品的合格率公式可近一步 写成人们从经验中还知道 当N数目越大 r N作为正品率的估计值 就越准确的可能性也越大 3 什么是分子动力学方法 如何实现分子动力学模型 答 1 分子动力学方法 Molecular Dynamics 简称MD 就是模拟大量粒子集合体系 固体 气体 液 体 中单个粒子的运动的一种手法 其关键的概念是运动 即要计 算粒子的位置 速度和取向随时间的演化 分子动力学中的质点可以是原子 分子 或更大的粒子集合 只有 在研究分子束实验等情况下 粒子才是真正的分子 与 分子动力学 相类似的名词还有 晶格动力学 研究固体中 原子的振动 和 分子力学 分子结构的量子力学 而分子动 力学限于模拟经典粒子的运动 分子动力学简单来说就是用数值方法求解经典力学中的N体问题 自Newton时代起 N体问题就被认为是很重要的物理问题 解析求解 或质点轨道的混沌分析是数理力学中的关注点 但时至今日 该问题重要性的原因已经进化成 将单粒子动力学与 系统的集体状态相联系 人们试图通过考察单个粒子的运动来解释 大量粒子集合系统的行为 例如 绕过一物体的流体是怎样产生湍流尾迹的 蛋白质分子中的 原子是怎样相互运动从而折叠成生命支撑形态的 流体气旋怎样产 生如木星上的大红斑那样的长寿旋涡的 溶液中的长链分子怎样自 组装成一些特殊结构 等等 因此 分子动力学在凝聚态物理 材料科学 高分子化学和分子生 物学等许多研究领域都有广泛的应用 经典分子动力学方法简单地说来就是求解多原子相互作用体系的New ton方程 在很小的时间步长下 对运动方程进行数值积分 就可以 得到体系随时间的演化过程 尽管分子动力学方法利用的是Newton方程 但它的基础仍是量子力 学 这是因为 原子相互作用的Schrodinger方程中包含有原子核和电子 的部分 在Born Oppenheimer近似下 波函数和Schrodinger方程可以分解成两部分 一部分描述电子动力学 另一部分描述原子核的运动 只要原子之间的相互作用势能 包含了电子的贡献 则该运动的动 力学方程可以用Newton方程近似 这样 我们只考虑核的运动而认为所有电子是处于基态的 体系的 量子行为由相互作用势来体现 另一方面 局域电子密度泛函理论只考虑电子的动力学问题 将两者结合起来就是量子分子动力学方法 其中不仅是核在运动 而且电子云也要按分子动力学方法得到 于是 体系的电子态一般来说并不一定处于基态 2 分子动力学模拟中的典型参数为 原子间距10 1 101nm 粒子数目103 109 时间步长10 14 10 15s 分子动力学在概念上相当于 在微观的时空尺度下研究星系中的大 量星体碰撞运动 星体的准确轨迹是不重要的 对于MD方法 向然的系综是微正则系综 这时能量是运动常量 分子动力学的模型的基本步骤分子动力学方法分为两大类一类是软 球 即粒子间的相互作用势能是其距离的连续函数 另外一类是硬 球 即势能是非连续的 在计算机上对分子系统的MD模拟的实际步骤可以划分为四步首先是 设定模拟所采用的模型 第二 给定初始条件 第三 趋于平衡的 计算过程 最后是宏观物理量的计算 1 模拟模型的设定 例如在一个分子系统中 假定两个分子间的相互作用势为硬球势 其势函数表示为实际上 更常用的是图 3 1 Lennard Jones型势 它的势函数表示为 6124 rrrV其中 是位势的最小值 可以确定能量的单位 这个最小值出现在 距离r等于21 6 的地方 可以确定为长度的单位 图4Lennard Jones势模型确定后 根据经典物理学的规律我们就可以知道在系综 模拟中的守恒量 例如对在微正则系综的模拟中能量 动量和角动量均为守恒量 在此系综中它们分别表示为其中pi mri 由于我们只限于研究大块物质在给定密度卜的性质 所以必须引进 一个叫做分子动力学元胞的体积元 以维持一个恒定的密度 对气体和液体 如果所占体积足够大 并且系统处于热平衡状态的 情况下 那么这个体积的形状是无关紧要的 对于晶态的系统 元胞的形状是有影响的 为了计算简便 对于气体和液体 我们取一个立方形的体积为MD元 胞 设MD元胞的线度大小为L 则其体积为L3 由于引进这样的立方体箱子 将产生六个我们不希望出现的表面 模拟中碰撞这些箱的表面的粒子应当被反射回到元胞内部 特别是 对粒子数目很少的系统 然而这些表面的存在对系统的任何一种性质都会有重大的影响 为了减小引入的表面效应 我们采用周期性边界条件 采用这种边界条件 我们就可以消除引入的表面效应 构造出一个 准无穷大的体积来更精确地代表宏观系统 2 给定初始条件MD模拟进人对系统微分方程组做数值求解的过程时 需要知道粒子的初始位置和速度的数值 不同的算法要求不同的初始条件 例如 对于硬球 其初始化阶段是给出系统的状态参数 硬球的初 始位置和速度 在模拟前 需要给定相关物理量的单位 对于长度L 通常只需采用相对长度 L 将其表示成球径 的倍数 LL 相应地 密度VN 则变为相对密度VNVN 3 密度还可以用堆积分数 表示 其定义是N个球的总体积与占据空间 体积之比 36234 VN 因为势能值除了零就是无穷大 不好用来作为能量的单位 所以采 用热能kT作为能3 TN量单位 总动能为2kE 则约化时间和约化速度 分别为kTmvvT kmtt 对于初始位置的选取 由于硬球是不能 互相重叠的 因此采用随机方法选取其空间坐标将是极为耗时的 除非密度非常小 因此 将它们布置在一个晶格中将是更好的方法 特别是如果已知 它们在给定物理条件下的晶格 3 趋于平衡按照给出的运动方程 边界条件和初始条件 就可以进 行分子动力学模拟计算 但是 这样计算出的系统不会具有所要求的系统能量 并且这个状 态本身也还不是一个平衡态 为了使系统达到平衡 模拟中需要一个趋衡过程 在这个过程中 增加或从系统中移出能量 直到系统具有所要求的 能量 然后 在对运动方程中的时间向前积分若干步 使系统持续给出正 确的能量值 这时系统已经达到平衡态 这段达到平衡态所需的时间称为弛豫时间 在MD模拟中 时间步h的大小选择是十分重要的 他决定了模拟所需要的时间 为了减小误差 步长h必须取得小一些 但是取得太小 系统模拟的 弛豫时间就很长 这需要积累一定的经验 选择适当的时间步长h 例如 对一个具有几百个氩分子的气体 如果采用Lennard Jones位势 我们发现取h为10 2量级 就可以得到好的相图 这里的h是没有量纲的 实际上这样选择的h对应的时间在10 14秒的量级 如果模拟1000步 系统达到平衡态 弛豫时间只有10 11秒 最后宏观物理量的计算实际计算宏观物理量往往是在MD模拟的最后 阶段进行的 它是沿着相空间轨迹求平均来计算得到的 4 什么是从头算 从头算的特点是什么 答从头算 ab initio 是狭义的第一原理计算 广义的从头算包括Hartree Fork自洽场计算为基础的ab initio从头算 和密度泛函理论 DFT 计算 也有人主张 ab initio 专指从头算 而第一原理和所谓的量子化学计算特指密度 泛函理论计算 从头算 ab initio 的理论基础是Hartree Fock HF 方法 即以非相对论近似和Born Oppenheimer近似为前提的方法 在HF计算中 电子波函数和它的能量通过自洽场 SCF 方法得到 体系的电子总能量通过调节一组基函数 单粒子基 的系数的方法 使之达到最小化 这组基函数的线性组合构成了该体系的电子波函 数的分子轨道 对于DFT 尽管有人称它为半从头算方法 但实际上仍应看成是一种 正规的从头算方法 但是它具有类似于半经验计算方法的经济性 即可以节省时间 DFT方法从理论上对电子相关性做了很好考虑 特别适用于含有过渡 金属的元素的分子体系 DFT方法中确实包含有一种经验的成分 有时某些函数只对某类分子 体系特别有效 对另外的分子体系可能无能无力 因此要寻找能够 具有更大的普适性的新函数F是一个重要的课题 HK定理虽然证明了电子密度是能量的唯一泛函 但是现在所有的DFT 方法are stillin theHF scheme 所以DFT还是ab initio 从化学家的角度讲 ab initio是指HF方法 HF和DFT都是从第一原理出发的 即在B O近似 单电子近似及相对论近似的前提下 求解的过程是通过自洽场 方法分别对HF和KS方程进行求解 但两种方法的基本思想出发点是不 同的 HF是通过求解体系的波函数获得体系的其它性质 而DFT是通过 电荷密度获得体系的其它性质 而不借助波函数 另外HF方程和KS方 程的意义是有很大区别的 虽然DFT是通过电荷密度获得体系的其它 性质 而不借助波函数 另外HF方程和KS方程的意义是有很大区别的 但是DFT思想的实现仍然不能摆脱单电子近似的框架 但是DFT思想的实现仍然不能摆脱单电子近似的框架 这句话是对DFT的误解 在DFT中根本不存在什么单电子近似 只是 对动能泛函与无相互作用体系动能作对应处理 这个和HF中的单电子近似有本质区别 HF中为了减小单电子近似引起的误差 可以通过引入多行列式波函 数方法 但在DFT中从原理上根本是不能这样做 只能通过找到更精 确的泛函来解决 从头计算法原则上讲 有了HFR方程 不论是RHF方程或是UHF方程 就可以计算任何多原子体系的电子结构和性质 真正严格的计算称之为从头计算法 在从头计算法里 分子轨道由组成体系的原子的全部原子轨道线性 组合而成 对于原子轨道有不同的选法 斯莱特型轨道适于描写电子云的分布 但在计算一些积分时包含对 无穷级数的积分 十分麻烦 所以在从头计算法里 常取高斯型函 数作为基函数 取一个高斯型函数或数个高斯型函数的线性组合模 拟一个原子轨道 已经有了不少进行多原子体系的从头计算法的标准的计算机程序 如J A 波普尔研究集体推出计算机程序系列高斯系列 该系列第一个公开的版本为高斯70 指1970年 以后差不多每年 更新一次 功能逐次增多 算法也日趋完善 从头算的分子动力学1985年 Car Parrinello提出的从头计算分子 动力学方 最重要的一点是在真实的物理系统中引入一个虚拟的电 子动力学系统 这样组成的新系统的势能面E是离子和电子自由度的 一个总泛函 恰好这个虚拟系统产生的轨迹与具有势能面V的实际物 理系统的轨迹非常一致 实际物理系统的经典拉格朗日量为 IIIIdRVRML 221而虚拟 系统的广义经典拉格朗日量为 R 21 2I2ijjijiijiI IIiiirrdrERMrdrL L是二套自由度 i 和 iR的泛函 它本身不显含时间t 但i 与iR与时间有关 i 为任意参数 单位为 质量 长度2 从式子中看 i 相当于电子的 质量 实际上它起着调节电子运动时间标度的作用 为简单起见 我们可以令i 与i 电子波函数无关 即i 在拉格朗 日量试中 第一项和第二项分别是电子和离子的动能K和KI E iR i 是电子和离子耦合虚拟系统的势能 拉格朗日乘子 是为了 保证i 的正交性而引入的 在经典力学中 它们就是一个完整约束 从广义经典拉格朗日量式我们容易得到相应的Euler方为 j jijIiE IIIRERM 我们注意到通过改变离子的速度 IR和电子的 速度 i 可以控制这一虚拟系统的温度 从而可以对 它们进行各种热力学处理 如退热 冷却等 在这些热力学处理过程中 可以同时处理离子和电子的自由度 特别 地 我们可以设计这样一个热力学过程 即慢慢地冷却离子的温度 最 后使系统在T 0时达到其平衡状态 这一方法称为动力学退热模拟 从头计算分子动力学 AIMD 方法主要基于以下3个假设 1 忽略系统的核量子效应 2 认为系统满足轨道近似 即单电子近似 3 认为系统满足绝热近似 其中电子基态本征函数和本征值的计算是A IMD的核心内容 电子基态计算属于复杂的量子多体问题 需引入密度泛函理论 densi sty functionalt heory DFT 以简化计算量 把复杂的多体问题转化为一组自洽的单电 子轨道

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论