(环境科学专业论文)用bp网络预测杭州西湖富营养化的短期变化趋势.pdf_第1页
(环境科学专业论文)用bp网络预测杭州西湖富营养化的短期变化趋势.pdf_第2页
(环境科学专业论文)用bp网络预测杭州西湖富营养化的短期变化趋势.pdf_第3页
(环境科学专业论文)用bp网络预测杭州西湖富营养化的短期变化趋势.pdf_第4页
(环境科学专业论文)用bp网络预测杭州西湖富营养化的短期变化趋势.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

¥浙盈大掌硕士掌位论叉 a b s t r a c t a r t i f i c i a ln e u r a ln e t w o r k sa l eb e c o m i n gm o r ea n dm o r ec o m m o nt ob eu s e di n d e v e l o p m e n to fp r e d i c t i o nm o d e l sf o rc o m p l e xs y s t e m sa st h et h e o r yb e h i n dt h e m d e v e l o p s a n dt h e p r o c e s s i n gp o w e ro fc o m p u t e r si n c r e a s e s at h r e el a y e r l e v e n b e r g - m a r q u a r d tf e e d f o r w a r dl e a r n i n ga l g o r i t h i nw a su s e dt om o d e lt h e e u t r o p h i c a t i o np r o c e s si nw e s tl a k e w eh a v ee s t a b l i s h e d8s a m p l i n gs p o t si nw e s tl a k e ja n dc o l l e c t e dt h ea q u a t i c d a t a ( 2 0 0 0 1 - 2 0 0 1 4 ) o f w e s tl a k eb yr o u t i n em e a s u r e m e n t s e l e c t i n gs p o t7w h i c h c a r im o s tr e p r e s e n tt h ew a t e rq u a l i t ys t a t u so f i ta ss t u d yo b - e c ta n df i l t r a t i n gt h ew a t e r q u a l i t yp a r a m e t e r s a st h e i n p u t s f o rn e t w o r kb yp r i n c i p a lc o m p o n e n t a n a l y s i s f u r t h e r m o r e ,t h ei n s e r t e dm e t h o dw h i c hc r e a t st h es u f f i c i e n ts a m p l e ss o l v e dt h e d e f i c i e n c yo fs a m p l e s i nt h ep a p e r , u s i n gb a c kp r o p a g a t i o n0 3 p ) n e u r a ln e t w o r k ,w e f o u n dt h em o s ti n f l u e n t i a le l e m e n t sw h i c hc a r r e f l e c tt h et r e n do fa q u a t i ce c o l o g yi n w e s tl a k ef o rm o d e l i n g ,a n de s t a b l i s h e dt h eb e s tn e w o r kt op r e d i c tt h es h o r tt e r m 乜芑n do fe u t r o p h i c a t i o ni nw e s tl a k e a tt h es a m et i m e w eu s e dt h ed a mo fs g l o t3t o t e s tt h eu n i v e r s a l i t yo ft h en e t w o r k ,a n df o u n dt h eo u t p u t st a l l i e dw i t ht h em e a s u r e d v a l u e sv e r yw e l l t h er e s u l t ss h o w e dt h a tw a t e rt e m p e r a t u r ea n dc h l o r o p h y l l aa f f e c t t h ec o n c e n t r a t i o no f e h l o r o p h y l l - ao f n e x tw e e kv e r yw e l l t h en e t w o r ku s i n gt h e m 船 i n p u tv a r i a b l e si ss i m p l ea n dp r o m p t ,h a v i n gg r e a t e ra d v a n t a g e st h a no t h e rl i n e a r i t y n u m e r i cm o d e l i n g s t h i si n d i c a t e st h a ta r t i f i c i a ln e u r a ln e t w o r km o d e l sw e r ea b l et om o d e ln o l l 1 i n e a r b e h a v i o ri ne u t r o p h i c a t i o np r o c e s sr e a s o n a b l ya n dc o u l ds u c c e s s f u l l yf o r e c a s tt h e c o n c e n t r a t i o no fc h l o r o p h y l l ai nw e s tl a k e i tc a l lp r o v i d et h es c i e n t i f i cb a s i sf o rt h e c o n t r o lo f t h ee u t r o p h i c a t i o no f w e s tl a k e k e y w o r d s :e u t r o p h i c a t i o n ;b pn e u r a ln e t w o r k ;s h o r t t e r m p r e d i c t i o n ; c h l o r o p h y l l - a 二w e s tl a k e 3 节浙江大掌硕士学位论文 e _ _ e ! 目! e - _ | e j 自! g s e | 目目e ! 自1 日目e | e ! ! ! ! ! ! ! 自! ! s g ! 自鲁g 量| e e 兰! ! ! ! ! ! ! 目e ! ! ! 詈! ! ! = e _ 皇 第二章,绪论 1 1 富营养化研究 1 1 1 富营养化的定义 所谓水体富营养化,是指水体中含有大量的磷,氨等植物生产所需要的营养 盐,造成藻类植物和其它浮游生物的爆发性繁殖,致使水的溶氧量大幅度下降, 水质恶化,导致鱼类和其他生物大量死亡的现象【l 】。 富营养化虽然是一个自然过程,但人类的活动( 如大量生活污水直接排入水 体) 可能会加速这一过程,这种情况下的富营养化称为人为富营养化。湖泊人为 富营养化的主要原因,是由于人类经济活动加强,含有大量氮、磷的生活污水或 工业废水流入湖泊后,使其在水体内部一系列的物理的、化学的,特别是生物的 转化过程中输入、输出的不平衡,输入太于输出,从而导致营养物质在水体中的 富集。水生植物由于得到这些营养素,而大量生长繁殖。这些植物死亡之后,在 其分解过程中,要消耗水中溶解氧,造成水中鱼类等浮游动物的死亡;藻类的大 量繁殖可使水变成绿色或棕红色,透明度下降,使水产生臭味,终于导致水质剧 烈恶化【2 j 。 1 1 2 研究现状及其发展趋势 富营养化已成为一个全球性的重大水环境问题,我国在经济持续高速增长的 同时,所带来的最大负效应就是环境污染e l 益严重。湖泊、水库主要的环境问题 就是水体富营养化,特别是人类活动比较集中的区域内的湖泊,水体富营养化过 程加快,水质恶化,可利用功能丧失,制约着人类社会和经济的发展,已引起了 世界各国的普遍关注。 一直以来湖泊富营养化研究倍受关注。自二、三十年代以来。湖泊富营养化 研究的理论研究已经比较成熟,经历了调查评价、模拟预测以及治理恢复等多个 阶段,其中富营养化模拟和管理是目前湖泊富营养化研究的热点。 对于杭州西湖的富营养化研究,裴洪平等分别建立了杭州西湖总磷动态预测 模型1 3 1 、引水后磷循环模型【4 】、藻类动态模型嘲和西湖富营养化生态模型 6 主 4 ¥浙江大掌硕士掌位论文 要模拟了西湖采取引水工程、底泥疏浚等措施后,西湖水体中总磷、藻类的变化 趋势,即评价了这些整治措施对西湖水质的改善效果,为科学决策和管理西湖水 质提供了科学依据。由于在运用模型进行湖泊富营养化管理的过程中,不确定性 是不容忽视的。因此,裴洪平等对杭州西湖富营养化生态模型在应用于实际管理 过程中可能遇到的不确定性进行了定量分析,开发了一个整合富营养化模拟、不 确定性分析、随机优化以及其他的管理模型框架。给出了各种情况下的水质风险 概率,客观评价了各种管理策略和整治措施所能实现目标的可能性,为西湖水质 的预警预报以及富营养化管理策略的程序的制定提供了科学依据 _ ”。 将来,西湖富营养化的研究趋势仍将是富营养化的预测模拟和管理。因此研 究工作的重点是:( 1 ) 进一步研究能精确模拟西湖富营养化变化趋势的模型,探 讨更为科学的预测方法,同时拓展模型的泛化性能,即提高模型的适用能力,这 是模型研究中的难点;( 2 ) 将建立的模型更好的应用于西湖富营养化的管理过程, 使研究成果更好更快的应用于实践,而不仅仅停留在理论的阶段。 1 2 人工神经网络 1 2 1 人工神经网络的分类 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k s ,简称a n n ) 是对人脑或自然的神 经网络若干基本特征的抽象和模拟,是一种非线性的动力学系统1 8 j 。目前,人工 神经网络已经渗透到各个领域,并在智能控制、模式识别、计算机视觉、自适应 滤波和信号处理、非线性优化、自动目标识别、连续语音识别、声纳信号的处理、 知识处理、传感技术与机器人、生物医学工程等方面取得了令人鼓舞的进展,而 且该种方法曰益成熟,具有重要的理论和应用价值1 9 】。目前,人工神经网络有以 下几种典型的模型: ( 1 ) e b p 网络( 反向传播算法) 【1 0 ,1 1 】 由于在神经网络中引入了隐层神经元,神经网络就具有更好的分类和记忆等 能力,因此相应的学习算法成了研究的焦点。1 9 8 5 年r u m e l h a r t 等提出的e b p ( e r r o rb a c kp r o p a g a t i o n ) 算法( 简称b p ) ,系统地解决了多层神经元网络中隐 单元层连接权的学习问题,并在数学上给出了完整的推导。由于b p 克服了简单 感知机不能解决的x o r 和其他一些问题,所以b p 模型已成为神经网络的重要 节浙江大学硕士学位论支 模型之一,并得以广泛使用。采用b p 算法的多层神经网络模型一般称为b p 网 络。它由输入层、中间层和输出层组成。中间层也就是隐含层可以是一层或多层。 ( 2 ) h o p f i e l d 网络模型 1 2 , 1 3 1 1 9 8 5 年,j r j h o p f i e l d 和d ,w t a n k 建立了相互连接型的神经网络模型,简称 h n n ( h o p f i e l dn e u r a l ) ,并用它成功地探讨了具有n p c 复杂性的旅行商问题 ( t s p ) 的求解方法。h o p f i e l d 模型属于反馈型神经网络,从计算的角度上讲, 它具有很强的计算能力。这样的系统着重关心的是系统的稳定性问题。稳定性是 这类具有联想记忆功能神经网络模型的核心,学习记忆的过程就是系统向稳定状 态发展的过程。h o p f i e l d 网络可用于解决联想记忆和约束优化问题的求解。 h o p f i e l d 网络模型又分离散型和连续型两种网络。 ( 3 ) 随机型神经网络【1 4 1 6 】 h o p f i e l d 神经网络在动力学模型中属于确定性的网络模型,其能量局部极小 所对应的稳态平衡点的存在,为联想记忆的实现提供了必要条件。但是,将h n n 用于优化问题的求解时,需要得到网络能量上全局最小的稳态平衡点,h n n 无 法保证最终给出的解一定是最优解。随机型的神经网络为求解全局最优解提供了 有效的算法。b o f c z m a n n 机( b o l t z m a n nm a c h i n e ) 模型采用模拟退火算法,使网 络能够摆脱能量局部极小的束缚,最终达到期望的能量全局最小状态,但是这需 要以花费较长时间的代价来得到。为了改善b o l t z m a n n 机求解速度慢的不足,后 来出现的g a u s s i a n 机模型不但具备h n n 模型的快速收敛特性,而且具有 b o l t z r n a n n 杌的“爬山”能力。o a u s s i a n 机模型采用模拟退火和锐化技术,使之 能够有效地求解优化及满足约束问题。 ( 4 ) 自组织神经网络1 1 7 , 1 8 自组织神经网络是一类无教师学习的神经网络模型,这类模型大都采用了竞 争型学习机制。自组织神经网络无需提供教师信号,它可以对外界未知环境( 或 样本空间) 进行学习或者模拟,并对自身的网络结构进行适当的调整,这就是所 谓自组织的由来。自组织神经网络模型的代表模型有自适应共振理论( a r t ) 模 型、自组织特征映射( s o m ) 模型和c p n 模型。 ( 5 ) 联想记忆神经网络【1 9 , 2 0 1 6 v 浙江大掌硕士掌位论文 联想记忆a m ( a s s o c i a t i v em e m o r y ) 是神经网络研究的一个重要方面,它在 许多领域都有广泛的应用。a m 作为人工神经网络的一种能力,就是将任意的输 入矢量集通过线性或非线性映射,变换为输出矢量集。许多网络模型都具有这样 的能力。联想记忆神经网络又包括线性联想记忆( l a m ) 模型、双向联想记忆 b a m 模型和时间联想记忆t a m 模型。 ( 6 ) c m a c 模型2 1 - 2 3 c m a c ( c e r e b e l l a r m o d e l a r t i c u l a t i o n c o n t r o l l e r ) 模型是由j s a l b u s 在1 9 7 5 年提出的。该模型虽然称为“小脑模型控制器”,但是它的网络模型却与习惯上 的人工神经网络有所不同。它虽然也要进行单元的权值调节,但并不具备人工神 经网络的层次连接结构,也不具备动力学的行为,只是一种非线性的映射。另外, c m a c 当初是以一种控制器模型提出来的,因而在某种上淡化了c m a c 的一些 主要特征。在1 9 8 9 年以后的若干年中,w t m i l l e r 等人将l m s 算法引入c m a c 中,成功地将其运用在多自由度机器人关节的控制上,并发表了一系列的文章, 使得c m a c 重新得到了人们的注意。 ( 7 ) 遗传算法原理口4 】 遗传算法g a ( g e n e t i c a l g o r i t h m ) 是一种根据生物学中所谓自然选择和遗传 机理的随机搜索优化算法。美国j o h nh h o l l a n d 教授在其1 9 7 5 年出版的 a d a p t a t i o ni nn a t u r a la n da r t i f i c i a ls y s t e m s ) ) 一书中系统地提出了遗传算法理 论,该书给出了遗传算法的基本原理和相应的数学理论证明。遗传算法的主要特 点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖于传统方法中常用 到的梯度信息。它尤其适台于处理传统搜索方法难于解决的复杂的非线性问题。 遗传算法给出了一个用来解决高度复杂问题的新思路和新方法。目前遗传算法已 被广泛应用于许多实际问题,如函数优化、自动控制、图象识别、机器学习、人 工神经网络、优化调度等。 1 2 2 人工神经网络的特点 a n n 是生物神经网络的抽象和模拟,它是由大量人工神经元广泛连接而成 的超大规模的非线性动力学系统,除具有一般非线性动力学系统的共性,如不可 预测性、吸引性、耗散性、非平衡性、不可逆性、高维性等特性外,a n n 还具 事浙江大掌碛士掌位论支 一一_ - - 詈皇兰皇曼_ | 呻詈詈詈皇鼍詈詈马_ e ! 兰= = = 鼍罩暑_ 日詈兰皇皇皇兰量量曼皇鼍_ _ e 置e 篁量e 詈竺兰= = 墨_ _ 曼曼皇皇 有以f 几方面的特征【9 j : ( 1 ) 大规模并行处理能力和信息的分布式存储。由大量人工神经元构成的 触心,每个神经元的结构和功能都相对简单,但其工作方式却是并行的,信息 ( 或学习到的知识) 广泛地分布在神经网络拓扑结构和神经元之间的相互连接 中。 ( 2 ) 容错性和稳健性。主要表现在神经网络中某个神经元的损坏或某两个 神经元之问的连接损坏,或某个神经元的输入有偏差时,网络的性能( 如学习性 能、泛化性能、稳定性能和收敛性能等) 没有明显改变。 ( 3 ) 自学习功能。通过训练样本的学习,神经网络能自动调整自己的拓扑 结构及网络参数,从而学习到蕴藏在样本中的知识,吼实现对训练样本的联想记 忆功能,和对新的样本的泛化能力等。 1 3 人工神经网络在水环境研究中的应用 1 3 1 国内现状 近几年,随着人工神经网络技术的迅速发展和日益成熟国内的研究人员将 其成功地运用于水生生态环境韵研究中,获得了相当满意的成果。 ( 1 ) 陈希、沙文钰等人的人工神经网络技术在海浪预报中的应用,文中 利用人工神经网络中的b p 算法,建立了南海洲岛海区风浪的预报方案。结果表 明:人工神经网络方法在海浪的定性及定量预报上。均有较好的拟台历史风浪浪 高的能力。该方案对风浪浪高的预报也达到了一定的精度。文中还针对b p 网络 容易产生振荡,易发生不收敛的情况,建立了不圊的预报方案并进行了对比分析。 9 k 至u t 较好的预报效果 2 5 , 2 6 】。 ( 2 ) 张忠永、王明涛等人的人工神经网络在地下水动态预测中的应用, 该文虚用人工神经网络中的b p 算法,根据地下水动态妁时间序列数据,建立地 下水动态模型,对地下水动态进行模拟和预测,并与灰色周期外延组合模型 方法对数据处理组合方法的结果进行比较,结果表明,其预测精度较高。说明神 经网络方法不仅简单、实用,又具有很强的处理地下水动态非线性及周期性变化 闯题的能力,可以在地下水动态等方面广泛使用 2 7 。9 1 。 ( 3 ) 王冬云、黄炎歆的海水富营养化评价的人工神经网络方法,文中运 ¥浙江大掌硕士掌位论文 用多层前馈神经网络模型和b p 算法对我国某海域的水质富营养化水平进行了评 价,只要将观测结果提供给网络,模型可自动将评价结果输出。该方法计算简便、 快速、具有实用性 3 0 3 1 l 。 ( 4 ) 楼文高写的湖库富营养化人工神经网络评价模型,在分析现有应用 人工神经网络评价模型局限性的基础上,根据湖库富营养化的评价标准,提出了 生成b p 神经网络训练样本、检验样本和测试样本的新方法,给出了区分湖库富 营养化不同程度的分界值,论述了确定合理隐层及其节点数的方法,使得训练后 的神经网络模型具有更强的泛化能力,不受初始连接权值的影响。训练后的评价 模型应用于实例的评价结果表明,新的评价模型具有更好的客观性、稳健性、通 用性和实用性。并且由于评价结果采用连续函数输出,能够比较精细地分析湖库 的富营养化程度 3 2 - 3 5 】。 ( 5 ) 邬红娟、郭生练等人写的水库浮游植物群落动态的人工神经网络方 法,他们根据辽宁大伙房水库1 9 8 0 1 9 9 7 年的水文和湖沼学观测资料,分别建 立浮游植物丰度和蓝藻优势度人工神经网络模型。将年降雨量、7 - 9 月平均水温、 7 罐月入库水量与7 罐月库容之比和磷酸盐作为输入,浮游植物生物量和丰度作 为输出,建立浮游植物群落消长的人工神经网络模型;将7 - 9 月平均水温、7 - 8 月入出库水量之比、磷酸盐和总氮作为输入,蓝藻优势度作为输出,建立浮游植 物演替的人工神经网络预测模型,并进行检验,其模拟值与观测值平均相对误差 分别为2 和1 。结果表明,人工神经网络方法优于传统的统计学模型,可进 行水库浮游植物群落动态的预测预报,并具有较高的精度p 6 - 3 9 。 1 3 2 国外现状 ( 1 ) y o u n g s e u kp a r k 等运用人工神经网络模拟和预测水生昆虫种类在流水 中的富集。文中,采用了两种人工神经网络方法,分别是无人监督的自组织神经 网络( s o m ) 和有人监督的b p 神经网络来分析生态数据。用四种主要水生昆虫 ( e p h e m e r o p t e r a , p l e c o p t e r a , t r i c h o p t e r a , a n dc o l e o p t e r a , i e e p t c ) ,和四种环境 变量( e l e v a t i o n ,s t r e a mo r d e r , d i s t a n c e f r o m t h es o a t e e ,a n d w a t e r t e m p e r a t u r e ) 来执 行网络。数据由a d o u r - g a r o n n e 流域( 法国西南部) 的1 5 5 个采样点收集和监测 获得。模型分两个步骤:首先,用s o m 网络根据e p t c 的富集对采样点进行分 9 ¥浙江犬掌硕士掌位论文 类;然后用b p 网络根据四个环境变量对e p t c 的富集进行预测。s o m 网络有利 于分析采样点、生物属性以及环境变量之问的关系,而b p 网络则根据四个环境 变量很精确的预测了e p t c 的富集( 训练集和检验集的r 分别为0 9 1 和0 6 1 ) 。 预测e p t c 的富集对以下领域的干扰评定是一种有用的工具,我们通过预测 e p t c 的富集可以确定该区域的受干扰程度。结果表明,成功运用两种不同的人 工神经网络方法,先分类,后预测目标变量,有助于理解生态数据 4 0 1 。 ( 2 ) k o h o n e n 神经网络在海岸水质管理中的应用:水质评价和预测的方法 学发展( p a a g u i l e m ,2 0 0 1 ) ,文中,用k n n 处理营养物的数据,这些数据源于 西班牙旅游地区的海岸水。由于活化图还不能充分评价和预测海岸水的营养状 态,为了弥补这一不足,产生了以k n n 活化图为出发点的新方法。评价海岸水 质的营养状态包括样方系统的发展。这系统比简单的基于标准数据的传统分类 方法优越。新的分类方法能说明中营养带水质的显著差异。其次,为了利用活化 图为预测工具,营养分类的活化图需变换为新的活化图。为了达到这一目的,定 义各个营养状态的取样点的活化图是成阶层的,为了避免不必要的复杂性和促进 进程,图象重合的频率应超过0 0 5 ,这样就产生了关于海岸水质营养状态的四个 频率图( 高中富营养、中低富营养、贫营养、潜在富营养) ,同时在图上还能 获得其他的相关信息。这一频率图可成功地预测海岸水质随机样本的营养状态, 这一基于k n n 的方法学也为海岸水质管理在决策时提供帮助 4 h 6 1 。 ( 3 ) 神经网络模拟海岸藻类水华( j o s e p hh ,w l e e ,2 0 0 3 ) ,该文利用人工 神经网络作为数据模拟方法来预测香港海岸水体藻类水华的动力学模型。采用广 泛使用的b p 算法来训练网络。模型采用的数据是t o l o 海湾1 9 8 2 2 0 0 0 年的全面 的双周水质数据,l a m i n a 海g1 9 9 6 :2 - 0 0 0 莳每周生物量数据。两处的藻类生物 量分别用c h l - a 含量和s k e l e t o n e m a 细胞浓度来代表。大量假设的分析说明:只 利用时间滞后的藻类动态学作为模型的输入量,其预测值和观测值吻合的最好。 这一结果与先前用复杂的网络模拟淡水中藻类水华动态学是相反的,现在表明在 潜在富营养状态的海岸水中,藻类浓度主要决定于先行1 2 周的藻类浓度。文中 还用神经网络的权重解释了这一结论。通过网络运行的系统分析发现,先前用人 工神经网络预测藻类动态模型在将“将来数据”用于网络是错误的。另外,还用 1 0 节浙江大掌硕士学位论文 l a m i n a 的数据进行了实时预测。研究表明,用小部分输入变量也可以获得藻类 的动态变化趋势,但数据的最小取样间隔必须是一周【4 7 巧2 1 。 ( 4 ) 用进化的计算法和传统的方法来模拟n a k d o n gr i v e r 的m i c r o c y s f i s a e m g i n o s a 藻类水华的动态模型( k w a n g s e u kj e o n g ,2 0 0 3 ) ,文中用遗传算法 g p 和多元回归法m l r 模拟富营养化河库混合型系统中m i e r o e y s t i sa e r u g i n o s a 藻组成的动态学。分别用g p 和m l r 建立了预测藻类发生的等式模型。g p 能成 功预测时间动态和大量水华,而m l r 的预测能力还是不够的。由于n a k d o n g r i v e r 的生态动力学是水库型而不是河流型的,所以原先的江河机械模型在描述 不确定性和复杂性时是失败的。文章表明在模拟河库变迁的生态系统的水华动 力学时,诱导完全经验方法是成功的【5 孓”j 。 一般而言,神经网络方法具有较强的处理相互矛盾样本的能力,尤其对非线 性水环境污染问题,其预测精度较高。目前,水环境污染领域的人工神经网络研 究虽取得了一些成果,但系统性不强,相信随着新的更完善的神经网络模型的开 发应用,必将引起人们的极大兴趣和重视。 1 4 本课题研究意义 湖泊富营养化预测的目的是为了准确反映水环境的质量和污染状况,预测将 来的发展趋势,为开展环境污染和综合治理、环境规划及管理提供科学依据。但 由于富营养化生态过程内在机制的复杂性、水环境的不确定性因素以及水质信息 自动测报、接受条件的限制,真实、有效的模拟水环境的富营养化状况就显得非 常困难。因此,探索和研究新的预测理论和方法,仍是水环境研究的一个重要课 题。通过以上文献可发现,人工神经网络是一种大规模荠行分布处理的非线性系 统,可以处理那些难以用数学模型描述的系统,可以逼近任何非线性的特性,具 有很强的自适应、自学习、联想记忆、高度容错和并行处理能力。而b p 网络是 目前人工神经网络中研究较为成熟,应用相当广泛的方法,也是最有效、最活跃 的方法之一。用b p 神经网络能成功预测水环境富营养化,而且都能取得比传统 方法更为科学的结果。因此我们用b p 神经网络来预测西湖富营养化是可行的。 用b p 网络进行湖泊富营养化评价的模型研究的很多,而用该模型对湖泊富 营养化状况进行预测却不是很多。虽然由于建立的基础理论与本课题有着一致性 ¥浙江大掌硕士掌位论文 因而对本课题有一定的借鉴作用,但考虑到并没有太多得用于预测模型,因而本 课题有着一定的研究必要性。此外,通过b p 网络建立具有预测能力的富营养化 评价模型,可以为环境规划、环境管理及决策者提供一个可靠的科学依据。 ¥浙江大掌硕士掌位论文 曼璺皇曼量暑詈詈曹詈詈舅| 曼兰苎鼍鼍皇皇i ii 皇皇皇皇蔓量曼| 鼍喜皇皇兰兰曼曼量曼寰皇皇曼曼舅皇蔓堂皇曼曼曼曼量曼曼舅量e 胃 第二章材料与方法 2 1 西湖及其概况 杭州西湖位于杭州市城区西侧,南、西和北三 面环山,湖水面积5 6 6 平方公里,平均水深1 5 6 米,流域面积2 7 2 5 平方公里( 不包括西湖西进工 程后增加的面积) ,是我国著名的风景旅游湖泊。 湖内白堤和苏堤把西湖分隔成外湖、北里湖、岳湖、 西里湖和小南湖等5 个湖区【5 8 】( 图2 1 ) 。 因库容量小,自然补给水源不足,加上流域内 经济迅速发展,致使氮、磷等营养物质大量累积, 水质日益富营养化,藻类过度繁殖,影响了水色和 透明度以及它的旅游价值。为改善西湖水质,在八 ;一甄善锥 一一。诩 ! 弩 3 十m 日* l 专 7 “ 矗5 矗彩 电 气 e * 缘。 斗1 ,引水连日、_ 图2 - 1 西湖湖区及采样点分布图 f i 啦1s a m p l i n gs p o t s nw e s tl a k e 十年代前后,实施了环湖砌岸、截污,局部疏浚、引水等一系列综合整治措施, 使西潮水质得到了一定程度的改善,但西湖富营养化趋势仍未得到有效控制f j 。 1 9 9 4 1 9 9 8 年在中国国家自然科学基金委员会、浙江省自然科学基金委员会 和日本民间财团基金会的共同资助下,开展了“关于保护杭州西湖的生态环境和 历史景观的中日合作研究”,对西湖的富营养化作了进一步深入研究,建立各种 富营养化模型,著提出了具体的防治对策和管理措施。本项研究就是在这项课题 研究的基础上进行的【7 1 。 2 2 研究概况 2 2 1 主要内容 话湖水生生态系统是一具有多因素耦合的复杂系统,生态要素间的关系错综 复杂,表现出极大的随机性、不确定性和非线性。基于误差反传算法的多层前馈 神经网络( 简称b p 网络) 是目前应用最广、通用性最好的能用于分类、模式识别 和函数逼近的网络。在水生生态领域,该方法已成功应用于水体的水质评价阳, 海岸的藻类水华模拟等方面5 2 1 。 1 3 v 浙江大掌硕士掌位论文 mm 1 _ 鲁皇鼻苎鼍曼鼍皇皇曾曼皇曩鲁! 皇皇皇詈詈詈詈詈曼曼皇皇曼_ 詈量曼! 蔓曼曼量置置墨_ 置曼量曼皇! 量曼量鼍暑暑胃詈喜置暑詈鼍鼻_ 詈墨詈曼 本文利用b p 网络强大的非线性能力,选择对西湖水质影响较大的因子建立 简单而又切实可行的网络,预测西湖短期的富营养化的变化趋势,从而为有效及 时的控制西湖水质提供科学依据。 2 2 2 研究步骤 2 3 研究方法 图2 - 2 研究步骤流程图 f j g 2 - 2t h ef l o wc h a r to fr e s e a c ha p p r o a c h 2 3 1 采样点的布设及测定 根据湖区的分布,近岸环境状况及游船往来等情况,共设8 个采样点( 图 2 1 ) 。每月采样一次,水样用采水器采集。监测项目中包括水温t w ( ) 、透明 度s d ( c m ) 、溶解氧d o ( m 鲋) 、电导率e c ( m s ) 、p h 值、总磷t p ( m g 1 ) 、 总氮t n ( r a g i ) 和叶绿素c h l - a ( 1 l 鲋) 共8 个物理、化学和生物等水质因子a 其中t w 、口h 、s d 、d o 和e c 用仪器在现场测定,t p 、t n 按常规化学方法在实 验室测定,c h l a 含量测定按a p h a ( 1 9 7 6 ) 1 0 0 2 g 1 项的方法,采用1 0 0 2 g 3 项公 式计算 5 9 1 。从图2 1 中可以看出,7 号点位于西湖中央,可以代表湖心附近较大 的一片水域。 丫浙江大掌硕士学位论文 曼e ! 皇詈蔓i i i 一i 皇置皇目舅阜曼皇皇詈置詈詈皇 2 3 2 输入参数的选择 为了能使神经网络有很好的预测能力,模型参数的选择相当重要。以往有模 型将藻类种类的细胞数量作为输出值,而将叶绿素a 浓度作为输入量,而在实际 情况中,这两者正是我们所未知的:现在也有模型将营养物浓度作为网络的输入 量,而这个只有通过连续的监测系统才能获得。还有模型将所有可能获得的环境 参数作为输入变量,但是这样很多的输入变量,其效果可能被复制了,比如藻类 的浓度和水体透明度有很好的相关性,若将两者都作为输入变量,这势必会影响 模型的预测能力,产生很多“噪音”而不是有用的信息1 6 0 。所以,参数选择的不 全面或过于复杂,就是说所选参数包含的信息不够完善或有所重复,均会影响预 测模型的客观真实性【6 1 1 。 因此,本研究通过主成分分析法对网络的输入变量进行选择,既减少神经网 络的输入交量,加快网络的收敛,又起到了主成分过滤“噪音”的目的。 2 3 2 1 主成分分析的基本原理 主成分分析法是一种通过对多变量进行降维处理的数据线性组合方法,它在 尽可能保留原有信息的基础上将高维空间中的样本映射到较低维的主成分空间 中。对于变量的主成分分析,可以观察到变量在主成分上的分布,通过各个变量 在主成分上的载荷因子大小,找出影响结果的重要变量,从而进一步选择主要表 征变量【6 2 】。 2 3 2 2 主成分分析的步骤 设原始变量为而,x 2 c - x n ,主成分分析后得到的新变量( 综合变量) 为 :1 ,z 2 c - - 2 - 。,它们是而,h 的线性组合 8 5 的最小m ( 聊_ ) ,则可得主超平面的维数m ,从而可对m 个主 成分进行综合分析。 2 3 3m l a t l a b m a t l a b 是m a t h w o r k s 公司于1 9 8 2 年推出的一套高性能的数值计算和可 视化软件,它集数值分析、矩阵运算、信号处理和图形显示于一体,构成了一个 方便的、界面友好的用户环境。 m a t l a b 强大的功能在于它的开放式的可扩展环境以及诸多的面向不同应 1 6 v 澎量大掌硕士掌位论文 用领域的工具箱( t o o l b o x ) ,主要包括信号处理( s i g n a lp r o c e s s i n g ) ,控制系统 ( c o n t r o ls y s t e m ) ,神经网络( n e u r a ln e t w o r k ) ,图象处理( i m a g ep r o c e s s i n g ) , 鲁棒控$ 1 ( r o b u s tc o n t r 0 1 ) ,非线性系统控制设计( n o n l i n e a rc o n t r o ls y s t e md e s i g n ) , 系统辨识( s y s t e mi d e n t i f i c a t i o n ) ,最优化( o p t i m i s a t i o n ) ,模糊逻辑( f u z z yl o g i c ) 等工具箱1 6 6 , 6 7 。 本研究采用的是全新的m a t l a b 6 5 正式版( r e l e a s e1 3 ) ,用m a t l a b 编 写了b p 神经网络训练、测试等各种程序。 2 3 4b p 神经网络 2 3 4 1 结构 在a n n 模型中,应用较多的是具有非线性传递函数神经元构成的前馈网络 中采用误差反传算法作为其学习算法的前馈网络( b a c kp r o p a g a g t i o na l g o r i t h m b p ) ,简称b p 网络。所谓“误差反传”是指,在计算具有隐层的前馈多层神经 网络的训练误差时,是先从输出层开始,逐层向后进行。b p 网络属于多层状型 的人工神经两络,由若干层神经元组成,它们可分为输入层、隐层和输出层,各 层的神经元作用是不同的,见图2 3 所示。输入层接受外部信息;隐层用来表示 和存储知识:输出层输出结果。3 层神经网络几乎可以对所有非线性函数进行模 拟。 输入层中问层输出层 图2 - 3b p 神经网络模型结构 f i g 2 - 3t h es t r u c t u r eo f b p n e u r a ln e t w o r k b p 网络中的信息传递是单向的,同一层中的神经元不存在相互联系,而层 与层之间则多采用全连接方式,连接程度由连接权重表示,并在学习过程中根据 误差进行调节。神经网络的权重是由前馈或反馈通过若干个神经元( 计算元素) 丫浙江大掌硕士掌位论文 i i i iiiiiiii 相互连接,这些神经元位于隐含层,并通过其连接输入层和输出层陋7 0 1 。 2 3 4 2 算法原理 首先分析出影响预测对象的因子,并将其作为b p 网络的输入,每一个影响 因子对应网络输入层的一个节点,将预测对象作为b p 网络的输出,输入层和输 出层的节点数由具体的预测问题来确定。当b p 网络确定后,用该网络对样本进 行监督学习,从而识别出影响因子与预测对象之间复杂的非线性映射关系。 b p 算法中其网络结构不仅有输入层节点、输出层节点,还可有1 个或多个 隐含层节点。对于输入信号,要先向前传播到隐含层节点,经函数作用后,再把 隐节点的输出信号传播到输出节点,最后给出输出结果。节点作用的激励函数通 常选取s 型函数,如 ,】 ,( 工) 2 百7 面 式中e 为调整激励函数形式的s i g m o i d 参数。 本文采用误差反向传播b p 网络模型,该网络选取3 层神经元,分别为包括 n 个节点的输入层( s ) ,h 个节点的隐层和1 个节点的输出层( r ) ,各相邻两层 之间单方向互联【6 6 】。 b p 网络的学习过程如下。首先从输入节点输入样本的n 个特征值,向前传 播;一般隐层神经元采用s 型非线性函数作为激活函数,其神经元个数f i 由训 练情况而定,这是b p 神经网络的缺点之一;输出层神经元的激活函数及其个数 根据输出目的决定。本文隐层神经元采用m a t l a b6 5 中的t a n s i g 激活函数,输出 层神经元激活函数采用线性函数郇。 在隐层节点的输出为: 帅= 噗州w ( f m ) 舭o a 朋 q 在输出层节点的输出为: y 【f ) = 蟆蚴川“) 堋f ) ( 3 ) 下浙江大学硕士学位论文 上面两式中,w ( o j k ) 为输入层k 节点对隐层,节点的连接权值,( r ,) 为隐层,节点对输出节点的连接权值,x ( f ,k ) 为输入的第,个样本的第k 个特征 值。( 7 ,) 和坼( ,) 分别为隐层和输出层的阈值。 先对上述两式中表示的网络各层间的连接权值w 、和阈值魄、q ,分别 取( 1 ,1 ) 之间的随机量作为初始值,然后输入样本进行学习。每学完一遍,比较 样本的实际输出结果与期望输出的误差,若误差小于指定精度,则学习结束,并 输出此时的最佳权值和闽值否则,将误差信号沿原来连接路径反向传播,并逐 步调整各层的连接权值和阂值,直到误差小于指定精度为止。具体过程见图2 - 4 。 从上述b p 算法可以看出,b p 模型把一组样本的输入,输出问题变为一个非 线性优化问题,它使用的是优化中最普通的梯度下降法。如果把神经网络看成是 输入到输出的映射,则这个映射是一个高度非线性映射。 设计一个神经网络专家系统重点在于模型的构成和学习算法的选择。一般来 说,结构是根据所研究领域及要解决的问题确定的。通过对所研究问题的大量历 史资料数据的分析及目前缒神经网络理论发展水平,建立合适的模型,并针对所 选的模型采用相应的学习算法,在网络学习过程中,不断地调整网络参数,直到 输出结果满足要求。 利用上述原始的学习算法调整各层的连接权值和闽值有许多缺陷,而改进的 学习算法有很多。本文基于m a t l a b6 5 软件,采用l e v e n b e r g m a r q u a r d t 算法训练 b p 网络,其在m a t l a b 6 5 中的函数名是t r a i n l m 。该算法的特点是训练速度比梯度 下降法要快的多,但要占用更多的计算机内存1 6 7 1 。 ¥浙江大掌硕士学位论文 开始 网络初始化 n n 输入学习模式 计算中间层单元的输出 计算输出层单元的输出 计算输出层单元的误差 计算中间层单元的误差 调整中间层至输出层 之间的连接权值 调整输入层至中间层 之间的连接权值 学习模式更新 学习模式结束 更新学习次数 误差 8 5 。表3 - 4 和3 - 5 是7 号点及全湖平均的主 成分分析结果。 表3 - 4 湖心( 7 号点) 主成分分析结果 t a b l e3 - 4 p r i n c i p a lc o m p o n e n t8 1 i l l l y s i sa ts p o t7 主成分系数 累积 主成分t w s dd oe c p h t pt nc h l - a 黼贞献率 第一o4 :50 4 40 2 3- 0 4 40 3 30 1 2 0 1 90 4 440 80 5 1 第二 一0 170 0 2 01 4- 0 0 7,0 2 506 7o 6 5 0 0 9 15 2 0 7 第三0 0 4- 0 1 307 80 0 4 0 5 50 0 600 80 2 41 1708 4 第四 03 2 - 0 0 8- 00 402 70 1 1o6 805 5 0 1 90 5 409 1 表3 5 全湖主成分分析结果 t a b l e3 - 5 p r i n c i p a lc o m p o n c n ta n a l y s i so ft h ew h o l ei 丑k e 主成分系数寨积 主成分t w s d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论