基于人工智能的台风增水预报系统优化与应用研究_第1页
基于人工智能的台风增水预报系统优化与应用研究_第2页
基于人工智能的台风增水预报系统优化与应用研究_第3页
基于人工智能的台风增水预报系统优化与应用研究_第4页
基于人工智能的台风增水预报系统优化与应用研究_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于人工智能的台风增水预报系统优化和应用研究文字目录文字目录中文摘要中文摘要.IABSTRACT.I1前言前言.11.1选题的由来.11.2国内外研究现状.21.3研究区域概况.31.4课题的主要研究内容.42研究的理论基础及方法研究的理论基础及方法.52.1人工神经网络.52.2标准 BP 网络的改进.62.3主分量分析.73技术路线设计技术路线设计.83.1预报因子分析.83.2神经网络参数选择.93.3预报过程设计.94主要研究过程主要研究过程.114.1数据标准化处理.114.2主分量学习矩阵的建立.114.3神经网络模型建立.114.4预报结果分析.124.52009 年“莫拉克”台

2、风增水检验.135结论及展望结论及展望.146参考文献参考文献.15中文摘要中文摘要该文在分析上海独特的地理位置以及台风水灾主要影响因子的基础上,从人工智能的角度提出了一种新的台风水灾预报方法,利用人工神经网络算法来模拟人工预报员的经验,并通过计算机实现上海地区台风增水的智能预报。在标准 BP 神经网络的基础上,对 BP 网络进行了改进并采用主分量 BP 网络来提高网络的泛化能力,减少网络的训练时间,加快网络收敛。结果表明,将人工神经网络技术应用于黄浦公园水位站的台风增水预报,可以借助计算机强大的计算功能模拟专家的思维过程,同时使用主分量分析构建神经网络输入因子,可以有效地减少重复信息和噪声,

3、增加神经网络的泛化能力,其预报客观、稳定,预报精度接近目前业务中使用的人工经验预报,可以在业务中应用。关键词:关键词:台风水灾、人工神经网络、BP 算法、主分量分析AbstractBased on the unique geographical position of Shanghai and the main factors of storm flood, a new method of storm flood forecasting is brought up from the angle of artificial intelligence. Artificially forecaste

4、rs experience is simulated by artificial neural network algorithm and through calculating to forecast the storm surge intelligently in Shanghai area. Based on the BP neural network, BP network is conducted additional momentum, and used adaptive principal component to increase network generalization

5、ability. At the same time, it reduces training time of network and accelerates convergence. The results show that the application of the artificial neural network for the storm surge forecast of Huangpu Park Hydrological Station can simulate forecasters thinking process by the powerful calculating f

6、unction of computer. At the same time, principal components analysis is used to build the input factors of neural network can decrease the repeating information and noise efficiently in order to increase the generalization ability of neural network. The forecasting precision is close to artificially

7、 experience predictive accuracy now used in business.Key words: typhoon flood; artificial neural network; BP network; principal component analysis11 前言前言1.1选题的由来选题的由来当前,地球气候变暖问题已经引起世界各国领导人对地球未来的担忧,由于地球变暖造成现极端气候灾害增多已经成为不争的事实,台风及其引起的水灾害正在愈加真切地威胁到我们的正常生活。2007 年 9 月 19 日,根据气象部门预报,上海市受台风“韦帕”较强风雨影响,为确保中小学

8、生和幼儿的安全,有关部门发出紧急通知,全市中小学校停课一天。在这之前的 2005 年 9 月 12日,受台风“卡奴”威胁,上海市中小学校实施停课一天的防御措施。这是上海首次实施停课。而同年的 8 月 25 日, “卡特里娜”飓风袭击美国新奥尔良市,使市区 75%的面积被洪水淹没,最大淹没深度达 6m 左右,最长淹没时间达七天以上。卡特里娜飓风造成大量市民伤亡,造成直接经济损失达到 1000 亿美元。经历两次学校停课和之后的台风灾害报道信息,我们不得不关注自己居住的城市如何防范台风水灾问题。新奥尔良市南临密西西比河,北接庞恰特雷恩湖,东面是博格纳湖,大部分地区的地面高程在海平面以下,易受墨西哥湾

9、飓风暴潮以及河、湖洪水灾害威胁。而上海面朝东海、背靠太湖,北挟长江口、南濒杭州湾,属于长江和太湖流域下游的典型感潮河口平原河网地区,同样易受台风暴潮、暴雨洪涝等水灾害侵袭。就在 1997 年 8 月 18 日,9711 号台风给上海带来了巨大的人员伤亡和经济损失。上海受台风水灾的威胁是真真切切存在的。如果能对台风水灾快速准确的作出预报,将为台风水灾的防御提供重要依据,对保护上海人民群众的生命财产安全具有重要意义。从而让城市更安全,让生活更美好!因此,我开展了本课题的研究,结合历史资料进行剖析,解释预警预报台风增水的重要性;在对目前各类方法以及对上海地形分析的基础上引出新型方法;分析大量台风水情

10、历史资料后提出建立合适的台风增水预报模型,采用神经网络的方法模拟专家预报经验,并构建了实时的计算机预报系统;进行了方法优化和系统改进,更加提升系统的智能效果,改善预报模型,提高预报精度2和预见期、加强实践检验的准确性;通过验证和实践检验为新方法的创新性与实用性作佐证, 1.2国内外研究现状国内外研究现状国内外众多学者对台风增水进行了研究,如王月宾利用气象科学和海洋科学相结合的方法,对发生在渤海西岸风暴潮进行统计分析,建立了渤海西岸风暴潮预报模型,结合天文潮汐资料进行高潮位预报,取得较好的效果1;张君伦等建立包括潮汐因素的综合模型2,并通过影响长江口区的多次台风水情资料进行模型检验;张胜平等对莱

11、州湾建国以来的风暴潮增水资料进行统计分析,探讨风暴潮产生的物理机制,建立了莱州湾温带风暴潮统计预报方法3。李艳芸等在 2006 年运用 COHERENS 三维多功能大陆架水动力模型,对渤海四个主要分潮进行调和分析,建立了渤海天文潮预报模型。李培顺利用增水峰、谷时与高、低潮时的对应的关系预报未来 24 小时的增水峰、谷时,采用趋势外延和回归计算相结合的方法与抱起峰值,采用模拟的增水曲线对青岛港区内的台风增水及潮位进行了预报。朱军政、黄冠鑫在 2002 年利用气压场、风场的气象知识建立风暴潮的模拟方程对钱塘江河口对杭州湾风暴潮增水进行了预报。这些研究主要还是基于气象、海洋、水文学的数值预报模拟系统

12、,大多数以其中单一专业基础理论为主,用统计回归法建立确定的数值模式,兼顾其他专业领域边界参数进行研究。随着人工神经网络算法的不断发展,神经网络的应用领域也不断拓展。人工神经网络作为计算机对人为经验的一种模拟,成为替代人为经验预报模式的最有效的算法。陈兆乾等基于 BP 网络开发了基于混合型神经网络的台风预报系统,将机器学习的理论和方法应用于天气预报的领域的一次较为成功的探索,该系统以神经网络学习为主,以符号处理作为其前端学习过程,利用数值预报结果及专家知识和经验规则来解决神经网络分类中的困难,提高分类精度,系统在江苏气象台“台风智能工作站”投入使用,取得较好的效果。罗志平等利用改进的灰色神经网络

13、组合模型,对灰色预测模型的初值进行了修正,以四川省都江堰灌区岷江上游来水逐年分旬流量数据为实验数据,结果发现,灰色理论与神经网络组合在水文时间序列预测是有实际应用价值的。李未等运用神经3网络模型对珠江口风暴潮进行了预报,他们发现当风暴潮沿河道上溯时,处于珠江口地区的灯笼山测站和黄埔测站的水位之间存在着非线性响应关系,利用BP 人工神经网络模型建立了两测站台台风风暴潮和天文潮的综合增水效应预报模型,对 9903、9908 和 9910 号台风期间黄埔站的综合增水进行了预报,并针对不同预报时段对计算结果潮位极值的准确程度进行了响应的讨论。神经网络模型综合考虑各种因素,将人为经验转化为知识让计算机进

14、行识别并预测,大大减少了人为判断的主观误差,在气象水文预报方面有很大的利用前景。资料显示,在众多的研究方法中,正在兴起并愈加成熟的神经网络计算技术为人们积累经验、优化判断提供了一个很好的手段,也为台风引起的水灾预警提供了一个新的方法。我们可以利用神经网络算法建立台风水灾预警数值模拟系统,以通过自我学习代替人工真实无误地积累历史资料、智能优化经验参数,从而不断提高台风水情预报精度,达到水灾预警目的。一些科研工作者已经在台风路径、台风暴雨、风暴潮等个别领域单一专业已作了一些相关探索,并取得了良好效果。人工神经网络预报模型结构灵活并具有模拟非线性关系的能力,但该预报方法在预报建模中易出现“过拟合”现

15、象,这主要与神经网络学习矩阵的构造有关。本文尝试采用主分量分析方法构造神经网络的学习矩阵,建立了基于主分量神经网络的台风增水预报模型,并结合天文潮汐资料对上海市的黄浦公园水文站进行快速、动态的高潮位预报。1.3研究区域概况研究区域概况上海位于长江和太湖流域下游,东濒东海,南临杭州湾,北依长江口,西接江苏、浙江两省。又地处北亚热带南缘,东亚季风盛行,气候温和湿润,台风影响和降雨较多,多年平均降水量约 1191 毫米,且降雨量在时间和地点上分布不均匀。黄浦江穿越上海市区,人为活动和城市建筑等影响较大。特定的地理环境,使上海在尽享渔耕舟楫之利的同时,也备受水患、台风灾害的困扰。4长长 江江长长 江江

16、太太 湖湖太太 湖湖东东海海杭杭州州湾湾杭杭州州湾湾上上 海海上上 海海长长 江江长长 江江太太 湖湖太太 湖湖东东海海杭杭州州湾湾杭杭州州湾湾上上 海海上上 海海上上 海海上上 海海图 1 上海市地理位置图据史料记载,上海平均每三年发生一次涝灾、五年发生一次风暴潮灾、十年发生一次洪灾。特别是二十世纪 90 年代以来,因受全球气候变暖、海平面上升,以及热岛效应、地面沉降等多种因素的交互影响,使风灾、水患呈现出更加复杂、多变、突发的态势。受东亚季风盛行的影响,平均每年影响上海的台风有 2 次,最多一年达 6 次。台风不但对高空构筑物、地面建筑物和各类设施造成直接的冲击,而且通常是风雨同行,破坏力

17、大,危害性强。由台风、暴雨、高潮位和上游洪水组成的“三碰头” 、 “四碰头”始终是上海的心腹之患。1997年上海受 11 号台风影响,沿海地区风力达 11 至 12 级,全市普降暴雨到大暴雨,同时恰逢天文大潮,全市经济损失高达 6 亿多元。如果当时再有上游洪水下泄,其后果将不堪设想。1.4课题的主要研究内容课题的主要研究内容在原先基于历史资料分析的智能系统上进行优化和改进,降低神经网络的规模,提高神经网络的泛化能力,以更精确地预报增水,这样为实现系统实际5应用做好充足的准备。为了使系统可以投入实际应用,我对系统进行了检验。借助于计算机来模拟专家思维过程,快速稳定的进行经验预报,将充分发挥经验预

18、报的优势,同时可解决人工预报时间过长且不够稳定的问题。资料检索表明,人工神经网络作为计算机对人为经验的一种模拟,成为替代人为经验预报模式的最有效的算法。这种技术从上世纪中叶开始产生并得到了迅速发展,它是利用计算机强大的计算能力来模拟人类思维活动的一项技术,现在已经在很多领域有了很好的应用。因此,本文在收集、整理和分析历史台风资料和台风期间部分水文站水情资料的基础上,开展了基于人工神经网络的台风水灾智能预报研究。同时,在研究过程中不断改进和优化预报方法,在标准 BP 神经网络的基础上,对 BP 网络进行了改进并采用主分量 BP 网络来提高网络的泛化能力,减少网络的训练时间,加快网络收敛,取得了较

19、好的预报精度。2 研究的理论基础及方法研究的理论基础及方法人工神经网络人工神经网络人工神经网络是在生物神经网络的基础上发展起来的,是人对生物神经网络处理信息的模拟。从 20 世纪 40 年代人类对人工神经网络的研究开始,就不断有新的网络诞生,并在模式识别、系统辨识、自然语言理解、智能机器人、信号处理、自动控制、预测预估等领域成功应用,表现出良好的智能性。1974年 P.Werbos 博士在其博士论文中提出了第一个适合多层网络的学习算法,但该算法没有引起足够的重视和广泛的应用,直到 20 世纪 80 年代,美国加利福尼亚的 PDP(Parallel Distributed Processing)

20、小组于 1986 年发表 Parallel Distributed Processing 一书,将该算法应用于神经网络的研究,才使之成为迄今为止最著名的多层网络学习算法BP 算法。BP 网络(反向传播神经网络)结构简单,可操作性强,能够模拟任何非线性输入输出关系。BP 算法的产生是为了解决多层神经网络中权值调整问题。利用此算法训练的神经网络,称之为 BP 神经网络。三层 BP 网络是至今为止应用最广泛的神经网络,包含输人层、输出层以及处于输入输出层之间的隐层。典型的三层 BP6网络结构如图所示:图 2 三层 BP 网络结构图其基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成:(

21、1)正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。在输出层把现行输出和期望输出进行比较,若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段;(2)误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差逆向传播的各层权值调整过程,周而复始地进行。权值不断调整的过程,也就是网络的学习过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。BP 网络通过自我学习进行高精度的数值预测。因此,在台风增水预测模型建立中选用了三

22、层 BP 网络,以经过样本训练后的网络作为数学模型映射台风增水与各影响因子之间的复杂非线性关系。2.2标准标准 BP 网络的改进网络的改进神经网络是在物理机制上模拟人脑信息处理机制的信息系统,由于它具有分布存储信息、并行处理以及可以自学习等优点,在信息处理、模式识别、智能控制以及系统建模等方面得到越来越广泛的应用,尤其是 BP 网络可以逼近任意的连续函数,所以广泛应用于非线性建模、函数逼近、模式分类的方面,取得了很多成果。但是 BP 网络也暴露出许多内在的缺陷:(1)易形成局部最7小而不是全局最优,学习过程容易发生震荡;(2)训练次数多使学习效率低,收敛速度慢;(3)隐含层神经元个数的选取缺乏

23、理论指导,缺少隐含层神经元个数选取的方法;(4)网络易对训练样本出现过拟合现象,对新样本的适应性不好,即网络的泛化性能力不强。神经网络的泛化能力,指对以同一样本中的非训练样本,网络仍能给出正确的输入输出关系的能力。网络的泛化能力依赖于训练样本的特性(训练集的大小和质量) 、网络结构(主要为隐含层神经元数目、隐含层和隐节点的函数特性)和问题的复杂度。当神经网络训练样本较少时,网络的学习不能获得足够的反应问题本质的信息,神经网络本身的可靠性受到影响;相反,网络的训练样本过多时,网络训练容易受到个别特殊噪声的影响,网络学习会出现所谓的过拟合现象,削弱网络的泛化能力。BP 网络的过拟合现象是指只要允许

24、网络足够复杂,BP 网络可使训练样本集的误差较少到足够小,但当样本数有限的情况下,却会导致网络的泛化能力下降。通过网络设计时误差函数的设置和主成分分析降低网络规模的方法提高网络的泛化能力。台风及其引起的增水系统是涉及多要素的复杂系统。在基于人工神经网络的台风水灾预报中,如何提高神经网络的泛化能力,是提高预报精度的重要手段之一。泛化能力高的网络对于非训练样本,网络仍能给出正确的输入输出关系,从而取得较好的预报结果。2.3主分量分析主分量分析利用主分量分析法可以研究各个变量之间的相关关系,用较少的新的独立变量代替原来较多的变量,并且尽可能保留原来较多的变量信息所反映的信息。这是一种减少变量降低网络

25、规模以提高网络泛化能力的技术,广泛应用于气象水情等预报和分析研究中。其基本思想是:设某一预报对象有 n 个预报因子x=(x1,x2,xn),通过主分量分析方法构造出 n 个新的综合因子变量 Z=(z1,z2,zn),每个新的综合因子变量是原因子变量的线性组合,变量之间相不关联,即各因子之间的相关系数为零,其特征值大小表示它对原因子组的贡献大小。将利用主分量分析法得到的综合因子变量用于构造神经网络学习矩阵,去掉特征值为零的主分量(这些主分量几乎没有包含原变量的信息),只保留特征8值相对较大且与预报量相关程度高的主分量,这样的作用非常显著,而且由于主分量间的相关系数是零,利用主分量构造的学习矩阵不

26、受重复信息的噪音影响。3 技术路线设计技术路线设计预报因子分析预报因子分析文献资料检索表明,影响台风及其增水的因子较多,目前主要集中于对天气形势的分析、风暴潮与气象因子的关联分析、气象因子叠加地理特征的综合分析等。预报方法主要分为数值预报、人工经验预报和叠加两者的综合预报。台风增水与该地区的风区、风向、风速、风时、地摩擦以及研究海区海水深浅、降雨、地面径流、上游来水等均有关,其预报涉及到台风预报、暴雨预报、风暴潮预报和产汇流预报四个模型,因此台风增水数值预报的难度较高,且精度受多过程影响,精度难以保证。在台风增水人工经验预报中,通常是将潮位变化设想为完全依赖于气象因子(风向、风速、气压、移向、

27、移速等) ,在二者之间建立某种关系,从而通过气象因子来估算潮位的高度。如统计模型预报方法是通过多元线性回归方法,对台风路径、天气学背景、台风各项特征(中心气压、近中心最大风速、风圈半径、移速)等参数建立回归方程,以进行台风风暴潮增水预报。但台风增水是一个复杂的非线性过程,难以用线性模型进行模拟。人工神经网络是人类利用计算机模拟人类神经元的一种方法,它不需要预先确定样本数据的数学模型,仅通过学习样本数据即可以模拟专家思维方式,进行相当精确的预测。在收集了大量的气象、水情资料后,经过对收集资料的分析比较,最后选择了数据相对比较完整的 1999 年2008 共十年的台风信息,以及台风期间上海市黄浦公

28、园、吴淞和米市渡三个水位观测站的潮位和增水信息,该时期内的台风及水情各项参数数据缺失率主成分分析11主要研究过程主要研究过程4.1数据标准化处理数据标准化处理为了保障模型计算过程的收敛和预测的精度,需进行必要的数据处理。首先,将部分参数缺失的数据项删除,以保证训练样本输入参数的完整性。其次基于对神经网络收敛性的考虑,为了使神经网络仿真结果不限制在一定的范围内,网络输入和输出参数采用除以一个常数的方法进行“归一化” ,使数据尽量集中在 1 附近。由于输入参数必须为数值型,对于输入参数中数据类型为字符串的数据要进行数据类型转换,如移动方向采用将正北方向记为 1,然后顺时针依次记录为 216 的处理

29、办法。处理后的总样本数 323 个,其中,1999-2006年的 272 个样本用于预报建模及历史资料回代检验,2007-2008 年的 51 个样本作为独立样本用于模型的预报检验。4.2主分量学习矩阵的建立主分量学习矩阵的建立主分量分析是将原始因子简化成几个不相关的新因子的方法,利用主分量分析方法对筛选后的 15 个输入因子进行主分量计算,剔除影响小于 0.01 的主分量,最终得到 5 个主分量,由表 1 可以看出,所得的五个主分量与预报目标黄浦公园台风增水之间的相关系数较大,能够代表 15 个原始因子,因此用所得的五个主分量因子作为网络预报的输入因子。同时构建 3 层 BP 网络,输入层包

30、含 5 个输入节点,隐含层神经元数目根据尝试选定为 11 个。表 1 各个主分量与预报因子之间的相关系数主分量第一主分量第二主分量第三主分量第四主分量第五主分量相关系数0.04330.3090-0.61370.3860-0.10844.3神经网络模型建立神经网络模型建立神经网络模型的建立过程即为网络的训练过程,即用自适应算法递归迭代求解因变量与自变量之间的非线性关系,训练后的网络可用于估算或预报预测变量。在 Matlab 环境中利用神经网络工具箱函数建立 BP 神经网络模型,将1219992006 年历次台风期间共 272 组样本数据,经过处理后保存为规范格式的文本文件,作为输入向量、输出向量

31、输入到神经网络中进行训练。同时 BP 网络具有收敛速度慢和容易陷入局部极小值的缺陷,采用附加动量和自适应学习率相结合的改进 BP 算法,对学习矩阵进行反复训练。经过 1000 次训练,误差趋于稳定,神经网络的连接权值和阈值达到稳定,从而获得确定的网络结构和参数,作为台风增水预报的模型。4.4预报结果分析预报结果分析利用主分量神经网络预报模型模拟计算 19992006 年历史台风期间黄浦公园站高潮位增水,与同期实测资料对比结果见下图。由图中可见,模型预测台风增水对试验样本有很好的拟合度,基本反映出了增水的趋势,并且对于增水高值有很好的拟合效果。图 4 试验样本实际增水与预测增水曲线13图 5 独

32、立样本实际增水与预测增水曲线在一般情况下,预报模型对历史样本的拟合精度很高,并不一定说明其预报效果也一定很好。统计预报方法在实际预报建模应用中,最大的障碍就是存在着明显的“过拟合”(模拟效果很好但预报效果不好)现象,因此预报模型是否存在着“过拟合”现象,是检验其应用价值的重要标准。由图 2 可以看出,对于独立样本,网络的泛化能力依然很强,独立样本增水趋势与实际基本一致。为了定量分析其预报效果,采用绝对平均误差指标进行评价。公式中为绝对平均误差,n 为样本数量,为主分量神经网络预测增MAEiy水,为实际增水。计算结果表明,试验样本的为 0.110 米,独立样本绝tiyMAE对平均误差为 0.13

33、6 米。此外,对于台风增水预报中特别关注的情况,如特MAE大增水(增水0.5m)和极高潮位(潮高4.5m) ,模型在这两种条件下的预报绝对平均误差分别为 0.148 米和 0.137 米。4.52009 年年“莫拉克莫拉克”台风增水检验台风增水检验日期本系统潮位预测结果(米)预报员潮位预测结果(米)实际潮位(米)8-7-20094.524.604.51nitiiMAyynE11148-8-20094.504.604.45图 6 本系统应用检验由于 8 月 9 日,上海地区台风蓝色预警解除, “莫拉克”台风对上海影响力减弱,便不再做预测。而 8 月 7 日和 8 月 8 日正值“莫拉克”台风影响力最大时,这两天媒体以及社会各界人士对其关注度较高,也是最有可能出现超高潮位的时间,恰能考验预报的客

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论