(计算机应用技术专业论文)基于emd和集合预报技术的短期气候预测方法研究.pdf_第1页
(计算机应用技术专业论文)基于emd和集合预报技术的短期气候预测方法研究.pdf_第2页
(计算机应用技术专业论文)基于emd和集合预报技术的短期气候预测方法研究.pdf_第3页
(计算机应用技术专业论文)基于emd和集合预报技术的短期气候预测方法研究.pdf_第4页
(计算机应用技术专业论文)基于emd和集合预报技术的短期气候预测方法研究.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(计算机应用技术专业论文)基于emd和集合预报技术的短期气候预测方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 气候系统是典型的非平稳性系统,然而对于气候观测数据的处理通常是在 时间序列平稳的假定下完成的,比如气温和降水的预报。这样导致预测准确度 通常较低,并且由于预测方法大多属于单一方法预测,其结果还具有不确定性。 为改进该缺陷本文研究了三种经典时间序列预测方法并针对各自特点研究了两 种新的时间序列预测改进方法,选取广西全区8 8 个气象观测站1 9 5 7 2 0 0 5 年2 月逐年气温的距平百分率和6 8 月逐年降水距平百分率序列作为实验数据,研 究的内容和初步结论如下: ( 1 ) 在原始数据输入端加入经验模态分解( e m d ) 这种处理数据序列的新方 法,采用将其与普通时间序列预测方法相结合的方式对算法进行初步改进。经 对比验证表明通过其对原始时间序列进行平稳化处理,确实降低了序列非平稳 特征对预测结果的影响,提高了预测效果。 ( 2 ) 在预报结果端加入集合预报技术,对不同的预报结果进行方法集成实 现进一步的算法改进,实验表明相对于直接预测,最终预报模型在仅使用历史 资料进行多部预测的情况下能有效的把握气候的变化趋势和气候的突然变化, 具有较高的预测精度。 ( 3 ) 利用本文详述的算法和改进算法的预报模型进行预报系统的开发,针 对气候预测的要求和大气时间序列的复杂性,设计了各个系统模块和特殊的模 块运行方式,具有一定的实际推广能力。 关键词:均生函数,支持向量机,模糊时间序列预测,经验模态分解,集合预 报技术 a b s t r a c t c l i m a t e s y s t e m i sat y p i c a ln o n - s t a t i o n a r ys y s t e m h o w e v e r , c l i m a t e o b s e r v a t i o nd a t ap r o c e s s i n gi su s u a l l yc o m p l e t e du n d e rt h ea s s u m p t i o nt h a tt i m e s e r i e sa r es t a t i o n a r y , s u c ha sm u l t i s t e pp r e d i c t i o no ft e m p e r a t u r eo rp r e c i p i t a t i o n t h e r e f o r et h e yh a v el o w e ra c c u r a c y i no r d e rt oi m p r o v et h i sd e f e c t ,t h i sp a p e ru s e s t h r e et i m es e r i e sp r e d i c t i o nm e t h o d s ,e a c hf e a t u r ei s s t u d i e da n dt h e nt h ep a p e r r e s e a l c h e sh o wi n t e g r a t i n gi tw i t ho t h e rt w om e t h o d st oi m p r o v e c u r r e n tp r e d i c t i o n m o d e l s t h ee x p e r i m e n t a l d a t ac o m e sf r o ma n o m a l yp e r c e n t a g e o ff e b r u a r y t e m p e r a t u r ed a t aa n ds u n l l l l e rp r e c i p i t a t i o nd a t af r o m8 8m e t e o r o l o g i c a ls t a t i o n si n g u 乏m g x iz h u a n ga u t o n o m o u sd u r i n g 19 5 7 - - 2 0 0 5 ,t h ec o n c l u s i o n sa n dr e s e a r c h d e t a i l sa r ea sf o l l o w s : ( 1 ) i nd a t al o a d i n gs i d e ,t h en e w m e t h o dn a m e de m p i r i c a lm o d ed e c o m p o s i t i o n ( e m d ) i sa d d e d c o m b i n i n gi tw i t hn o r m a lp r e d i c t i o nm e t h o d s t op r e s e n t sat e n t a t i v e i m p r o v i n gm e a s u r e t h r o u g hr e s u l t sc o m p a r i n g ,t h en e w a l g o r i t h mc a nr e a l l yr e d u c e t h ei n s t a b i l i t yo f t i m es e r i e s ,a n dd e p r e s s i n gi t si n t e r f e r e n c et ot h er e s u r ( 2 ) i np r e d i c t i o nr e s u l to u t p u ts i d e ,a d d i n g e n s e m b l ep r e d i c t i o nt e c h n i q u e , i n t e g r a t i n g s e v e r a la l g o r i t h m s t o p r e s e n t s u l t e r i o r i m p r o v i n g m e a s u r e ,t h e e x p e r i m e n t sr e s u l ti n d i c a t e t h a tr e l a t i v et ot h ed i r e c t l yp r e d i c t i o nm e t h o d sa n d r 的r n 皿lp r e d i c t i o nm e t h o d s ,t h ef i n a lp r e d i c t i o nm o d e lw h i c ho n l y u s eh i s t o r i c a ld a t a c a ne f f e c t i v e l yp r e d i c tt h ec l i m a t ef l u c t u a t ef i e n da n da b r u p tc l i m a t ec h a n g ei nt h e c a s eo fm u l t i s t e pp r e d i c t i o n ,a n dh a v eb e t t e rp r e d i c t i o na c c u r a c y ( 3 ) u s i n gt h ef i n a lp r e d i c t i o nm o d e lt o d e v e l o pt h ep r e d i c t i o ns y s t e m ,i n r e s p o n s et ot h ef e a t u r e so fc l i m a t ep r e d i c t i o na n dp r o c e s s i n go fc l i m a t et i m es e r i e s , d e s i g n i n gs e v e r a ls y s t e mm o d u l e sa n dt h e i r o p e r a t i n gw a y s ,h a v es o m e c e r t a i n g e n e r a l i z a t i o na b i l i t y k e y w o r d s :m e a n v a l u e dg e n e r a t e df u n c t i o n ;s u p p o r t v e c t o rm a c h i n e ;f u z z y s e t st i m es e r i e sp r e d i c t i o n ;e m p i r i c a lm o d ed e c o m p o s i t i o n ;e n s e m b l ep r e d i c t i o n t e c h n i q u e 第一章绪论 目录 l 1 1 研究背景及意义l 1 2 国内外研究现状2 1 3 本文研究内容4 1 4 本文的组织结构4 第二章时间序列预测相关理论5 2 1 时间序列预测简介5 2 1 1 预测的基本概念5 2 1 2 时间序列预测的基本概念5 2 1 3 混沌时间序列预测6 2 2 均生函数预测方法简介6 2 2 1 均生函数的基本概念6 2 2 2 均生函数逐步回归模型7 2 3 支持向量机预测简介8 2 3 1 支持向量机的概念和基本思想9 2 3 2 支持向量机回归算法模型1 0 2 4 基于模糊集的时间序列预测简介1 2 2 4 1 大气预测的模糊性和模糊预测的基本概念1 2 2 4 2 模糊时间序列预测模型一1 3 2 5 本章小结1 4 第三章基于经验模态分解和集合预报的算法改进1 5 3 1 时间序列预测算法的实现。1 5 3 1 1 均生函数预测算法实现。1 5 3 1 2 支持向量机回归算法实现1 6 3 1 3 基于模糊集的时间序列预测算法实现1 7 3 2 经验模态分解2 0 3 2 1 经验模态分解的算法原理2 0 3 2 2 基于经验模态分解的预测算法改进2 2 3 3 集合预报技术2 4 i 3 3 1 集合预报的算法实现2 4 3 3 2 基于集合预报的综合改进算法流程2 5 3 4 本章小结2 6 第四章预测实验及结果分析。 4 1 基于e m d 的算法改进结果分析2 7 4 1 1 实验数据来源2 7 4 1 2 评价方法讨论2 9 4 1 3 实验结果与分析3 0 4 2 基于e m d 和集合预报的综合算法改进结果与分析3 8 4 2 1 实验数据准备一3 9 4 2 2 评价方法讨论3 9 4 2 3 试验结果与分析3 9 4 3 本章小结4 3 第一章绪论 1 1 研究背景及意义 第一章绪论弟一早珀t 匕 短期气候预测是气象业务的重要组成部分,是当今人类社会面临的一项重大课题,也 是当前气象科学研究和发展的重点。全球气候变暖已是一个不争的事实,气候问题日益受 到关注,气候变化与社会、经济发展关系密切,近年来各种气候极端事件如干早、暴雨洪 水、低温冷害、沙尘暴、雪灾等频繁发生,呈现加剧趋势,随着我国经济社会的快速发展, 社会进步,人民生活水平的提高,政府和公众防灾减灾对短期气候预测产品的需求在急速 增长,短期气候预测的需求越来越迫切。短期气候预测在国民经济建设和防灾减灾中的作 用越来越重要。然而气候的形成和演变非常错综复杂,除大气子系统的内部因素外,还有 来自地球外部的影响和气候系统五大圈内部的相互作用。所有这些内外因素和相互作用, 即有确定的也有不确定的,即有人类所已认识了解的,也有人类目前或相当一段时间内所 无法或尚未认识的。这就注定了以研究随机现象为目的的统计概率理论在短期气候预测和 诊断方面的重要地位,进入本世纪以来,全球气候变化异常,利用短期气候预测对气候突 发性变化或气候整体趋势进行预报或预警是十分重要的,而如何更加准确的进行预报,提 前做好防范,这对短期气候预测提出了更高的要求。 预测技术以其预测的性质来分可分为定性预测和定量预测,前者以判断或推论气候要 素( 即预测对象) 未来的变化趋势和演化特性为目的,后者则是对气候要素未来变化的量的 多少做出预测。短期气候预测的关键是建立预测模型。以模式的动力学性质来分统计预测 技术可以分为纯统计预测模式和统计一动力模式。前者包括时间序列分析、多元回归、变 量场时空结构的分析等,后者包括动态模式、随机动力模式、反演模式等。在这些预测模 式中,统计方法扮演着一种十分重要的角色。 本文在中国气象局新技术推广项目“时间序列的e m d 分析及预测系统”课题的支持 下,对多种统计预报模型用于气候预测的技术进行了深入研究,并引入用于信号处理的经 验模态分解方法和集合预报的方法,首先对具有非平稳性质的气候时间序列进行平稳化预 处理,再将处理后的数据分别用三种经典的时间序列预测算法进行预测,最后通过集合预 报算法进行结果集成。相对于各直接预测法,可以达到更好的预测效果。 南京信息工程大学硕士学位论文 1 2 国内外研究现状 中国是世界上开展短期气候预测业务较早的国家之一,世界上开展短 的国家有印度,开始于本世纪初,前苏联,开始于本世纪前半叶,然后就 2 0 世纪3 0 5 0 年代,接下来是美、日、英、东欧,但是因为国外一些发达 水平高,在五十年代末至六十年代初期开始使用计算机处理气象资料,我 理气象资料起步较晚,七十年代才开始将计算机应用于气象资料加工处理 因为受到计算能力的限制,短期气候预测技术无法进行大规模计算模拟, 低,这也是中国的短期气候预测技术以往相对落后的主要技术原因。 数据处理能力较 短期气候预测目前仍是世界性的难题,短期气候预测的许多理论问题至今仍没有解决, 特别是在存在太多不确定性的季风区【2 1 ,人们至今仍然对短期气候是否可以预测,以及预 测的方法进行研究、探讨【3 】。短期气候预测在中国经历了简单经验统计分析、数理统计、 动力气候模式等几个发展阶段1 4 1 1 5 1 1 6 】。就目前业务应用的方法归纳起来,气候预测方法可 以分为两大类【7 j :一类是基于资料统计分析的统计方法,另一类是基于气候系统变化规律 的动力方法。 统计学方法在短期气候预测中应用十分广泛,它比较客观、定量,是种很有用的工 具。长期以来,数理统计方法在预测研究和业务中发挥了重要作用,也在应用中取得了长 足的进展【8 1 ,它可以是简单的经验统计方法,也可以是数理统计的方法,还可以同天气气 候学的大气物理因子和非大气因子相结合,形成物理统计学的短期气候预测方法;它也可 以应用于流体力学,同气候动力模式相结合而形成动力一统计方法的短期气候预测预报方 法。因为短期气候预测不同于天气预报,它涉及的主要是大气圈,只要知道了大气的初始 状况,就可以用一套描述大气运动的方程组来预测未来的天气;气候预测涉及的是地球上 的5 个圈层,即大气圈、岩石圈、生物圈、冰雪圈和水圈。所用的方程组极其复杂,而且 从数学和物理上如何正确表征各圈层相互作用,还没有完全解决。因而面临着预测理论的 困难,所以短期气候预测问题十分复杂,它的复杂性促使实际应用中几类基本方法相互渗 透,相互结合,相互促进。 近3 0 年来,第一类方法在我国取得了长足的发展,气象统计方法在我国气象业务和科 研工作中占有重要的位置,特别是在数值预报产品的统计使用及中长期天气预报业业务中, 比如多元分析中的回归分析、典型相关分析、e o f 分析等统计方法成为气象预报和天气分 析不可缺少的工具。现阶段我国的短期气候预测主要还是应用各种经验和物理统计分析方 法,在国家“九五”科技项目中国短期气候预测的研究中对中国长期预报的准确率进 行了评估,结果表明,除夏季气温的预报水平稍高外,月、季气温及降水的预报评分大体 2 第一章绪论 在6 0 - 6 5 之间,单纯从预报准确率来讲,我国的长期预报水平接近或略低于国际水平, 这是我国在尚未有一套完整的数值模式条件下,主要依靠统计预报而取得的成绩。因此可 以说,统计预报确实在我国的长期预报业务中发挥了很好的效果和作用,经验统计方法正 在朝着更加客观化、定量化和自动化方向发展。 然而需要看到的是数值统计预报经过近一个世纪的发展,已经成为每天气象预报不可 缺少的重要基础和手段。在数值预报方面,人们发现:一方面,“单一的”确定性数值预报 水平的再提高变得越来越困难;另一方面,“单一的”的确定性数值预报的结果也很不稳定。 数值预报的这种“不确定性”主要来自三个方面初值误差,模式误差及大气的混沌特 性。由于观测的不准确( 包括仪器误差,观测点在空间上、时间上的不够密集引起的插值 误差) 和资料分析、同化处理中导入的误差,所得到的数值模式的初始场总含有不确定性, 换言之,气象分析资料永远只是实际大气的一个近似值,而实际大气的真正状态永远也不 可能被完全精确地描述出来。 数值预报中的关键部分大气模式是一个离散化的数值模型。它存在物理意义和数 学意义上的近似。数值预报模式所描述的大气过程并非“真实”的大气过程,“模式大气” 与“真实大气”存在着误差,而这种数值模式的预报误差随模式积分时间的延长而增加。 目前我国已有的预测方法很多都是将研究的重点放在对海洋、气象等观测资料进行的 处理方法上,如乌文奇【9 】等应用最优气候值方法,通过把握气候变化的内在规律进行气候 数据预测;董秀蒯1 0 1 等采用均生函数模型,对单一要素序列进行预测;覃志年i 川通过均生 函数模型将数据动态建模最后再进行拟合分析。这些方法有的是建立在数据为平稳型数据 的假定上,有的属于单一预测方式,然而单一预测方法在单步预测中由于其本身的局限性, 在缺乏预测因子拟合的情况下利用价值也很有限。 因此本系统拟通过对数据和预测方法两个方面分别作出处理,使其在无法获得预测因 子的情况下做一次性多步预测,以期对未来的气候状况尤其是气候的变化趋势作出更好的 把握。 首先考虑到气候系统本身属于复杂的非线性系统,具有不平稳性,因此需要研究将气 候数据进行平稳化处理。h u a n gn e l l 2 于1 9 9 8 年提出了一种新的信号分析方法经验模 态分解( e m p i r i c a lm o d ed e c o m p o s i t i o n ,e m d ) 。该方法从本质上讲是对一个信号( 或其导 数,视所需的分解精度而定) 进行平稳化处理,其结果是将信号中不同尺度的波动或趋势逐 级分解开来,产生一系列具有不同特征尺度的数据序列,每一个序列称为一个本征模函数 ( i n t r i n s i cm o df u n c t i o n ,u r n :) 分量,不同的分量成为平稳信号后,就使得后面的数据预测 等处理更加合理、有效。其次是在预测结果上,拟将三种出自不同种类不同性质的预测方 法( 支持向量机( s v m ) 、模糊聚类、均生函数逐步回归模型) 的结果进行数学处理,对 3 南京信息工程大学硕士学位论文 于实际问题进行单个或综合的实践检验,得出研究结果,判断在不同情况下各种方法的不 同适应情况,以及信号被平稳化后的预测效果及其详细原因,即进行数值集合预报,以期 能够得到更好的综合预报结果。 1 3 本文研究内容 本文的研究内容主要包括2 个方面:第一,统计分析广西全区近4 9 年来( 1 9 5 7 2 0 0 5 ) 的二月逐年平均气温资料,根据资料的时间序列性、非线性和模糊性,对各种预报方法进 行单独和综合的检验。第二,通过对我国短期气候预测方法应用现状以及对均生函数、支 持向量机、模糊集时间序列预测等三种方法在气候预测方面应用的了解,基于经验模态分 解( e m d ) 和集合预报技术分别进行算法改进和结果分析,通过广西全区1 9 9 5 2 0 0 5 年的两 份气候数据进行实验并检验结果,以判断其实用性。最终构建综合预报模型,进行气候预 测系统的开发。 1 4 本文的组织结构 本文内容共分6 章,各章的内容简单概括如下: 第一章,绪论。首先介绍了本文的研究背景和意义,并对当前各种基于统计预报的气 候时间序列预测的国内外研究现状进行了总结归纳,给出本文的研究内容与组织结构。 第二章,时间序列预测理论。介绍了时间序列预测的相关理论。首先介绍了预测和时 间序列预测的理论基础,提出了时间序列预测要求;接着分别介绍了本文所引用到的三种 时间序列预测模型:均生函数、支持向量机和模糊集时间序列预测。 第三章,基于经验模态分解和集合预报的算法改进。首先阐述本文所用的预测算法的 实现方式,然后介绍了两种改进算法,经验模态分解算法和集合预报技术。对经验模态分 解和集合预报的算法及其在本文中的应用进行了探讨。 第四章,预测实验及结果分析。对前文所述的算法和改进算法进行实验验证,使用广 西季节气温和降水资料作为实验数据,深入探讨了经验模态分解和集合预报对三种时间序 列预测方法的改进结果和存在问题,并分析了效果差异的各方面原因。 第五章,时间序列的e m d 分析及预测系统的设计与实现。本章分为两部分,第一部 分介绍系统的设计,针对系统的设计目标给出了系统各个功能模块,并详述了模块间的调 用关系。第二部分按照系统流程展示了系统运行时的各个界面。 第六章,总结与展望。总结了全文所做的研究,并给出论文存在的不足以及下一步研 究展望。 4 第二章时间序列预测相关理论 第二章时间序列预测相关理论 2 1 时间序列预测简介 2 1 1 预测的基本概念 预测就是通过调查和分析,对事物的动态和发展趋势事先做出估计和评价,其实质是 利用以往的经验或数据资料认识事物的规律,最终指出事物发展的趋势或事物在未来某时 段的状态。 虽然事物的未来发展过程总是由必然性推移和偶然性推移组合而成,但其过程却是连 续的,并且具有规律性,这就是我们赖以进行预测的依据。 生产生活中预测的一般过程如下: ( 1 ) 对收集到的信息,包括历史的、现在的、未来可能的数据,认真分析研究,找出 其内在联系; ( 2 ) 根据预测的目的和占有的信息,选择适当的预测方法; ( 3 ) 根据选定的方法进行预测; ( 4 ) 对预测结果予以估计和评价,如果能够进行实际验证,那么一定要分析预测的误 差。 其中第四条为本文的核心内容,一般情况下,由于未来尚无确定的信息可寻,因此对 于预测误差的分析只能在有限的范围内进行或根据各种经验加以估计,本文为了能够有效 的检测误差,选择降低原始资料长度,用实际值进行验证,使得能对预测方法在未来的表 现进行更合理的预判。 2 1 2 时间序列预测的基本概念 时间序列预测是用被预测事物过去和现在的观测数据,构造依时间变化的时间序列模 型,并借助于一定的规则来推测未来。时间序列分析的目的是根据系统的时间序列找出相 应系统的内在统计特性和发展规律,尽可能多地从中提取出我们所需要的准确信息。其基 本思想是根据系统有限的观测数据建立能够比较精确地反映时间序列中所包含的动态依存 关系的数学模型,并借以对系统的未来行为进行预测【1 3 】。 假设历史和现在时刻的观测值为x ( 1 ) ,x ( 2 ) ,x ( t q ) ,x ( d ,时间序列预测是对未 来时刻x ( t + t ) ( t 1 ) 的值进行估计,时间序列预测的数学模型如下【1 4 】: 5 南京信息工程大学硕士学位论文 x ( r + f ) = ( x ( 1 ) ,x ( r 一1 ) ,r ( 丁) ) + e ( t + ,) ,h l( 2 - 1 ) 式中,坟x ( 1 ) ,x ( 2 ) ,x ( t q ) ,x ( t ) ) 代表预测方法( 函数) ,t + t ) 表示随机噪声。t 为预测步数,当t = l 时,为单步预测;当t l 时,则为多部预测,本文选取t 为l o ,作l o 步预测。 需要指出的是,实际问题中要进行时间序列预测的事物都是十分复杂的,所以在预测 时,应采用多种方法,从不同角度进行预测,然后再对结果进行比较、评价,找出主导性 的预测判断。这较之单独一种预测作出的判断通常比较全面和可靠些。 2 1 3 混沌时间序列预测 l l 6 第二章时间序列预测相关理论 间序列预测模型的缺陷,对序列极值的拟合和预测会得到较为理想的效果。 均生函数逐步回归的基本概念是在建立多元回归方程的过程中,按偏相关系数的大小 次序将自变量逐个引入均生函数延拓矩阵也就是多元方程,对引入方程中的每个自变量偏 相关系数进行统计检验,效应显著的自变量留在回归方程内,循此继续选下一个自变量。 如果效应不显著,停止引入新自变量。由于新自变量的引入,原已引入方程中的自变量由 于变量之间的相互作用其效应有可能变得不显著者,经统计检验确证后要随时从方程中剔 除,只保留效应显著的自变量。直至方程不再引入和剔除自变量为止,从而得到最优的回 归方程。一般用来计算多元方程的方法时需要考虑到,在一个多元线性回归模型中,并不 是所有的自变量都与因变量有显著关系,有时有些自变量的作用可以忽略。这就产生了怎 样从大量可能有关的自变量中挑选出对因变量有显著影响的部分自变量的问题。 在可能自变量的整个集合有4 0 到6 0 个,甚至更多的自变量的那些情况下,使用“最 优”子集算法可能并不行得通。那么,逐步产生回归模型要含有的x 变量子集的自动搜索 方法,可能是有效的。逐步回归方法可能是应用最广泛的自动搜索方法。这是在求适度“好” 的自变量子集时,同所有可能回归的方法比较,为节省计算工作量而产生的。本质上说, 这种方法在每一步增加或剔除一个x 变量时,产生一系列回归模型。增加或剔除一个x 变 量的准则,可以等价地用误差平方和缩减量、偏相关系数或f 统计量来表示。 无疑选择自变量要靠有关专业知识,但是作为起参谋作用的数学工具,往往是不容轻 视的。通常在多元回归模型中,我们首先从有关专业角度选择有关的为数众多的因子,然 后用数学方法从中选择适当的子集,这些都是应用均生函数为基础进行时间序列预测需要 考虑到的问题。 2 2 2 均生函数逐步回归模型 均生函数逐步回归是这样一种方法,使用它时每一步只有一个单独的均生函数回归因 子引进或从当前的回归模型中剔除。e f r o y m o s o n ( 1 9 6 6 ) 编的程序中,有两个f 水平,记作 f i n 和f o m ,在每一步时,只有一个回归因子,比如说x i ,如果剔除它可能引起r s s 的减少 不超过残差均方m s e ( 即e s s ( n k - o ) 的f o m 倍,则将它剔除。 若剔除的变量需要选择,则就选择使r s s 减少最少的那一个( 或等价的选择f 比最小 的) 。用这种方式如果没有变量被剔除,则开始引进一个回归因子,比如x i ,如果引进它 后使r s s 的增加,至少是残差均方的f i n 倍,则将它引进。即若在当前模型加x i 项后,为 了检验p j = o 的f 比,f 氏时,则引进x i ,其次,若引进的变量需要选择,则选择f 比最 大的。程序按照上面的步骤开始拟合,当没有回归因子能够引进模型时,该过程停止,即 开始预测。 7 南京信息工程大学硕士学位论文 均生函数预测模型的应用流程如下图2 1 所示: 上 构造外延均生函数 上 得出逐步回归预测模型 上 构造预报方程 上 拟合值与实际值对比 上 厂、 应用预测 图2 1 均生函数动态预测模型应用示意图 2 3 支持向量机预测简介 统计学习理论( s t a t i c sl e a r n i n gt h e o r y ,s l a b 是一种专门研究小样本情况下机器学习规 律的理论。v a p n i k 等人从六、七十年代开始致力于此方法的研究,1 9 8 1 年,v a p n i k 和他的 合作者提出了s v m 的重要基础理论v c 维,1 9 8 2 年,v a p n i k 提出了具有划时代意义的结 构风险最小化原则。到九十年代中期,随着其理论的不断发展和成熟,统计学习理论开始 受到越来越广泛的关注。1 9 9 5 年,v a p n i k 首次提出来了支持向量机( s u p p o r tv e c t o rm a c h i n e s v m ) 这一概念。s v m 是一种基于统计学习理论的模式识别方法,主要应用于模式识别领 域。由于当时这些研究尚不十分完善,在解决模式识别问题中往往趋于保守,这些研究一 直没有得到充分的重视。直到2 0 世纪9 0 年代统计学习理论的实现和神经网络等较新兴的 机器学习方法的研究遇到一些困难,比如如何确定网络结构的问题、过学习与欠学习问题、 局部极小点问题等,使得s v m 迅速发展和完善。现在己经在许多领域都取得了成功的应 用。考虑到支持向量机具有强大的处理非线性问题的能力,以及良好的自学习、自适应等 性质,因此本文其中一种经典时间序列预测方法即使用支持向量机回归算法来实现。 8 第二章时间序列预测相关理论 2 3 1 支持向量机的概念和基本思想 s v m 方法的基本思想是:基于1 9 0 9 年m e r c e r 核展开定理,可以通过非线性映射,把 样本空间映射到一个高维乃至于无穷维的特征空间( h i l b e r t 空间) ,使在特征空间中可以应 用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。 支持向量机是从线性可分情况下的最优分类面发展而来的,也是统计学习理论中最实 用的一部分,支持向量机是统计学习理论的核心和重点。从线性可分模式分类的角度看, 支持向量机的主要思想是建立一个最优决策超平面,使得该平面两侧距平面最近的两类样 本之间的距离最大化,从而对分类问题提供良好的泛化能力。 就分类、回归等问题来说,也许在低维样本空间无法线性处理的样本集,在高维特征 空间却可以通过一个线性超平面实现线性划分( 或回归) ,而与特征空间的线性划分( 或回归) 相对应的却是样本空间的非线性分类( 或回归) 。降维( 即把样本空间向低维空间做投影) 是人 们处理复杂问题常用的简化方法之一,这样做可以降低计算的复杂性。而升维,即向高维 空间做映射,一般只会增加计算的复杂性,甚至会引起“维数灾_ 因而人们很少问津。这 样就会出现如何求得非线性映射砂和解决算法的复杂性的问题。s v m 方法方便地解决了这 个难题:由于应用了核函数的展开定理,所以根本不需要知道非线性映射的显式表达式:由于 是在高维特征空间中应用线性学习机的方法:所以与线性模型相比几乎不增加计算的复杂 性,这在某种程度上避免了“维数灾”【l 引。 支持向量机方法是一种新颖的小样本“机器”学习方法,比较适合解决本质上非线性 的回归问题,其具体优点如下【1 9 1 】f 2 0 2 】: ( 1 ) 支持向量机的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持 向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾”,非

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论