(机械制造及其自动化专业论文)组合预测方法研究.pdf_第1页
(机械制造及其自动化专业论文)组合预测方法研究.pdf_第2页
(机械制造及其自动化专业论文)组合预测方法研究.pdf_第3页
(机械制造及其自动化专业论文)组合预测方法研究.pdf_第4页
(机械制造及其自动化专业论文)组合预测方法研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(机械制造及其自动化专业论文)组合预测方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 组合预测方法研究 研究生姓名:张疆涌 导师姓名:许飞云教授 学校名称:东南大学 预测是一门研究范围广泛的综合性学科,被预测的对象往往是一个复杂的社会系统或经济系 统,由于研究对象的复杂性,多个模型经常可以对同一个研究对象作出预测,但预测精度都有待提 高,组合预测方法已被证明其预测效果优于单个预测模型,但是目前依然缺乏有效的单模型选择以 及单模型组合的规则和方法。 本文首先研究了基于预测模型的长期误差表现、近期误差表现和近期误差进步表现三个独立因 素分析的综合权组合预测方法,该方法计算简单,数学意义直观,便于在预测实践中积累专家经验 和调整修正权值,另外,由于三个因素是独立的,可以建立多时步变权值组合预测,同时为寻求更 优的变权值组合预测提供了可能。 其次,文中研究了基于遗传算法的最大误差最小化组合预测方法,运用遗传算法求得加权值, 其最大预测误差明显小于灰色模型、a 鼢以a 模型、人工神经网络模型和回归模型,可有效避免最大 预测误差所造成的错误决策。 针对上述方法,文中建立了上海市用电量、我国钢产量、我国人口、我国人均净用电量等组合 预测模型,结果表明,本文所建立的组合预测模型其预测精度优于现有的单模型以及组合模型的预 测结果,表明本文所提方法是可行的和有效的。 关键词:预测模型;组合预测;综合权组合预测;最大误差最小化预测;遗传算法 东南大学硕士学位论文 s t u d yo nt h em e t h o d o l o g yo fc o m b i n e df o r e c a s t i n g b y z h a n gj i 锄g - y o n g s 删i s e db yp r o f c s s o r ) ( uf e i - y 姗 s o u t i l e a s tu n i v e r s 姆 p r e d i c t i o ni sac o m p r e l l e 鸺i v ed i s c i p l i 舱s “i d i e di ne x t e n s i v e 砌g e f o 陀c a s t i n go b j e c ti so 舭na c o m p l i c a t e ds o c i a ls y s t e m0 re c o m i cs y s t e m b e c a u s eo ft h ec o m p l e x 时o ft h eo b j e c t st ob cp r e d i c t e d , m 孤ym o d e l sa 他p r o p 0 dt o l v et l l ep 陀d i c t i o np r o b l 锄,b u tt l l ep r e i c i s i o no f e 孔hm o d e la nn e e dt ob e i n l p r o e d c o m b i n e df o r c c a s t i n gm e t h o dh 笛p f o v e dt ob es u p e r i o ft ot h es i n 西em o d e l sb u t 也e r ea r ea l s o l ko ft h em l 终a n dt l l em 砒o d m l e c t i n g 曲昭s i n 翻em o d e l s 签w e n 舔c o m b i n i n gt t l e 辩l e c 倒s i n g l e m o d e l s f i r s t l y a 舯廿l e t i c a lw e i g h tc o m b i n e df o r c a s t i n gm o d e ib a 辩d t l l i 优i n d e p e n d e n t 柚a l y s i sf k t o 硌, 岫i s ,t h el o n gp e r i o d 踟0 fp e 响咖锄c e ,n l er e c e n te n 饼p e 雨肿柚c e 锄dn l er e c 明te n o rp r o g r e 豁 p e r f l 0 册a n c e ,i s 聆s e a r c h e d 砌t hm es i m p l ec o m p u t a t i o n 锄di n t u i t i v em a t h e m a t i c a lm e 锄i n go fn l em o d e l , i ti se 勰i e rf o re x i ,e r t s 幻a d j u s t i i l g 也ew e i g h ta n da c c u m u l a t i n ge x l 圮r i e n c ei i if 0 他c 笛t i n gp r t i c e i i i a d d i t i o i l 硒t i i et l l r f 犯t 0 幅a 陀i n d e p i d e n ti i it l l em o d e l ,m u l t i - s t 叩v a r i a b l ew e i g h tc o m b i n e df o r c 舔t i n g m o d e lc 锄b eb u i n 锄d 锄o p t i m i z e dv 撕a b l ew e i g h tc o m b i n c df o l 优a s t i n gm o d e im a ya l s 0b ef o u n d s e c o n d l y ,t h em e 1 0 do fm i n i m i 嚣dm a 妇m u me r r o rc o m b i n e df o r e c a s t i n gi ss t u d i e d ,t h eg e n e t i c a l g o r i t l l mi su s e dt oo b t a i nt h eo p t i m 啪w e i g h to ft l l ec o m b i n e dm o d e l t h em a x i m u mp 陀d i c t i o ne r r o ro f 协em o d e lp r o v e d0 _ b v i o l l s i yl e 豁t 1 1 觚也a to ft h e 伊a ym o d e l ( g m ) ,锄n o - r e g r e 鹞i v em o v i n ga v e m g e ( a 卧伙) m o d e l ,a n i f i c i a ln e u m li l e _ t w o d c ( a n n ) m o d e l 觚d 把秒嘟i m o d e l 1 1 h e r e f 0 他,t h em i s 乜妇si n d e c i s i o n - m a l ( i n gd u e t 0m a ) 【i i l l 哪p 他d i c t i e 仃o rc 柚b ee 腩c t i v e i ya v 0 i d e d b 舔e do nt h ep r o p o s e d 廿l em e t h o d sa b o v e ,n l ed i f f e 陀n tm o d e l st op 他d i c ts h a n g h a ie l e c t r i cp o w e f c o l l s u m p t i o i l t i l e 锄u a io u t p u to fs t e e l i l lc h i n a ,n l ep o p u l a t i i i lc h i i l a 锄dt h ee l e c t r i cp o w e r c o i l s u m p t i o np c rp e f s 0 ni nc h i i i aa 他e s t a b l i s h e df i n a l l y t h c 陀s u l t ss h o wt h a tt h ec o m b i n e df 0 r e c a s t i n g m o d e l sa r es u 耐0 rt ot 1 1 es i n 舀em o d e l s 缸i dt h ee x i s t i n gc o m b i n c dm o d e l s ,t h em e t h o dp r o p o s e di nt l l e p a p e ra r ef e 豳i b l e 锄de 仃e c t i v e 1 ( e yw o r d s :f o r e c a s tm o d e l :c 啪b i n e df o r e c a s t i n g ;s y n t h e t i c a lw e i g h tc o m b i n e df o r e c a s t i n g ;m i n i m i z e d m a x i m u m 啪rf o r c c s t i n g :g e n e t i ca l g o r i t 胁 1 l 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学 位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。 本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外, 允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文 的公布( 包括刊登) 授权东南大学研究生院办理。 研究生签名:监导师签名日期:叫:吁 第l 章绪论 1 1 课题背景与意义 第l 章绪论 预测技术是对事物未来发展状况与趋势进行的推测和判断的重要手段,自人类有文明历史以来, 就存在了预测实践活动。古代社会中,人们通过各种经验方式预测地震、天气、粮食收成、社会变 迁、人生顺逆等等i l 】,而现代社会特有的人口问题、政治危机、经济危机、能源危机、恐怖活动等 不确定因素,使得现代社会人们预测的内容除上述范围外,还涉及到诸如经济、能源、社会发展与 规划等等,现代预测的范围更加广泛,手段更加科学。 在人类早期的预测实践活动中,往往根据个人或者社会群体口耳相传的经验、阅历、学识以及 智慧等,通过类比、分析和综合的方法对未来做出直观判断,直到2 0 世纪初期才逐渐出现有基于数 学的定量预测【2 j 。一般认为,完整的定量预测方法是在2 0 世纪3 0 年代末创立嘲。在5 0 年代和7 0 年代之 间,各种基于数学方法的预测理论逐渐诞生和成熟。经过三、四十年的发展,目前,形形色色的预 测方法已达数百种,其中最常用的也有几十种1 4 】。 目前,预测学已发展成为一门综合性的学科,它突破了自然科学和社会科学的界限。已广泛地 应用于人口、环境、资源、教育、金融、交通运输、城市规划、医药卫生、材料科学、科技管理等 领域。 预测技术可分为定性预测和定量预测两大类,其中定量预测采用数学模型,可以量化系统发展 的趋势和状态,日益得到人们的重视,但是预测模型的选择和建立迄今为止仍然缺乏必要的理论指 导,由于预测问题本身的复杂性,尽管许多情况下,多种数学模型均可以对同一事物进行预测,但 预测精度往往难如人意,所以,对于预测方法和技术的继续深入研究,探索新的有效的预测理论和 方法,仍然是众多学者不断探求的目标。 组合预测是一种融合多种预测模型,综合利用各种模型所提供的信息进行适当的组合,从而形 成了预测精度更高的预测模型的一种方法。现有研究表明组合预测技术可以有效地提高预测的精度 和稳定性。最简单的组合预测方法就是对不同模型的预测结果进行加权组合,虽然众多学者已经提 出了各种各样的加权系数求解方法睁 】。但目前为止,还没有一种适用于任何情况下都有效的加权系 数确定方法,如何解决这一问题尚有待迸一步深入研究。 在衡量组合预测的效果的定量标准方面,目前,大多数研究采用基于预测误差的度量方法,比 如绝对误差、相对误差、最小方差等等,但是,在预测实践中,最大误差往往引起决策的较大失误, 因此有必要研究减小最大误差的组合预测。 东南大学硕士学位论文 1 2 预测技术国内外研究现状 自2 0 世纪3 0 年代末创立基于数学方法的预测理论以来,经过各行各业预测实践和理论工作者的 总结,目前已经发展诞生了许多种预测方法,一般来说,预测方法可以做如下分类。 1 2 1 预测方法分类 按照预测的性质、预测不同的角度,可以把预测方法分为如下几类: ( 1 ) 按照事物质和量的规定性,可以分为定性预测方法和定量预测方法1 2 j 。 定性的预测方法有赖于经验的积累,常见的定性预测方法有德尔菲法( d e l p h i ) 、类比法等l 阍。依 据各种数学模型进行定量分析的方法为定量方法,定量预测法的优点是偏重于预测事物未来发展数 量方面的准确描述,但定量的预测方法有赖于建立合理的数学模型。定量的预测较少依赖于人的知 识、经验等主观因素,而是更多地依赖于预测对象客观的历史统计资料,利用电子计算机对数学模 型进行大量的计算而获得预测结果。本文研究的内容主要是定量预测方法。 ( 2 ) 按照预测的时间,可以分为长期预测、中期预测和短期预测 比如电力负荷预测、天气预测、地震预测、经济预测等都有长期预测、中期预测和短期预测的 区别。 ( 3 ) 按照预测模型函数类型来分,线性模型预测和非线性模型预测。 回归分析、时间序列分析等属于线性模型预测,神经网络模型等分析属于非线性模型预测。线 性模型预测有明确的数学表达式,有利于积累预测经验,调整参数,非线性模型预测对与复杂系统 有较好的拟合性,但神经网络等非线性模型预测缺乏明确的数学表达式,不利于积累专家预测经验。 ( 4 ) 从分析数据的方式来看,可以分为因果分析型、类比分析型和统计分析型预测【1 她们。 因果分析型通过研究事物的形成原因来预测事物未来的发展变化;类比分析通过类比来预测事 物的未来;统计分析通过一系列的数学方法,对事物过去和现在的数据资料进行分析,去伪存真, 由表及里,揭示出历史数据背后隐藏的必然规律,给出事物的未来变化趋势。 ( 5 ) 按照预测模型的综合性,可以分为单模型预测和优选组合预测。 常用的单模型预测方法有移动平均法、指数平滑法、线性回归法、非线性回归法、马尔科夫预 测法、投入产出预测法、灰色预测法、b o x - j e n k i n s 模型法、经济计量模型法、干预分析模型法以及 近年来发展起来的神经网络法、聚类分析法、数据挖掘法、模糊推理法、小波分析法等等。常用的 组合预测方法主要有:固定权值、变权值和最优组合预测等。 1 2 2 定量预测的模型检测 定量预测方法中对模型的评价和测试都是定量的。本文依据如下评价方法: ( 1 ) 模型检测准则 传统的预测误差的评价方法有绝对误差、相对误差、平均绝对误差、平均相对误差、文献【2 1 】 2 第l 章绪论 提出内蕴误差评价方法区别对待模型建立区和预测区误差以及误差区别对待;文献【2 2 构建了一种 基于统计分析的负荷规律性评价,对预测效果的评价方法有所贡献,是有益的尝试。 ( 2 ) 模型测试方法 定量预测中,基于一段时间的观测数据建立数学模型,预测后续的一端时间的值,然后通过实 际值与预测值比较,检验模型的实用性,最后对未来数值作出预测。一般在定量预测实践中,模型 建立区和预测区划分如下( 图卜1 ) : 图1 1 模型建立区和测试区分段 预测既是科学,又是艺术。说它是科学,是指它依赖于科学的理论和方法、可靠的资料、先进 的计算技术等等;说它是艺术,是指它还依赖预测者提出的假设、选择方法、利用资料的技巧和运 用自己学识、经验、获得的情报进行判断的能力田】。 随着人类社会的不断进步,科学工作者所涉及的系统越来越庞大,越来越复杂,对预测技术的 适应性和预测理论的要求越来越高,难度也越来越大。由此产生了针对系统不确定性( 模糊性,灰色 性,未确定性等) 的不确定性系统预测理论和方法,以及综合利用各种预测方法所提供的信息,尽可 能地提高预测精度的组合预测方法。所以组合预测技术是目前预测理论两个比较有代表性的发展方 向之一。组合预测是以单项预测基础上的建立的,下面简单介绍单模型预测方法和组合预测方法。 1 2 3 单项模型预测方法 常见的单项模型预测方法如下: ( 1 ) 时间序列模型法 在众多定量预测模型中,时间序列模型是线性模型中精度比较高,应用较广的模型之一。时间 序列分析最早由g u y u l e 提出a r 模型用于预测,此后,逐步发展了a r 姒模型、多维a r m a 模型、 非平稳时序模型、非线性时序模型等等1 2 4 1 。时间序列被广泛应用于平稳数据的建模和预报,利用现 代统计学和信息处理技术寻求随机事件的统计规掣2 5 1 。但对于具有趋势项的非平稳时间序列,无法 直接建立a r 姒模型,因而要先进行时序的平稳化,提取趋势项,然后再建立a r ( n ) 模型进行预测。 缺点是对于趋势项的提取,不论是采用多项式还是指数函数的形式,都是用一种确定的函数形式来 描述随机的数据序列,常带有一定的主观性,预测的外延性也不好1 2 6 l 。 3 东南大学硕士学位论文 ( 2 ) 回归分析法 回归分析是寻找自变量与因变量之间存在的相关关系及其回归方程式,即确定适当的函数类型 和响应参数,拟合一条最佳曲线,将此曲线外延至未来适当时刻,在已知自变量取值时得到因变量 的预测值。为预测对象选择适当的回归变量是运用回归分析法预测的关键。该方法的优点是模型可 以直接反映研究对象和不同影响因素的关系。模型的缺点是其不能结合模型中没有考虑到的因素f 2 7 1 。 ( 3 ) 指数平滑法 指数平滑法是一种曲线拟合法,实际上是对历史数据采取限定记忆,其预测思想是:不同历史时 期的数据对未来数据的影响是不同的,历史时间越近的数据对未来数据的影响越大,反之就越小, 这就是预测中的所谓“近大远小”原则,所以对于过去很久的数据,不必作很精确的拟合。这种方 法经常被用于呈现水平、线性、二次曲线趋势变化的情况,其有关数学模型有:一次指数平滑、二 次指数平滑、三次指数平滑等。这种方法的的优势在于分析时间序列数据时,它允许较近期的数据 有较大的权值,此外,可以增加新的数据使预测适合新的情况。但是指数平滑法则受季节性、周期 性影响程度大若有这些因素的存在,则指数平滑法不能很好的预测【2 8 】。 ( 4 ) 趋势外推法 数据的变化一方面有其不确定性,但在一定条件下,又存在着明显的变化趋势,一旦找到了数 据的变化趋势,按照该变化趋势就能对未来数据做出判断,这就是趋势外推技术。 应用趋势外推法有两个假设条件:假设数据没有跳跃式变化;假定数据的发展因素也决定数 据未来的发展,其条件是不变或变化不大。选择合适的趋势模型是应用趋势外推法的重要环节。 该方法假定预测对象为只时间为,则j ,为f 的函数,即】,= 尺,) ,该函数可以为线性函数、对数函 数、指数函数,也可以为其它的数理逻辑函数。这些预测技术的共同特点是作趋势外推,不对其中 的随机成分做统计处理。趋势外推法的优点是:只需要历史数据、所需的数据量较少。但是趋势外 推模型对于序列中的非趋势分量,即趋势值与实际值的离差序列却没有进行描述,这使得趋势外推 模型存在着序列相关的可能性时,不能完全的反映时间序列的变化特征印l 并且传统的非线性回归模 型趋势外推发散快、误差大删。 ( 5 ) 灰色预测法 灰色数列模型是邓聚龙教授1 3 1 l 在上世纪8 0 年代提出的一种预测模型,该模型采用对数列建立微 分方程的办法,对无规则的原始灰色数列进行分析和预测。灰色数列模型将无规律的原始数据进行累 加生成,得到规律性较强的生成数列再重新建模,由生成模型得到的数据通过累加生成的逆运算一 累减生成得到还原模型,由还原模型作为预测模型。由于它所需因素少,模型简单,在我国经济、医 学、农业等领域都得到了广泛应用1 3 2 j 。由于灰色预测方法是一种指数增长模型,当生成数据呈严格 指数增长时,此方法具有预测精度较高,不考虑变化趋势,结果可以检验等优点。但是,当影响数 据的因素较多,且生成后不一定按指数规律增长,有时有波动性变化时,其预测精度不能令人满意, 适用范围受到很大限制例; 灰色预测方法在预测中,数据离散程度越大,即数据灰度越大,则预测精度越差;另外,灰色 数列模型真正具有实际意义、精度较高的预测值,仅仅是前面的几个数据,这样对于后几期的预测 值将会有较大的偏差;其次,其预测精度随时间增加而降低。数据离散程度越大,则预测精度越差, 4 第l 章绪论 模型对序列数据出现异常的情况也很难加以考虑州。 ( 6 ) 神经网络法 人工神经网络模型产生于2 0 世纪4 0 年代,在1 9 8 6 年,r 硼e h a r t 和m cc 1 e 1 1 a n d 提出了b p 算 法,使得神经网络方法应用范围大大拓宽p 5 1 神经网络模型具有高度的非线性映射能力,能以任意 精度逼近非线性函数,因此较适合于一些复杂问题的建模。其自学习和自适应功能是常规算法和技 术所不具备的哪i 。有文献证明在住宅需求预测方面,神经网络模型优于其它模型1 3 7 l 。另有文献表明 在粮食产量预测方面,神经网络模型优于a r i m a 模型【3 8 】。但是,b p 神经网络在实际计算中,也存 在一些问题:( 1 ) 计算量大,反向传播的计算过程收敛速度较慢,一般需要成百上千次的迭代计算; ( 2 ) 存在能量函数的极小值,存在学习速度慢和易陷入局部极小点等问题;( 3 ) 模型复杂,拓扑结 构较难确定。隐层神经元个数和连接权的选取往往要靠经验;( 4 ) 网络的收敛性与网络的结构有关 等。 神经网络法实质上是把大量的数据交给按一定结构形式和激励函数构建的人工神经网络进行学 习,然后在给出未来的一个输入的情况下,由计算机根据以往。经验”判断应有的输出。人工神经 网络模型有多种形式,预测中用得较多的是b p 网络和r b f 网络。神经网络用于预测,其关键工作在 于选择样本空间,样本空间若代表了所有变化模式,那么,网络通过训练后进行预测,适用性强、 精度高,反之,则某些情况下精度下降。 ( 7 ) 模糊推理法 自1 9 6 5 年美国控制论专家l 、a 、z a d e h 教授创建模糊集合( f u z z ys e t ) 理论以来,在众多国 内外学者努力之下,已解决了许多实践中的难题,特别在决策研究中已展示了它的巨大威力模 糊理论是介于逻辑计算和数值计算之间的一种数学工具,形式上利用规则进行逻辑推理,但其逻辑 取值可以在o 与1 之间连续变化,采用数值的方法进行处理。由于模糊集理论适合描述广泛存在的 不确定性,同时具有强大的非线性映射能力,能够在任意精度上一致逼近任何定义在一个致密集上 的非线性函数,并且能够从大量的数据中提取它们的相似性,这些特点正是进行短期预测所需要的 而其它方法所欠缺的优势所在1 3 9 j 。 目前,模糊推理和神经网络相结合的方法也成为了一个研究热点和发展趋势,它有机结合了各 自的优点,更具有智能性,在处理预测问题方面显示出了一定的优势。 ( 8 ) 小波分析法 小波分析是近年来发展起来的一种用于信号分析的数学方法。小波分析方法吸取了现代分析学 中诸如泛函分析、数值分析、f o u r i e r 分析、样条分析、调和分析等众多分支的思想,具有广泛的应 用性,已在信号处理、图像处理、模式识别、地震预测、状态监视等多个学科领域中得到了应用。 小波分析是一种窗口大小固定、形状可变的时频局部化信号分析方法,即在低频部分具有较高 的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率。 使用小波分析预测即是对序列进行小波变换,将序列分别投影到不同的尺度上,在此基础上, 采用其他负荷预测的方法对不同的子负荷序列分别进行预测,最后通过序列重组,得到完整的预测 结果i 舳l 。由于各个子序列的周期性更为明显,其精确性比直接用原时间序列进行预测有一定改进。 总体看来,单项预测方法的研究现状主要有如下几个特点: s 东南大学硕士学位论文 预测模型从简单到复杂:传统经典预测方法在一定条件下仍具有良好的预测效果。 智能技术用于负荷预测:神经网络、模糊推理等智能技术以及不少新预测理论、数据分析方法引 入到负荷预测中 影响负荷变化因素的计及:不断挖掘和充分考虑影响研究对象变化的各种因素,以进一步提高预 测准确率。 有关综述中提到1 2 】:随着人类社会的不断进步,社会对预测技术的适应性和预测理论的要求越 来越高,难度也越来越大。由此产生了不确定性系统预测理论和方法,以及综合利用各种预测方法 所提供的信息,尽可能地提高预测精度的组合预测方法。所以组合预测技术是目前预测理论两个比 较有代表性的发展方向之一。 1 2 4 组合预测方法 1 9 6 9 年j m b a t e s 和c w j g r 觚g 盯对预测方法进行了系统的研究1 4 舶,在运筹学季刊中第一次提 出组合预测方法,开始了对组合预测的系统研究,引起了预测学者的重视。7 0 年代以后,组合预测 的研究逐渐被预测工作者所重视,发表了一系列关于组合预测的论文。目前,组合预测已成为预测 领域中的一个重要的研究方向,引起了不少学者的兴趣【4 。 组合预测法主要是各种预测算法的组合,选择几种较好的预测方法优化处理、取长补短,达到 进一步提高预测精度并使之实用化的目的。1 9 6 9 年j m b a 她和c w j g 瑚g e r 在对预测方法进行系 统研究的基础上,提出了组合预测的概念和方法【4 御。其中美国加利福尼亚大学c w j g r 姐g e r 教授, 在2 0 0 3 年获得了诺贝尔经济学奖,他对组合预测方法的评价是【4 3 l :“该方法提供了一种简便而实用 的途径,可能产生更好预测效果”。 组合预测在国外称作c 伽b i n 鲥f o r e c a s t i n g 或c 鲫b i 鹏d 触c a s t i n g 。国内也有人称为综合预测。 自j m b a t e s 和c w j g 删毽e r 教授提出组合预测以来,不断有学者研究组合预测1 4 2 卅。1 9 8 9 年,国 际预测领域的权威学术刊物j o 啪a lo f f o r e c :a s t i n g 出版了组合预测的专辑【4 8 l ,充分说明预测领域 对组合预测的重视。 1 组合预测方法的分类 组合预测集结各单项预测方法的特点,它可以从不同的角度进行分类。根据其目标和特点不同, 大体上可从如下几个角度分类【5 l : ( 1 ) 按组合预测与各单项预测方法的函数关系,组合预测可以分为线性组合预测和非线性组合 预测。 设预测对象存在k 个单项预测方法,第i 个单项预测方法的预测值为】,f ,( i = l ,2 ,k ) ; 若组合预测值为】,。,满足 】,c = 缈l 】厂l i l - 2 】,2 + + q 】,i 则称该组合预测为线性组合预测。其中q ,吃,q 为各种预测方法的加权系数- 6 第l 章绪论 若组合预测值j ,满足 】,c = ( 】,l ,】,2 ,】,i ) 其中矽为非线性函数,则称该组合预测为非线性组合预测。 文献【4 7 】提出了基于神经网络的组合预测方法。文献【5 0 】通过几种线性和非线性组合预测的方法 比较,认为神经网络是最优的,但是,实践中,神经网络方法由于有网络结构不易确定,过拟合等 缺点,限制了它的应用 ( 2 ) 按组合预测加权系数计算方法的不同,组合预测方法可以分为最优组合预测方法和非最优 组合预测方法。 最优组合预测方法的基本思想就是根据某种准则的构造目标函数,在一定的约束条件下求得目 标函数的最大值或最小值,从而求得组合预测方法加权系数。最优组合预测方法一般可以表示成如 下数学规划问题: m a x ( m i n ) 恻q ,吼,吼) 盯惜羔国 其中q ( 缈i ,缈2 ,q ) 为目标函数,国i ,2 ,吼为各种预测方法的加权系数。 非最优正权组合预测方法就是根据预测学的基本原理,并力求简便的原则来确定组合预测的权 系数的一种方法。具体地说就是根据各个单项预测模型预测的误差与其权系数成反比的基本原理, 给出组合预测的权系数的计算公式。 ( 3 ) 按组合预测加权系数是否随时间变化,组合预测方法可以分为不变权组合预铡方法和可变 权组合预测方法。 不变权组合预测方法就是通过最优化规划模型或其它方法计算出各个单项预测方法在组合预测 中的权系数。假定它们不变,并用这个权系数进行预测。 所谓可变权组合预测方法就是组合预测加权系数随时间变化而变化。一般来说,可变权组合预 测优于不变权组合预测。 ( 4 ) 按组合预测的前后时段来分,组合预测方法可以分为串联组合预测和并联组合预测。 串联组合预测法是过程组合的方法,即在整个预测过程中,先对预测对象的不同分量或预测阶 段采用不同的技术方法进行分析和预测,再将这几部分的结果合成。并联组合预测是结果组合的方 法,即将几种预测方法所得的预测结果选取适当的权重进行加权处理,最终结果是各种方法预测结 果的加权和。本文研究的主要是并联组合。 2 组合预测方法的特点和模型测试 由于每一个单项预测方法都从不同规律的角度对事物的未来发展提供了估计值,也就是说从不 同侧面提供了有用的信息,组合预测方法是建立在最大信息利用的基础上,融合多个单项预测的信 7 东南大学硕士学位论文 息,得到比单项预测模型更高的预测精度。因此,在大多数情况下,通过组合模型可以达到改善预 测结果的目的。 预测实践中,一般在评估各单项模型的基础上,制定出组合预测的方案,然后检验组合预测的 效果,模型的好坏,归根到底是模型预测性能的好坏,所以模型的优劣评价不能在建立模型的窗数 据段内,而应该是在模型的预测区,这样,模型预测的时间序列可分为单模型建立区、单模型检验 及组合模型建立区、组合模型测试区、预测区等几个区段( 图1 2 ) 。 图l - 2 模型建立区和测试区分段 目前,组合预测的应用的主要方面是简单加权、最优加权和变权值组合预测。固定权组合预测 有等权组合、按误差绝对值倒数加权p ”、按平均相对误差加权【5 2 1 、按灰色关联度加权【5 孓5 4 1 、按方差 倒数加权脚l 等。 在组合预测方法的研究中,最优组合预测方法的研究较多,最优加权一般是根据一定准则,求 取误差某种表达形式的最优值,最常见的有:基于方差最小准则、基于误差平方和最小准则i 卯侧、 基于相对误差和最小准则、基于误差绝对值和最小准则1 6 嘶1 】等。 文献【6 2 】提出基于三个范数的组合预测方法,其中厶范数的实质是基于误差绝对值和最小准 则,厶范数的实质是基于误差平方和最小准则,而基于工。范数的预测方法,在现有文献的实际预 测中应用的却很少,文献【6 3 】提出采用相对误差的l 范数准则组合预测石油价格,但没有预测数据 实例支持。究其原因,l 范数的组合预测计算方法较为复杂,实际上,工。范数组合预测的数学意 义是预测最大误差的最小化,这恰恰是预测工作者比较关心的,因为,最大误差的过大往往造成决 策中的较大失误。所以,有必要研究基于最大误差最小化原则的组合预测的更加快速更加有效的求 解计算方法。 文献【6 4 】认为由于最优组合预测的目标函数的建立是严格依赖于最优准则,不同的准则下建立 不同的组合预测模型。每种准则都有其优缺点,在实际问题中,面对那么多的不同准则,实际工作 者如何选择一个最适合的准则来建立其目标函数? 如果说凭借预测者本人的知识结构和工作背景来 选择,就不可避免带来主观因素的影响,所以最优组合预测准则本身最优性也是一个不容忽视的问 题。 2 第l 章绪论 在权重可变性的问题上,目前的最优组合预测模型的权重的确定也大多集中在不变权重问题上, 而时变权重方法显然更为科学。常见的变权值组合主要是不断吸收最新的观测数据进行滚动的加权 组合,其组合方法与固定权、最优加权方法类同。大多数变权值组合在加入最新的观测数据建立模 型的时候,将最新观测数据和以前的观测数据同样对待,而事实上。事物发展一般总是受最新的因 素影响最大,另外,除考虑误差值之外,误差的变化趋势也应该考虑,文献【6 5 - 6 6 】考虑到最近一次 观测值的误差值和误差发展趋势,预测效果较好,但它们都是把前一次误差和误差的变化率经过模 糊运算后得到一个综合的参数,然后再与基本组合权相乘,再次得到一个参数系数,最后加权,这 样做虽然在最后加权考虑中有前一次的误差的大小和变化的因素,但反过来,从最后加权看各个因 素的组成却不直观、各成分方法使用上也不均等,更进一步的改进算法有困难。另外,采用模糊算 法增加了计算量,模糊算法的规则有不完善性,即规则过多,会大量增加计算机存储空间和计算量, 规则过少,则会因有些因素考虑不到,预测效果往往不好,因此,有必要研究考虑因素更加全面、 意义更加明确和有改进余地的综合变权值组合预测。 综合以上文献分析,在误差评价方法、最优组合预测准则的确定、变权值组合预测的优化等方 面都存在不足,有待进一步深入研究。探索已有准则( 比如最大误差最小化准则) 的组合预测的求 解方法也很有必要。另外,在预测模型越来越复杂的今天,寻求有效的、简洁的、数学意义明显、 计算量小的赋权方法,仍然有其价值。 1 3 本文主要研究内容 本文在组合预测过程中对参与预测的各种单项模型的优劣从模型的长期误差表现、近期误差表 现和近期误差进步表现三个要素全面考虑,考虑了最新观测数据对预测值的影响以及单项模型预测 误差的发展趋势,研究了三因素并列考虑的改进的综合权组合预测,通过对我国能源消耗量、我国 钢产量、上海市历年用电量、我国人口增长数量、我国能源消耗量、我国人均净用电量等预测实例 预测比较,验证改进的综合权组合预测方法的有效性。 具体做法是:选取目前应用较为广泛的回归模型、时间序列模型、神经网络模型、灰色模型等 单项进行预测,然后采用等权、不等权、最优加权、滚动变权等不同的方法进行不同组合预测,最 后与改进的综合权组合预测比较。 由于在预测实践中,人们在关心平均误差、相对误差的同时也非常关心预测的最大误差出现情 况,本文研究了最大误差最小化的预测问题,并利用遗传算法优化其组合权重。 9 东南大学硕士学位论文 第2 章组合预测的基本原理 本文把组合预测按照简单组合预测、最优组合预测、变权值组合预测分类分析,并与综合权组合预 测比较,下面简单介绍常见的简单组合预测、最优组合预测和变权值组合预测方法。 2 1 简单组合预测 2 1 1 等权平均组合预测 等权平均组合预测法是一种常用的组合预测方法。 设i ( - l ,2 ,l ( ) 为第i 个模型的预测值,如果使用代表组合预测值,则等权平均方法得到的组 合预测值为 丸:! 争多, 后智 ( 2 1 ) 这种方法不需要了解单一的预测值的预测精度,也不需要进一步知道单一的预测误差之间的相互 关系。使用起来简单方便。 2 1 2 不等权组合预测 不等权组合预测有多种,一般基于不同的模型误差评价准则,主要有:按误差绝对值和确定权系 数法;按方差大小确定权系数法;按误差倒数确定权系数法;按关联度确定权系数法等。举例如下。 ( 1 ) 按误差绝对值和确定权系数法 设】,l 、】,2 是两个模型的预测值,】,c 是加权平均的组合预测值,预测误差分别为q 和p 2 ,方 差为吼和盯2 ,取q ,国2 为相应的权系数,且q + 缈2 = l ,q 、吐0 有 】,c = 彩i 】,l + 国2 】,2 ( 2 2 ) 开 蚓 q = 百生_ 川+ 蚓 f 皇l,= l l o ( 2 3 ) 第2 章组合预测的基本原理 川 吐= i 盟f 一 川+ 蚓 ( 2 4 ) 这种方法利用加权平均的方法,对较精确的预测值赋予较大的权重,简单方便,数学意义明显。 ( 2 ) 按方差大小确定权系数法 若预测模型预测误差的标准差表示为仃,k 个不同单项预测模型预测误差的标准差分别为q , 且方差q 越大,该模型取的权值越小;方差仃,越小,该模型取的权值越大 ( 2 5 ) ( 2 6 ) 这种方法按方差大小确定权系数。对方差较小的模型预测值赋予较大的权重,简单方便,数学意 义明显。 ( 3 ) 按关联度大小确定权系数法 关联度是灰色系统理论提出的一种分析系统中各因素关联程度的量化方法。 如果参考数列为而,比较数列为毛,其中i = 1 ,2 ,l i i ,且 x o = 扛。( 1 ) ,x o ( 2 ) ,x o ( 玎) 毛= b ,( 1 ) ,五( 2 ) ,而( 刀) ) 则称 占m 一呼n 哑n k ( 七) 一毛( 七) l + p m 警1 k ( 七) 一t ( 七) l 烈d2 东两两焉面缸蒹衍 为曲线z o 和t 在第k 点的关联系数。 其中p 为分辨系数,是o 1 之间的数,一般取j d = o 5 。 综合各点的关联系数,可得出整个曲线与参考曲线的关联度为 ) 幺 | 土( q 。瑚 = 盯巳 吒2 盯 上h q 一 一一d竽 q 足菏 驭 啪 = 彩 。脚 东南大学硕士学位论文 2 三喜驰, 关联度分析时,数据要做无量纲化、归一化预处理,常采用每一个数列的第一个数除墨( 1 ) 其他数 毛( 七) 组合预测时,若有七个模型,先求取各单项模型在预测段数据与实际值的关联度 然后按照下式确定该模型的加权值。 r 哆2 l ( f 2 1 ,2 ,七) , o j = l 这样,与实际值关联度越大的模型加权值越大。 2 2 最优加权组合预测 最优组合预测方法是根据某种准则的构造目标函数,在一定的约束条件下求得目标函数的最大值 或最小值,从而求得组合预测方法加权系数。常见的有最小二乘法、最小绝对值和法、最小相对误差 和法等。对于构造的目标函数的求解,有些可以得出解析解,不能得出解析解的可以利用计算机自动 搜索或者采用遗传算法等优化算法求解。 2 2 1 自动搜索最优解点组合预测 固定权重组合预测,权重的取值依据模型在观测数据计算上的误差大小,对较精确的模型赋予较 大的权重。由于权值的变化范围在0 1 之间,在模型数目比较少的时候,可以利用计算机自动搜索最 优解点。假如以误差的方差最小为目标函数。 若两个模型的组合预测,】,l ( 而) 和】,2 ( 薯) 分别为两个模型在t 点的预测值,q 和哆是它们的加 权值。则有 j ,( 一) = q 】,l ( 一) + 国2y 2 ( t ) 约束条件:q 、吐0 ,铂+ 哆= l ( 2 7 ) 我们让q 由0 到l ,以o 0 5 的步长,在计算机上依次算出每一种组合预测值,以及在这种加权组 合值下的组合预测的误差方差,找到误差方差最小时的加权值q 、哆即为所求。 自动搜索最优权重组合预测没有确定的数学表达式,数学意义不明显,尤其在组合的模型较多时, 搜索难度加大,搜索时间较长,甚至无法得到最终解,所以不适合多模型时应用。 1 2 第2 章组合预测的基本原理 2 2 2 最小二乘法计算的最优加权预测 设有七种方法进行组合预测,各种方法的权系数分别为q 、彩2 、q ,构造如下最优的模型 目标函数为 础ir 一哆nl 一,七 、z ,= i ,篁l 其中: f = l ,2 ,以 f = l ,2 ,七 z 为实际值; “为预测值: 令为第i 种方法在第t 时段的误差( n 个时段) ,其组合预测时段的误差为: p r 2 q e l f + 缈2 p 2 ,+ + 仞k p b 由于约束条件 故 巳= 功l p l ,+ 国2 p 2 ,+ + 仇一i p ( i 1 ) ,+ ( 1 一国l 一哆一一q i ) p 打 2 彩l ( p l ,一) + 国2 ( p 2 f 一) + q l ( p ( i 1 ) r p 打) + p 打 令以= p 打一p 灯 ( f = l 2 ,肌1 ) ; f h = e b 则误差表达式为 e ,= 缈l z f + 国2 厶+ + q i 石i 1 ) r + 厶 以误差平方和最小为最优组合标准,即求国l 、2 、q 使 为最小。根据多元函数求极值的方法: 1 3 ( 2 8 ) ( 2 9 ) ( 2 1 0 ) ( 2 1 1 ) ( 2 1 2 ) ( 2 1 3 ) l l l q 。鲥 p 厶 + ph石 一 + 以吐 + 石q,l 。闽 = 母 。硝 = q 东南大学硕士学位论文 a 国t l 可以写为: 以+ + 吼一。五,厂( 。p + 厶厶) = o 2 ( 国五,工。4 ) l + 彩:厶,五。_ ) ,+ + 国。一五:_ ) i + 名 z ,厶 i z ,厶 尼 。 1 兀丘y 厶,工y 。 石。石: 护l -0 l : l z ,五。_ v ,正t 一啪 则有:肋7 转d f 假设以上k 种方法线性无关,只需门 此方程组有唯一的解,即 9 = 口? = ( q 石,+ 缈:五, 有唯一驻点:肛( 肋r ) 1 卯 q 彩2 : 缈i l 五) l 厶) = o 石,厶 厶厶 v 厂, 厶- ,( 胛一1 ) ,打1 ( 2 1 4 ) ( 2 1 5 ) 刭活褂p 七一l ,总会有心1 个行向量线性无关,故肋r 可逆,因 + + 吼一1 石i 1 ) ,+ 厶) 2 2 3 神经网络加权组合预测方法 ( 2 1 7 ) ( 2 1 8 ) 神经网络方法是重要的非线性函数方法,可以用它构建组合预测各个模型的权值,构成非线性组 合预测,如果观测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论