(应用数学专业论文)混沌时间序列预测及其在股票市场中的应用.pdf_第1页
(应用数学专业论文)混沌时间序列预测及其在股票市场中的应用.pdf_第2页
(应用数学专业论文)混沌时间序列预测及其在股票市场中的应用.pdf_第3页
(应用数学专业论文)混沌时间序列预测及其在股票市场中的应用.pdf_第4页
(应用数学专业论文)混沌时间序列预测及其在股票市场中的应用.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(应用数学专业论文)混沌时间序列预测及其在股票市场中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

混沌时间序列预测及其在股票市场中的应用 研究生:朱梅导师:王海燕副教授东南大学 摘要 本文主要研究了混沌时问序列的预测方法,从三个不同的方面提高了预测效 果,然后将这些方法应用于理论上的混沌模型和上海股票市场。论文的安排如下: 首先,概述了复杂性和混沌等非线性分析的发展和特点及其在股票市场中的 应用,指出目前在混沌时间序列预测研究中存在的一些问题和今后一段时间内的 研究方向。 其次,探讨了混沌时问序列的预测原理以及目前常用的几种预测方法,比如 局部常数预测法,局部线性预测法,神经网络预测法。并进一步讨论了预测和噪 声的关系。 第三,在上面单变量混沌时序预测的基础上,研究了多变量混沌时序的预测 方法。在数据长度和其他条件都相同的情况下,无论是用局域预测法,还是用全 域预测法,数值模拟实验都证明了多变量时间序列能够比单变量时间序列具有更 好的预测效果。 第四,主要针对股票市场,考虑两种不同的消除趋势方法,并分析不同的消 除趋势方法对预测的影响。 最后,结合嵌入理论和预测误差,提出了基于嵌入技术和确定集上预测误差 的混沌时序预测方法。该方法充分利用了两者的优点,弥补了各自的不足,能更 有效地预测。 关键词:混沌时间序列;预测:股票市场;多变量时间序列;嵌入理论: 神经网络;噪声 p r e d i e t i o nt oc h a o t i ct i m es e r i e sa n d i t sa p p l i c a t i o nt os t o c km a r k e t g r a d u a t e :z h um e i s u p e r v i s o r :w a n gh a i y a n s o u t h e a s tu n i v e r s i t y a b s t r a c t i nt h i sd i s s e r t a t i o n ,w em a i n l y s t u d y t h ep r e d i c t i o nm e t h o d st oc h a o t i ct i m es e r i e s a n di m p r o v et h ee f f i c i e n c yf r o mt h r e ed i f f e r e n ta s p e c t s t h e nt h em e t h o d sa r ea p p l i e d t ot h e o r e t i c a lc h a o t i cm o d e l sa n ds h a n g h a is t o c km a r k e t t h i sd i s s e r t a t i o nc o n s i s t so f t h ef o l l o w i n g p a r t s : a tf i r s t ,t h ec l l a r a c t e l sa n dd e v e l o p m e n t so fc o m p l e x i t ya n dn o n l i n e a ra n a l y s i s s u c ha sc h a o sa r es u m m a r i z e da n dt h e i r a p p l i c a t i o n s t os t o c km a r k sa r ea l s o s u m m e d u p t h e ns o m ep r o b l e m si nt h ep r e s e n t r e s e a r c ho f c h a o t i c p r e d i c t i o na n d t h e d i r e c t i o nf o rf u r t h e rs t u d yi nt h i sf i e l da r ei l l u m i n a t e d 。 s e c o n d l y , t h et h e o r y o fp r e d i c t i o ni sd i s c u s s e da n dt h es e v e r a l p r e d i c t i o n m e t h o d st h a ta r eo f t e nu s e da tp r e s e n ta r ei n t r o d u c e d ,s u c ha sl o c a lc o n s t a n tp r e d i c t i o n , l o c a ll i n e a r p r e d i c t i o n a n dn e u r a ln e t w o r kp r e d i c t i o n a n dt h e r e l a t i o n s h i p o f p r e d i c t i o na n d n o i s ei sf u r t h e rd i s c u s s e d t h i r d l y , p r e d i c t i o nm e t h o d s t om u l t i v a r i a t ec h a o t i ct i m es e r i e sa r es t u d i e d ,b a s e d 0 n t h ea b o v eu n i v a r i a t ep r e d i c t i o nm e t h o d s u n d e rt h es a m ec i r c u m s t a n c e ss u c ha st h e i i l a l l l ed a t al e n g t h ,n u m e r i c a le m u l a t i o nc a l c u l a t i o n sv e r i f yt h a tm u l t i v a r i a t et i m es e r i e s 细p r e d i c t b e t t e rt h a nu n i v a r i m et i m es e r i e sb o t hw i t hl o c a lp r e d i c t i o nm e t h o d sa n d 蛳g l o b a l o n e s f o u a h l y ,a st ot h et i m es e r i e sf r o ms t o c km a r k e t s d i f f e r e n td e t r e n d i n gm e t h o d s h s ;c u d i e da 1 1 dt 1 1 e i rd 珀奄r e n te 舵c t so nt h ep r e d i c t i 。na r ea n a l y s i s f i n a l l y ,c o n n e c t i n ge m b e d d i n gt h e o r yw i t hp r e d i c t i o ne r r o r s ,w ep r o p o s ea n e 、, v p r e d i c t i o nm e t h o d t oc h a o t i ct i m es e r i e sb a s e do n e m b e d d i n gt e c h n i q u ea n dp r e d i c t i o n e r r o r so nt e s t e ds e t s t h i sm e t h o dm a k e sf u l lu s eo f t h ea d v a n t a g e so f t h e t w o a s p e c t s a n do v e r c o m e st h e i ro w n d i s a d v a n t a g e s t h e r e f o r ei tc a np r e d i c tb e t t e l k e y w o r d s :c h a o t i ct i m es e r i e s ;p r e d i c t i o n ;s t o c km a r k e t ;m u l t i v a r i a t et i m e s e r i e s ; e m b e d d i n gt h e o r y ;n e u r a ln e t w o r k ;n o i s e i l l 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 己在论文中作了明确的说明并表示了谢意。 研究生签名:圭垫日期:竺:兰:! :7 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 研究生签名:烛导师签名:弓上备姿日期:蛐 东南大学硕士学位论文 第一章绪论 第一章绪论 1 1 问题的提出 在过去的5 0 多年中,金融经济学一直被一个线性范式所主宰,也就是认为 相对于每一个作用都有一个与之成比例的反作用的观点。然而,市场很少会如此 秩序井然,经常是在你预料不到的时候,对于一个作用出现了指数性的过分反作 用,这就是非线性的本质。大多数实际从业者都承认其与实际的联系,许多学者 和数量分析者也承认市场会以非线性方法做出反应。然而,他们假定,即使系统 有非线性性质,线性限制也不会影响他们的模型的有用性,线性模型要比杂乱的 非线性模型容易处理得多,简单的线性模型的好处比其局限性所带来的潜在弊害 要大。然而混沌理论和复杂性科学告诉我们情况并非如此i l 】。 美国刊物s c i e n c e 于1 9 9 9 年4 月出版了一个复杂性科学专辑,专辑的题目 为“复杂系统”。两位编者r i c h a r dg a l l a g h c r 和t i m a p p e n z e l l e r 在前言中以“超 出还原论”为标题对复杂系统作了如下简单描述:通过一个对系统的分量部分( 子 系统) 的了解,不能对系统的性质作出完全的解释,这样的系统称为复杂系统。 通俗地说就是:对于复杂系统,整体的性质不等于部分性质的和,即系统整体和 部分之间的关系不是一种线性关系。 2 0 世纪7 0 年代创立的非线性科学,其中包括耗散结构论、协同学、突变论、 混沌动力学及分形理论【2 1 ,它们共同的研究目标是探索大自然中的复杂性,它 们从不同的角度揭示了复杂系统中发生复杂现象的规律性,它们共同的本质都是 非线性的。非线性是复杂系统的一个重要特征,复杂系统中的分岔、混沌、奇异 吸引子等动态行为,本质上都是非线性的。 l o y d 于1 9 9 5 年曾统计了3 0 多种不同学者给出的复杂性定义,而且相当多 的学者把复杂性科学与非线性科学等同起来,把复杂性和非线性等同起来。桑塔 费研究所的科学家们认为,复杂性处于混沌的边缘,主要指的是复杂适应系统。 钱学森指出,复杂性是开放的复杂巨系统的动力学特征,复杂性问题是开放的复 杂巨系统的动力学或开放的复杂巨系统的问题。盛昭翰在研究管理科学的复杂性 时,将复杂性分为“一般意义”下的复杂性,即广义的复杂性和“管理系统意义” 东南大学硕士学位论文第一章绪论 下表现出来的复杂性 6 - 8 。他将管理意义下复杂性概括为四个方面:对象行为的 不确定性,各层次子系统的异质性,多模型与全局复杂性,非线性相互作用。不 同的学科多少有些差异,有的甚至很大,这就给复杂性的统一定义带来困难,如 今通过不同学科的渗透,交叉融合将更好地研究复杂性,提炼出不同的学科间的 共性,作为“普适”意义下的复杂性应具有以下特征:( 1 ) 协同性;( 2 ) 层次性: 时间与空间尺度上皆构成不均匀的多层次结构;( 3 ) 开放性:系统与外部环境的 统一性,相互关联,相互制约:( 4 ) 多样性:系统具有多种多样的独立结构功能 的子系统;( 5 ) 动态性:系统不断地变化发展着,变化具有有序性,可预见性; ( 6 ) 突变性:系统演化过程是阶段性的,有渐变和突变,整个过程是非线性的, 系统可以自己自学习,进行功能和结构的重构及完善。 非线性科学是当代五大前沿学科之一。从8 0 年代末开始,非线性动力学的 发展才对经济学理论基础产生巨大的冲击。冲击的起因就是混沌的产生,简单的、 低维的、非线性的确定性系统,在一定的参数区域会产生非常复杂的非周期行为。 这种不规则的运动在表面上看来与高维的随机运动非常相似,特别是混沌系统中 的奇异吸引子,它的运动轨迹通常由分数维来描述,其运动局限于空间的某一区 域,但也不收敛于某一点或某个曲面,初始条件的微小变化可能导致轨道的巨大 漂移【9 】。 2 0 世纪8 0 年代初,美国经济学家s t u t z e r 和d a y t l 0 1 最先将新兴的混沌理论和 方法用于分析宏观经济中非规则增长和经济增长中呈现的混沌等问题。之后不 久,国外经济学家们便开始运用混沌理论,研究和探讨包括财政、金融在内的经 济和管理方面的问题,特别是有关证券市场股价指数、汇率变化方面的研究格外 引人注目。文献1 1 - 1 2 研究了汇率波动和外汇期货市场中的混沌问题,文献 1 3 】 研究了欧洲股票市场股票回报率和英国证券市场f t s e - 1 0 0 指数方面的混沌问 题。我国运用现代混沌理论研究证券市场中的股价波动问题是从1 9 9 1 年才开始 的。文献 1 4 研究了伦敦外汇市场英镑兑美元的汇率变动,给出了汇价吸引子的 证据;文献 1 5 1 研究了s & p 5 0 0 指数存在混沌吸引子的证据;文献 1 6 】从理论上 探讨了通过计算混沌吸引子分形维和r i s 分析研究股票价格变动规律的可能性。 我国证券市场于2 0 世纪9 0 年代初期建立以来,虽然仅有十来年的历史,却 己先后出现了五次较大的股价暴涨暴跌,引起了社会的巨大反响。因此,正确认 2 东南大学硕士学位论文 第一章绪论 识我国殴价波动的混沌规律,从而比较准确地预测股价的走势,对我国政府加强 证券市场宏观调控和管理,引导股民进行正确的投资,使股价指数真正成为经济 发展的睛雨表,保障我国证券市场的健康持续发展具有重要的意义。 因此,本文的选题正在上述背景下,围绕如何提高股价指数的预钡0 效果,从 几个不同的侧面探讨了有效地预测混沌时间序列的途径。 1 2 混沌时间序列预测模型的研究现状 非线性动力学是定量研究复杂系统的一种较好的方法。复杂系统一般不是随 机的,而是确定的,但是随着混沌现象的出现,人们发现确定系统内部也存在随 机性。对于那些其演化过程不可预测但其不可预测性可以预测的复杂系统,即确 定性系统内部具有内在随机性的复杂系统,混沌动力学理论成为一种有效的研究 工具。因此基于混沌时间序列的复杂系统不是以统计的方法进行研究的,而是用 非线性动力学方法进行研究的,要考虑的是以下反问题:如何由获取的一组或多 组时间序列来分析并刻画原动力系统。从复杂系统中通过观测或实验手段获取时 间序列,由此来研究原复杂系统的方法称为时间序列分析法。一切科学的目的就 是要发掘出事物的因果关系。一个理论能否被接受,很重要的一个条件在于它能 否对事物的客观规律做出一定的预测,根据万有引力定律人们可以说出数千年后 的月食或日食。然而在自然界中也存在一些不可精确预言的现象,如大气运动一 样都遵从物理学定律,但目前人们只能从一定的概率作天气预报。由于不存在确 定的因果关系,就称这类现象中存在着随机性的因素。混沌现象的发现开创了科 学模型化的一个新典范,一方面,混沌现象所具有的确定性表明许多随机现象实 际是可以预测的;另一方面混沌现象所固有的对初值的敏感依赖性又意味着预测 能力受到的根本性限制。混沌现象是短期可以预测,而长期不能预测的。 自2 0 世纪9 0 年代以来,混沌科学与其他科学相互渗透。无论是在数学、物 理学、生命科学、地球科学、信息科学、还是在经济学、天文学等领域,混沌均 得到了广泛的应用。2 0 多年来,混沌科学虽然在某些基础理论方面取得了很大 的进步,但还没有取得根本性的突破,还有许多问题没有解决,根据混沌系统提 取的非线性时间序列对系统的未来进行预测,是一个十分重要的方面。 实际问题中的复杂系统往往表现为多变量动态演化行为,多层次结构,由于 3 东南大学硕士学位论文 第一章绪论 获取的信息通常不完备,并且具有不确定性,系统的结构参数和边界条件具有时 变性和复杂性,因此难以直接建立起精确的解析形式的数学模型。由于它们是具 有非线性因素的庞大系统,求其近似解难度很大,数值解的计算工作量也十分庞 大,故常常依赖于实验或现场测量所获得的数据,进行非线性动力系统的综合分 析。因此,非线性研究中的一个新的分支方向混沌时间序列分析就应运而生。 混沌时间序列分析就是回答如何由时间序列来辩识和重构混沌动力系统这一基 本问题,并由此预测非线性动力系统的发展趋势,进而达到控制的目的。混沌时 间序列分析主要包括复杂性的度量、相空间重构、混沌预测、混沌控制、确定与 随机、线性与非线性的判定。 到目| j 仃为止,人们提出了许多混沌时间序列的非线性预测方法,这些方法大 致上可分为局域预测法和全域预测法。局域预测法比较有效简洁,如果时间序列 数据足够长,噪声级别比较小,可以利用局域预测法。局域预测法是将相空间轨 迹的最后一点作为中心点,把离中心最近的若干轨迹点作为相关点,然后对这些 相关点作平均或拟合,再估计轨迹下一点的走向,最后从预测出的轨迹点的坐标 中分离出所需要的预测值。根据对相关点作的不同处理,局域预测法可分为局部 常数预测法和局部线性预测法。 全局建模比较直接,是将轨迹中的全部点作为拟合对象找出其规律,即得 厂( ) ,由此预测轨迹的走向。这种方法在理论上是可行的,但由于实际数据总 是有限的,以及相空间轨迹可能很复杂,从而不可能求出真正的映射厂,通常是 根据给定的数据构造映射于:r “斗r 使得夕逼近厂,即 y o + 1 ) 一夕( 】,( f ) ) 】2 达 面 到最小值的夕:r ”呻r 。,要充分的灵活,以便能对整个吸引子上的真正的动力 系统进行建模。尹不同,得不同的模型。据此,全局法主要包括多项式逼近预测 法,神经网络预测法。 1 3 中国股市的概述 中国的股票市场从1 9 8 4 年发行的第一张股票“上海飞乐音响”股票算起至 今已是第2 0 个年头,而从第一家证券交易所成立算起也已经1 4 年。这期间,我 4 东南大学硕士学位论文 第一章绪论 国的股票市场的发展经历了国企改革、亚洲金融风暴、中国加入w t o 、海湾战 争等各种各样的政治、经济因素的考验,证券市场发展迅速,截止2 0 0 3 年1 0 月, 境内上市公司已达1 2 6 6 家,另外还有境外上市公司( h 股) 8 2 家。境内上市证券 总数1 5 1 8 只,上市股票总数1 3 5 2 只,其中上市a 股1 2 4 2 只,上市b 股1 1 0 只, 投资者开户总数达到6 9 8 9 6 3 万户,总市值3 9 1 8 4 6 4 亿元,总市值占g d p 的比 重由初期的0 4 跃升为现在的3 8 2 7 。应该看到这个数值与最高时5 0 相比降 低不少,主要原因是经过前几年的快速发展后,这两年中国的股市基本上是处于 结构性调整期。然而不可否认的是,中国的股票市场十几年的发展已经走过了发 达国家一百多年才走过的发展历程。 在股票市场上成百上千的股票在进行着不断的买进、卖出,各种股票的价格 各异,价格种类又多种多样,卖出价、买入价、最低价、最高价、开盘价、收盘 价,股票价格水平此起彼伏,变幻不定。个别股票的价格变化行情显而易见,然 而整个股票市场或者某个行业的股票的价格有涨有落,如何评价整个股市或者某 个行业,用一种股票显然是无法衡量的,这就需要一个总的尺度标准来衡量股票 价格的涨落,股票价格指数( 或者简称“股价指数”) 概念就是为了解决衡量整 个股票行市的变化问题而产生的,其实质就是用平均值的变化来描述整个或者某 个行业股票市场的变化,从而可以将股票价格指数分为综合指数和分类指数。世 界上各种股票价格指数名目繁多,如世界著名的道琼斯指数、标准普尔5 0 0 指 数、纽约证券交易所指数、伦敦金融时报指数、东京证券交易所指数、香港恒生 指数等等。但他们都有着许多的共性,比如具有代表性和敏感性、作用的共同性、 编制步骤的一致性、变化的总趋势的同向性等等。在股票指数的计算上一般有三 种方法:即简单算术平均数法、加权算术平均数法和调整算术平均数法。 我国股票价格指数主要由上证指数、深证指数、上证3 0 指数、深证成指以 及各种分类指数等构成,其具体编制方法如下: 1 ) 上证指数全称为上海证券交易所股票价格指数综合指数,以1 9 9 0 年1 2 月1 9 日为基期,基期指数定为1 0 0 ,以现有所有上市的股票为样本,以报告期 股票发行量为权数进行编制。计算公式为:今日股价指数= ( 今日市价总值基日 市价总值) 1 0 0 。如果遇到股票增资扩股或新增( 删除) 时,则需要进行修正。 其有如下的特点:( 1 ) 以上证全部股票作为编制对象,一方面全面、准确的反映 某一时点股票价格的全面变动情况。广泛的考虑行业分布,兼顾公司的不同规模 东南大学硕士学位论文 第一章绪论 和实力,因而具有广泛的代表性。对于当时上市只有8 只股票而言这样的方法既 全面又可行且敏感性强。但是现在随着股票总数的增加,其缺陷明显的体现出来, 一是缺乏敏感性,二是只要有新股上市,就得计入股指,使得指数内部结构变化 频繁,影响了指数内部结构的稳定性和指数的前后可比较性。( 2 ) 以发行量为权 数是国际上的通行的方法,这主要是国外的股票发行量般都可以上市流通。但 我国股票发行量中的国家股和法人股占总股本的7 0 一8 0 ,且不能上市流通。将 其计算在内,指数只能反映潜在的流通市场,而无法反映实际流通市场股价的变 动情况。鉴于上述情况,增设上证a 股指数、上证b 股指数、上证3 0 指数、工 业类股价指数、商业类股价指数、地产类股价指数、公用事业类股价指数与综合 类股价指数等等分类股指。上证a 股指数以全部上市a 股发行股数为权数的加权 综合股票指数,以1 9 9 0 年1 2 月1 9 日为基期,基期指数1 0 0 。上证b 股指数以 全部上市b 股发行股数为权数的加权综合股票指数,必1 9 9 0 年1 2 月1 9 日为基 期,基期指数1 0 0 ,其股价以美元直接标价。 2 ) 上证3 0 指数有上海证券交易所于1 9 9 6 年7 月1 日正式推出,该指数 选择最具有市场代表性的3 0 家上市公司作为样本,以1 9 9 6 年一季度为编制基期, 基期指数1 0 0 0 ,采用加权综合价格指数公式计算。 3 ) 深证综指全称深圳政权交易所股票价格综合指数。有深圳证券交易所 于19 9 1 年编制,在编制方法上与上证综指相似,以全部上市公司股票为采样股, 以每日收盘价乘以发行量求得市价总值,再与基期( 1 9 9 1 年4 月3 曰,指数1 0 0 点) 的市价总值相除而进行指数化,计算日股价指数= ( 计算日市价总值基日市 价总值) x1 0 0 。自从1 9 9 5 年深圳推出成分指数后,深证综指的作用和影响有 所下降,但依然是投资者研究判断大势的重要指标。 4 ) 深圳成指深圳交易所于1 9 9 4 年推出,按一定标准选择4 0 家代表性上 市公司作为成分股,以成分股的可流通股数为权数,采用综合指数法编制而成。 该指数以1 9 9 4 年7 月1 8 日为基准日,基期指数为1 0 0 0 点。 总的看来,目前国内外关于证券价格波动研究的方法主要有两大类:一是传 统的统计学方法;另一类就是前述的混沌动力学等非线性系统的理论和方法。后 者是前者的发展和补充,由于它能揭示一些传统方法无法解释的“巨涨巨跌”现 象的本质和有序与无序的关系。因此,用第二种方法研究股票市场价格波动规律 已成为发展趋势。 6 东南大学硕士学位论文 第一章绪论 1 4 以前预测方法的不足和进一步研究的方向 首先,以前的混沌时序预测集中在单变量时间序列上。原则上在没有噪声且 数据足够长的情况下,根据嵌入定理,单变量时序足够重构原动力系统。但由于 从实际中得到的数据往往并不是足够长,且一般都带有噪声,所以由单变量时间 序列重构的动力系统不一定能很好地逼近原动力系统,因此在可以得到更多变量 的情况下,可以考虑利用多变量重构,在数据长度相同的情况下,由于多变量时 序比单变量时序包含了系统更多的信息,自然地应该能够较好地重构原动力系 统,进而预测得更好些。 其次,以前做预测时的状态变量的重构一般都是只根据嵌入理论,也有直接 根据预测误差( 实际上是拟合误差) 最小的。我们知道一般的时间序列不可能无 限长,甚至可能还比较短,且往往带有噪声,另外嵌入技术本身也不是完美的, 这样得到的嵌入维数和嵌入时间延迟可能有较大的偏差,同时拟合的预测误差最 小并不一定就代表预测效果最好。即使预测误差和拟合误差相一致,这样得到的 嵌入维数和嵌入延迟也可能只使预测误差达到局部极小,而不是全局最小,从而 未能达到更好的预测效果。因此本文就试图把这两者有效地结合起来,既发挥了 它们各自的特长,又弥补了各自的缺陷。 最后,当把混沌预测方法应用于股票市场时,首先要对股价指数作消除趋势 处理,因为资产的价值是随着经济和通货膨胀的增长而增长的。过去把股票市场 作为一个非线性动力系统的研究一直是集中在收益率上,其成果并不令人鼓舞, 所以可以设想采用另外一种消除趋势的方法。 l 。5 本论文从事的主要研究工作 针对上述问题,本文从以下三方面考虑来提高预测效果: 1 ) 针对单变量时间序列的缺陷,提出多变量时间序列的预测方法。 2 ) 将不同的混沌预测方法应用于股票市场,并研究了股价指数的不同消除趋 势方法对预测的影响。 3 ) 提出了基于嵌入理论和确定集上预测误差相结合的混沌时间序列预测方 法,并通过数值模拟加以验证,证实了在实证分析中的有效性。 7 东南大学硕士学位论文 第二章单变量混沌时间序列的预测 第二章单变量混沌时间序列的预测 自2 0 世纪9 0 年代以来,混沌科学与其他科学相互渗透。无论是在数学、物 理学、生命科学、地球科学、信息科学、还是在经济学、天文学等领域混沌均得 到了广泛的应用。2 0 多年来,混沌科学虽然在某些基础理论方面取得了很大的 进步,但还没有取得根本性的突破,还有许多问题没有解决,根据混沌系统提取 的非线性时间序列对系统的未来进行预测,是一个十分重要的方面。 2 1 引言 在实际问题中,复杂系统是到处都存在的。复杂系统往往表现为多变量非线 性动态演化行为、多层次结构和信息的不完备与不确定性,因此难以建立起准确 的解析形式的数学模型,常常依赖于通过观测所得到的时间序列进行分析。时间 序列的建模和预测已经发展了相当长的时间,一些传统的建模和预测方法已经在 实际工作中得到广泛的应用,像b o x j e n k i n s 方法,m a r k o v 方法,灰色系统方 法,统计回归方法等,然而这些模型或方法基本都是线性的,处理起来相对来说 简单得多,关于各种线性模型的识别、阶的确定和模型参数的估计等已基本趋于 完善和成熟。然而现实问题中,大量的时序不是线性时序而是非线性混沌时序, 这些时序中出现的混沌、分岔等复杂的行为特征使得人们根本不可能用传统的线 性方法或统计学方法来建立一个非线性混沌模型。即使用高阶的线性模型也不能 描述一个低阶的非线性模型,所以开展非线性混沌模型的研究就变得越来越重 要。 混沌时序预测是8 0 年代末发展起来的一种非线性预测的新方法,已在天气 预报、经济预测、电力负荷预测和股市预测等方面得到广泛的应用。混沌运动是 确定性系统所表现出来的内随机运动,它的行为极其敏感地依赖于初始条件,即 从两个非常邻近的初始点出发的两条轨道,在短时间内其差距不大,但在足够长 的时间以后将出现很大差异。这种称为“蝴蝶效应”的行为表明,对混沌运动不 可能做出长期的精确预测,然而混沌吸引子的确定性动力学机制,又使得对混沌 时序进行较准确的短期预测是可行的。混沌吸引子是一个非平凡的吸引子,一方 面耗散系统运动最终要收缩到相空间的有限区域( 吸引子) 上,另一方面运动轨 东南大学硕士学位论文 第二章单变量混沌时问序列的预测 道局部相互排斥,沿着某些方向指数分离,从而形成某种无穷次折迭现象,这种 现象是由奇异吸引子的几何结构所决定的。这种几何结构确定了奇异吸引子的内 外两个方向,吸引子外的所有运动会向吸引子靠拢,吸引子内的轨道则是相互排 斥,混沌预测就是依据这种吸引子的运动趋势来进行预测的。处于吸引子外的状 态点的运动轨迹与其临界点的运动轨迹具有相同的趋势,而吸引子内的状态点的 运动轨迹与其临界点的运动轨迹也有驻留在吸引子内保持其分形特征的趋势。因 此根据这个趋势,状态点的临界状态与后续状态点之间的函数关系就可以作为预 测的基本模型,实现对混沌时序的预测。 一个混沌时间序列是指对某一确定的混沌动力系统观测采样而得到的单变 量( 也可以是多变量) 时间序列,混沌时间序列研究的中心问题在于能否以及如 何根据观测时间序列的变化来推知整个动力系统的性质,这一研究的理论基础是 相空间重构理论。 2 2 相空间重构 设观测到的混沌时间序列为 “ 丝,假设= t + l ,前丁个数作为构造模 型所需的样本,后三个数作为预测精度的度量。采用延迟重构法,在相空间中重 构的状态向量为 瓦= ( x 。,x ,x 。一f 。一l h ) ,n = t o + 1 ,t o + 2 ,t ( 2 1 ) 其中t o = m 一1 ) r ,m 称为嵌入维数,f 为延迟时间间隔,聊和f 的选择用下面 介绍的方法。 2 2 1 延迟时间f 的选择 如果r 取得太小,那么作为坐标的x 。,与x 州) f 在数值上很接近,难以区 分,相互间不独立,而且由于系统演化时间过短,每一步的演化不能提供关于系 统状态空间足够多新的信息;而如果f 取得过大,x 。,与x 川) f 在统计意义上 将完全独立,形同随机噪声,吸引子将在方向完全无关的向量坐标上重建。因此 f 取得过大或过小,都不可能很好地重构原动力系统。 对单变量时间序列时间延迟的选择通常是用线性自相关函数法或平均互信 o 东南大学硕士学位论文 第二章单变量混沌时间序列的预测 息法。实践证明,用线性自相关函数法估计的时间延迟往往偏大“7 ,。平均互 信息揭示的是两序列间非线性相关性,所以更适合于分析来自非线性动力系统的 时间序列。一般地定义平均互信息为 ,( r ,= 善np c x 。,x ) ,。s : j i ;! ! ! ;:。! j ;高 c z 。, 式中i ( r ) 0 ,p ( ) 表示概率。,( f ) 指出了从一个序列能得到多少关于另一个序列 的信息。如果f 过小,由x 。可以完全得到x ,实际上等同为一个序列;如果f 过大,i ( r ) = 0 ,由x 。得不到有关x 的任何信息。一般取i ( r ) 达到第一个极小 点所对应的f 作为嵌入时间延迟“”。 2 2 2 嵌入维卅的选择n 7 1 虚假最近邻点法的基本思想是当维数从m 变成m + l 时,考察轨线以的邻点 中哪些是真实的邻点,哪些是虚假的邻点,当没有虚假邻点时,可以认为几何结 构被完全打开,此时的m 即为所求最佳嵌入维数。 设x 。的最近邻点为彳咖) ,即 k c 。,一以忆2 。m ,i 。n ,。x ,一以| l ( 2 3 ) 其中为欧氏范数( 即l 纠j _ j ( j ,嘭,劬) j j = ( :。q 2 ) 必) 或最大范数( 即 1 i - l l :l l ( q ,口z ,) i i = m 。a ;x 。川) ,这里我们使用欧氏范数。对实测时间序列,让 维数m 从1 开始增加,当维数从m 增加到m + l 时,则它们之间的距离变为 f f 一瓦卅+ ,若阮。,一五。比阮。,一五8 。大很多,可以认为是由于高维 吸引子中两个不相邻的点在投影到低维轨线上时变成相邻的两点造成的,因此这 样的邻点是虚假的。具体地说,当 睦豫孥丑辱 , 时,五。) 为_ 0 的虚假最近邻点,r ,为阚值,可根据具体情况选取。 一直增加m ,直到虚假最近邻点数很少或虚假最近邻点数不再随着m 的增加 1 0 东南大学硕士学位论文 第二章单变量混沌时间序列的预测 而变化时,可以认为吸引子几何结构完全被打开,此时的m 即为最佳嵌入维数。 按照t a k e n s 的结论,一般地,如果m 2 d + 1 ( d 表示原动力系统相空间的 维数) ,则i 。是原动力系统相应的一条轨道到r ”中的嵌入“7 ”1 。由此可得到月m 上的一个离散的动力系统f :r “斗r ”,使得 量= f ( 矗)( 2 5 ) 或者得到一个函数f :r ”斗r ,满足 x 。= 厂( i 。) = 厂( ,x 。一,x 。一f ,一l h ) ( 2 6 ) 非线性预测问题即根据 ) 乙如何确定,或构造厂的一个近似形式夕( 也可 以是对f ) ,当然,由于系统的混沌性质,夕或户应该是非线性的。 构造预测函数于或户一般有两大类方法:( 1 ) 用局域的方法来拟合预测函数, 只利用被预测点周围邻域点的信息;( 2 ) 用全局的方法来拟合预测函数,即利用 全部数据的信息来近似预测函数,然后用它的迭代来预测未来每一步。 2 3 局域预测法 局域法是将相空间轨迹的最后一点作为中心点,把离中心点最近的若干轨迹 点作为相关点,然后对这些相关点作平均或拟合,再估计轨迹下一点的走向,最 后从预测出的轨迹点的坐标中分离出所需要的预测值。根据对相关点作的不同处 理,局域法可分为局部平均预测法和局部线性预测法。局域预测法比较有效简洁, 如果时间序列数据足够长,噪声级别很小,可以利用局域预测法。 2 3 1 局部平均预测法 设时刻r 的状态向量为爵= ( x tx r 一,工h ) ,) ,找x r 的五个最近邻点 气,毛:,a 如果系统是确定性的,n n 2 r z l 酮= 2 。,七= 1 , 2 ,k 时,i 川 也靠近于。k = 1 ,2 , - - - , k ,因此以式i + l ,l :一,+ - 的平均作为x 川的预测值, 即 讯2 壶否。 _ 7 东南大学硕士学位论文 第二章单变量混沌时间序列的预测 k + ,p 一吨w 曼n = 丝f 一 ( 2 8 ) 8 一以一如 其中巩= i 陆- i o i i ,k = l ,2 ,k ,d 。= 嗔p 以,z 为参数,一般取,1 a 毛,:骥k 眨。, 叼“一血二虫 ” 怠d 村一d m 其中d u = 田样巩。 为了检验预测的精确性,可以通过比较预测值量川与观测值畸+ l ,定义预测 误差为曼川与x 川的差。一次预测可能较好或较差,偶然性较大,为了克服这种 上面介绍的是一步预测,而在实际中有时需要作多步预测。有两种方法可以 ( 1 ) 利用上述模型预测t + 1 时刻的值量n ,然后利用预测值曼川构造一个 找曼川的世个最近邻点,预测丁+ 2 时刻的值,记为曼r + 2 ,继续这一过程,可得 东南大学硕士学位论文第二章单变量混沌时间序列的预测 x r + 3 ,x r + l 的预测值量r + 3 ,主n l ,这一过程可以看成是时间序列的外推。虽 然这种方法在用于预测不远的将来时刻的值是有用的,但在判别时间序列是否来 自与确定性系统时最好还是用已知的观测数据,即下面的方法。 ( 2 ) 为了预测t + 2 时刻的值,构造嵌入向量 弓十l = ( x n ,x n f ,x t + l - ( m - i ) r ) 这时虽然t + 1 时刻的预测值曼川已经得到,但还是用x n l ,因为它来自于实际 观测,因此以x 川而不是主n 构造向量,可得时刻x r + 2 的预测值量r + 2 ,依次下 去。 2 3 2 局部线性预测法 设时刻丁的状态向量为= ( x ,x 。,x h 卅) ,) ,预测模型为黔2 ” z r + f = 夕( 哥r ) = c 1 + c 2 x r + c 3 x r 一,+ - - + c 。“x r 一( 。+ 1 ) r ( 2 1 0 ) 其中c ic 2 ,q ,c 。+ l 为待定系数。为了估计这些系数,设五,l :,气为爵的 k 个最近邻点,记为气= ( k ,飞。,飞巾- 1 ) ,) ,k = 1 ,2 ,k 。问题转化为求 c l ,c 2c 3 ,c m + l 使 量k + ,一( c l + c 2 均h _ f + + ,巾- 1 ) f ) 1 2 i x + f ,屯,x m + ,】- h ,c 2 ,c “ 记 1 x m 。 x a 2 一( m i ) f 。一 x 。_麓柏 x 东南大学硕士学位论文第二章单变量混沌时间序列的预测 y = i x ,k ,x + ,】r c = 【c l ,c 2 ,c m + l 】r “1 z = r ( “+ 1 m 则有 y = c x 由最小二乘原理可解得 c = y x 7 ( 肠7 ) 一1 ( 2 1 1 ) 则丁+ f m t 麴j x r + ,的预测值曼n ,为 主r + ,= c 1 ,x r ,x ,一,一,j 吁一( ,一1 ) r 7 ( 2 1 2 ) 关于参数k 的选取,文献 2 4 给出了下面的方法。 步骤1 :取k = 2 m + 1 , 2 m + 2 ,2 m + 1 0 : 步骤2 :对上述每一k ,计算 h = x ( x 7 x 、一1 x 7 d ( k ) = f r ( 日) 盯2 ( 足) = y - y x r ( x x r ) i - ix 历 y 丽- y x r ( x x r ) q x r 步骤3 :选择使盯2 ( k ) 最小的k ,记为k + ; 步骤4 :利用k + 构造局部预测模型,即计算c ,然后进一步计算x m 的预 测值量。 继续上述过程,可进行多步预测,即得,2 ,x t + ,的预测值 曼r + r ,曼r 十2 f ,主r + f 。 2 3 3 其它局域预测方法 局域预测方法还有基于最大l y a p u n o v 指数的预测方法汹- 驯、线性内插方法 2 s , z o ,、局域超平面近似法”3 。如果能适当建立x n ,与之间的某种非线性函 1 4 。鼍一 , 咖 ,2一岍 ,一 东南火学硕士学位论文 第二章单变量混沌时间序列的预测 数关系,还可得到局域非线性预测方法。 局域法柔性较好,拟合速度较快且精度较高,但需实时地拟合系数。局域方 法虽然在每一步都可能是线性的,但从整体上看却是非线性的。 2 4 全域预测法 所谓全域预o , j j 法就是将轨线中的全部点作为拟合对象,寻找合适的函数, 由此预测轨迹的走向。这种方法在理论上是可行的,但由于实际问题中数据总是 有限的,因而不可能求出真正的厂,只能通过有限数据,构造夕,使 z ( x 。一夕( 曩) ) 2 最小。不同的夕对应不同的模型。 全域法在概念上很清楚,但实现并不容易。尤其当映射厂很复杂时。因为混 沌行为只有在厂为非线性的情况下才能产生,所以预测时必须找出厂的一个非线 性表达式,通常多项式是个很好的近似。全域方法就是从标准函数基中选取多 项式厂,的系数由最j z 乘法确定,当多项式的阶数增加时,所拟合的函数厂 会越来越接近真实的动力系统,它的缺点是当多项式的阶数很大时,系数个数也 很多,需要确定大量系数,这往往会超过计算机的承受能力而使计算无法进行下 去。另外,这时也要求有足够多的样本点。 2 4 1 多项式逼近预测法 取,( i 。) 为x 。,x ,x 州) r 共t n 个变量的s 次多项式,即 x n + 。= ( 磊) = 气。x n 矗“x n :( 。- i ) ,“其中+ 如+ + j 。当j 较大 1 2 2 时,待定系数较多,非常复杂;当s = 1 时即线性逼近。当坍= 1 ,r = 1 时,即 x 。= f ( x 。) ,此时不妨假设厂( z ) = 口l + a 2 x + a ,x 2 ,则预测模型为 z n + l = a l + a 2 x + 口3 x h c a r d 、二乘法,求q ,a 2 ,a 3 使 东南大学硕士学位论文 第二章单变量混沌时问序列的预测 【x - ( a l + d 2 h + 吒矗2 ) 2 n 最小,则得预测模型。1 。 2 4 2 多层前馈型神经网络预测方法 3 1 - 3 8 j 一般的前馈型神经网络即b p 网络具有逼近复杂非线性函数的能力,通常可 以根据所选取的样本数据对网络进行训练,在训练过程中使预测的均方差达到最 小,从而建立相应的预测模型。由于一个3 层前馈网络有可能逼近任意的复杂连 续函数,所以人工神经网络也是逼近非线性函数的重要预测工具。 输入层 隐层输出层 图2 1b p ( b a c kp r o p a g a t i o n ) 网络结构图 y y m 人工神经网络的基本思想:已知输入力维向量王,= n ,x 。) ,对应的 垅维输出向量为乃= ( _ y 。,_ y n ,y 。) ,p = l ,2 ,p ,这些向量称为样本,通过训 练( 或学习) ,找向量函数户,使歹,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论