多层径向基函数网络_第1页
多层径向基函数网络_第2页
多层径向基函数网络_第3页
多层径向基函数网络_第4页
多层径向基函数网络_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 . . . 第一章 引 言随着中国资本市场的迅速发展和居民收入水平的较大提高,越来越多的人参与到股票市场的投资中,希望能够实现财富的保值和增值。虽然投资股票可能带来高回报,但是同时又蕴含着高风险,其时刻变化不定的价格,让投资者感受到这个市场的复杂性,所以他们迫切需要一种用来解释价格变动原因的理论,最好有一种科学的预测方法来指导投资,从而规避或在锁定风险的同时,获得最大的投资回报。股票价格的预测是一个世界性难题,但这项研究却蕴含了巨大的潜在商业价值,所以吸引着全球许多的学者专家对其进行探索和研究。在承认股票价格走势可以被预测的基础上,本文阐述了用来预测股票价格走势的各种方法,既包括常规的的基本

2、面分析和技术分析等方法,也包括基于时间序列分析的多层径向函数神经网络这种现代预测方法,当然由于影响股票价格的因素有很多种,一种简单的模型或方法是不能够完全预测其未来的涨跌情况的。本文尝试使用多层径向函数神经网络模型和SAS统计分析软件的强大功能的结合对股价波动趋势进行短期预测,发现在短期预测上有良好的效果,这对提醒投资者注意风险和帮助投资者把握买点和卖点上有较强的现实意义和一定的实用价值。一、 股票价格预测的背景分析 股票市场与国民经济发展密切相关,是金融市场的重要组成部分,股票作为资本证券化的工具,是虚拟资本中比较普遍的一种,上市公司可以方便地通过股票市场进行融资活动实现套利或者追加项目的投

3、入资金等。从表面上看,股票市场的运行是缺乏秩序的,或者说通常意义下是没有规律性可言的,似乎指数与股价的变动是难以预测的。在资本市场中有许多经济学家用倾其一生的精力,研究出各种数学模型来研究股票市场,试图定量地去把握资本的流动方向与其规律性。自各种金融市场和股票市场的诞生,人们对以股票价格为代表的各种金融资产价格的分析预测方法的研究就没有停止过,这其中涌现出了各种各样的分析方法体系。虽然这些方法派系众多,比如:基本分析流派、技术分析流派、学术分析流派和行为分析流派等等,但从出发点和分析对象来看,可以分为基本分析(fundamental analysis)和技术分析(technical analy

4、sis)两大类。基本分析是依照价格围绕价值波动的原理,通过收集相关的数据和资料,研究影响证券价格的各种基本因素,确定证券的在价值,找出被市场错误定价的证券,买入并长期持有,直到证券的市场价格回归到它的在价值为止。技术分析则是根据证券市场信息的历史数据,通过图表、技术指标等探求股票价格变化的在规律,从而找出最佳的买入点和卖出点。随着各种数据分析工具开发和数学理论研究的深入,人们用各种不同的方法和工具来分析金融时间序列,做出各种金融时间序列预测的模型,特别是在股票价格的预测模型方面更是数不胜数。时间序列分析方法是统计学研究的一个重要分支,以事物在不同时刻所形成的数据作为研究对象,通过对时间序列数据

5、的特征进行分析和研究,探索事物的发展变化规律。经典的时间序列分析方法有图表法、指标法和模型法本文主要取用模型法。模型法是当前对时间序列进行深层次分析和刻画的主要方法,利用事物过去和现在的变化规律数据,构造依时间变化的序列模型,借助外推原则来推测未来是模型法的分析思路。时间序列模型分析方法具有逻辑的美感,模型的形式通常是一个或者一组数学方程。这既具有表达上的简洁性,又可在解释性和可理解性有非常好的效果,为进一步的处理、推导和应用提供方便。二、传统预测分析方法 传统的预测分析方法主要是指基本分析方法和技术分析方法,这是目前仍然被广大投资者广泛使用的方法。股票的市场价格由它的价值决定,但同时也受到许

6、多因素的影响。其中,供求关系是最直接的因素,其他因素都是通过作用于供求关系而影响股票价格的。(一) 基本分析方法1基本面分析的基本原理 基本面分析一般是指对宏观经济面、公司主营业务所处行业、公司业务同行业竞争水平和公司部管理水平包括对管理层的考察这诸多方面的分析,数据在这里充当了最大的分析依据,但往往不能以数据来做最终的投资决策,如果数据可以解决问题,那计算机早就代替人脑完成基本面分析,事实上除了数据还要包括许许多多无法以数据来衡量的东西,比如商誉、垄断、管理层人员素质等许多方面难以用数据来表达,这些方面的东西相对而言就成了分析中比较主观的成分。证券分析师根据经济学、金融学、财务管理学与投资学

7、等基本原理,对决定证券价值与价格的基本要素,如宏观经济指标、经济政策走势、行业发展状况、产品市场状况、公司销售和财务状况等进行分析,评估证券的投资价值,判断证券的合理价位,提出相应的投资建议。基本面分析重点研究股票的在价值也即是上市公司经营状况的真实反映。这种分析方法认为股票价格在市场上的频繁波动是受多种外因素影响的,但股票的市场价格总是围绕着在价值上下波动,市场价格和在价值之间的差距最终会被市场纠正,即回归价值。因此市场价格低于(或高于)在价值之时,便是买(卖)机会到来之时。影响股票市场价格波动的因素很多,主要的有三个方面的原因:一是宏观因素为国家经济的繁荣或萧条,二是中观方面的企业所处行业

8、以与相关行业的发展状况,三是微观的角度看是企业自生的经营状况,如经营不当,盈利能力比较弱,则它的股票价值就低,价格就低,反之,则价值就高,价格就贵。2 基本分析应考虑主要因素由于影响股票价格的因素复杂多变,所以股票的市场价格呈现出高低起伏的波动性特征。基本分析法通过对决定股票在价值和影响股票价格的宏观经济形势、行业状况、公司经营状况等进行分析,评估股票的投资价值和合理价值,与股票市场价进行比较,相应形成买卖的建议。基本分析包括下面三个方面容: (1)宏观经济分析。研究经济政策(货币政策、财政政策、税收政策、产业政策等等)、经济指标(国生产总值、失业率、通胀率、利率、汇率等等)对股票市场的影响。

9、 (2)行业分析。分析产业前景、区域经济发展对上市公司的影响 (3)公司分析。具体分析上市公司行业地位、市场前景、财务状况(二) 技术分析的方法体系在价、量历史资料基础上进行的数学计算、统计和绘制图表的方法是技术分析方法的主要手段。技术分析的方法繁多,形式多样,本章仅介绍一些比较实用和比较常用的技术分析方法。一般说来,可以将技术分析方法分为如下五类:指标类、K线类、切线类、波浪类、形态类。1 指标类指标类要考虑市场行为的各个方面,建立一个数学模型,给出数学上的计算公式,得到一个体现股票市场的某个方面在实质的数字,这个数字叫指标值。指标值的相互间关系和具体数值,直接反映股票市场所处的状态,为我们

10、的操作行为提供指导方向。指标所反映出来的许多信息是不能从行情报表信息中直接看出来的。2 K线类K线类的研究手法是侧重若干天的K线组合情况,推测股票市场多空双方力量的对比,进而判断股票市场多空双方谁占优势,是暂时的,还是决定性的。K线图是进行各种技术分析的最重要的图表。3 切线类切线类是按一定方法和原则在由股票价格的数据所绘制的图表中画出一些直线,然后根据这些直线的情况推测股票价格的未来趋势,这些直线就叫切线。切线的作用主要是起支撑和压力的作用。支撑线和压力线的往后延伸位置对价格趋势起一定的制约作用。4 波浪类波浪理论把股价的上下变动和不同时期的持续上涨、下跌看成是波浪的上下起伏。波浪的起伏遵循

11、自然界的规律,股票的价格运动也就遵循波浪起伏的规律。波浪理论较之于别的技术分析流派,最大的区别就是能提前很长的时间预计到行情的底和顶,而别的流派往往要等到新的趋势已经确立之后才能看到。但是,波浪理论又是公认的较难掌握的技术分析方法。5 形态类形态类是根据价格图表中过去一段时间走过的轨迹形态来预测股票价格未来趋势的方法。根据技术分析的假设,市场行为包括了一切信息。价格走出的形态是市场分析的重要部分,是股票市场对各种信息进行消化后的具体表现。从而用价格的形态来推测股票价格的将来就十分有意义。三、 技术分析的发展趋势在20世纪70年代曾有人提出了著名的有效市场假设,认为股票价格的波动是随机游走过程,

12、未来的价格是不可能被预测的,人们不可能依靠分析公开信息和历史价格信息来获得超额收益。然而,近年来越来越多的实践和研究表明,这种理论与事实是不符合的。为了更充分地解释证券市场的运动规律,在20世纪90年代初又有学者提出了分形市场假说,强调证券市场投资时间尺度和信息接受程度对投资者行为的影响,认为所有稳定的市场都存在着分形结构,证券价格走势在一定程度上是可以被预测的。近十几年来,证券分析技术出现了一些新的发展趋势。计算机技术的进步使各种分析、预测理论得以和信息技术、统计学、优化算法紧密结合,使证券分析向数量化、技术化、复杂化方向发展。将随机过程,混沌理论、模糊数学等数学理论和神经网络、人工智能等工

13、程学手段应用于股票价格预测逐渐成为了现在股票价格预测分析的热门领域。西方金融理论界对技术分析的研究主要集中于两个方面:寻求价格运动规律存在的统计支持:研究基于技术分析的交易规则,获得更直接的实证支持。比如在统计上对证券收益中厚尾现象(fat tail)的发现,使得一些研究者采用分形和混沌理论来解释证券的价格行为,并得到很好的效果。还有贝叶斯统计、神经元网络、人工智能等方法,这些工程学的手段也逐步使用在各种投资软件和自动交易系统中。与简单的移动平均等方法相比,现代技术分析在预测技术方面达到了更高的境界。第二章 文献综述预测是根据过去和现在估计未来。实际资料是预测的依据,科学理论是预测的基础,数学

14、模型是预测的手段。神经网络用于股价预测,与传统方法相比具有很大的优越性。它不需要事先知道被控对象的模型,就可以实现任意的函数关系、学习能力以与通过学习掌握数据之间的依存关系。并且它只需要通过对历史数据的学习,就能够从纷繁复杂的数据中自主寻找出参数之间的规律和特点,并且刻画这些规律和特点。目前,根据所使用的神经网络结构类型的不同,大致可以分为六类:一、误差反传神经网络(Back-propagation Neural Network )误差反传神经网络也称为多层前向网络,简称BP 神经网络,是目前在股票预测中应用最广泛的一种神经网络。文1利用BP 神经网络和公司在各个层面的财务指标来预测上市公司的

15、股价;文2采用改进BP 算法的误差反传神经网络对综合指数的收盘价与个股的收盘价、股票价格变化趋势进行了预测,并与ARIMA 预测模型的结果进行了比较,结果表明神经网络在股价变化趋势方面优于ARIMA 预测模型;文3-5提出BP 神经网络与遗传算法结合的股价预测模型,对部分大股和个股的收盘价进行预测,验证了该预测模型的有效性。二、模糊神经网络(Fuzzy Neural Network)由于模糊神经网络(简称FNN)处理非线性、模糊性等问题上的优越性,以与它在智能信息处理方面拥有的巨大潜力,使得越来越多的专家学者投入到这个领域中来,并做出了卓有成效的研究成果。文6提出了一个面向股市预测的模糊神经网

16、络系统,对某上市股票进行了短期预测,结果表明该方法对股票市场的短期预测是可行的和有效的;文7利用股票市场的理论和模糊神经网络进行预测股票价格;文8利用模糊集理论和模糊概率的方法来模拟股价分析过程和研究投资策略,由此获得了一些有关投资决策的关键技术指标和控制风险的策略。三、 小波神经网络(Wavelet Network Network)小波分析理论与神经网络结合形成小波神经网络(简称WNN)。它将小波分析良好的时频局部性质和神经网络自学习功能与良好的容错能力有效的结合起来9。文10,11以小波神经网络建立预测模型对个股进行预测,取得了较为满意的结果;在文献12中,利用遗传算法对小波包进行最优小波

17、包分解的选择,并训练神经网络,对股指的走势进行预测,取得了比较满意的预测效果。四、 径向基函数神经网络(Radial-Basis Function Neural Network)径向基函数神经网络简称RBFNN,由于这种网络类型不存在局部最优的问题,使得其在非线性时间序列预测中得到广泛的应用。文13以开盘价、收盘价、最高价、最低价作为神经网络的输入变量,利用RBFNN自适应算法建立起神经网络模型,以当天的股票平均价格作为预测对象;文献14把RBFNN与混沌理论结合,以股票的实际收盘价作为预测对象,建立了基于RBFNN的股市混沌预测模型,结果表明用RBFNN预测股价是可行的的和有效的;文15借助

18、RBFNN对非线性函数的逼近能力,对深能源A股价作了连续若干天的一步预测,也收到了比较好的预测结果。五、 回归神经网络(Recurrent Neural Network)回归神经网络也称为递归神经网络,简称RNN,其网络结构与其它神经网络结构的不同之处在于它多了一个反馈层,这使得它具有动态记忆的特点。文献16使用动态递归神经网络标准Elman 模型的一种变形模型(输入层与隐层均加入反馈层)建立预测模型,以五个不同股票市场(加拿大、英国、美国、日本)的历史交易数据作为样本,预测下一年的股票回报,为个人投资决策提供参考,做出了成功的探索;文17采用快速BP 算法的递归神经网络标准Elman 模型对

19、股价做出预测,结果表明对于比较稳定的股票数据,采用快速BP 算法的标准Elman 模型的预测结果比多层前馈网络、径向基函数网络的预测结果要好;文献18采用BP 算法的标准六、 概率神经网络概率神经网络是在RBFNN 和窗函数密度估计方法的基础上提出的一种新的人工神经网络。它利用了样本的先验概率Bayes 定律和最优判定原则对新的样本进行分类, 其不受多元正态分布等条件的限制,并且在运算过程中可算出被分类的新输入样本的后验概率,从而提供对计算结果的解释。目前,它在股票预测方面的应用不多。文献19分别运用五个模型:概率神经网络、径向基函数神经网络、径向基函数概率混合神经网络、EM 算法优化的径向基

20、函数概率混合神经网络、遗传算法优化的径向基函数概率混合神经网络,建立对股票波动率的预测模型,得到了令人满意的实验结果。用神经网络对股市预测,预测对象也多种多样。目前主要有以下五种预测对象:当日股指预测、股价趋势预测、股票投资策略、股票系统风险预测和股票收益预测,还有对股票在价值的预测20等等。本文以股票未来两天的最高价作为预测对象。近年来,径向基网络(RBF)仍是人工神经网络研究的热点之一,每年都有大量的成果出现,包括理论研究,算法设计,以与大量的各个学科领域的应用,包括模式识别和图象处理、自动控制、函数逼近、时间序列、数据挖掘,通信等领域。因此RBF 网络的研究具有巨大的理论价值和实用价值。

21、RBF 网络的最大优点是其具有很强的函数逼近能力。理论证明只要RBF 网络的隐节点足够多,则它可以以任意精度逼近紧集上的连续函数。但是如何提高和改进RBF 网络的性能仍需要深入研究。现有的RBF 网络的学习策略主要集中在RBF 网络中心的确认,即在径向基函数数目预先确定的条件下,RBF 的中心从训练集中随机的选取或由训练集以某种无监督方式或有监督方式确定。这就产生了像多层前馈神经网络一样如何确定隐层节点个数的问题,它常常导致网络具有较差的性能和较大的不必要的体积,并且增加网络隐层节点个数,不能较好地改善网络的性能,从而造成网络资源的浪费,而RBF 函数中心的选择显然也是不能令人满意的。第三章

22、多层径向函数网络一、单层径向函数网络算法综述单层径向神经网络采用高斯函数等径向函数作为神经元传递函数,用于非线性函数的逼近。从网络结构上看 , 它是由第一层的输入层,第二层的隐层和第三层的输出层组成。输入层是由输入样本节点组成;隐层为径向基层,作用函数是径向函数,当输入样本落到输入空间某一小围里时,隐层才会发挥他的作用,隐层的输出结果是各隐层的加权和,从而完成从输入空间到隐含层空间的非线性变换;输出层为线性层,提供从隐层空间到输出层空间的线性变换。 图1说明了径向神经网络的整个输入输出过程。图1 径向函数输入输出过程径向基函数网络的输入输出关系可以表示成如下形式这里是径向函数参数,其中是径向函

23、数的中心,为径向函数的宽度参数。径向函数网络的学习有以下几种典型方法(a) Mood和Darken的算法21这个算法先对样本的输入部分做聚类分析,通常是k-mean法,将样本的输入部分分成若干类,算出每类的重心作为径向函数的中心,再指定径向函数的宽度参数,然后用最小二乘法确定各径向函数的组合系数。(b) Poggio算法22和Mood和Darken的算法不同,这个算法将每个样本的输入部分作为一个径向函数的中心,这样径向函数的个数就是样本的个数。然后指定径向函数的宽度参数,再用最小二乘法确定各径向函数的组合系数。(c) 正则正交最小二乘法23设样本为。每个样本输入都是径向函数基的中心的候选。记当

24、所有样本输入都被选为基函数的中心是,有记则得矩阵表现形式如下将矩阵分解为正交回归矩阵形式,则有这里满足。当被选为径向函数基的中心时,模型的逼近误差下降率为可以选对下降率贡献大的输入样本,直到被满足是停止。这里为选定的容许误差。这时网络的径向函数的个数即为。(d) 局部学习法24局部学习法的径向函数都选用这样的函数,它们在各自的一个局部空间上不为0,而其余空间上都为0. 这样,这些径向函数都是接近正交的。于是我们可以一个一个地把径向函数加到网络上去,直到拟合误差小于预先确定的值为止。在以上的各方法中,Mood和Darken的算法是最基本的,也是最简单的。其它的方法旨在解决径向函数的个数确定问题。

25、近年来发展的方法也是以怎样快速地寻找径向函数的中心,确定径向函数的个数为宗旨而提出来的25,26,27,28。这里我们从另一个角度出发,改善Mood和Darken的算法的精度问题,同时间接地解决基函数的个数问题。为此,我们提出了多层径向函数网络。一层径向函数的逼近能力是有限的。在一层网络的基础上用第二层网络去拟合第一层网络的残差函数,这样拟合精度就提高了。再在两层网络的基础上,用第三层网络去拟合两层网络的拟合残差函数,得到了三层网络,它的拟合精度又提高了。如此进行下去,就得到一个高精度的多层径向函数网络。单层径向函数网络的逼近精度较低,限制了它的应用效果。这里我们提出多层径向函数网络,以克服这

26、个缺点。高精度的函数逼近网络在非线性建模,特别是非线性时间序列和混沌时间序列的建模和预测上有着重要的意义。二、多层径向基函数网络(Multi-layer Radial Basis Function Network)(一)径向基函数网络的基本概念(1)径向基函数(Radial Basis Function)径向函数指的是峰状型的函数,如高斯函数这里为维的向量,。 (2) 径向基函数网络(Radial Basis Function Network)径向函数网络是一组径向函数的线性组合,即这里构造这个网络的目的是用它去逼近一个真实的函数。通常是不知道的。我们知道的只是有限个样本和它们所对应的函数值这

27、里如果是确定性的,即那么这就是一个函数逼近的问题。如果是不确定性的,即这里的为随机噪声,那么这就是一个非参数回归的问题。按Mood和Darken的算法这个网络可以按如下步骤构造的。设数据样本为它们所对应的函数值为将分成个聚类(通常用K-平均法)它们的中心被定义为令用最小二乘法决定加权系数这样得到的就是普通的径向函数网络。(二) 多层径向基函数网络假设我们已经得到了单层镜像函数网络这里令这就是单层镜像函数网络所实现的函数在处的值与实际值的误差。做增广样本这里。再将分成个聚类这样我们就得到了个新的聚类它们的中心是令用最小二乘法决定加权系数使这里也就是说,我们用一个新的径向函数网络去拟合前一层网络的

28、拟合残差于是我们得到了一个更精确的模型这就是一个2层镜像函数网络。重复这一步骤,我们得到一个多层镜像函数网络根据适当的判别准则,已决定增加几层最为适合。需要说明的是,在增广样本中,我们用代替是因为的绝对值往往远小于的各分量的绝对值,这样新的聚类受拟合残差的影响就小,所得到的函数对残差的抵消作用就小。三、用多层径向基函数网络做非参数回归 用多层径向基函数网络做非参数回归分析时,本文采用如下方法确定网络的结构和参数。1. 网络层数的确定确定网络层数最简单的方法是将样本分为两组,一组用于学习,另一组用于检验。为简单起见,记用于学习的样本为它们所对应的函数值为用于检验的样本为它们所对应的函数值为对于学

29、习样本,第1层网络的残差为残差平方和为对于检验样本,第1层网络的拟合残差为残差平方和为对第2层网络,学习样本和检验样本的拟合残差分别为残差平方和分别为如此计算下去,记第层径向函数网络对学习样本和检验样本的拟合残差分别为残差平方和分别为那么如果就取层网络为我们所需的模型。需要说明的是,在非线性回归和非线性随机时间序列分析中,有时不宜设置检验样本集。我们必须采用信息量准则来确定哪层最佳。但多层径向基函数网络的信息量的计算尚处于研究阶段,所以我们只能用训练集的残差平方和来衡量模型的优劣。虽然这样确定的模型有过拟合的可能,但在许多实际数据的分析中仍得到了高精度的预测。2的确定 对第层网络中的第个聚类,

30、可取为该聚类中样本的样本均方,即如果聚类中只有一个样本,则取这个聚类的样本方差为该层各聚类样本方差的平均值。3确定和由试探法决定。一般可取1到10之间。对前几层,因为误差较大,可取得小一些,后几层,因为误差较小,可取得大一些。一般说来取得大,在增广样本的聚类分析中,误差项对聚类的产生的影响也大,拟合精度提高。但是过大,拟合误差不随网络层数的增加而减小甚至增大,所以确定一个合理的值是很有必要的。我们可以用一维搜索来确定的值。即先确定的取值区间,然后搜索,使检验样本的残差平方和达到最小。越大,径向基函数越平坦,不会出现过拟合现象,但太平坦了会降低拟合精度。反之,越小,径向基函数越尖,拟合精度提高,

31、但太尖了,会出现过拟合现象。因此确定一个恰当的值是很有重要的。做法之一就是确定一个的取值区间,对的一个取值,计算对检验样本的残差平方和,用一维搜索的方法求得使检验样本的残差平方和达到最小的最佳值。然而,检验样本的残差平方和同时依赖于和。我们可以按如下的方法探索和的最佳值。先固定的值,即令,搜索。设当时最小。再固定,搜索。设当是最小。在固定,搜索。当时最小。再固定,搜索。如此进行下去,直到收敛或收敛。4径向基函数个数的确定每层径向基函数的个数也就是聚类个数。先确定第一层的聚类个数。可以通过根据样本个数决定,如取样本数的1/30到1/10,也就是平均每个聚类分配10至30个样本。因为拟合误差函数一

32、般比原函数形状复杂,所以第二层以后的聚类个数可取得大一些,一般取的1到2倍,但必须保证每个聚类的平均样本个数为5,即不超过样本数的1/5。第四章 时间序列的建模与预测一、基本原理用多层径向基函数网络对时间序列进行建模是使用这种网络作非线性回归模型的特例。时间序列的一般模型为这里为白噪声。令为初始条件,对应的输出的值为于是有这样就可以用第三章介绍的方法建模。确定的过程如下:令,记模型信息量,如的值为。再令,记模型的记模型信息量,如的值为。再令,记模型信息量,如的值为。假设则取 在完成建模后,就可以对时间序列进行预测。我们从已知的出发,得到的估计值再令由此,我们得到了一组时间序列的预测值。二、在股

33、票预测中的应用本文选用了中视(600088)自2009年4月20日到2010年6月10日的股票收盘价格数据,共280个数据。在试探过程中设置程序的最大层数为20。样本个数n=280,将数据分为两组,一组用于训练学习,另一组作为预测,其中275个数据用作学习,5个数据作为预测,通过我们试探,增广数据系数取5比较适宜。本文采取将延迟步数定为从1到5,在每一类延迟步数过试探,选出最佳的宽度系数值,再对这5种类型的拟合精确度进行比较,最终得到最佳模型。需要说明的是,多层径向基函数网络的信息量的计算公式还在研究阶段,我们暂时用残差平方和代替信息量。这样做可能会使模型产生过拟合现象,使预测精度降低,但计算

34、机实验结果表明模型仍有很好的预测精度。(一)延迟步数为1的值确定过程我们取用于观测样本个数为,预测个数为5个,增广数据系数,第一层聚类数为9,第二次以后的聚类个数为15。宽度系数通过试探确定。试探结果如下表所示:表1 延迟步数为1时值探求过程(1)2010060420100607201006082010060920100610平均值真实值24.824.1824.6824.8925.2824.766d=1024.691424.72924.332424.682724.754724.63804d=1524.701724.740624.324124.692524.766524.64508d=2024.

35、786324.844824.276224.772424.880324.712d=2524.769624.816624.311824.758224.843524.69994d=3024.696824.742924.30624.686424.77524.64142相对误差0.44%2.27%1.41%0.83%2.08%1.406%0.40%2.32%1.44%0.79%2.03%1.396%0.06%2.75%1.64%0.47%1.58%1.300%0.12%2.63%1.49%0.53%1.73%1.300%0.42%2.33%1.52%0.82%2.00%1.418%通过对上表的观察,我们

36、可以发现随着从10到30的变化,相对误差的平均值呈先减小后增大的变化,其中当和时取得最小的平均相对误差,这样,我们再通过观测20至25之间的相对误差的平均值的变化从其中挑选出最佳的值,试探过程如表2所示:表2 延迟步数为1时值探求过程(2)2010060420100607201006082010060920100610平均值真实值24.824.1824.6824.8925.2824.766d=2024.786324.844824.276224.772424.880324.712d=2124.79724.875524.239724.779224.927324.72374d=2224.730924

37、.77524.315424.720524.802524.66886d=2324.794224.850624.284624.780724.883624.71874d=2424.791824.844224.293824.779124.87424.71658d=2524.769624.816624.311824.758224.843524.69994相对误差m0.0552%2.7494%1.6361%0.4725%1.5811%1.2989%0.0121%2.8763%1.7840%0.4452%1.3952%1.3026%0.2786%2.4607%1.4773%0.6810%1.8888%1.3

38、573%0.0234%2.7734%1.6021%0.4391%1.5680%1.2812%0.0331%2.7469%1.5648%0.4456%1.6060%1.2793%0.1226%2.6328%1.4919%0.5295%1.7267%1.3007%从图中不难看出,当时,相对误差为最小。由此我们可以确定,当,时函数模型的预测精确度最高。这时最佳层数为3。表3 延迟步数为1,时的拟合误差指标层数 最小误差值 最大误差值 均值误差 残差平方和 -1 0.0015654 2.1390533 0.4942203 112.2804893 2 0.000366952 1.9702120 0.41

39、50932 90.5169204 3 0.000228606 1.9704613 0.4151024 90.5169031 4 0.000228606 1.9704613 0.4151024 90.5169031 5 0.000228606 1.9704613 0.4151024 90.5169031 6 0.000228606 1.9704613 0.4151024 90.5169031 7 0.000228606 1.9704613 0.4151024 90.5169031 8 0.000228606 1.9704613 0.4151024 90.5169031 9 0.000228606

40、 1.9704613 0.4151024 90.5169031 10 0.000228606 1.9704613 0.4151024 90.5169031 11 0.000228606 1.9704613 0.4151024 90.5169031 12 0.000228606 1.9704613 0.4151024 90.5169031 13 0.000228606 1.9704613 0.4151024 90.5169031 14 0.000228606 1.9704613 0.4151024 90.5169031 15 0.000228606 1.9704613 0.4151024 90.

41、5169031 16 0.000228606 1.9704613 0.4151024 90.5169031 17 0.000228606 1.9704613 0.4151024 90.5169031 18 0.000228606 1.9704613 0.4151024 90.5169031 19 0.000228606 1.9704613 0.4151024 90.5169031 20 0.000228606 1.9704613 0.4151024 90.5169031 表4 延迟步数为1,时的预测误差指标层数 最小误差值 最大误差值 均值误差 残差平方和 -1 0.0211526 0.821

42、0685 0.3130287 0.9146263 2 0.0079583 0.6645090 0.3150105 0.7676239 3 0.0081913 0.6642220 0.3151052 0.7675445 4 0.0081913 0.6642220 0.3151052 0.7675445 5 0.0081913 0.6642220 0.3151052 0.7675445 6 0.0081913 0.6642220 0.3151052 0.7675445 7 0.0081913 0.6642220 0.3151052 0.7675445 8 0.0081913 0.6642220 0

43、.3151052 0.7675445 9 0.0081913 0.6642220 0.3151052 0.7675445 10 0.0081913 0.6642220 0.3151052 0.7675445 11 0.0081913 0.6642220 0.3151052 0.7675445 12 0.0081913 0.6642220 0.3151052 0.7675445 13 0.0081913 0.6642220 0.3151052 0.7675445 14 0.0081913 0.6642220 0.3151052 0.7675445 15 0.0081913 0.6642220 0

44、.3151052 0.7675445 16 0.0081913 0.6642220 0.3151052 0.7675445 17 0.0081913 0.6642220 0.3151052 0.7675445 18 0.0081913 0.6642220 0.3151052 0.7675445 19 0.0081913 0.6642220 0.3151052 0.7675445 200.00819130.66422200.31510520.7675445-通过观察,不难发现当层数从1-20层的变化情况是:随着层数的不断递增,平均误差由0.3130287变大至0.3151052,由0.91462

45、63逐渐减少至0.7675445,以上两个误差的值到了第三层次之后就不再改变,因此,我们可以认为该网络到此收敛。延迟步数为1时拟合曲线和预测曲线由图2和图3给出。图2 延迟步数为1,时第3层的拟合结果(星为实际值,点为拟合值)图3 延迟步数为1,,时第3层的预测结果(星为实际值,点为拟合值)从图中可以很直观的发现,训练集和预测集的拟合程度都非常的高。预测值,误差与相对误差列于表5。由表可以看出相对误差是较小的。表5 延迟步数为1的预测误差指标最优参数时间收盘价预测收盘价误差相对误差a=5 d=24层数=32010060424.824.79180.00820.033%2010060724.182

46、4.8442-0.66422.747%2010060824.6824.29380.38621.565%2010060924.8924.77910.11090.446%2010061025.2824.8740.4061.606%(二) 延迟步数为2至5时宽度系数值的确定延迟步数为2-5时确定宽度系数值的过程与延迟步数为1时是一样的,均采用试探的方法,从大围搜索到小围搜索。通过这样的试验,可以确定在参数,延迟步数为2至5的条件下的最优值。以下列出实验结果1.当延迟步数为2时的实验结果:表6给出延迟步数为2时的预测误差指标表6 延迟步数为2的预测误差指标最优参数时间收盘价预测收盘价误差相对误差a=5

47、 d=80 层数=52010060424.824.0650.7352.964%2010060724.1824.5638-0.38381.587%2010060824.6824.60910.07090.287%2010060924.8924.50930.38071.530%2010061025.2824.55820.72182.855%图4和图5分别为延迟步数为2时的拟合曲线图和预测曲线图。图4 延迟步数为2,,时第3层的拟合结果(星为实际值,点为拟合值)图5 延迟步数为2,,时第3层的预测结果(星为实际值,点为拟合值)2.当延迟步数为3时的实验结果:表7给出延迟步数为3时的预测误差指标表7 延

48、迟步数为3的预测误差指标最优参数时间收盘价预测收盘价误差相对误差a=5 d=50 层数=12010060424.824.4050.3951.593%2010060724.1824.8998-0.71982.977%2010060824.6824.7393-0.05930.240%2010060924.8925.0123-0.12230.491%2010061025.2824.86810.41191.629%延迟步数为3的拟合曲线和预测曲线由图6和图7给出。图6 延迟步数为3,,时第1层的拟合结果(星为实际值,点为拟合值)图7 延迟步数为3, ,时第1层的预测结果(星为实际值,点为拟合值)3.当

49、延迟步数为4时的实验结果:表8给出延迟步数为4时的预测误差指标表8 延迟步数为4的预测误差指标最优参数时间收盘价预测收盘价误差相对误差a=5 d=40 层数=112010060424.824.14770.65232.630%2010060724.1824.16650.01350.056%2010060824.6824.8176-0.13760.558%2010060924.8924.59780.29221.174%2010061025.2825.00280.27721.097%延迟步数为4的拟合曲线和预测曲线由图8和图9给出。图8 延迟步数为4, ,时第11层的拟合结果(星为实际值,点为拟合值

50、)图9 延迟步数为4,,时第11层的预测结果(星为实际值,点为拟合值)4.当延迟步数为5时的实验结果:表9给出延迟步数为5时的预测误差指标表9 延迟步数为5的预测误差指标最优参数时间收盘价预测收盘价误差相对误差a=5 d=80 层数=202010060424.824.70260.09740.393%2010060724.1824.1320.0480.199%2010060824.6824.7638-0.08380.340%2010060924.8925.4252-0.53522.150%2010061025.2825.06140.21860.865%延迟步数为5的拟合曲线和预测曲线由图10和图11给出。图10 延迟步数为5,、,第20层的拟合结果图(星为实际值,点为拟合值)图11延迟步数为5,、,第20层的预测结果图(星为实际值,点为拟合值)(三)最优延迟步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论