多层径向基函数网络_第1页
多层径向基函数网络_第2页
多层径向基函数网络_第3页
多层径向基函数网络_第4页
多层径向基函数网络_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 简介随着我国资本市场的快速发展和居民收入的大幅度提高,越来越多的人参与到股票市场的投资中,希望能够保值增值。投资股票虽然可能带来高收益,但同时也蕴含着高风险,其不断变化的价格让投资者感受到这个市场的复杂性,所以迫切需要一个理论来解释价格变化的原因,要有科学的预测方法来指导投资,从而规避或锁定风险,获得最大的投资回报。股票价格预测是一个世界性难题,但这项研究蕴含着巨大的潜在商业价值,因此吸引了全球众多学者和专家对其进行探索和研究。在承认股价趋势可以预测的基础上,本文阐述了预测股价趋势的各种方法,包括常规的基本面分析和技术分析方法,以及基于时间序列分析的多路径分析。功能神经网络的现代预测方

2、法,当然,因为影响股价的因素很多,一个简单的模型或方法并不能完全预测其未来的涨跌。本文尝试将多层径向函数神经网络模型与SAS统计分析软件的强大功能相结合,对股价波动趋势进行短期预测,发现在短期内具有良好的效果。期限预测,有助于提醒投资者注意风险,帮助投资者。把握好买卖点具有很强的现实意义和一定的实用价值。一、股价预测的背景分析股票市场与国民经济发展密切相关,是金融市场的重要组成部分。作为资本证券化的工具,股票是一种比较常见的虚拟资本。上市公司很容易通过股票市场进行融资活动,实现套利或追加项目投资等。表面上,股票市场的运行是混乱的,或者说一般来说,没有规律可言。似乎指数和股票价格的变动是不可预测

3、的。在资本市场上,许多经济学家毕生研究各种数学模型来研究股市,试图量化把握资本流动的方向和规律。自各种金融市场和股票市场诞生以来,人们对以股票价格为代表的各种金融资产价格的分析预测方法的研究就一直没有停止,各种分析方法体系也应运而生。虽然这些方法有很多流派,如:基本面分析学派、技术分析学派、学术分析学派和行为分析学派等,但从出发点和分析对象来看,又可以分为:基本面分析(fundamental analysis)和技术分析(technical analysis)两大类。基本面分析基于价格围绕价值波动的原则。通过收集相关数据和信息,我们研究影响证券价格的各种基本面因素,确定证券的当前价值,发现被市

4、场错误定价的证券,买入并长期持有。 , 直到证券的市场价格恢复到当前价值。技术分析是根据证券市场信息的历史数据,通过图表、技术指标等,探索股价变化的规律性,从而找到最佳的买卖点。随着各种数据分析工具的发展和对数学理论的深入研究,人们利用各种方法和工具对金融时间序列进行分析,做出各种金融时间序列预测模型,特别是在股价预测模型方面。还有无数。时间序列分析法是统计研究的一个重要分支。它以事物在不同时间形成的数据为研究对象,通过分析研究时间序列数据的特征,探索事物的发展变化规律。经典的时间序列分析方法包括图表法、指数法和模型法。本文主要采用模型法。模型方法是目前对时间序列进行深入分析和表征的主要方法。

5、它利用事物过去和现在的变化规律的数据,构建随时间变化的序列模型,并利用外推原理推断未来。这就是模型方法的分析思想。时间序列模型分析方法具有逻辑美,模型通常以一个或一组数学方程的形式出现。这不仅具有表达的简单性,而且在可解释性和可理解性方面也有很好的效果,为进一步的处理、推导和应用提供了便利。2. 传统的预测分析方法传统的预测分析方法主要是指基本面分析方法和技术分析方法,目前仍被投资者广泛使用。股票的市场价格是由其价值决定的,但也受许多因素的影响。其中,供求关系是最直接的因素,其他因素通过作用于供求关系来影响股价。(1) 基本分析方法1. 基本面分析的基础基本面分析一般是指对宏观经济、公司主营业

6、务所在行业、公司业务在同行业的竞争程度、公司管理水平等进行分析,包括对管理层的考察.数据是这里最大的分析。但是,通常不可能使用数据来做出最终的投资决策。如果数据能解决问题,那么计算机已经取代人脑完成了基本面分析。其实,除了数据之外,还包括很多数据无法衡量的东西。比如商誉、垄断、管理人员素质等很多方面很难用数据来表达,这些方面在分析中都是比较主观的成分。证券分析师根据经济学、金融学、理财和投资的基本原理,分析决定证券价值和价格的基本要素,如宏观经济指标、经济政策趋势、行业发展、产品市场状况、公司销售额和分析财务状况,评估证券的投资价值,判断证券的合理价格,提出相应的投资建议。基本面分析侧重于股票

7、的真实价值,即对上市公司经营状况的真实反映。这种分析方法认为,市场中股票价格的频繁波动受各种外部因素的影响,但股票的市场价格始终围绕价值波动,市场价格与价值之间的差距最终会被市场修正. ,返回值。因此,当市场价格低于(或高于)价值时,买入(卖出)的机会就来了。影响股市价格波动的因素有很多。主要原因有三个:一是宏观因素是国民经济的繁荣还是萧条;从公司自生的经营状况来看,如经营不当,盈利能力相对较弱,其股票价值将偏低,价格将处于低位。反之,价值会高,价格会贵。2、基本面分析要考虑主要因素由于影响股票价格的因素复杂多变,股票的市场价格呈现涨跌互现的特点。基本分析法是通过分析决定股票价值并影响股价的宏

8、观经济形势、行业状况、公司经营状况来评价股票的投资价值和合理价值。基本分析包括以下三个方面:(一)宏观经济分析。研究经济政策(货币政策、财政政策、税收政策、产业政策等)和经济指标(GDP、失业率、通货膨胀、利率、汇率等)对股市的影响。(2)行业分析。分析行业前景和区域经济发展对上市公司的影响(3) 公司分析。上市公司行业现状、市场前景及财务状况详细分析(2) 技术分析的方法体系基于价格和成交量历史数据的数学计算、统计和图表方法是技术分析方法的主要手段。技术分析的方法和形式有很多。本章只介绍一些比较实用和常用的技术分析方法。一般来说,技术分析方法可以分为以下五类:指标、K线、切线、波浪和形态。1

9、个指标类指标类需要考虑市场行为的方方面面,建立数学模型,给出数学计算公式,得到一个反映股市某一方面实质的数字。这个数字称为指标值。指数值与具体值的关系直接反映了股票市场的状况,为我们的操作行为提供指导。指标所反映的许多信息不能直接从信息表中的信息中看到。2K线类K线的研究方法是关注多日K线的组合,推测股市多空双方的强弱对比,然后判断多空双方是否股市有优势,无论是暂时的还是决定性的。烛台图是各种技术分析中最重要的图表。3 切线切线类就是在股价数据绘制的图表中,按照一定的方法和原则,画出一些直线,然后根据这些直线的情况来推断股价的未来走势。这些直线称为切线。切线的作用主要是起到支撑和压力的作用。支

10、撑线和压力线的向后延伸对价格走势起到一定的限制作用。4波波浪理论把股票价格的涨跌和不同时期的连续涨跌看作是波的涨跌。波浪的涨跌遵循自然规律,股票的价格走势遵循波浪规律。与其他技术分析学派相比,波浪理论最大的不同在于它可以提前很长时间预测市场的底部和顶部,而其他学派往往要等到新的趋势已经建立之后才能看到.然而,波浪理论被认为是一种难以掌握的技术分析方法。5个形态分类模式类是一种基于价格图表在过去一段时间内走过的轨迹模式来预测股票价格未来趋势的方法。根据技术分析的假设,市场行为包括所有信息。价格走出去的形态是市场分析的重要组成部分,是股市在消化各种信息后的具体表现。因此,用价格的形态来推测股票价格

11、的未来是非常有意义的。三、技术分析发展趋势1970年代,有人提出著名的有效市场假说,认为股票价格的波动是一个随机游走的过程,未来的价格无法预测,人们不可能依靠对公开信息和历史价格信息的分析以获得超额收入。然而,近年来越来越多的实践和研究表明,这一理论与事实不符。为了更充分地解释证券市场的运动规律,1990年代初有学者提出了分形市场假说,强调证券市场的投资时间尺度和信息接受程度对投资者行为的影响。 ,认为所有稳定的市场都存在由于分形结构,可以在一定程度上预测证券价格的变动。近十年来,证券分析技术出现了一些新的发展趋势。计算机技术的进步使各种分析预测理论与信息技术、统计、优化算法紧密结合,使证券分

12、析向量化、技术、复杂化方向发展。随机过程、混沌理论、模糊数学等数学理论和神经网络、人工智能等工程方法在股价预测中的应用逐渐成为股价预测和分析的热门领域。西方金融理论界对技术分析的研究主要集中在两个方面:为价格运动规律的存在寻求统计支持;研究基于技术分析的交易规则,以获得更直接的实证支持。例如,统计学中证券收益的肥尾现象的发现,使得一些研究人员利用分形和混沌理论来解释证券的价格行为,并取得了很好的效果。还有贝叶斯统计、神经网络、人工智能等方法。这些工程方法也逐渐应用于各种投资软件和自动交易系统。现代技术分析在预测技术方面达到了比简单移动平均线等方法更高的水平。第二章文献综述预测是基于过去和现在对

13、未来的估计。实际数据是预测的基础,科学理论是预测的基础,数学模型是预测的手段。神经网络用于股票价格预测,与传统方法相比具有很大优势。它不需要事先知道被控对象的模型,可以实现任何函数关系、学习能力,以及通过学习掌握的数据之间的依赖关系。并且它只需要从历史数据中学习,就可以从复杂的数据中独立地找出参数之间的规律和特征,并描述这些规律和特征。目前,根据所使用的神经网络结构类型不同,大致可分为六类:1. 误差反向传播神经网络误差反向传播神经网络,又称多层前向网络,简称BP神经网络,是目前股票预测中应用最广泛的神经网络。论文1利用BP神经网络和公司各级财务指标预测上市公司股价;论文2利用改进的BP算法的

14、误差反向传播神经网络对综合指数收盘价、个股收盘价、股票价格进行分析。预测价格变化趋势,并与 ARIMA 预测模型的结果进行比较。结果表明,神经网络在股价变化趋势方面优于ARIMA预测模型。论文3-5提出了一种结合BP神经网络和遗传算法的股票价格预测。该模型对部分大盘股和个股的收盘价进行了预测,验证了预测模型的有效性。2.模糊神经网络由于模糊神经网络(FNN)在处理非线性、模糊性等问题上的优越性,以及在智能信息处理方面的巨大潜力,越来越多的专家学者投入到这一领域,并取得了丰硕的研究成果。论文6提出了一种用于股票市场预测的模糊神经网络系统,并对上市股票进行了短期预测。结果表明,该方法对股票市场的短

15、期预测是可行和有效的。理论和模糊神经网络用于预测股票价格;论文8利用模糊集合理论和模糊概率来模拟股票价格分析和研究投资策略的过程,从而得到投资决策和风险控制方法的一些关键技术指标。战略。3.小波神经网络(Wavelet Network Network)小波分析理论与神经网络相结合,形成小波神经网络(WNN)。它有效地结合了小波分析良好的时频局部特性和具有良好容错性的神经网络的自学习功能9。论文10,11建立了用小波神经网络预测个股的预测模型,取得了比较满意的结果;在文献12中,利用遗传算法对小波包选择最优的小波包分解,并训练神经网络。该网络对股指走势进行预测,取得了较为理想的预测效果。四、径向

16、基函数神经网络(Radial-Basis Function Neural Network)径向基函数神经网络(RBFNN)简称,由于这类网络不存在局部最优的问题,所以广泛应用于非线性时间序列预测。论文13以开盘价、收盘价、最高价和最低价作为神经网络的输入变量,采用RBFNN自适应算法建立神经网络模型,以当日股票平均价格为预测对象;参考文献14利用RBFNN结合混沌理论,以股票的实际收盘价为预测对象,建立了基于RBFNN的股市混沌预测模型。结果表明,利用RBFNN预测股票价格是可行且有效的。逼近能力,连续数日对深能A的股价进行了一步预测,也收到了较好的预测结果。5.循环神经网络循环神经网络也称为

17、循环神经网络,简称RNN。它的网络结构与其他神经网络结构的区别在于它多了一个反馈层,这使得它具有动态记忆的特点。参考文献 16 使用动态循环神经网络标准 Elman 模型的变体(输入层和隐藏层都添加反馈层)建立预测模型,并使用五个不同的股票市场(加拿大、英国、美国、日本) 建立预测模型。以历史交易数据为样本,预测未来一年的股票收益,为个人投资决策提供参考,并进行了成功的探索;论文17使用快速BP算法的递归神经网络标准Elman模型对股票价格进行预测,结果表明,对于相对稳定的股票数据,使用快速BP算法的标准Elman模型的预测结果为优于多层前馈网络和径向基函数网络的预测结果。参考文献 18 使用

18、标准的 BP 算法。6. 概率神经网络概率神经网络是在RBFNN和窗函数密度估计方法的基础上提出的一种新型人工神经网络。它利用样本的先验概率贝叶斯定律和最优判断原理对新样本进行分类,不受多元正态分布等条件限制,在运算过程中可以计算分类后的新输入样本的后验分类.为计算结果提供解释。目前,它在股票预测中的应用很少。参考文献19分别使用了五个模型:概率神经网络、径向基函数神经网络、径向基函数概率混合神经网络、EM算法优化的径向基函数概率混合神经网络、遗传算法优化的径向基函数。采用函数-概率混合神经网络建立股票波动率预测模型,获得了满意的实验结果。用神经网络预测股市,预测的对象也是多种多样的。目前,预

19、测对象主要有以下五种:股票指数预测、股价趋势预测、股票投资策略、股票系统风险预测和股票收益预测、股价预测20等。本文以该股未来两天的最高价为预测对象。近年来,径向基网络(RBF)仍然是人工神经网络研究的热点之一,每年都有大量的成果出现,包括理论研究、算法设计,以及在各个学科的大量应用,包括模式识别与图像处理、自动控制、函数逼近、时间序列、数据挖掘、通信等领域。因此,RBF网络的研究具有很大的理论价值和实用价值。 RBF网络最大的优势在于其强大的函数逼近能力。理论上证明,只要RBF网络有足够多的隐藏节点,就可以任意精度逼近紧集上的连续函数。但如何改进和提高RBF网络的性能仍需深入研究。现有的RB

20、F网络学习策略主要侧重于RBF网络中心的确认,即在径向基函数个数预先确定的情况下,RBF的中心从训练集中随机选取或从训练集以无监督方式或有监督来确定。这就导致了如何像多层前馈神经网络一样确定隐藏层节点数量的问题,这往往会导致网络性能不佳和不必要的体积变大,并增加网络中隐藏层节点的数量,这不能更好地提高网络的性能,造成网络资源的浪费,RBF功能中心的选择显然不能令人满意。第 3 章多层径向函数网络1. 单层径向函数网络算法概述单层径向神经网络使用径向函数如高斯函数作为神经元传递函数,用于逼近非线性函数。从网络结构来看,它由第一层的输入层、第二层的隐藏层和第三层的输出层组成。输入层由输入样本节点组

21、成;隐藏层是径向基层,动作函数是径向函数。当输入样本在输入空间落入一个小圆圈时,隐藏层将发挥作用,隐藏层的输出将是每个隐藏层的加权和,从而完成从输入的非线性变换空间到隐藏层空间;输出层是一个线性层,它提供了从隐藏层空间到输出层空间的线性变换。图 1 说明了径向神经网络的整个输入输出过程。图1 径向函数的输入输出过程径向基函数网络的输入输出关系可以表示为以下形式这里是径向函数参数,其中是径向函数的中心,是径向函数的宽度参数。径向函数网络的学习有几种典型的方法:Mood和 Darken 算法 21该算法首先对样本的输入部分进行聚类分析,通常是k-mean方法,将样本的输入部分分成几类,计算每一类的

22、重心作为径向函数的中心,然后指定径向函数的宽度参数,然后使用最小二乘法确定每个径向函数的组合系数。Poggio 算法 22与 Mood 和 Darken 的算法不同,该算法将每个样本的输入部分视为径向函数数的中心,所以径向函数的个数就是样本的个数。然后指定径向函数的宽度参数,然后用最小二乘法确定每个径向函数的组合系数。正则正交最小二乘法 23让样本为。每个样本输入都是径向函数基中心的候选。记住When all sample inputs are selected as the center of the basis function, there is记住那么矩阵表示如下将矩阵转化为正交回归矩

23、阵形式,那么我们有满意在这里。 When selected as the center of the radial function basis, the approximation error of the model decreases by可以选择对丢弃率有显着贡献的输入样本,直到满足就是停止。这是选择的公差。此时网络的径向函数数为。局部学习方法24局部学习方法的径向函数都使用这样的函数,它们在它们的局部空间中不为0,在其他空间中为0。这样,这些径向函数接近正交。然后我们可以将径向函数一一添加到网络中,直到拟合误差小于预定值。在上述方法中,Mood 和 Darken 的算法是最基本、最简

24、单的。其他方法旨在解决确定径向函数数量的问题。近年来发展起来的方法也是基于如何快速找到径向函数的中心,确定径向函数的个数25,26,27,28。这里我们从另一个角度出发,提高 Mood 和 Darken 算法的精度,间接解决基函数个数的问题。为此,我们提出了一个多层径向函数网络。一层径向函数的逼近能力是有限的。在一层网络的基础上,利用第二层网络对第一层网络的残差函数进行拟合,从而提高拟合精度。在二层网络的基础上,利用第三层网络对二层网络的拟合残差函数进行拟合,得到三层网络,提高了其拟合精度。这样就得到了一个高精度的多层径向函数网络。单层径向函数网络的逼近精度较低,限制了其应用效果。在这里,我们

25、提出了一个多层径向函数网络来克服这个缺点。高精度函数逼近网络在非线性建模,尤其是非线性时间序列和混沌时间序列的建模和预测中具有重要意义。2.多层径向基函数网络(1)径向基函数网络的基本概念(1)径向基函数径向函数是指类峰函数,例如高斯函数这是一个维向量, 。径向基函数网络径向函数网络是一组径向函数的线性组合,即这里构建这个网络的目的是用它来逼近一个真实的函数。通常不知道。我们所知道的只是一个有限样本及其对应的函数值如果在这里是确定性的,即那么这是一个函数逼近问题。如果不确定,即这是随机噪声,所以这是一个非参数回归问题。根据 Mood 和 Darken 的算法,这个网络可以构造如下。让数据样本为

26、它们对应的函数值为将被分成簇(通常是K-means)它们的中心定义为制作使用最小二乘法确定加权系数结果是一个普通的径向函数网络。(2) 多层径向基函数网络假设我们得到了一个单层镜像功能网络这里制作单层镜像函数网络实现的函数值与实际值的误差。制作增强样本在这里。再次成簇_所以我们得到了一个新的集群他们的中心是制作使用最小二乘法确定加权系数制作这里也就是我们使用一个新的径向函数网络来拟合之前网络的拟合残差所以我们得到了一个更准确的模型这是一个 2 层镜像功能网络。重复这一步,我们得到一个多层镜像功能网络基于适当的标准,已确定附加层是最合适的。需要注意的是,在增加样本时中,我们改用,因为的绝对值往往

27、远小于每个分量的绝对值,所以新的聚类受拟合影响的残差影响很小,得到的函数对残差的抵消作用很小。3. 具有多层径向基函数网络的非参数回归当使用多层径向基函数网络进行非参数回归分析时,采用以下方法确定网络的结构和参数。1.网络层数的确定确定网络层数的最简单方法是将样本分成两组,一组用于学习,另一组用于测试。为简单起见,用于学习的样本表示为它们对应的函数值为用于测试的样品是它们对应的函数值为对于学习样本,第 1 层网络的残差为残差平方和为对于测试样本,第 1 层网络的拟合残差为残差平方和为对于第二层网络,学习样本和测试样本的拟合残差分别为残差平方和为这样,第一层径向函数网络对学习样本和测试样本的拟合

28、残差记为残差平方和为那么如果只需将层网络作为我们想要的模型。需要注意的是,在非线性回归和非线性随机时间序列分析中,有时不宜设置测试样本集。我们必须使用信息量标准来确定哪一层是最好的。但是,多层径向基函数网络的信息量计算还处于研究阶段,所以只能用训练集的残差平方和来衡量模型的好坏。这样确定的模型虽然存在过拟合的可能,但在对很多真实数据的分析中,仍然获得了高精度的预测。2.确定对于层网络中的第一个簇,可以取为簇中样本的样本均方,即如果簇中只有一个样本,则取该簇的样本方差作为该层中每个簇的样本方差的平均值。3.确定和由启发式确定。通常在1到10之间。对于前几层,由于误差较大,可以得到较小的值,后面几

29、层由于误差较小,可以得到较大的值。一般来说,增益越大,在增强样本的聚类分析中,误差项对聚类的影响就越大,拟合精度也会提高。但是,如果太大,拟合误差不会随着网络层数的增加而减少甚至增加,因此需要确定一个合理的值。我们可以使用一维搜索来确定该值。即先确定取值区间,然后搜索使测试样本的残差平方和最小。值越大,径向基函数越平坦,不会出现过拟合,但太平坦会降低拟合精度。反之,数值越小,径向基函数越尖锐,拟合精度越好,但如果太尖锐,就会出现过拟合。因此,确定合适的值很重要。其中一种方法是确定一个值区间,一个正确的值,计算测试样本的残差平方和,并使用一维搜索的方法找到使测试样本的残差和最小的最优值。但是,测

30、试样本的残差平方和也取决于总和。我们可以探索sum的最优值如下。第一个固定值,即搜索。设置当时的最小值。重新修复,搜索。让它成为最低限度。在固定,搜索。当时最小的。重新修复,搜索。依此类推,直到收敛或收敛。4.径向基函数个数的确定每层中径向基函数的数量就是簇的数量。首先确定第一层的簇数 QUOTE 。可以根据样本个数来确定,比如样本个数的1/30到1/10 ,即平均每个簇分配10到30个样本。因为拟合误差函数一般比原函数复杂,所以第二层之后的簇数可以更大,一般是1到2倍,但必须保证每个簇的平均样本数为5,即,不超过样本数的 1/5。第四章时间序列的建模与预测一、基本原则使用多层径向基函数网络对

31、时间序列进行建模就是将此网络用作非线性回归模型。特殊情况的类型。时间序列的一般模型是这里是白噪声。制作是初始条件,对应的输出值为所以有这样就可以使用第 3 章中描述的方法进行建模。确定过程如下:让表示模型信息的数量,例如的值。然后让,记录模型的模型信息量,比如的值。然后,记录模型信息的数量,例如的值。假设然后拿一旦建模完成,就可以对时间序列进行预测。从我们所知道的开始,我们得到一个估计再次订购由此,我们得到一组时间序列的预测值.2. 在股票预测中的应用本文选取中视(600088)2009年4月20日至2010年6月10日的股票收盘价数据,共280条数据。在启发式期间将程序的最大层数设置为 20

32、。样本数n=280,数据分为两组,一组用于训练和学习,一组用于预测,其中275个数据用于学习,5个数据用于预测。 5更合适。本文将延迟步数设置为 1 到 5,并测试每种类型的延迟步数以选择最佳宽度系数值 ,然后比较这五种类型的拟合精度,最终得到最佳模型。需要说明的是,多层径向基函数网络的信息量计算公式还处于研究阶段,我们暂时用残差平方和代替信息量。这样做可能会导致模型过拟合,降低预测精度,但计算机实验结果表明,该模型仍然具有良好的预测精度。确定延迟步数为 1的值的过程我们取观测样本数为 5,预测数为 5,增广数据系数,第 1 层聚类数为 9,第 2 次后聚类数为 15。确定宽度因子启发式地。测

33、试结果如下表所示:表 1 延迟步数为 1 时的取值过程 (1)2010060420100607201006082010060920100610平均值实际价值24.824.1824.6824.8925.2824.766d=1024.691424.72924.332424.682724.754724.63804d=1524.701724.740624.324124.692524.766524.64508d=2024.786324.844824.276224.772424.880324.712d=2524.769624.816624.311824.758224.843524.69994d=3024.

34、696824.742924.30624.686424.77524.64142相对误差0.44%2.27%1.41%0.83%2.08%1.406%0.40%2.32%1.44%0.79%2.03%1.396%0.06%2.75%1.64%0.47%1.58%1.300%0.12%2.63%1.49%0.53%1.73%1.300%0.42%2.33%1.52%0.82%2.00%1.418%通过上表的观察可以发现,随着从10到30的变化,相对误差的平均值先减小后增大,求和相等时得到最小平均相对误差。观察相对误差的平均值在 20 和 25 之间的变化,从中选出最佳值。启发式过程如表2所示:表 2

35、 延迟步数为 1 时的取值过程 (2)2010060420100607201006082010060920100610平均值实际价值24.824.1824.6824.8925.2824.766d=2024.786324.844824.276224.772424.880324.712d=2124.79724.875524.239724.779224.927324.72374d=2224.730924.77524.315424.720524.802524.66886d=2324.794224.850624.284624.780724.883624.71874d=2424.791824.844224

36、.293824.779124.87424.71658d=2524.769624.816624.311824.758224.843524.69994相对误差 m0.0552%2.7494%1.6361%0.4725%1.5811%1.2989%0.0121%2.8763%1.7840%0.4452%1.3952%1.3026%0.2786%2.4607%1.4773%0.6810%1.8888%1.3573%0.0234%2.7734%1.6021%0.4391%1.5680%1.2812%0.0331%2.7469%1.5648%0.4456%1.6060%1.2793%0.1226%2.63

37、28%1.4919%0.5295%1.7267%1.3007%从图中不难看出,当时的相对误差是最小的。由此我们可以确定函数模型的预测精度在 时最高。此时,最佳层数为 3。延迟步数为 1 时的拟合误差指数层 最小误差值 最大误差值 平均误差 残差平方和- -1 0.0015654 2.1390533 0.4942203 112.28048932 0.000366952 1.9702120 0.4150932 90.51692043 0.000228606 1.9704613 0.4151024 90.51690314 0.000228606 1.9704613 0.4151024 90.5169

38、0315 0.000228606 1.9704613 0.4151024 90.51690316 0.000228606 1.9704613 0.4151024 90.51690317 0.000228606 1.9704613 0.4151024 90.51690318 0.000228606 1.9704613 0.4151024 90.51690319 0.000228606 1.9704613 0.4151024 90.516903110 0.000228606 1.9704613 0.4151024 90.516903111 0.000228606 1.9704613 0.41510

39、24 90.516903112 0.000228606 1.9704613 0.4151024 90.516903113 0.000228606 1.9704613 0.4151024 90.516903114 0.000228606 1.9704613 0.4151024 90.516903115 0.000228606 1.9704613 0.4151024 90.516903116 0.000228606 1.9704613 0.4151024 90.516903117 0.000228606 1.9704613 0.4151024 90.516903118 0.000228606 1.

40、9704613 0.4151024 90.516903119 0.000228606 1.9704613 0.4151024 90.516903120 0.000228606 1.9704613 0.4151024 90.5169031延迟步数为 1 时的预测误差指数层 最小误差值 最大误差值 平均误差 残差平方和- -1 0.0211526 0.8210685 0.3130287 0.91462632 0.0079583 0.6645090 0.3150105 0.76762393 0.0081913 0.6642220 0.3151052 0.76754454 0.0081913 0.66

41、42220 0.3151052 0.76754455 0.0081913 0.6642220 0.3151052 0.76754456 0.0081913 0.6642220 0.3151052 0.76754457 0.0081913 0.6642220 0.3151052 0.76754458 0.0081913 0.6642220 0.3151052 0.76754459 0.0081913 0.6642220 0.3151052 0.767544510 0.0081913 0.6642220 0.3151052 0.767544511 0.0081913 0.6642220 0.315

42、1052 0.767544512 0.0081913 0.6642220 0.3151052 0.767544513 0.0081913 0.6642220 0.3151052 0.767544514 0.0081913 0.6642220 0.3151052 0.767544515 0.0081913 0.6642220 0.3151052 0.767544516 0.0081913 0.6642220 0.3151052 0.767544517 0.0081913 0.6642220 0.3151052 0.767544518 0.0081913 0.6642220 0.3151052 0

43、.767544519 0.0081913 0.6642220 0.3151052 0.7675445200.00819130.66422200.31510520.7675445- -通过观察不难发现,当层数从1变为20时,平均误差从0.3130287增加到0.3151052,随着层数的不断增加,从0.9146263逐渐减小到0.7675445。上述两个error的值在达到第三级后不会发生变化,所以我们可以认为网络已经收敛到这里。图 2 和图 3 给出了延迟步长为 1 的拟合曲线和预测曲线。延迟步数为 1 时第三层的拟合结果, , ,(星号为实际值,圆点为拟合值)延迟步长为 1 时第三层的预测结

44、果, , ,(星号为实际值,圆点为拟合值)从图中可以直观的发现,训练集和预测集的拟合度非常高。预测值、误差和相对误差见表5。从表中可以看出,相对误差很小。表 5 延迟步长为 1 的预测误差度量最优参数时间收盘价预计收盘价错误相对误差a=5 d=24层数=32010060424.824.79180.00820.033%2010060724.1824.8442-0.66422.747%2010060824.6824.29380.38621.565%2010060924.8924.77910.11090.446%2010061025.2824.8740.4061.606%(2) 延迟步数为25时的宽

45、度系数值的确定延迟步数为2-5时,宽度系数取值的确定过程与延迟步数为1时相同,均采用试探法,从大范围搜索到小范围搜索规模搜索。通过这样的实验,可以确定参数的最优值,即延迟步数为 2 到 5 。实验结果如下1、延迟步数为2时的实验结果:表 6 给出了延迟步数为 2 时的预测误差指标表 6 延迟步长为 2 的预测误差度量最优参数时间收盘价预计收盘价错误相对误差a=5 d=80 层=52010060424.824.0650.7352.964%2010060724.1824.5638-0.38381.587%2010060824.6824.60910.07090.287%2010060924.8924

46、.50930.38071.530%2010061025.2824.55820.72182.855%图 4 和图 5 分别为延迟步数为 2 时的拟合曲线图和预测曲线图。延迟步长为 2 时第三层的拟合结果, , ,(星号为实际值,圆点为拟合值)延迟步数为 2 时第三层的预测结果, ,(星号为实际值,圆点为拟合值)2.延迟步数为3时的实验结果:表 7 给出了延迟步数为 3 时的预测误差指标表 7 延迟步长为 3 的预测误差度量最优参数时间收盘价预计收盘价错误相对误差a=5 d=50层数=12010060424.824.4050.3951.593%2010060724.1824.8998-0.7198

47、2.977%2010060824.6824.7393-0.05930.240%2010060924.8925.0123-0.12230.491%2010061025.2824.86810.41191.629%图 6 和图 7 给出了延迟步长为 3 的拟合曲线和预测曲线。延迟步长为 3 时第一层的拟合结果, , ,(星号为实际值,圆点为拟合值)延迟步数为3时第一层的预测结果, ,(星号为实际值,圆点为拟合值)3、延迟步数为4时的实验结果:表 8 给出了延迟步数为 4 时的预测误差指数表 8 延迟步长为 4 的预测误差度量最优参数时间收盘价预计收盘价错误相对误差a=5 d=40 层=1120100

48、60424.824.14770.65232.630%2010060724.1824.16650.01350.056%2010060824.6824.8176-0.13760.558%2010060924.8924.59780.29221.174%2010061025.2825.00280.27721.097%图 8 和图 9 给出了延迟步长为 4 的拟合曲线和预测曲线。延迟步长为 4 时第 11 层的拟合结果, ,(星号为实际值,圆点为拟合值)延迟步数为 4 时第 11 层的预测结果, ,(星号为实际值,圆点为拟合值)4、延迟步数为5时的实验结果:表 9 给出了延迟步数为 5 时的预测误差指标

49、表 9 延迟步长为 5 的预测误差度量最优参数时间收盘价预计收盘价错误相对误差a=5 d=80 层=202010060424.824.70260.09740.393%2010060724.1824.1320.0480.199%2010060824.6824.7638-0.08380.340%2010060924.8925.4252-0.53522.150%2010061025.2825.06140.21860.865%图 10 和图 11 给出了延迟步长为 5 的拟合曲线和预测曲线。图 10 延迟步数为 5, , , 第 20 层的拟合结果(星号为实际值,圆点为拟合值)图 11 延迟步数为 5

50、, , , 第 20 层的预测结果(星号为实际值,圆点为拟合值)(3) 最佳延迟步数的选择在确定每个延迟步长的最优d值后,需要对选择的模型进行横向比较,从而选择出逼近能力更强、学习效果更好、预测精度更高的参数模型。下面将根据上述各种预测结果的平均相对误差来评价预测效果。见表 10各模型的平均相对预测误差延迟步骤的预测误差的预测误差的预测误差的预测误差的预测误差平均相对预测误差错误大小排序10.033%2.747%1.565%0.446%1.606%1.279%322.964%1.587%0.287%1.530%2.855%1.845%531.593%2.977%0.240%0.491%1.62

51、9%1.386%442.630%0.056%0.558%1.174%1.097%1.103%250.393%0.199%0.340%2.150%0.865%0.789%1看上表不难看出,当延迟步数为 5, , ,层数为 20 时,多层径向基函数网络在预测股票价格时达到了很高的准确率,并且预测误差很小,是一个比较满意的模型。第五章小结本文建立的多层径向基函数网络模型取得了良好的拟合效果,同时也具有良好的短期预测效果。但在实验中发现,随着样本延迟步数由小变大,网络的结构和参数也发生了变化。这说明股价走势的波动模式具有短期稳定性和波动性,即模型对样本敏感。使用单一模型进行预测将不太有效。金融市场是一

52、个复杂的系统,市场表现出来的行为实际上是投资者群体行为的统计结果。价格走势的发展过程反映了投资者群体心理特征的变化轨迹。在一个阶段,是一种心态,在另一个阶段,又会变成另一种心态。正是这种心态的变化导致了价格的变化。 ,这反过来又导致了预测模型的变化。我们在进行趋势分析时,要及时掌握群众心理的变化,从而预测未来市场趋势可能向哪个方向发展。股票价格预测是一个有争议的问题,而多层径向基网络函数分析方法是市场行为统计分析的有效工具,具有广阔的前景。实证研究表明,股价波动是有规律的。我们可以根据历史价格时间序列数据建立价格波动模型,进行短期预测,可以帮助我们发现投资机会,规避投资风险。方法验证。政策分析

53、和基本面分析仍然具有重要的应用价值。在短期内,价格与实际价值关系不大。尤其是对中小投资者来说,要充分发挥小本钱、更容易进入市场的优势。波段操作是为了最大化投资回报,但从长远来看,价格是由价值决定的。本文建立的时间序列模型具有良好的短期预测效果,可实现动态连续预测,对投资者规避风险、把握买卖时机具有重要的实用价值。至首先,我想把我最大的心意献给我的导师庄健先生。庄先生学识渊博,治学严谨,平易近人。他从头到尾关心、指导和激励我的写作。他为这篇文章付出了很多努力。如果没有庄老师的无私帮助和细心指导,我无论如何也无法完成这篇文章。庄先生高尚的品格、无私的奉献精神和严谨的学术态度将使我受益终生。其次,感

54、谢姜海峰老师提供给我们的节目。在写这篇论文的过程中,我不仅收获了知识,也收获了毅力和感恩。它让我意识到认真和脚踏实地的重要性。我衷心感谢参考文献中列出的论文的作者,他们的工作是我在本文中工作的基础。最后,衷心感谢所有审阅本文的老师们的支持和厚爱。春天2010参考1 程,程晓玲,尹禄江。基于人工神经网络方法的上市公司股价预测J.统计和决策,2005 年,12(第 2 部分):106-108。2 王博,冯玲。股票预测中神经网络与时间序列模型的比较J理工大学学报, 2005.12, 27(6):69-73.3 钟颖,王炳文.基于遗传算法的BP神经网络时间序列预测模型J系统工程与电子技术, 2002

55、, 24 (4): 9-11.4 林建宇. BP神经网络结合遗传算法的股市预测研究J计算机,2005,12:91-92。5 欧阳林群.基于GA-BP的个股超短期预测应用研究J微机信息, 2007, 01Z: 306-307.6 迎春基于模糊神经网络的股价预测研究D.:气象学院,2003.7尹鸿才,春燕,王家秋模糊神经网络在股市预测中的应用J科技大学学报。 2007-04:85-88。8 建新,胡刚基于模糊概率的股价波动分析模型J系统工程理论与实践,2006-09:33-42。9 洪英,吴斌。小波神经网络研究与展望J西南工学院学报, 2002, 17(1): 8-10, 15.10 钟满天.基于

56、小波神经网络非线性逼近的股票分析与预测方法研究D. :科技大学,2007。11 连新宇,吴立峰基于小波神经网络的股票价格预测J商场现代化。 2006482:331-332。12 常松,何建民结合小波包和神经网络的股价预测模型J东南大学学报(自然科学版), 2001.31(5):90-95。13 王敬宝径向基函数网络(RBF)在股市预测中的应用J.计算机与信息技术,2007,第 2 期:40-41。14 应,王艳华基于RBF网络的股市混沌预测J.经济管理干部学院学报,2005-05:72-7315宗伟,王美娟,舒华基于径向基神经网络的股票价格预测J.科技大学学报,2002-01:16 Jovin

57、a Roman 和 Akhtar Jameel。反向传播和递归神经网络在多重股票市场收益的财务分析中J。第 29 届夏威夷年度系统科学国际会议论文集,1996 年。17 林春艳,朱东华基于Elman神经网络的股价预测研究J.计算机应用,2006,2(2):446-447 至484。18 翁军,林曦 BP网络、RBF网络和Elman网络在股价预测中的应用C,1999中国智能自动化会议论文集(第1卷):205-210。19 贾白概率神经网络的改进及其在股票预测中的应用研究D.:暨南大学,2007.20 吴晓伟.基于人工神经网络的股价预测模型研究D.:科技大学,2004。21 Moody J, Da

58、rken C. 本地调整处理单元网络中的快速学习。神经计算,1989 (1): 281-29422 Piggio T,Girosi F,近似和学习的网络理论。 AI 备忘录 No 1140,人工智能实验室理工学院,Cambridge马萨诸塞州,1989 年23 Chen S, Cheng ES, Ai Kadhimi, K. 构造径向基函数网络的正则化最小二乘学习算法J, 国际控制杂志, 1996,64(5): 829-83724 泰勒霍尔科姆,曼弗雷德莫拉里。径向基函数网络的局部学习:解决隐藏单元问题。美国控制会议,1991:2331-233525 Ho SL, Fei MR, Fu WN,

59、 et al.基于RBD网络的无刷直流电机输出特性估计策略J. IEEE Transactions on Neural Networks on Magnetics, 2002, 38(2): 1033-1036。26 Yu DL,Yu DW,Gomm JB,等。基于模型的控制的自适应 RBF 模型C,第五届世界智能控制与自动化大会论文集。 IEEE 出版社,2004:78-82。27 李凯,彭建新,白依文. 一种快速非线性模型辨识方法J. IEEE Transactions on Automatic Control, 2005, 50(80): 1211-1216。28 李凯,彭建新,白依文.

60、 一种非线性动力系统辨识的两阶段算法J.自动, 2006, 42(7): 1189-1197附录一程序将步骤数扩展到 5 个程序数据原始数据;输入次数 spj;x1=滞后(spj);x2=滞后2(spj);x3=lag3(spj);x4=lag4(spj);x5=lag5(spj);如果x5 = .thendelete ;t+ 1 ;时间yymmdd8 。 ;格式化时间yymmdd8。 ;卡片;样本;% 宏mxz ;proc转置数据=menx out=cxz 前缀=p;数据 dxz;设置 cxz;%do i= 1 %to &m ;如果 p&i= .或 p&i= 0然后 p&i=mean(of

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论