论文基于B神经网络的上证股票指数预测_第1页
论文基于B神经网络的上证股票指数预测_第2页
论文基于B神经网络的上证股票指数预测_第3页
论文基于B神经网络的上证股票指数预测_第4页
论文基于B神经网络的上证股票指数预测_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于BP神经网络的上证股票指数预测 ShanghaiShanghai StockStock IndexIndex PredictionPrediction withwith NeuralNeural NetworksNetworks 内容提要 证券市场作为高风险高收益的投资领域一直倍受投资者的关注 如何能够准 确分析和预测股票价格以便获取丰厚的收益一直受到人们的关注 于是各种股票 价格分析预测和方法应运而生 如何建立一个成功率比较高的预测理论和模型是 多年来许多学者一直研究的内容 随着证券市场混沌和分形理论的逐步确立 人们开始利用神经网络对证券市 场的变动加以预测 神经网络是一种重要的人工智能技术 它的研究开始于20世 纪40年代 近年来 神经网络任意连续映射的逼近能力学习理论以及动态网络的 稳定性分析都已取得了丰硕的成果 在应用上也迅速扩展到许多重要的领域涉及 模式识别与图象处理 控制与优化 ATM网络中呼叫接纳的识别与控制 导航 多媒体处理系统等等 神经网络的自适应学习非线性映射强的特点非常适合应用 于经济领域的信息处理以及分析时间序列 BP Back Propagation 网络是一种被广泛运用的神经网络 它的核心是 BP算法 一种对于多基本子系统构成的大系统进行微商计算的严格而有效的方法 结构简单 算法成熟 与传统统计回归方法相比 神经网络不仅能够学习训练集 的例子 且能从训练集中提炼出某种一般性原理 规律 具有很强 的非线性函 数拟合特性 这对于预测短周期内股指波动有较强的适用性 本文尝试利用基于BP算法的三层向前神经网络对上海交易所上证指数进行了 预测 并针对BP网络原形的一些缺点和不足 对原有的预测方法作出了一些改进 在实际预测中取得了良好的效果 关键词 指数预测 神经网络 关键词 指数预测 神经网络 BPBP算法算法 AbstractAbstract To be an investment region of high risk and high profit Stock market attracts many investors attentions all along How to obtain profit through analyzing and forecasting the share price accurately is attracting the people s attentions With the developing of Fractal Market Hypothesis FMH theory people have tried to forecast the change of the Stock market The neural network is an important technology in the filed of AI which was developed in 1940 s In recent years the theory about the approximation of random continuous maps by neural network and the analyzing of the stability of a dynamic network have been used in many fields and gained great achievement BP Back Propagation is a neural network which is adopted widely The core is the BP arithmetic a strict and effective method to derivative problem for system based on multi subsystem which has simple configuration and mature arithmetic To compare with the traditional statistical regress method BP network can not only study the example of training set but also abstract some general theory and rule It has strong characteristic of approximation of non linear functions which is much fit for stock index analyzed and predicted in a short term This article tries to use a neural network on the base of BP arithmetic to forecast the share index of Shanghai stock exchange Meanwhile it makes some improvement to the original forecast method according to the limitation and disadvantage of the BP network original shape KeywordsKeywords StockStock IndexIndex ForecastingForecasting NeuralNeural NetworksNetworks BPBP arithmeticarithmetic 目目 录录 前言前言 1 1 第一章第一章股票市场的分形特征及其指数的预测方法股票市场的分形特征及其指数的预测方法 2 2 第一节 股票市场的分形特征第一节 股票市场的分形特征 2 2 1 传统的有效市场假说 2 2 分形市场的假说 FMH 3 第二节第二节 分形市场的判断分形市场的判断 5 5 1 分形市场的常用判断方法 5 2 使用 R S 法计算 Hurst 指数 5 3 R S 计算的结果分析 10 第二章第二章 利用神经网络对具有分形特征的时间数列进行预测利用神经网络对具有分形特征的时间数列进行预测 10 10 第一节第一节 常用的混沌时间序列分析预测方法常用的混沌时间序列分析预测方法 10 10 第二节第二节 神经网络的基本原理神经网络的基本原理 10 10 1 人工神经网络的历史 11 2 神经网络的特点 12 3 神经网络的基本原理 13 第三节第三节 基于基于BPBP算法的三层向前的神经网络算法的三层向前的神经网络 15 15 1 多层次的神经网络 15 2 BP网络的基本原理 16 第三章第三章 对对BPBP神经网络的改进神经网络的改进 17 17 第一节第一节 BPBP网络的缺陷网络的缺陷 1717 第二节第二节 与与BPBP算法相结合的遗传算法算法相结合的遗传算法 1818 1 遗传算法简介 18 2 遗传算法的基本原理 19 3 遗传算法与传统BP神经网络的结合 20 第三节第三节 在样本输入中添加随机噪声在样本输入中添加随机噪声 21 21 第四节第四节 多个神经网络集成预测多个神经网络集成预测 22 22 第四章第四章 实证结果及其分析实证结果及其分析 2424 第一节第一节神经网络结构设计神经网络结构设计 24 24 第二节第二节 利用利用BPBP神经网络预测上证指数的流程神经网络预测上证指数的流程 26 26 第三节第三节 实际预测结果实际预测结果 28 28 第四节第四节 对预测结果的分析和思考对预测结果的分析和思考 3434 第五节第五节 总结总结 3535 前言前言 从股市诞生一百多年以来 不断有人用各种方式研究股市运行的规律 人们 希望能从复杂多变的股市中找到一个规律来预测股市未来的发展 从而通过证券 交易获得最大的投资净效用 另一方面 随着证券市场的飞速发展 证券市场 与经济发展的关系越来越密切 证券市场在成为世界公认的经济晴雨表的同时 也对经济的发展产生着发作用 因此预测股票市场的变化趋势更对经济发展的管 理和调控有着重要的参考作用 如何能够准确分析和预测股票价格 各种股票价格分析预测和方法应运而生 如 何建立一个成功率比较高的预测理论和模型是多年来许多学者一直研究的内容 国外的研究者先后提出了一系列的定价理论和投资组合模型如马柯威茨的投资组 合理论夏普等人的CAPM以及罗斯的APT然而投资者们发现虽然这些理论极大地开 阔和提高了投资者的思想理念及其对风险和收益的辨证理解但对实际操作却缺乏 明确的指导作用 随着近年来人工智能方法研究的发展以及证券市场一些特性逐渐被人所揭示 一些新的预测方式开始浮出水面 神经网络由于其在分析和预测时间序列方面 的独到优势 逐渐成为构建证券预测模型的有力工具 我国证券市场自 90 年代初期成立以来 虽然经历的时间只有短短 15 年 经过 15 年的努力 中国证券市场取得了巨大的成就 当前深圳 上海两家证券 交易所总市值达到 4 万多亿元 已经有 1300 多家的上市公司 7000 多万名投资 者 对我国证券市场走势的预测同样有着重要的意思 上海证券交易所编制的上证综合指数 该指数以 1990 年 12 月 19 日为基日 以该日所有股票的市价总值为基期 基期指数定为 100 点 自 1991 年 7 月 15 日 起正式发布 上证指数将上海交易所流通股票的总市值的变动以指数的形式表示 出来 易于计算 上证指数的变化情况准确的反映着证券市场的波动情况 对 于上证指数的预测工作不但能够帮助资本市场的投资者对后市发展进行分析获取 收益 对分析和微调我国经济发展方向也有着重要的参考价值 本文在意在研究股票市场的一些基本的特点 通过尝试利用神经网络对上证 指数的变化趋势进行了预测 探索为预测我国证券市场指数的变动提供了一种具 有一定准确性与可操作性的实用方法 第一章 股票市场的分形特征及其指数的预测方法 第一节 股票市场的分形特征 1 1 11 1 1 传统的有效市场假说传统的有效市场假说 美国经济学家 Fama1965 年在其经典文献中提出了有效市场假说 Efficient Market Hypothesis EMH 他认为投资者对市场信息会作出合 理的反应 应该将市场信息与股票价格相结合 在 EMH 假说里 市场是一个鞅 或 公平博弈 即信息不能被用来在市场上获利 即 如果在一个证券市场 中 价格完全反映了所有可获得的信息 那么就称这样的市场为有效市场 经济学家 Roberts 根据信息集的不同内涵 区别了三个层次的市场效率 即弱型效率 半强型效率 强型效率 这种分类法被 Fama 确定而成为经典 这三种信息集分别为 1 历史价格信息 通常指证券过去的价格和成交 量 2 所有可公开得到的信息 包括盈利报告 年度财务报告 财务分析人 员公布的盈利预测和公司发布的新闻 公告等 3 所有可知的信息 包括不 为投资大众所了解的内幕信息 与这三类信息相对应 有效率的市场可分为弱型 效率 半强型效率 强型效率 弱型效率 Weak Form Efficiency 认为价格反映了包含在历史价格序列 中的所有信息 投资者不能通过分析历史价格获得超常收益 这意味着技术分析 无效 弱型效率是证券市场效率的最低程度 半强型效率 Semistrong Form Efficiency 认为如果市场达到半强型有效 则分析资产负债表 损益表 宣布股利的变化或股票拆细和其它任何有关公司的 公开信息不能获得超常收益 这意味着基础分析无效 半强型效率是证券市场效 率的中间状态 证券价格已充分 及时地反映了公开信息 强型效率 Strong Form Efficiency 认为市场参与者知道的有关公司所 有的信息都已充分反映在股价当中 即使那些拥有优越信息的人也无法获得超常 收益 强型效率是市场效率的最高程度 它包含了弱型效率和半强型效率 如果市场是有效的 意味着即使是专业投资人也无法败市场 那么实际上就 否定了积极管理的投资理念 相反 如果市场无效 那么投资者和投资机构就可 以通过构造组合 创造超过市场的收益 市场有效性假说是理性预期学派理论的重要基础 它是数量话资本市场理 论的基础 现代经典的资本市场理论以及证券技术分析方法很多都是从 EMH 假说 上发展起来的 进入上世纪 80 年代 在探寻一般均衡定价模型进展不大的情况下 人们开 始将定价理论的研究方向转向注重市场信息的考察 经过实证检验 邦德特和塞 勒 Bondt and Theler 1985 发现股市存在投资者有时对某些消息反应过度 overreact 而杰格蒂什 Jegadeesh 1990 莱曼 Lehmann 1990 等则发现 了股价短期滞后反应现象 由此 杰格蒂什和迪特曼 Titman 1993 认为投资者 对有关公司长远发展的消息往往有过度的反应 而对只影响短期收益的消息则反 应不足 关于这一点仍然存在着争论 尽管如此 信息与股价之间应存在着某种 关系得到了经济学家们的认同 并且 弗伦奇和罗尔 Roll 的实证研究证明了股 价波动幅度与可获得信息量之间存在着良好的正相关关系 然而 EMH 假说同样存在着明显的缺陷 一是对信息的反应 并非以因果关 系的形式呈现 由于信息的分布是狭峰态的 因而价格变化的分布也应该是狭峰 态的 从而人们对信息的作出的反应是非线形的 一旦信息水平达到了某个临界 值 人们才会对所忽略的信息作出反应 并直接达到临界值 二是 EMH 假说没有 涉及到市场的流动性问题 一个稳定的市场有 EMH 描述的有效市场并不相同 一 个稳定的市场是一个富有流动性的市场 如果市场富有流动性 那么可以认为 价格是接近公平的 然而市场不是一直富有流动性的 三是市场的有效性并不一 定意味着随即游走 但随即游走的确意味着是市场是有效的 四是市场的有效性 检验 对市场的有效性检验仍然停留在最初的随即游走模型上 然而满足随机游 走模型只能看作是市场有效性的充分条件而不是必要条件 不满足随机游走模型 的市场不一定就是无效的 五是有关效应的问题 股票收益的季节性 大小效应 等都不利于 EMH 假说 上世纪 80 年代以来的许多相关的统计检验也出现了与有效市场理论假设相 冲突的股价异常现象 即证券市场异象 出现了任何一种股票或其组合的平均超 常收益率不为零的证券市场异象 并且诸如价值异象 时间效应 规模效应 公 告效应 处置效应等异常现象在金融市场上频繁出现 运用 EMH 理论却很难解释 以 Manddlborot 为代表的一些学者对 EMH 理论提出了质疑 他们认为资本市 场的收益率并不服从正态分布 其分布具有尖峰 厚尾等特征 实际上服从稳定 帕累托分布 在这类分布中 方差是无定义或者无限的 在一定的条件下它对 应与分数布郎运动 具有自相似 长期相关 统计相关等特性 因此传统的的 资本市场方法无法准确的反映市场的 1 1 21 1 2 分形市场的假说 分形市场的假说 FMHFMH 面对 EMH 理论的种种不足 金融学家们开始尝试利用非线性方法与混沌思想 来理解股票市场行为 并开始探索的描述市场特性的假说 20 世纪 80 年代初 美国经济学家 Stutzer 最先将新兴的混沌理论和方法用于分析宏观经济中非规则 增长和经济增长中显现的混沌等问题 之后不久 国外经济学家们便开始运用混 沌理论 研究和探讨包报财政 金融在内的经济和管理方面的问题 特别是有关 证券市场股价指数 汇率变化方面的研究格外引入注目 金融证券市场越来越多 的混沌特征被逐步揭示了出来 分形原理作为混沌研究的重要组成 近年来取得了很大进展 1996 年 Edgar E Peters 在 Chaos and Order in the Capital Markets 一书里提出了分形市 场的假说 Fractal Market Hypothesis FMH 将分形理论用于资本市场 并 且成功的建立了标准普而 500 家公司股票日周月年之间的收益曲线的自相似性 分形是 20 世纪 70 年代后发展起来的一门新兴的复杂科学 它研究的是一种特 伍恒煜 林详 金融市场非线形 混沌与分形 商业研究 2003 年第 7 期 殊的复杂系统 自相似 系统 即在不同标度下存在相同或相似特征的系统 分形的一个奇怪性质是 它们不具有通常情况下用于测量的特征标度 并且具有特 殊的特征量 介于整数维之间的分数维 著名的海岸线测量就是分形的一个例子 人们发现在测量海岸线长度时 所测长度取决于用来测量的尺子长度 尺子越短 所测的实际长度就越长 其原因是所用的尺子越短 系统内部相似的细微结构就越 多地被揭示出来 在金融市场上 我们也观察到类似的分形结构 价格序列在日 周 月的轨迹 具有相似性 我们无法确切地将它们分辨开来 基于这一观察 以及金融市场分形 性质的不断发现 Peters 提出的分形市场假说 即金融市场本质上是一个复杂系统 而分形是刻划这一系统的有力工具 依据最近的研究进展 我们对这一假说提出部 分修正 即金融市场事实上是有界的分形系统 有界分形指的是市场的分形性质是 有界的 金融市场上并不存在无限尺度上的自相似特征 分形市场是指市场是内在波动的 不存在一个静态的均衡 同时向投资者提 供了一个稳定性和流动性的环境 这里的稳定不是均衡 而是相对市场的崩溃而 言的 不同于有效市场假说 分形市场理论认为 信息依照投资者的投资偏好而 被评读 因为具有不同的投资偏好的投资人对信息的评估是不同的 所以信息的 传播也是不均衡的 市场价格不可能每一次都反映出所有相关的信息 而只是反 映出投资人偏好的那部分信息 这样的结果就是市场的强烈波动被吸收而呈现出 稳定发展的形态 FHM 理论认为市场价格是保持流动和稳定性的结果 而不是 EMH 认为的博奕结果 价格不能线形的反映出所有的信息 价格的变化不是相互独立 的 在分形市场上是不存在理性人的假设 投资人的决策依赖于历史的经验 证 券价格具有一定周期的长期记忆性 只有在市场面临突发的重大事件 大部分投 资者对信息的观点相同的时候 才会破坏这样的稳定性 造成突然的暴涨和暴跌 行情 分形市场假说主要考察金融市场上存在的长程相关 Long range dependence 或 Long memory 和标度行为 Scaling behavior 通过全新的观念和工具 它为 揭示金融市场可能存在的内在结构提供了新的洞察力 分形市场假说强调了流动性的影响已经基于投资者行为之上的投资偏好 分 形市场假说的目的是给研究者一个符合实际观测到的投资人行为和市场价格运动 的模型 FMH 的主要内容包含了以下 5 个方面 1 市场由众多投资者组成 他们具有不同的投资时间尺度 如长线的或 者短线的 这使他们有着不同的投资行为 2 信息对于投资时间尺度不同的投资人的影响是不同的 短线的投资者主 要是投资行为主要是频繁的加交易 因此他们比较关注技术分析信息 而基本 面的信息经常被忽略 长线的投资者则认为技术面的分析的信息不能用于长期的 的投资决策 只有对证券的内在价值进行评估才能获得长期的投资收益 3 市场的稳定在于市场的流动性的保持 而要作到这点需要大量的具有不 同的时间投资尺度的投资人的存在 在证券市场上 正是因为具有大量不同投 资时间尺度的投资者的存在 才使得市场稳定而具有活力 当所有投资人的尺度 如果趋向一致的时候 市场的稳定必然被破坏 4 基于以上特点 证券市场的价格是长线基本面分析和短线技术分析共 同作用的结果 一般来说短期的价格比长期的价格变化更具有易变性 市场发展 的内在趋势反映了投资者期望收益的变化 并受到整个经济大环境的影响 短期 交易行为更多的是从众行为的结果 因此 市场的短期倾向与市场的长期趋势 并无内在的一致性 5 如果证券与经济循环没有关系 那么就不存在长期的趋势 交易 流 动性和短期信息将在市场里起到决定性的作用 FMH 和 EMH 理论的不同在于 分形市场假说认为资产的价格并非纯粹的随 机运动 而是服从一定的规律分布 是由价格决定系统的混沌性质所引起的 FMH 理论强调信息对不同投资时间尺度的投资者所产生的影响是不同的 信息传 播是不均衡的 价格变化不是独立的 第二节第二节 分形市场的判断分形市场的判断 1 2 11 2 1 分形市场的常用判断方法分形市场的常用判断方法 那么怎么判断一个市场是不是存在分型特征呢 要描述一个系统的分形 特征 经常被采用的方法包括 1 相关维 相关维指标的作用在于用来判断对象系统的行为是否混沌的 说明了为描述该系统所需要的最多独立变量数 独立变量的个数某种程度上反映 了系统方程的复杂程度 但不能完全反映系统结果的复杂程度 2 李雅普诺夫指数 利用李雅普诺夫指数可以判断对象系统的行为是否 混沌的 该指数还说明了该系统的动力行为在某个方向上是指数发散或收敛的 李雅普诺夫定量地给出了系统在某个方向上发散的速度 因此从最大李雅普诺夫 指数我们可以知道系统包含的信息损失的最大速度 最大李雅普诺夫指数的倒数 就给出了对象系统的最大可预报时间 3 Kolmogrov嫡 到目前为止 Kolmogrov墒仅用于判断数据结构中的混 沌性质 4 Hurst指数 Hurst指数说明了时间序列的持续性行为 大于0 5的 Hurst指数表明序列是持续性的 小于0 5则序列是反持续性的 Hurst指数还反映 出时间序列的分形特征 从时间尺度上看 Hurst指数越是靠近0 5 序列的结构 越复杂 其时间曲线越是曲折 1 2 21 2 2 使用使用 R SR S 法计算法计算 HurstHurst 指数指数 用 R S 分析法计算 Hurst 指数的方法是一种常用的 用来检验系统是否具有 分形特征的办法 具有简单易行的特点 陈永忠 分形市场假说下的风险度量 经济师 2004 年第 8 期 Peters E E Fractal Market Analysis Applying Chaos Theory to Investment and Economics M John Wiley 是时间序列的标准差 表示偏离均值 n S 的程度 是分散程度的测度 表示极差的大小重新用 来衡量 这就是重 n n S R n S 标极差法的名字的由来 R S法可以用于统计分析可用来研究一大类问题 对于方差发散或有长期记 作用的随机过程都适用 下面是R S 分析的具体过程 考虑一个收益率序列 偏离均值的累积和为 1 y 2 y n y i y 1 1 t i nint myX 其中 是n 期的累积偏差 是n 期的平均值 nt X n m n 个数据的极差就是式 1 最大和最小值之差 2 n R Max ni 1 nt X Min ni 1 nt X 其中 是X 的极差 n R 为了比较不同类型的时间序列 用极差除以标准差 即重标极差 得到 3 n n S R n t i ni nia t i ni nia S mymy 11 minmax 其中 2 1 1 2 1 n t nin mynS 重标极差应该随时间而增加 Hurst 建立了以下关系 R S a 4 H n 其中 a 为常数 如果序列是一个随机序列 H 应该等于0 5 即累积离差的极差应该随时 间的平方根增加 一般地 H不等于0 5 可这样求出 对式 4 两边先取对数得 ln R S Hln n ln a 5 因此可画出ln R S 和ln n 的双对数图 做二元回归拟合 直线的斜率就给出了Hurst 指数的一个估计 截距就是ln a 的一个估计 其中H 即是Hurst 指数 a 为相关系数 当H 0 5 时 过去和未来增量间的相关系数为0 表明现在不影响未来 这说明增量过程是一个独立的随机过程 布朗运动是其特殊情况 当H 0 5 时 为分数布朗运动 此时 增量之间不再相互独立 但是这个 过程与马尔科夫过程所具有的短期记忆行为不同 分数布朗运动的记忆作用是长 期的 而且长期记忆只与Hurst 指数的大小有关 没有标度性 因此它具有分形 的特征 H 值指示了这种长期记忆作用的特性 0 5 H 1 有持久性效应 表明过去一直增长意味着未来这种趋势 将继续下去 而且对任意大的时间t 都是如此 反之 过去的减少趋势就平均而言 意 味着未来的连续减少 H 越接近1 趋势越明显 H越接近0 5 逐渐趋于随机性 这种长期记忆作用使得随机过程呈现一定的趋势 增量间有一定的正相关性 绝大多数资本市场都符合持久性时间序列特征 0 H 0 5 增量间是负相关的 称为反持久性效应 antipersistent 如果过去是增长的 则下一时刻下降的可能性更大 反之 过去是下降的 则下一 时刻上升的可能性更大 反持久性效应的强度取决于H 接近0 的程度 H 越接近 0 则C 越接近 0 5 负相关性越强 我们知道 证券的指数 价格等都是一个时间序列 可以用以上办法计 算出Hurst值 如果Hurst值大于0 5 说明系统存在分形的特征 1 2 3 上证指数序列的Hurst值的计算 我们使用R S法对我国上海交易所 1997 年 5 月以来的上证指数的分形特征 选取的时间区间 1997 5 14 到 2005 8 23 日作为研究的时间段 在这段时间内 共有正好 2000 个交易日数据 R S 分析步骤 首先对2000个收盘数据序列进行处理 设t日的收盘数据为 计算的对数 t P t P 收益率 ln ln 5 t R t P 1 t P 为了去掉对数收益率的线性相关性 我们对进行AR 1 的自回归得到其残 t R 差序列 a b t X t R 1 t R 6 其中 a和b是回归模型AR 1 的系数 为残差序列 经过回归计算 t X 有 a 0 0147 b 0 0001 选取时间增量n 对于确定的n 和1999个值的 序列 我们可以得到 t X 1999 n 个时间段 在每个时间段我们都可以计算出对应的R与R S 为此可 以得到 1999 n 个的R S 求这些R S值求平均值作为在时间增量为n时的R S 估计值 我们这里将n 的起始取值定为5 即1 个交易周 对所得到的结果 既n 5 6 1000 的取值区域分别做ln对ln n 的 n SR 回归 取ln n 的参数估计作为H 的估计 结果如下图1 图1 计Vn VN统计量同样也可以用来很好地估计非线性系统长期 n SR n 记忆过程的长度 观察序列如图2所示 在n 308时出现明显从上升转为 n V n V 下降 的现象 可以知道n 308 是一序列长期记忆的消失点 对5 n 308的这 个区域做一次回归 计算Hurst指数 得到H 0 608 图2 1 2 31 2 3 R SR S计算的结果分析计算的结果分析 通过上面的计算 我们得到H 0 608 由于计算所跨越的时间长度比较长 所 以这个H值稍微小于国外的一些证券市场利用R S法计算出的Hurst指数值 并不 说明我国的市场成熟度比国外市场来的更佳 一般的 系统的分形维数为2H 可 见上海指数从1997年5月14日以来的指数序列是具有分形特征和持续性的 上证 指数的时间序列的确存在着混沌现象 因此 我们知道上证指数不是随机变化的 而是一个有偏的随机游走 不完全属于EMH理论分析的有效市场 而是在一定时 期内相关的 既然上证指数具有分形市场的特点 那么我们是否能够在此基础上对其走 势进行分析和预测呢 第二章第二章 利用神经网络对具有分形特征的时间数列进行预测利用神经网络对具有分形特征的时间数列进行预测 第一节第一节 常用的混沌时间序列分析预测方法常用的混沌时间序列分析预测方法 由于混沌时间序列不是完全的随机游走 而是有偏的 所以我们可以利用 这个特点对混沌时间序列进行预测 通常的做法是根据实际问题正确地建立描述系统的动态数学模型 然后求解 这个数学模型 最后反过来根据计算结果进行预测 传统的预测方法主要有动力学 方法和数理统计方法 这些方法的共同特点是先建立数据序列的主观模型 然后根 据主观模型进行计算和预测 常用的建立模型的方法主要有两种 一是时间序列关 系模型 在这类的模型中被预测的对象的演变过程为一时间的函数 另一种是结 构关系模型这类模型的特点是被预测的事物与其影响因素之间在一定的时间内保持 着某种固定的函数结构关系 混沌时间序列预测的常用方法 全域法 局域法 加权零阶局域法 加权一 阶局域法 基本李雅普诺夫指数的时间序列预测方法等 时间序列关系模型与结构关系模型一般对被预测对象都有具体而且严格的要求 这就要求我们在做预测之前必须对被预测对象做深入系统的分析只有在确认某类预 测模型的前提条件得到满足的情况下才可以使用该模型进行预测否则预测结果是不 可靠的股票市场作为现实经济运行状况的直接体现其影响因素如GDP增长率汇率及 国内外政治形势等时常发生较大的变动所以要确定和修改模型的结构确非易事 另 一方面一般计量统计的时间序列模型很难处理高度非线性的问题而实际上股票市场 与其影响因素之间存在着复杂的非线性关系已有大量的实际数据表明股票市场是一 个具有混沌现象的非线性动力系统 随着混沌科学的发展 使得可以不必事先建立主观模型 而直接根据数据序 列本身所计算出来的客观规律 如李雅普诺夫指数等 进行预测 这样可以避免预 测的人为主观性 提高顶测的精度和可信度 近年来 由于计算机与人工智能技术的飞速发展 为股票市场建模预测中新技 术新方法的应用提供了有利的条件 人工神经网络 ArtificialNeuralNetworks 简称ANN 是由大量简单的处理单元 神经元按照某种方式联结而成的自适应的 非线性系统 它的每一个神经元的结构和功能都很简单 其工作是 集体 进行 的 它没有运算器 存储器 控制器 其信息是存储在神经元之间的联结上的 它是一种模仿人脑的神经系统结构和功能的物理可实现系统 因为人工神经网络广泛的适应能力 学习能力和映射能力 在多变量非线性系 统的建模方面取得了惊人的成就 成为新兴的预测时间序列的方法 人工神经网 络模型具有巨量并行性 存储分布性 结构可变性 高度非线性 自学习性和自 组织等特点 而且可以逼近任何连续函数 目前广泛应用神经网络作为非线性函 数逼近模型 ANN的最大优点是不需依赖于模型 所以非常适合用于股票市场的预 测 因为股票股市的建模与预测所处理的信息量往往十分庞大 对算法有很高的 要求 它的非线性动力学特性非常复杂 所以一般传统的方法对于股市的预测往往 难如人意 因此 我们选取了人工神经网络作为预测上证指数的工具 第二节第二节 神经网络的基本原理神经网络的基本原理 2 2 12 2 1 人工神经网络的历史人工神经网络的历史 20 世纪50 年代末F Rosenblatt 提出了著名的感知机Perceptron模型这是 第一个完整的神经网络这个模型由阈值单元构成初步具备了诸如并行处理分布存 储和学习等神经网络的一些基本特征从而确立了从系统的角度研究神经网络的基 础 1960 年B Windrow 和M E Hoff 提出了自适应线性单元Adaline 网络它可用 于自适应滤波预测和模式识别从20 世纪50 年代末到60 年代初神经网络的研究 受到人们的重视研究工作进入了一个高潮 芬兰学者T Kohonen 提出的自组织影 射理论 美国S A Grossberg 提出的自适应共振理论 日本学者福岛邦彦 K Fukushima 提出了认知机Neocognitron 模型等研究成果对以后神经网络的研 究和发展都产生了重要影响 进入20 世纪90 年代神经网络的研究又引起了众多学科领域学者的关注并很 快形成了热潮其主要原因是以逻辑推理为基础的人工智能理论和Von Neumann 计 算机在处理诸如视觉听觉形象思维联想记忆和运动控制等智能信息处理问题上受 到了挫折具有并行和分布机制的神经网络本身的研究成果以及脑科学和神经科学 研究成果的推动作用以及VLSI 技术和光电技术的发展为神经网络的实现提供了 物质基础由于以上原因使人们产生了一个共识即神经网络可能成为未来智能机良 好的模式 1982 年美国加州理工学院生物物理学家J J Hopfield 提出了一个新的神经 网络模型Hopfield 网络模型首次引入了网络能量函数的概念并给出了网络稳定 的判据1984 年他又提出了实现网络模型的电子电路为神经网络的工程实现指明 了方向Hopfield 的研究成果开拓了神经网络用于联想记忆和优化计算的新途径 引发了神经网络研究的又一次热潮并为神经计算机的研究奠定了基础1984 年 Hinton 等人将模拟退火算法引入到神经网络中提出了Boltzmann 机 BM 模型 网络BM 网络算法为神经网络优化计算跳出局部极小提供了一个有效的方法 迄今为止的神经网络研究大体上可分为三个大的方向 1 探求人脑神经系统的生物结构和机制这实际上是神经网络理论的初衷 2 用微电子学或光学器件形成特殊功能网络这主要是新一代计算机制造 领域所关注的问题 3 将神经网络理论作为一种解决传统方法无法或难以解决的某些问题的 手段和方法 人工神经网络是由大量简单的处理单元 神经元按照某种方式联结而成的 自适应的非线性系统 它的每一个神经元的结构和功能都很简单 其工作是 集 体 进行的 它没有运算器 存储器 控制器 其信息是存储在神经元之间的联 结上的 它是一种模仿人脑的神经系统结构和功能的物理可实现系统 鉴于神经网络的并行处理及强大的非线性映射能力 即它可以把许多非线性 信号的处理方法及工具集成起来 对于未知的动力系统 可以通过它来学习很池 时间序列 然后进行预测和控制 由于混纯时间序列在内部有着确定的规律性 这种规律性产生于非线性 它表现出时间序列在时间延迟状态空间中的相关性 这种特性使得系统似乎有着某种记忆能力 同时又难于用通常的解析方法把这种 规律表达出 1 焦李成 神经网络系统理论 西安电子科技大学出版社 1990 年 来 而这种信息处理方式正好是神经网络所具备的 2 2 22 2 2 神经网络的特点神经网络的特点 神经网络在信息处理的很多方面具有比传统的方法更明确的优势主要表现在 以下几个方面 1 可避免数据的分析工作和建模工作 通过观测样本神经网络完全能够发现其隐含的信息 经过学习神经网络建立 一个规则 该规则最小程度地受到人为的支配这样就避免了或大大减少了常用的 数据分析工作和建模工作 而且在没有关于信号结构先验知识的前提下取得优良 的性能 例如神经网络在语音图象处理编码压缩声纳手写识别等领域的应用已取 得了甚至超过了传统方法经过几十年研究所取得的成果 2 信息的并行结构和并行处理 神经网络与人的大脑类似不但结构上是并行的 它的处理顺序也是并行的 在同一层内的处理单元都是同时操作的 即神经网络的计算功能分布在多个处理 单元上 而一般计算机通常只有一个处理单元其处理顺序是串行的 目前的神经 网络功能常常用一般的串行工作方式来模拟它的并行处理方式 所以显得很慢而 真正的神经网络将会大大提高处理速度并能实现实时处理方 3 自适应的信息处理方式 人类具有很强的适应外部环境的能力 神经网络也可以通过学习具备这种能 力 这种自适应一般包括四个方面学习性 自组织性 推理能力和可训练性 4 完成复杂的输入 输出的非线性映射 信息处理的大部分问题可归结为数学影射 给定一个输入矢量X 经过信息处 理系统可得到一个所要求的输出矢量Y Y f X 函数可以解析表达也可以是 非解析的 Kolmogrov 定理保证了任一连续函数或映射可由一个三层神经网络实 现此神经网络的输入层包含N 个神经元隐含层具有2N 1 个神经元 输出层M 个 神经元即可实现该函数 根据Kolmogrov神经网络映射存在定理 通过选择一定 的非线性和连接强度调节规律 我们就可解决任何一个信息处理问题 5 信息存储与处理合而为一 与传统的信息处理方式不同 神经信息处理系统运行时 存储与处理是兼而 有之的 而不是绝对分离的 经过处理信息的隐含特征和规则分布与神经元之间 的连接强度上通常有冗余性 这样当不完全信息或含噪声信息输入时神经网络就 可以根据这些分布式的记忆对输入信息进行处理 恢复全部信息 同时这种合二 为一的方式从本质上消除了软件和算法的瓶颈效应提供了实现高速信号处理的手 段 由于神经网络具有以上描述的几个特点 并且已经被开始运用于各个行业 的时间序列预测之中 所以本文试图利用遗传神经网络预测方法 以混沌动力 学的相空间重构技术为思想基础 以上证指数收盘价序列为主体 通过使用此时 间序列重构股票指数的相空间保存股票指数混沌吸引子的性质 并且利用遗传神 经网络的非线性函数逼近特性来求出股票指数的非线性方程 利用神经网络模型 对股票未来指数趋势进行预测 混沌时间序列分析的基础是重构相空间 混沌时 间序列的预测问题可以理解成动力系统研究的 逆问题 通过股票价格时间序 列重构股票市场非线性动力系统 给定相空间中的一串迭代序列 构造一个非线 性映射来表示这一动力系统 此非线性映射就可作为预测模型 逼近此非线性映射可采用局部线性模型 全局多项式模型 前馈神经网络模 型 BP 径向基函数模型 RBF 小波神经网络等 2 2 32 2 3 神经网络的基本原理神经网络的基本原理 1 人工神经元模型 图3 图3所表示的是一个基本的人工神经元的结构模型 它有下列几个基本要素 1 组连接对应于生物神经元的突触连接强度由连接线上的权值给出权值为 正的表示激活为负的表示抑制 2 一个求和单元用于求取n个输入信号的加权和线性组合 3 一个非线性变换函数起非线形映射作用并将神经元输出幅度限制在一 定范围之内一般限制在 0 1 或 1 1 之间 4 一个阈值 i 以上可分别用数学公式表示出来 式中为输入信号 为神经元i的权值 为线性组 n xxxx 321iniii wwww 321i u 合结果 为阈值 为变换函数 为神经元i的输出 i i v i y 变换函数 可以有几种形式 如阈值函数 分段线性函数 sigmoid函数 i v 等 最常见的sigmoid函数形式是 其中参数a控制其斜率 2 神经网络的结构 从连接方式来看NN主要分为下列两种 1 前馈型网络 各神经元接受前一层的输入并输出给下一层没有反馈 连接点分为两类即 输入单元和计算单元 每一计算单元可有任意个输入但只有一个输出 它可耦 合到任意多个其它结点作为输入 通常前馈网络分为不同的层 第i层的输入 只与第i 1层的输出相连 输入和输出结点与外界相连 而其它中间层则称为 隐层 2 反馈网络 所有结点都是计算单元同时也可接受输入 并向外界输出 这种网络可以 画成一个无向图 其中每条连接线都是双向的 其中前馈网络最典型 前馈网络方法NN的工作过程主要分为两个阶段 第一个 阶段是学习期 此时每个计算单元的状态不变而各条连接线上的权值可通过学习来 修改 第二阶段是工作期 此时n个连接权固定而计算单元的状态发生变化以达到 某种稳定状态 从作用效果来看 前馈网络主要是函数映射 可用于模式识别和函数逼近 反馈 网络则主要用于求解最优化问题 3 神经网络的学习 通过向环境学习以获取知识并改进自身性能是NN的一个重要特点 在一般情况下性能的改善是在某种预定的度量标准下 通过逐步调节自身参 数如权值而达到的 神经网络的学习主要含括两部分内容 即学习方式与学习算 法 神经网络的学习方式有下列三种 监督学习 有教师学习 非监督学习 无教师学习 在励学习 或强化学习 其中监督学习的方式需要外界存在一位教师 他对一组给定的输入提供应有 的输出结果正确答案 这组已知的输入输出数据就是训练样本集 学习系统NN可 以根据已知输出与实际输出之间的差值误差信号来调节系统参数 神经网络最常用的学习算法是误差纠正算法 下面是其算法过程 令表示输入x n 时神经元在i时刻n的实际输出 表示相应的应有 nyi ndi 输出 由训练样本给出 则误差信号可写成 nei nyi ndi 误差纠正学习的目的是使某一基于 的目标函数达到最小 使得网络中 nei 每一输出单元的实际输出在某种统计意义上最佳逼近于应有输出 一旦选定了目 标函数的形式误差纠正学习就成为一个典型的最优化问题最常用的目标函数是均 方误差判据可定义为 i i neEJ 2 1 2 其中E是求期望算子 将上式直接作为目标函数时 需要知道整个过程的统 计特性 为克服这一困难 通常用J在时刻n的瞬时值代替J 即 n ER 1 2 n ER i i ne 2 这样问题就变为函数对权值向量 为自变量 求最小值 具体计算可用 n ER 梯度下降法 若在第n步迭代中当前的权值向量为w n 函数的梯度 是在 n ER n ER w n 处的一阶导数矩阵 则沿负梯度方向即 方向 是减少最快的方向因 n ER n ER 此第n 1步的权值迭代公式为 其中为学习步长 第三节第三节 基于基于BPBP算法的三层向前的神经网络算法的三层向前的神经网络 由于在我们选取了基于BP算法的神经网络作为预测指数的模型 在这里必 须对该模型做一个了解 2 3 12 3 1多层次的神经网络多层次的神经网络 多层前馈网络结构含一个输入层一个输出层以及若干个隐含层隐含层的变 换函数一般为非线性函数输出层的变换函数可以是非线性的也可以是线性的在这 里隐含层和输出层的变换函数都采用 函数形式sigmoid将影响股指的各因素输入 至输入层并传至后面的隐含层最后通过连接权输出到输出层 多层前馈网络的典型结构如下图所示 图4 多层神经网络模型图 2 3 22 3 2 BPBP网络的基本原理网络的基本原理 图5 BP网络模型结构图 基于BP算法的三层向前神经网络结构 一般是一3层或者3层以上的的神经网 络 包括输入层 中间层 隐层 和输出层 上下层之间实现全连接 而每层 单元之间无连接 当一学习样本提供给网络之后 神经元的激活值从输入层 经中间层想输出层传播 在输出层的各个神经原获得网络的饿输入响应 节下来 按照减小目标输出与实际误差的方向 从输出层经过中间层逐层修正各连接权 值 最后回到输入层 这个算法就是所谓 逆无偿传播算法 也就是BP算法 随着这种逆误差的传播修正不断进行 网络输入模式响应的正确率也不断上升 BP网络的传递函数要求是可微的 所以不能使用二值函数 常用的有 sigmoid型对数 正切函数或者线形函数 由于传递函数是处处可微的 所以 对于一个BP网络来说 一方面 所划分的区域不再是一个线形划分 而是一个 非线形的超平面组成的区域 它是比较平滑的曲面 所以它的分类比线形划分 更加精确 容错性也比线形划分更好 另一方面 网络可以严格采取剃度下降的 学习方法 权值修正的解析式十分明确 Funahashi证明 当隐层节点函数为单调递增连续函数时 三层前向网络具 有以任意精度逼近定义在紧致子集上的任意非线性函数的能力 Hornik进一步证 明隐层节点函数有界是必要的 单调递增的条件是非必要 这说明采用三层BP网 络 隐节点函数为Sigmoid函数 输出节点函数采用线性函数 完全可以达到网 络逼近的要求 也就是说 单隐层的的BP网络可以逼近任意的非线形映射 只 要隐层神经单元的个数是可以随意调节的 因此

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论