(计算机应用技术专业论文)基因表达式编程在股票预测中的应用与研究.pdf_第1页
(计算机应用技术专业论文)基因表达式编程在股票预测中的应用与研究.pdf_第2页
(计算机应用技术专业论文)基因表达式编程在股票预测中的应用与研究.pdf_第3页
(计算机应用技术专业论文)基因表达式编程在股票预测中的应用与研究.pdf_第4页
(计算机应用技术专业论文)基因表达式编程在股票预测中的应用与研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(计算机应用技术专业论文)基因表达式编程在股票预测中的应用与研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 股票是市场经济的产物,从诞生的那天起就牵动着数以千万投资者的心。 十多年来,我国己有股民数千万,股票己经深入到日常经济生活中的方方面面。 因为巨大的经济利益,分析股票内在的规律性一直是研究的热点,股票预测的 理论和方法也因此层出不穷。但是股价系统内部结构的复杂性和外部因素的多 变性决定了股市预测的艰巨性,现有的分析预测方法应用效果并不理想。 本文主要研究了基因表达式编程的实现技术,并将其应用在股票预测领域。 首先,介绍了股票及其相关的基础知识,论述了影响股票价格的因素,并对股 价预测存在的一些问题进行了总结。然后,介绍了遗传算法的基本操作和一般 流程,分析了遗传程序设计的基本思想和基本技术,讨论了基因表达式编程的 基本思想和具体实现,并给出了d e l p h i 语言的核心代码和二个测试集的拟合实 验及结果分析。最后,讨论了股票样本的选择标准,分析了输入样本的预处理 机制,介绍了常用的二种预测方法,并对所选取的三支股票进行了单步预测和 多步预测的对比实验。 本文的主要贡献如下:1 ) 、对股票预测的相关理论进行了分析和总结。2 ) 、 对遗传算法g a 、遗传程序设计g p 和基因表达式编程g e p 的核心思想进行了分 类总结。3 ) 、用d e l p h i 语言对基因表达式编程进行了完整的代码实现,并给出 了d e l p h i 语言的核心源代码。4 ) 、对二个测试集进行了拟合实验,实验结果表 明,基因表达式编程技术在函数发现和数据挖掘方面具有广阔的应用前景。5 ) 、 对三支股票进行了单步预测和多步预测的对比实验,实验结果表明:利用基因 表达式编程技术时,用小样本数据进行短期的单步预测是完全可行的,其涨跌 预测正确率约为6 0 7 0 ,对股票的合理投资决策具有一定的指导意义。 关键词:股票预测,基因表达式编程,遗传程序设计,遗传算法 a b s t r a c t t h es t o c km a r k e t ,w h i c hi st h em a i nc h a r a c t e ro fm a r k e te c o n o m y ,a t t r a c t s m i l l i o n so fi n v e s t o r sf r o mi t sb i r t h w i t h i nr e c e n tt e ny e a r s ,s t o c kh a sp e n e t r a t e di n t o o u rd a i l yl i f ea n dt h ep o p u l a t i o no fi n v e s t i n gs t o c kh a si n c r e a s e dt om i l l i o n s f o rt h e e n o r m o u sp r o f i t s ,s t u d yo nt h ei n t e r n a lr u l eo fs t o c kh a sb e e nah o tt o p i ca n dt h e r e e m e r g eal o to ft h e o r i e sa n dm e t h o d st op r e d i c tt h et r e n do fs t o c km a r k e t h o w e v e r , d u et ot h ec o m p l e x i t yo ft h ei n t e m a ls t r u c t u r eo ft h es t o c kp r i c es y s t e ma n dt h e c h a n g e a b i l i t yo ft h ee x t e r n a lf a c t o r s ,t h ee f f e c to fp r e s e n tp r e d i c t i o nm e t h o d si sn o t s a t i s f a c t o r y i nt h i st h e s i s ,w eh a v e d o n eas e r i e so fr e s e a r c ho ng e n ee x p r e s s i o n p r o g r a m m i n g ,a n dh a v ea p p l i e di t t os t o c kp r e d i c t i o n f i r s t l y ,w ed e s c r i b e dt h e r e l e v a n tb a c k g r o u n da n db a s i cp r i n c i p l eo fs t o c kp r e d i c t i o n ,d i s c u s s e ds o m ef a c t o r s w h i c hh a v ev i t a li n f l u e n c et os t o c kp r i c e ,a n ds u m m a r i z e ds o m ep r o b l e m si ns t o c k p r e d i c t i o nf i e l d s s e c o n d l y ,w ed e s c r i b e dt h eb a s i cp r i n c i p l eo fg e n e t i ca l g o r i t h m s , g e n e t i cp r o g r a m m i n ga n dg e n ee x p r e s s i o np r o g r a m m i n g ,l i s td e l p h is o u r c ec o d e s o fg e n ee x p r e s s i o np r o g r a m m i n g ,a n da n a l y z e de x p e r i m e n t a lr e s u l tw h i c hw a sb a s e d o nt w ot e s tp r o b l e m s f i n a l l y ,w ed i s c u s s e dt h es e l e c t i o ns t a n d a r do fs t o c ks a m p l e s , a n a l y z e dt w oc o m m o nf o r e c a s tm e t h o d s ,a n dc o m p a r e de x p e r i m e n t a lr e s u l t sb a s e d o n t h r e ed i f f e r e n ts t o c k s t h em a i nc o n t r i b u t i o n si nt h i st h e s i sa r el i s t e da sf o l l o w s : 1 ) w ea n a l y z e da n ds u m m a r i z e dt h eb a s i ct h e o r i e so fs t o c kp r e d i c t i o n 2 ) w ed e s c r i b e d t h eb a s i c p r i n c i p l e o fg e n e t i c a l g o r i t h m s ,g e n e t i c p r o g r a m m i n ga n dg e n ee x p r e s s i o np r o g r a m m i n g 3 ) w e d i s c u s s e dt h ei m p l e m e n t a t i o no fg e n ee x p r e s s i o np r o g r a m m i n g , a n dl i s t i t sd e l p h is o u r c ec o d e s 4 ) e x p e r i m e n t a lr e s u l t sb a s e do nt w o t e s tp r o b l e m ss h o wt h a tg e n ee x p r e s s i o n p r o g r a m m i n g c a nb e a p p l i e d i nf u n c t i o nf i n d i n ga n dd a t a m i n i n g s u c c e s s f u l l y 5 ) w ec o m p a r e de x p e r i m e n t a lr e s u l t sb a s e do nt h r e ed i f f e r e n ts t o c k s ,a n df r o m e x p e r i m e n t a ld a t aw ec a nf i n dt h a tg e n ee x p r e s s i o np r o g r a m m i n gh a da c o r r e c tr a t eo f6 0 一7 0 w h e ni tw a sa p p l i e dt os h o r t - t e r ms t o c kp r e d i c t i o n , a n di tc a n g i v ei n v e s t o r ss o m eh e l p f u ls u g g e s t i o n s k e y w o r d s :s t o c kp r e d i c t i o n ,g e n ee x p r e s s i o np r o g r a m m i n g ,g e n e t i cp r o g r a m m i n g , g e n e t i ca l g o r i t h m s i i i 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 签名:埤日期:世 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权 保留、送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部 或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 武汉理工大学硕士学位论文 1 1 选题意义 第1 章绪论 智能信息处理技术的研究是科学发展中非常富有挑战性的课题。智能的本 质、内涵和潜能的奥秘,一直是古今中外的哲学家、思想家和科学家关注、探索 和研究的重大问题。经过几十年的发展,到目前为止,对智能的研究已经成为了 一个十分重要而且极具挑战性的学科人工智能( a r t i f i c i a li n t e l l i g e n c e ,a i ) 。 它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互 相渗透而发展起来的一门综合性学科。 人们从智能的外在表现出发,从不同的角度,不同的侧面,用不同的方法来 对智能进行研究。到目前为止,对人工智能的研究主要分为两大学派,即传统的 符号智能学派和计算智能学派。传统的符号智能或逻辑智能主张基于物理符号进 行逻辑推理和启发性搜索求解,虽取得了巨大的成功,但一般只能适合于较为狭 窄的应用领域,并且随着人工智能应用领域的不断拓广,传统的基于符号处理机 制的人工智能方法在知识表示、处理模式信息及解决组合爆炸等方面所碰到的问 题已变得越来越突出。而计算智能主张用计算机模拟和再现人类的某些智能行 为,并用于改造自然的工程实践的一种新型人工智能研究领域。 自动程序设计是人工智能研究的中心目标之一。在实现这一宏伟目标的途径 上,符号智能主张采用基于知识与逻辑推理的演绎综合法、归纳综合法、程序转 换法等来实现之;而计算智能则主张采用基于演化计算的遗传程序设计( 简称g p ) 与语法演化( g e ) 等来实现。几十年的实践已经证明,尽管符号智能在实现自动程 序设计中已经取得了一些成就,但是距离人类的理想还相差很远;而计算智能的 主张却取得了了不起的成绩,研究成果令人鼓舞。于是,1 9 9 8 年初,著名的计 算机科学家j o h nh o l l a n d 教授举起了:“遗传程序设计就是自动程序设计”的大旗, 把自动程序设计的研究推向了高潮,这似乎展示了计算智能在实现自动程序设计 道路上的光明前景。 智能计算是从模拟自然界生物体系和人类智能现象发展而来,用计算机模拟 和再现人类的某些智能行为,并用于改造自然的工程实践的一种新型人工智能研 武汉理工大学硕士学位论文 究领域。智能计算领域非常广泛,从方法上讲,目前智能计算主要包括演化计算、 神经计算和模糊计算三大研究领域。智能计算的最大特点就是不需要建立问题本 身精确的数学模型,适合于解决那些因为难以建立有效的形式化模型而用传统人 工智能技术又难以有效解决甚至无法解决的问题。 演化计算1 1 】是受大自然的演化机理启发,得益于计算机的高速计算能力,在 计算机上实施的模拟大自然演化过程的算法及其应用的总称。它主要应用来解决 科学与工程上的复杂优化决策分析问题,其中包括对生命现象的研究,如人工生 命。演化计算分为仿生演化和拟物演化。仿生演化算法包括遗传算法1 2 l 、演化策 略、演化规划和遗传程序设计,而拟物演化算法包括模拟退火算法和弹性松弛算 法。 遗传程序设计是演化计算的一个新分支。它是由美国的j k o z a l 3 】教授在遗传 算法的基础上于1 9 9 0 年代提出的,属于仿生演化的范畴。遗传程序设计对群体 中表示独立的计算机程序的个体( 而不是g a 中的固定长度的二进制字符串) 进行 操作,克服了传统g a 在表示方法上的局限,采用了更为灵活的可变分层结构。 根据对问题的求解要求,g p 采用层次描述方法,自动生成解决问题的程序,因 此它是一种不局限于某一领域的“遗传或进化搜索”技术。目前,g p 的研究已经 渗透到工程技术科学,生命科学及社会科学的各个领域中,取得了巨大成果并仍 在迅猛发展。 然而g p 也有其不足之处。它的解的构造很复杂,并且进行遗传操作时需要 一定的限制规则才能保证遗传操作的正确性。针对g p 的不足,在g a 和g p 基 础上,葡萄牙科学家c a n d i d af e r r e i r a 于2 0 0 1 年提出了基因表达式编程( g e n e e x p r e s s i o np r o g r a m m i n g , 简称g e p ) 。g e p 是借鉴生物遗传的基因表达规律提出 的一种知识发现新技术。实现了由g e p 进化的复杂的计算机程序( 表现型) 被 完全编码在一个固定长度的简单字符串里面( 染色体或者基因型) 。即g e p 个 体表示为定长线性编码,并通过映射规则,将g e p 的线性串和表达式树巧妙的 结合起来,而且在转化中不会产生错误的染色体。克服了传统遗传算法在表示方 法上的局限和传统g p 复杂的解的构造和复杂的遗传操作的缺陷。 g e p 是一种通用的自适应式随机搜索算法,能够在缺乏先验知识,不了解 事物内部机制,只有实验数据的情况下挖掘出较为准确的公式,以其较强的普适 性和较高的精确度在很多应用领域都取得了很好的实际效果。它提供了自动程序 设计的一种可行方法并且继承了g p 和g a 的优点,具有更简单的编码表示方法、 2 武汉理工大学硕士学位论文 更强大的遗传算子( 遗传算子的种类和数量不存在任何限制) 、更易于遗传操作、 能产生更高级别的复杂度的能力。它是遗传程序设计和遗传算法的继承和发展, 它综合了g a 和g p 的优点,具有更强的解决问题的能力。 目前g e p 已成为前沿研究热点,它以全新的与传统不同的信息表达和处理 方式,对人工智能研究产生了巨大的吸引力。由于g e p 具有很强的非线性概括 能力,它不需要建立复杂的非线性系统的数学模型。将g e p 技术应用于股票预 测,实际上是将人工智能应用于经济预测,这将为股票这种非线性系统的预测提 供广阔的发展空间。 自从改革开发以来,我国经济高速发展,但是我国的市场经济体制并不完善。 股票市场作为金融市场的一部分,对我国经济的稳定发展起着举足轻重的作用。 前段时间我国股市的暴涨暴跌对金融市场产生了很大的振荡,直接影响到我国金 融市场的稳定和经济的健康发展。如果能够预测股票的涨跌,及时对股票市场进 行合理的调控和健康的引导,这将为我国经济的持续发展提供坚实的后盾。 股票市场是经济的“晴雨表”,其作用不仅被政府所重视,更受到广大投资者 的关注。人们之所以对其如此感兴趣,不外乎两个原因:一、投资者希望了解股 价运行的规律,从而正确预测股价走势,由此获利;二、管理层希望了解股价运 行的内在机制帮助预测灾难性的股价振荡,从而采取适当措施来维护股票市场的 稳定。 从总体上来说,中国股市现阶段的生存危机是一种复合危机,是由多种因素 组合并且具有多重影响的深层制度危机。正所谓“冰冻三尺非一日之寒”,中国股 市的基本制度缺陷在长时期中被忽视、被容忍、被放纵,使得市场中的消极因素 日益累积、相互交织,积极因素不断削弱、相互掣肘,以至于最终演化为危及股 市根基的全面生存危机。 不管是处于发展阶段,还是萎靡阶段,不可否认,股票市场的发展为中国的 经济体制改革注入了巨大的活力,并且成为中国经济高速成长的重要动力源泉。 它的迅速发展摧毁了传统经济体制的根基,为新经济体制的建立与成长赢得了时 间。股市在现代市场经济中具有不可忽视、不能轻视和无法替代的地位与作用, 特别是对于我们这样一个处于经济体制转轨时期的国家来说更是如此。没有好的 股市就不可能有好的银行,没有好的银行就不可能有好的金融,没有好的金融就 不可能有好的经济。 总之,股票市场作为社会主义市场经济的重要组成部分,在我国的经济发展 3 武汉理工大学硕士学位论文 中发挥着重要的作用。研究股票的预测能够指导投资者进行有益的投资,不仅可 以为个人提供利润,更可以为国家经济的发展做出贡献。 1 2 国内外研究现状 目前国内外在进行股票预测时,采用的智能计算方法主要还是神经网络技 术,利用基因表达式编程( g e p ) 技术的较少。 在利用神经网络技术进行股票预测的研究中,w h i t e ( 1 9 8 8 ) 1 4 】曾经尝试利用 神经网络来预测i b m 普通股每日报酬率,但是预测结果不甚理想。他认为原因 可能是神经网络陷入局部极小值而无法跳脱。k i m o t o ,a s a k a w a ,y o d aa n dt a k e o k a ( 1 9 9 0 ) 【5 j 等人开发了t o k y os t o c ke x c h a n g ep r i c ei n d e xf f e o t x ) 预测系统,主要研 究了东京证券交易所股价加权平均指数( t o p i x ) ,最后得到的结果为:神经网络 模型的报酬率优于t o p i x 加权平均指数1 9 。 b e r g e r s o na n dw u n s c h ( 1 9 9 1 ) 6 1 禾l j 用s & p 指数训练神经网络,对$ 1 0 ,0 0 0 进 行投资指导,2 5 个月后,基金增长至f j $ 7 6 ,0 3 4 ,达到了6 6 0 的增长率。b a b aa n d k o z a k i ( 1 9 9 2 ) 1 7 1 使m1 5 个输入变量、2 个隐含层及1 个输出变量的神经网络来预 测日本股价趋势。训练范例分成上涨及下跌趋势的学习,在趋势决定后,预测 股价涨跌方向的正确率相当高,但是,若趋势决定错误时,神经网络的预测能 力减弱,无法正确预测股价。 g e n c a y ( 1 9 9 6 ) 利用移动平均线法作为神经网络判断股票操作的指标,并在长 期移动平均线与短期移动平均线接近时,设定一个买卖区间,其研究结果显示, 利用b p 算法比线性模式具有较佳的预测能力。k u t s u r e l i s ( 1 9 9 8 ) 吲研究了从1 9 9 1 到1 9 9 8 年的s & p 指数变化,神经网络的输出为1 0 天的变化百分率,对指数上 升趋势的预测精度9 3 3 ,下降趋势的预测精度为8 8 0 7 。 p e s a r a na n dt i m m e r m a n n ( 1 9 9 9 ) 川对过去2 5 年的伦敦证券指数进行预测,采 用神经网络技术预测指数的月变化率可以达到6 0 的1 e 确性。c h u n gk i mk w o n g ( 2 0 0 1 ) 1 1 0 l 利用澳大利亚股票市场中的7 家公司的数据进行研究,得到的平均预测 精度为4 8 2 。 台湾地区的研究中,张文信( 1 9 9 5 ) 以总体经济变量预测股价加权指数走势, 其预测正确率约为5 0 6 0 。郑志伟( 1 9 9 7 ) 以基本分析为主,采用反向传播算法 预测股价涨跌走势,个股平均正确率为5 9 2 5 ,而类股趋势预测的正确率达 4 武汉理工大学硕士学位论文 6 7 2 2 。 虽然上述方法对于国内股票市场的预测有着一定的借鉴意义,但是由于经 济结构的差别、股票市场发展过程和成熟度的不同,决定了国外和台湾地区的 研究成果不能直接应用于中国内地的股票预测。 1 3 本文的研究内容 基于以上分析,本论文主要的研究内容包括以下三个方面: 首先,介绍了股票及其相关的基础知识,论述了影响股票价格的因素,包括 市场内部因素、基本面因素和政策因素;讨论了股票预测的理论前提及常见的 股票预测分析方法,基础面因素分析和技术分析等;并对股价预测存在的一些 问题进行了总结。 然后,介绍了遗传算法的基本操作和一般流程;分析了遗传程序设计的基本 思想和基本技术;重点讨论了基因表达式编程的基本思想和具体实现,并给出 了d e l p h i 语言的核心代码。二个测试集的拟合实验结果表明,基因表达式编程 技术在函数发现和数据挖掘方面具有广阔的应用前景。 最后,讨论了股票样本的选择标准,即要对多支股票进行实验对比分析, 一支股票的预测好坏不能说明某种预测方法的准确度;分析了输入样本的预处 理机制,即归一化处理;介绍了常用的二种预测方法,即单步预测和多步预测; 并对所选取的三支股票进行了单步预测和多步预测的对比实验。实验结果表明, 利用基因表达式编程技术时,用小样本数据进行短期的跨三步预测不大可行, 但用小样本数据进行短期的单步预测则是完全可行的,其涨跌预测正确率约为 6 0 7 0 ,对股票的合理投资决策具有一定的指导意义。 1 4 本文内容安排 本文后续章节组织如下:第二章介绍了股票及其相关的基础知识,论述了 影响股票价格的因素,讨论了股票预测的理论前提及常见的股票预测分析方法, 并对股价预测存在的一些问题进行了总结。第三章介绍了遗传算法的基本操作 和一般流程,分析了遗传程序设计的基本思想和基本技术,讨论了基因表达式 编程的基本思想和具体实现,并给出了d e l p h i 语言的核心代码和二个测试集的 5 武汉理工大学硕士学位论文 拟合实验及结果分析。第四章讨论了股票样本的选择标准,分析了输入样本的 预处理机制,介绍了常用的二种预测方法,并对所选取的三支股票进行了单步 预测和多步预测的对比实验。第五章总结全文,并对进一步的研究工作提出了 一些想法。 6 武汉理工大学硕十学位论文 2 1 股票概述 第2 章股票预测相关理论 股票至今有将近4 0 0 年的历史,最早出现于资本主义国家。在1 7 世纪初, 随着资本主义大工业的发展,企业生产经营规模不断扩大,由此而产生的资本短 缺、资本不足便成为制约资本主义企业经营和发展的重要因素之一。为了筹集更 多的资本,于是出现了以股份公司形态、由股东共同出资经营的企业组织,进而 又将筹集资本的范围扩展至社会,产生了以股票这种表示投资者投资入股,并按 出资额的大小享受一定的权益和承担一定的责任的有价凭证,并向社会公开发 行,以吸收和集中分散在社会上的资金。 世界上最早的股份有限公司制度诞生于1 6 0 2 年,即在荷兰成立的东印度公 司。股份有限公司这种企业组织形态出现以后,很快为资本主义国家广泛利用, 成为资本主义国家企业组织的重要形式之一。伴随着股份公司的诞生和发展,以 股票形式集资入股的方式也得到发展,并且产生了买卖交易转让股票的需求。这 样,就带动股票市场的出现和形成,并促使股票市场完善和发展。 股票( s t o c k ) 是资本证券中的分支,是表明股票持有人对企业资产所占份额的 一种所有权证书,也是投资者借以取得收益的凭据,它是资金市场中主要的长期 信用工具之一。由于股票投资具有筹资简便、产权明确、利益共享、风险分散、 两权分离等优点,符合商品经济和社会化大生产发展的要求,因此近一个多世纪 以来获得了迅速的发展。 股票虽然只是一种凭证,但由于股票的持有人凭着股票可获得一定的经济利 益并享有相应的权利,所以股票是一种有价证券,并具有以下一些性质: ( 1 ) 收益性 股票的收益性主要表现在股票的持有人都可按股份公司的章程从公司领取 股息和红利,从而获取购买股票的经济利益,这也是股票购买者向股份有限公司 投资的基本目的,也是股份有限公司发行股票的必备条件。如我国就规定,一个 公司的股票在证券交易所挂牌的前三年必须是连续盈利,这为上市股票的收益性 提供了一定的保障,因此盈利是股票分红的必要前提条件。 7 武汉理t 大学硕士学位论文 ( 2 ) 风险性 任何一项投资都伴随着风险存在,股票投资也不例外。股票的风险主要表现 在以下几点:其一,影响股份公司经营的因素繁多且变化不定,其每年的经营业 绩都不确定,而股票的股息和红利是根据公司具体盈利水平确定的。盈利多,股 息红利就可多发;经营不佳盈利少,股东的收益就少甚至无利可分;若公司破产, 则股票持有者就可能血本无归。其二,当投资者购买二级一市场上流通的股票时, 股票的价格除受公司的经营业绩影响外,还要受众多其它因素的影响。当股票的 价格下跌时,股票持有者会因股票的贬值而蒙受损失。但二级市场股价的波动并 不影响上市公司的经营和业绩,股民购买股票的目的是取得上市公司的股息红 利,二级市场上股价的波动对其经济利益并无实质性的影响。 ( 3 ) 流通性 经国家证券管理部门或证券交易所同意后,股票可以在证券交易所流通或进 行柜台交易。股票的持有者可以将股票按照相应的市场价格转让给第三者,将股 票所代表的股东身份及各种权益出让给受让者。当持有的股票是可流通股时,其 持有人可在任何一个交易日到市场上将其兑现,这就是股票的流通性。但不论在 那一国家或地区,能上市流通的股票所占的比例都很小。一般来说,在证券交易 所挂牌的上市公司占股份制企业的比例大约也就5 左右,并不是所有的股票都 能在市场上流通转让。 ( 4 ) 参与性 根据公司法的规定,股票的持有者就是股份有限公司的股东,他有权出席股 东大会、参加公司董事机构的选举及公司的经营决策。也正因为如此股东的投资 意志和经济利益才能通过其行使的股东参与权而得到强化。虽然股东参与股东大 会的权利不受所持股票多寡的限制,但参与经营决策的权利大小是要取决于其持 有的股票份额的。一般来说,当股东持有的股票数额达到决策所需的相对多数时, 他就成为股份有限公司的决策者。 ( 5 ) 稳定性 股票是一种无期限的法律凭证,它反映的是股东与股份公司之间比较稳定的 经济关系。在向股份公司参股投资而取得股票后,任何股东都不能退股,股票的 有效存在是与股份有限公司的存在相联系的,即股票是与发行公司共存亡的。对 于股票持有者来说,只要其持有股票,其股东身份和股东权益就不能改变。如要 改变股东身份,要么将股票转售给第三人,要么等待公司的破产清盘1 1 1 l f l 2 l 。 8 武汉理工大学硕士学位论文 2 2 影响股票价格的相关因素 股票的市场价格由股票的价值决定,但是同时受到许多因素的影响。其中, 供求关系是最直接的因素,其他因素都是通过作用于供求关系而影响股票价格 的。由于影响股票价格的因素复杂多变,所以股票的市场价格呈现出高低起伏 的波动性特征。这些影响因素基本上可分为以下三类:市场内部因素、基本面 因素、政策因素1 1 3 】。 1 市场内部因素 市场内部因素主要是指市场的供给和需求,即资金面和筹码面的相对比例, 如一定阶段的股市扩容节奏将成为该因素的重要部分。 2 基本面因素 基本面因素包括宏观经济因素和公司内部因素。宏观经济因素主要是指能 影响市场中股票价格的因素,包括经济增长、经济景气循环、利率、财政收支、 货币供应量、物价、国际收支等。公司内部因素主要是指公司的财务状况。 3 政策因素 政策因素指足以影响股票价格变动的国内外重大活动以及政府的政策、措 施、法令等重大事件。政府的社会经济发展计划、经济政策的变化、新颁布法 令和管理条例等均会影响到股价的变动。 2 3 股票预测的理论前提 1 市场行为涵盖一切信息 市场行为涵盖一切信息是从英文e v e r y t h i n gi sd i s c o u n t e da n dr e f l e c t e di n m a r k e tp r i c e s 直译而来。未来股价的变化趋势完全取决于供求双方力量的变化。 如果供不应求,价格就会上升:反之,价格就会下跌。任何影响供求力量的因 素,包括政治的、社会的、经济的、心理以及其它方面的因素,会立即体现在 价格、成交量和时间变化中。许多信息并不是所有股民马上能够收集到的,但 是所有的股民都可以分析市场行为得到有关信息。 2 价格依据趋势移动 物理学中,牛顿第三定律告诉我们:一个运动的物体若不受任何外力作用, 那么它将永远保持匀速直线运动。同样,在股市里,一只正处在上涨的股票, 9 武汉理工大学硕士学位论文 如果所有投资者都对其不失信心,那么这只股票将继续保持上涨势头;一只正 处在下跌的股票,如果所有投资者都对其丧失信心,那么这只股票将成下跌势 头。这主要是因为股民的心理因素在作用,一旦股民对某只股票建立起信心, 上涨势头决不会昙花一现,而将会持续一段较长的时间,反之,则只能处于跌 势。 3 历史往往会重演 相信历史往往会重演( m a r k e ta c t i o ni sr e p e t i t i v e ) 是通过过去预测未来走向 的前提,是数学外推法的应用基础,即模式重现原理。这主要源于心理学命题, 在不同的时间里,人们面对相同境况时会做出相同的反映。在股票市场里,通 过长期统计验证,发现有许多经验型和规律性的东西,一旦这些现象出现,人 们就会做出相应的预测。 2 4 股票常用预测方法 一、证券投资分析方法 股票分析方法是分析和预测股价变动方向和趋势的方法,可分为:基本分析 法、技术分析法和组合分析法三大类。 1 基本分析法 。 基本分析法以经济学、财政金融学、财务管理学、投资学为理论基础,研 究的是影响股市走势的基本要素。基本分析法把分析重点放在股票的内在价值 上,它认为影响股票价值的因素有很多,最重要的有五个方面:宏观经济指标, 利率水平,汇率变动,行业因素和政治因素。7 2 技术分析法 技术分析对于投资者投资决策的可行性是建立在以下理论基础之上的: 市场行为体现一切信息;价格变动具有趋势性;历史会重演。技术分析的 理论基础之一是空中楼阁理论,是美国著名经济学家凯恩斯于1 9 3 6 年提出的, 该理论抛开股票的内在价值,强调心理构造出来的空中楼阁。 3 组合分析法 组合分析法是将技术分析法和基本分析法二者结合起来的一种方法。在中 国股票市场上进行股票投资,在运用技术分析指导市场的同时,不应忽视对基 本因素的分析,特别是中长线投资者,应将基本分析与技术分析结合起来,完 1 0 武汉理工大学硕士学位论文 全不理会基本面,也是片面的。 特点:一般投资者及股票市场预测专家所运用的大多是这二种分析工具, 由于其不需要高深的理论和文化水平,因此被投资大众看中并运用到投资决策 中。在入市时机的选择问题上,基础分析从当前的宏观经济状况及上市公司的 财务状况给出大势的基本面分析,技术分析则可在合理价位的判断方面给出投 资决策的参考,而挑选盈利的股票组合则非组合分析莫属。 二、时间序列分析法 时间序列分析法也叫历史延伸法,它是以历史的时间序列数据为基础,运 用一定的数学方法,寻找数据变动规律,以预测未来事物的发展趋势。时间序 列的分析方法有:长期趋势的分析方法、季节性变动的分析方法和周期性变动 的分析方法。 1 长期趋势的分析方法 长期趋势是统计指标在较长一段时期内发展变化的基本形式和方向。长期 趋势的分析方法主要有移动平均法和回归分析法,二者可依据时间序列的变动 特点分别使用或搭配使用。 ( 1 ) 移动平均法 移动平均法又称修匀方法,是以依次逐期推移的方式,计算时间序列中一 段期间的变量值的序时平均数的方法。通过依次逐期推移计算所得的一系列序 时平均数,消除了时间序列的波动程度,计算结果比较均匀。但是,移动平均 数有一定的局限性。首先,由于循环周期的间隔时间往往不相等,造成移动平 均数的移动步长与循环周期不一致。在这种情况下,移动平均数难以消除循环 变动因素的影响。其次,在以移动平均数为长期趋势值时,其序列的首尾无移 动平均数,因此,造成了预测信息的不完整。 ( 2 ) 回归分析法 时间序列的回归分析法是以时间t 为自变量,以形成时间序列的统计指标y 为因变量,应用最小二乘法,建立y 和t 之间的回归模型,以此测定时间序列的 长期趋势值。时间序列的长期变动趋势有直线和曲线之分,因此,应当根据其 变动趋势的特征分别拟合相应的直线回归模型或曲线回归模型。 2 季节性交动的分析方法 季节性变动分析法研究和测定统计指标随季节变动的规律性。季节性变动 的分析方法依时间序列是否存在明显增或减的趋势而异。若时间序列无明显增 武汉理工大学硕士学位论文 长趋势,可采用“同月( 季) 平均法”;反之,可采用“移动平均数比率法”。值得指 出的是,月( 季) 指数只反映各月( 季) 的季节影响程度。为了反映在整个时间序中 季节变动因素总的、平均的影响程度,还应再作调整。 3 周期性变动的分析方法 周期性变动是指统计指标在一年以上的期间内沿其长期趋势线上下波动的 幅度及其出现的周期。周期波动分析只是反映和描述统计指标的时间序列过去 的变动特征,一般不能用于预测经济现象未来的状况。周期性波动的分析方法 主要有趋势比率法和周期余数比率法。 特点:分析时间序列的基本思路就是将其中的变动因素一一分解出来,测 定其变动规律,然后再综合反映它们的变动对时间序列变动的影响。采用何种 方法分析和测定时间序列中各因素的变动规律或变动特征取决于对四种变动因 素之间相互关系的假设。一般,存在计算比较复杂、费时、预测精度较差等问 题。 三、神经网络预测方法 神经网络是一个不依赖于模型的自适应函数估计器,因而不需要模型就可 以实现任意的函数关系。神经网络具有的自学习功能、联想存储功能和高速寻 找优化解的能力对于预测有特别重要的意义,特别是在模式识别、图像处理、 预测顾报、人工智能等领域己取得了令人注目的发展。神经网络预测方法主要 包括前向神经网络预测方法( 咖、时间延迟神经网络预测方法m 町和自回 归神经网络预测方法( r n n ) 。 四、其他预测方法 市场调整法和专家评估预测法是常用的两种定性预测方法。市场调整法的 理论基础是假设市场指数收益率就是每只股票当日的正常收益率。但是,个股 收益率往往受到股票市场公告的影响,所以,这种假设使用的空间很有限。专 家评估预测法则是以专家为信息的索取对象,由专家直观地对预测对象进行分 析评估,再对结果进行统计处理以获得预测结果的预测方法,包括:专家意见 汇总预测法、头脑风暴法、德尔菲法和派生德尔菲法。 定量预测方法有:时间序列平滑法、随机时间序列预测法、回归分析法、趋 势曲线模型法、马尔柯夫预测法和判别分析预测法等。 1 2 武汉理工大学硕士学位论文 2 5 股价预测存在的问题 1 股价数据的高噪声 股票市场上股票的供求关系,机构大户的造市行为,以及诸多外在因素的 冲击影响而造成股市的强烈波动,使得股价表现为高噪声且存在许多“奇异点”。 “奇异点”的存在会大大影响系统性能,导致求解过程振荡甚至无法收敛。在线性 条件下,可设计各种滤波器将其滤除,但在非线性条件下却不能轻率处理,因 为它( 们) 可能代表一类模式或结构变化的先兆。数据的这种特性要求系统具有较 强的鲁棒性。 2 股价的非线性特性 股价以及影响其自身的各变量之间呈现非线性特性。因此,预测方法要求 有强大的处理非线性问题的能力。己有的比较成熟的技术大多是解决线性问题 和单变量非线性问题,对于复杂的、一般性的多变量非线性问题缺乏有效的分 析工具。股价系统是一个多变量非线性问题。虽然非线性数学、耗散结构理论、 协同学为描述非线性动力学系统提供了一些工具,但实际应用于股价实证分析 仍有不少问题。 3 股价系统的主体是具有主观能动性的投资者 投资者商业行为的复杂性和对未来事件的影响能力使得预测误差相当大, 并且随着时间的增加而急剧升高。与其他物理系统不同,在股价系统中,对样 本数据的最好匹配并不能保证最好的预测,即建模数据的最小误差准则并不是 提高预测精度的最好准则,一种预测方法过去和现在的表现不能说明其未来的 预测结果。 2 6 本章小结 股票预测的对象是股票,所以有必要对股票的一些基础只是进行简单介绍。 本章从股票入手,对股票及其相关的基础知识进行了介绍,然后论述了影响股 票价格的因素,包括市场内部因素、基本面因素和政策因素。另外,股票价格 变化多端,如果没有一定的理论前提是很难进行预测的。所以紧接着介绍了股 票预测的理论前提及常见的股票预测分析方法,基础面因素分析和技术分析等。 最后,对股价预测存在的一些问题进行了总结。 武汉理工大学硕士学位论文 3 1 遗传算法 第3 章基因表达式编程 遗传算法【1 4 , 1 5 】是模拟生物在自然环境中的遗传和进化过程而形成的一种自 适应全局优化概率搜索算法。算法中存在一个代表问题潜在解集的种群,该种 群由经过基因编码的一定数目的个体组成。每个个体携带不同的染色体,染色 体作为遗传物质的主要载体表现为某种基因组合,决定了个体的性状的外部表 现。于是,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代演化产 生出越来越好的近似解。对应于遗传算法,就是根据问题中个体的适应度大小 按照相应的规则挑选个体,借助于自然遗传学的遗传算子进行组合交叉和变异, 产生出代表新的解集的种群。该过程将导致种群像自然进化一样,后生代种群 比前代更加适应于环境,末代种群中的最优个体经过解码,可以作为问题近似 最优解【1 6 1 。 基本操作 遗传算法包括三个基本操作【1 6 】:选择、交叉和变异。这些基本操作又有许 多不同的地方,下面我们逐一进行介绍。 1 选择( s e l e c t i o n ) 在生物的遗传和自然进化过程中,对生存环境适应程度较高的物种将有更 多的机会遗传到下一代:而对生存环境适应程度较低的物种遗传到下一代的机 会就相对较少。模仿这个过程,遗传算法使用选择算子( 或称复制算子) 来对种群 中的个体进行优胜劣汰操作:适应度较高的个体被遗传到下一代种群中的概率 较大;适应度较低的个体被遗传到下一代种群中的概率较小。遗传运算中的选 择操作就是用来确定从亲代种群中按某种方法选取哪些个体遗传到下一代种群 中的一种遗传运算。 选择操作建立在对个体的适应度进行评价的基础之上。选择操作的主要目 的是在保持种群大小恒定的情况下复制种群中适应度高的个体,去除种群中适 应度低的个体。首先计算适应度【1 8 】,适应度计算之后是实际的选择,按照适应 度进行父代个体的选择。 1 4 武汉理工大学硕士学位论文 2 交叉或基因重组( c r o s s o v e 价e c o m b i n a t i o n ) 在生物的自然进化过程中,两个同源染色体通过交配而重组,形成新的染 色体,从而产生出新的个体或物种。交配重组是生物遗传和进化过程中的一个 主要环节。模仿这个环节,在遗传算法中也使用交叉算子来产生新的个体。 遗传算法中的所谓交叉运算,是指对两个相互配对的染色体按某种方式相 互交换其部分基因,从而形成两个新的个体。前面介绍的选择算子不能在种群 中建立任何新的个体,它只能以不复制适应度较差的个体为代价复制多个适应 度较高的个体,新个体的建立只能通过交叉算子和变异算子来实现。交叉运算 是遗传算法区别于其他进化算法的重要特征,它在遗传算法中起着关键作用, 是产生新个体的主要方法【1 7 1 。 在遗传算法中,在交叉运算之前还必须先对种群中的个体进行配对。目前 常用的配对策略是随机配对,即将种群中的个个体以随机的方式组成n 2 对 配对个体组,交叉操作是在这些配对个体组中的两个个体之间进行的。交叉算 子的设计和实现与所研究的问题密切相关,一般要求它既不要太多地破坏个体 编码串中表示优良性状的优良模式,又要能够有效地产生出一些较好的新个体 模式。另外,交叉算子的设计要和个体编码设计统一考虑。 交叉算子的设计包括以下两方面的内容【1 7 l : 1 ) 如何确定交叉点的位置; 2 ) 如何进行部分基因交换。 依据个体编码表示方法的不同,可以采用实值重组和二进制交叉。 3 变异:( m u t a t i o n ) 在生物的遗传和自然进化过程中,其细胞分裂复制环节有可能会因为某些 偶然因素的影响而产生一些复制差错,这样就会导致生物的某些基因发生某种 变异,从而产生出新的染色体,表现出新的生物性状。虽然发生这种变异的可 能性比较小,但它也是产生新物种的一个不可忽视的原因。模仿生物遗传和进 化过程中的这种变异环节,在遗传算法中也引入了变异算子来产生新的个体。 遗传算法中的所谓变异运算,是指将个体染色体编码串中某些基因座上的 基因值用该基因座的其他等位基因来替换,从而形成一个新的个体。 从遗传运算过程中产生新个体的能力方面来说,交叉运算是产生新个体的 主要方法,它决定了遗传算法的全局搜索能力;而变异运算只是产生新个体的 辅助方法,但它也是必不可少的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论