基于堆叠自编码器和长短期记忆网络的金融时间序列深度学习框架_第1页
基于堆叠自编码器和长短期记忆网络的金融时间序列深度学习框架_第2页
基于堆叠自编码器和长短期记忆网络的金融时间序列深度学习框架_第3页
基于堆叠自编码器和长短期记忆网络的金融时间序列深度学习框架_第4页
基于堆叠自编码器和长短期记忆网络的金融时间序列深度学习框架_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

引言由于具有噪声和波动性的特点,股票市场的预测通常被认为是时间序列预中最具挑战性的问题之一ang等人,212)。对于现代社会的经济和社会组织来如何准确地预测股票走势仍是一个悬而未决的问题。在过去的几十年里,机器学习模型,如人工神经网络Asuo等人,204)和支持向量回归SR)herassky,99)被广泛用于预测金融时间序列,并获得较高的预测精度Reees等人99),on等人193),Paadas和Pdhy01),Lu等人2009),Hung等人25))。然而,在文献中,机器学习和模式识别社区的最近趋势认为应该将深度非线性拓扑应用于时间序列预测。作为对传统机器学习模型的改进,新的深度学习模型可以通过提取相关信息的鲁棒性特征来成功地对复杂的现实世界数据建模Hnon和Slahudnv,20),并实现比之前更好的性能Beno人013。虑到融间列复性,深学与融场测相结被为最引的话之一Cvlcne等人206然,领域相对来仍还被入。一般来说,在研究中广泛使用的深度学习方法主要有三种:卷积神经网络CN)(Kzhesky等202深信网络BNinon等,206和堆叠自编码器SakedAuoncoers,As)Bngo等人,207)。目前一些深度学习应用于金融领域的相关工作已经将前两种方法引入研究。如ig等人215)结合神经张量网络和深度卷积神经网络,预测事件对股票价格走势的短期和长期影响此外,某些研究在金融市场预测中使用了深度信念网络shhara等人204),Shen等人015,uroo等人214然关于叠编器法否可以应用于金融市场预测,很少有人深入研究这个问题。因此,本文对这一领域做出了探索并出一基堆叠编器法股市场测模。本文提出的模型由三部分组成:小波变换T)、堆叠自编码器As)和长短期记忆STM。Es是型的要成分用在无督情下习融间序列的深层特征。具体来说,它是由多个单层自编码器uoncoe,A)组成的神经络其每层输出征接连层输入在E训过种输入数据x同时也是其输出̂的标签,其损失函数的宗旨就是最小化输入和输出的误差。此AEs模够成地习不量抽象Chen等24。SEs结合另外两种方法有助于提高预测的准确性。STM是一种循环神经网络N),隐藏层采取循环式前馈结构。与传统的N不同,当存在任意大小的时间步长时,它非常适合从经验中学习来预测时间序列。此外,它还改善了梯度消失的问题,方法是让内存单元将重要时间步的信息保留任意的时间huKL等人,206)。有证据证明它比传统的RN更有效Plagi等人206),Pani等人216)。此决定用个模来测票的走。此本还用小波变换修正了金融时间序列的噪声特征。它是一种广泛应用于滤波和挖掘一维信号的技术Hieh等人21),mngaari等人206),Dnoo等人195))。本次研究用它对输入金融时间序列进行去噪,然后将去噪后的数据输入神经网络模型中。综上所述,本文所介绍的模型是这三种方法的结合,并将这个新模型简称为WAsLT。本文取了6股指来检所出型预能力这指包中内地A市的深00数、表度的iy50指、港场恒指、东京的ikei25数纽约券易的SP0指和DJA指。术上讲,文用AsLTM预每股指的变,检模在测票变动势面效。值得注意的是,本文在多个金融市场而非单个金融市场中测试EsSM模型的表现。这是出于获得可靠结果的考虑。根据有效市场假说EH),市场的效性影响其资产的可预测性。换句话说,即使一个市场的预测表现令人满意,但仍然很难将其归因于所提出的模型的作用。在不同的市场条件下测试模型是解决这问题的一种方法,若模型在多个市场都展现出了较好的预测结果,则可将功劳归模型而非市场本身的强有效性。本文所选择的多个市场可以达到上述目标,它们表了金融市场的三个发展阶段。例如,中国大陆和印度的股市通常被视为发展中市场,尽管这两个国家在过去几十年都经历了快速增长,但它们的大部分监管都不成熟。相比之下,纽约证券市场被认为是最发达的市场。它也是迄今为止世界上最大的证券交易所和最有效的市场。除此之外,香港和东京的股票市场处于最发达国家和发展中国家之间的中间地带。因此,本文的样本设置可以帮助检查提出的模型不同场态的效。对于每个股票指数,使用三种类型的变量作为模型输入。第一组是股票交历史据如盘、高价最价收价HChag等人004,hen等人203),Paasurn等人005)。第二组是股票交易的技术指标,这些都是以前研究中常的输入Zhng等,202。此之外本文还入宏经济变量作为第三种类型的输入。由于宏观经济会对股票市场产生巨大影响,而深度学模型优在能从入变中取象不的特征ue等人015ue等人206),文为经济量加可提模型性。在预方上用Chn和ehaizdeh206描述分预方,到各股票指数的预测结果。然后,本文从两个维度评估模型的性能:预测精度和盈利能力。预测精通过三测量值来评估平均绝分比误E)、相关R)和泰尔不等式系数hilsinquliycoeiien,TilU)。这些都是广泛的衡量预测值与实际值是否相似的指标uo等人014,seh等人21),Aly和Saman205),mniKlu210))。为了检查盈利能力,本文还建立了买卖交易策略ao等人,199。该策略应用于基于模型预测结果的交易收益。作为基准本文计算了每个股票指数的买入持有策略的回报han和hraiadh206),Chn和Rzmah016。其本路根据AsLTM的易收否能超过种单易略收益进步断型盈利力。为了好现SEsLTM型性还引了他个型并评估了它们在预测每个股票指数时的预测精度和盈利能力,作为本文提出的模型比较这种型包括LTM即T和TM组LTM传的N。前两个模型用于检验SEs方法在提高预测性能方面的有效性,最后一个模型NN被用作性能基准。由于在以往的文献中神经网络模型已经成功地应用于预测金融间列Hseh人201,i和Ceng(12Raer等人015),这有助更地解文出的型传神网相能多提。本研的本据来上海得息术限公提的WND数、深圳大通教育科技有限公司提供的SAR数据库以及全球金融门户网站nvesigcm。本由208年7至06年9约8年数组。研究结果表明,SEsM不仅在预测性能上优于其他三个模型,而且在盈利能力上也于他个型。本文的工作根植于一个不断发展的研究领域,即利用深度学习方法来提高效率。例如,基于深度学习的方法极大地提高了图像识别Kihesky等人212),Faaet等人01),mson等人01),Sgedy等人015))、语音识别iklov等人21),Hion等人202),Siah等人203))、语言翻译Jean等人014,Sukeer等人014)及物Sheidn人205基因组学Leng人204Xng等人015)等多领域最水。项的主要献,次试用堆自码来成HC技指和观济件的深特作多信,以提给STM模预未的票格与统的STM和NN方比文提的度习架AsTM可以更方便地进行数据降维提特而不用进行繁的设检验。方法阐述图表1A-LTM模型结构示意图资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,为了提取输入数据中的不变信息生成深度特征,用于向前一个时间步的股预测,本文提出了一个新的金融时间序列深度学习框架,使用基于深度学习的预测方案,之为EsSM模,模集了叠自编器和LTM型。图表1展示了模型的整体结构。该框架包括三个阶段1)利用小波变换对数据进行处理,对股价时间序列进行分解,消除噪声2)应用堆叠自编码器,该编码器具有以无监督方式训练的深层架构3使用具有延迟的LSTM来生成向前一步出。下面进步细绍个模小波变换由于小波变换具有处理非平稳金融时间序列数据的能力Rsey,199),因此本研究采用小波变换进行数据去噪。与傅里叶变换相比,小波变换的关键特性于,它能同时分析金融时间序列不同时段的频率分量。因此,小波变换在处理高不规的融间列pola人,006时有用。本研究采用Har函数为小波基函数,它不仅可以对金融时间序列进行时域分,且以著少处时间Hih,1。以Har数基波变换的时复为n中n示间列Abovih202)的度。连续波换小函定义:1𝑎,𝜏(𝑡)= 𝜙√𝑎

𝑡−𝜏) ()𝑎其中𝑎和𝜏分别是尺度因子和平移因子,(𝑡)是小波基函数,它必须服从容许性条件即:∞|(𝜔)|𝜙=∫0

𝑑𝜔<∞ ()𝜔其(𝜔)是频𝜔的数同也(𝑡的傅叶换。对于方积𝑥(𝑡)𝑥(𝑡)∈2(𝑅),具小波连小变定如下:∞1 ̅𝐶𝑥𝑎,𝜏)= ∫𝑥(𝑡𝜙√𝑎∞

)𝑎

()其)表(𝑡的复共函。上变的变形:1 ∞𝑑𝑎 ∞𝑥(𝑡)= ∫𝜙0

2∫𝐶𝑊𝑥𝑎,𝜏)𝑎,𝜏(𝑡)𝑎−∞𝑎

()连续小波变换的系数含有大量的冗余信息。因此为了减少冗余,对系数进采样。将时间序列分解为正交分量集,得到离散小波变换DT)。ala189)提出用一对高通和低通滤波器对时间序列进行滤波,作为离散小波变换的实现。alat算法中有两类小波,父小波𝜑(𝑡)和母小波𝜓(𝑡)。父小波𝜑(𝑡)和母小波𝜓(𝑡)分别积分为1和0用学示:∫𝜑(𝑡𝑑𝑡=1,∫𝜓(𝑡𝑑𝑡=0 ()母小波描述时间序列的高频部分,而父小波描述时间序列的低频部分。j级度的小和小可示为Dgais等214:𝑗,𝑘𝑡)=2

−𝑗2𝜑(2−𝑗

𝑗𝑗

−𝑘) ()𝑗,𝑘(𝑡)=2

2𝜓(2

−𝑘) ()原序列可以通过在父小波和母小波上的一系列投影来重构,6)、7)式中的𝑗∈02,⋯,𝑘∈01,⋯,𝐽代不小的引其中J多辨率度个,而k表间。从间列x的交波近似式:𝑥(𝑡)=∑𝐽,𝑘,𝑘(𝑡)+∑,𝑘,𝑘(𝑡)+⋯+∑,𝑘,𝑘(𝑡)

()𝑘 𝑘 𝑘其中胀,𝑘和𝐽,𝑘的义下式出:,𝑘=∫𝐽,𝑘𝑥(𝑡𝑑𝑡 ()𝑗,𝑘=∫𝐽,𝑘𝑥(𝑡𝑑𝑡 (1)时间列x多度:𝐽𝑡)=∑,𝑘𝐽,𝑘𝑡)𝑘𝑗𝑡)=∑,𝑘𝐽,𝑘𝑡)𝑘那么正小级近的简式以示为:

(1)(1)𝑥(𝑡)=𝐽𝑡)+𝐽(𝑡)+𝐽−1(𝑡)+⋯+1(𝑡) (1)上式中𝐽(𝑡)是输入事件序列x)的最粗略近似,这样就将x)分解为了𝐽𝑡,𝐽𝑡,−1(𝑡),⋯,1(𝑡的序列。对于不平滑的时间序列数据,重复做离散小波变可“少刺避免拟合Hih等201本在预处理过中使用双重离散小波变换。堆叠自编码器深度学习是通过深度神经网络架构从输入数据中提取深度特征的一系列模深度学习模型通常有三层以上,即至少含有一层隐藏层。深度网络可以通过无监的分层训练初始化,然后利用带标签的数据进行监督训练调优,这些标签可以逐逐步生成更抽象和高级的特征Shlkopf等人,207)。已有研究显示Susever等人208),Rox等人010)),深层模型可以比结构较浅的模型更好地逼近非线性函。最近的研究中提出了几种深度神经网络架构,包括深度玻尔兹曼机DBs)Slahuinov和Hnon,009),深度信念网络Ns)和堆叠自编码器SEs)。带约束的玻尔兹曼机RBsinn,010)、卷积神经网络CNFuksma,19)和自动编码器Bnio,007)是常用的分层训练模型。本文用编器对HC变和他标行分训,用AEs作相应的度经络构。图表2单层自编码器的结构图资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,单层动码是个层神网,图表2示。一和三分为输入和k神构层第层包含n神经的藏,于成单层AE的深层特征。训练单层AE的目标是使输入向量与重建向量之间的误差最小化单层E向播第步是输向映到藏层如表2区,而第二步通将藏量射到建来建入量。两步可表为:𝑎(𝑥)=𝑓(1𝑥+1) (1)𝑥′=𝑓(2𝑎(𝑥)+2) (1)其𝑥∈𝑅𝑘和𝑥′∈𝑅𝑘分是入量重构量𝑎(𝑥是层AE隐状1和2分别为隐藏层和重构层的权重,1和2分别是隐藏层和重构层的偏置。𝑓(∙)表示激活数激函有多选,如ioid函、线整函数EU双正切函数nh本用sgmod激函数Chn人014。小输量与重构量间差优函数以述:𝑔𝑖𝑊,𝑏,𝑊,𝑏[𝐽]=𝑔𝑖𝑊,𝑏,𝑊,𝑏

𝑚(⁄)‖𝑖−𝑥′‖+𝑑+𝑝] (1)1122

112

2 𝑖𝑖=1𝑖其中J代单层AE重误差平𝑖和𝑥′分入向索为i分它对应的重构向量。m为训练数据集的大小,在本文中m代表训练阶段的交易日的数𝑑和𝑝分是重减和稀惩项可表:𝑖𝐹𝐹𝑑=(2)(‖1‖2+‖2‖2) (1)𝐹𝐹𝑘𝑝=𝛽∑𝐿(𝜌||𝑡)𝑡=1

(1)其中‖‖𝐹表示Froeius范数,𝜆和𝛽分别是权重衰减项和稀疏惩罚项,𝐿(∙)表示Kllackeber散度𝜌是稀疏性参数,只有少数藏层节点可以大于稀疏参数。𝑡是第t个藏隐态平均,:𝑘𝑡=(𝑚)∑𝑡𝑖)𝑖=1

(1)其𝑎𝑡𝑖表示第t层状中索为i的量梯下降法广应于经网络模型的优化问题Chn等人214),ue等人2016)。因此,按照in等人2015的议采梯下降法成数化。图表3由4个encoder构成的5层As实例资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,堆叠编器由个层自码的藏构的,5层SEs结如表3所,模由个层E的ncder分成层动码将入日频变量映射到第一个隐藏向量。训练完第一层单层自编码器后,去除第一层单层自编码器的重构层,保留隐藏层作为第二层单层自编码器的输入层。一般来说,后续AE的输入层是前一声发射的隐藏层。每一层都使用与单层E相同的梯度下降算法,通过求解16)式的优化函数来训练,并将隐藏向量输入后续的E。值得注意的是每层E训结束,构的值偏差被弃。这工作,每个数据集的输入日量的数量大概为85维,然后,通过试错隐层的维度设置为0。模型深度在SEs中扮演着重要的角色,因为它决定了提取特征的不变和象等质。在研中Es的深度按照Cen等人04的建议设置为5。长短期记忆网络长短期记忆是循神经络模型hu等人206的众多变体之一本节绍了RN型何用LTM收价行。此基的N开始介绍,后到STM型。N是一种深度神经网络架构Dal等人,012,在时间维度上具有深度结构。它已广泛应用于时间序列建模man990,Roison994),iov等人2010,aves202enio人202)esil等人013传神络的假设是输入向量的所有分量都是相互独立的,因此传统神经网络不能充分利用序时间维度上的信息。相比之下,NN模型增加了一个由时间序列的顺序信息生成的隐藏状态,下一时刻的输出依赖于上一时刻的隐藏状态。图表4显示了一个NN模及按间开的算表4的数符如下:𝑡是t时刻输;𝑡是t时刻隐态是根输向和前隐藏态算来𝑡的计公为:𝑡=𝑓(𝑈𝑡+𝑊𝑡−1) (2)其𝑓是激函,于算第个状1的始状0通常初为0;𝑡是t刻输过下计:𝑡=𝑓(𝑉𝑡) (2)U和V分是藏输出的重W隐态的渡重。图表4循环神经网络模型结构及按时间轴展开的逻辑结构资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,图表5LTM的Cl结构资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,图表6Cl的内部结构

尽管RN对间列模得好但于度失问Plngi等06,很难学习长期依赖关系。STM是一种利存储单对抗梯度消失的有效解方案Hohreir和Scihber,997。SM藏层计门记单,每个记忆元输们遗门和出三门部,如表5所。同模型记忆和当前时间步输入之间的相互作用中起不同功能。输入信号是否能改变存储单元的状态由输入门控制。另一方面,输出门可以控制存储单元的状态是否可以改变他储元状。此,忘可选记住忘之的态。资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,图表6示了STM忆单内的造据可以出在TM模每个时步输是何输出系来,中学符如:1)𝑡是t时刻输;2)𝑖,𝑓𝑐,𝑜𝑖,𝑓𝑐,𝑜𝑜都权重阵;3)𝑖,𝑓𝑐和𝑜是置阵;ℎ𝑡是t时刻输值;𝑖𝑡和𝑡分为t时的门值候记值可示为:𝑖𝑡=𝜎(𝑖𝑡+𝑖ℎ𝑡−1+𝑖) (2)𝑡=𝑡𝑎ℎ(𝑐𝑡+𝑐ℎ𝑡−1+𝑐) (2)𝑡和𝑡分为t时遗和输下时的忆,计公为:𝑡=𝜎(𝑓𝑡+𝑓𝑡−1+𝑓) (2)𝑡=𝑖𝑡∗𝑡+𝑡∗𝑡−1 (2)𝑡和ℎ𝑡分是t时输和下时的状同也是前刻输出)𝑡=𝜎(𝑜𝑡+𝑜𝑡−1+𝑜𝑡+𝑜) ℎ𝑡=𝑡∗a(𝑡) LTM模型的超参数包隐藏层数和延迟期数。目前对于隐藏层数和延迟期的选还有验则本文过错隐藏层延迟的数量设置为5和。金融时间序列分为三个子集:训练集、验证集和测试集,其中训练集占80%,验证集占10测集占10。用反传算练SEsSM型及验照组的LTMLTM和N模学习率、bachze和poh数分别为00、60和00。收敛速度由学习率控制,学习率是时间的递减函数。实验证明将epoch数学率置为5000和005可实练的敛即改参组合,只要到敛实结就会于定。数据描述此部分将介绍关于样本选择和本文为模型预测选择的输入变量的细节。此本节提了据源。样本选择和输入变量本文选择的六个股票指数是沪深30指数、iy50指数、恒生指数、日经225指S&P50指道斯数正本之前到,场态能潜在地影响模型的有效性。来自不同市场条件的样本可以帮助解决这个问题。S&P500指数和道琼斯工均指数来自被公认为世上最发达的金融市场—纽约证券交易所。因此,它们表示发展水平最高的市场。相反,中国大陆和印度的金融市场往往被归类为新兴市场,事实上,大多数国家的市场制度还远远没有完全完善。因此本选择SI300和iy50来代发市场除述场,生指数东日经225指代表介发市和展中场间市状。大多数情况下,香港和东京的金融市场通常被认为是发达市场,但是这两个市场与国股市相比,还没有美国股市成熟。因此,这六个股票指数为实验测试基于不同场条的型现鲁性提了个然环。图表7输入变量的详细描述资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,本文择组量为入表7描详信息PnlA的组变量是各指数的历史交易数据。根据之前的文献,数据包括开盘价、最高价、最价和收盘价HC变量以及交易量。这些变量反映了每个指数的基本交易信息。另一输是个的12个泛用技指,PnlB出详息。最后一组输入是宏观经济变量。毫无疑问,各地区的宏观经济状况也在影股市表现方面发挥着关键作用。例如Zho210)认为人民币汇率的波动会影响中国内地A股场走。此,观济量加有助在经络测引更多的信息。本文选取了两类宏观变量:汇率和利率。这两种变量都可能影响股票市场的资金流动,最终影响股票的表现。具体来说,选择美元指数作为汇率的代替。众所周知,美元在货币市场上扮演着最重要的角色。因此,仅凭这一点就足以捕捉到从货币市场到股市的影响。在利率方面,选取各个市场的银行间同业拆借利率作为代理,即上海银行间同业拆借利率SHBR)、孟买银行间同业拆借利率BR)、香港银行间同业拆借利率HBR)、东京银行间同业拆借利率TBR)和美联基利。数据来源本文样本数据均来自上海万得信息有限公司提供的WND数据库hpwwwndcmn)、深圳大通教育科技有限公司提供的CR数据库hpwwgarccm)全球融户站nvesngc。本期为008年7月1日至2016年9月0日所变都日数据可在ighare站上获得igsarecmsadb91806545e33,D106049ighare0210)。本文没有进行先验时间序列分析。事实上,经典时间序列模型的应用,如移动平均自回归模型RA),通常需要对时间序列的分布和平稳性进行严格的假设。由于金融时间序列通常被认为是非常复杂、非平稳和非常嘈杂的,因此在应用经典时间序列模型之前,有必要了解时间序列的性质odankiy和Ppov200,Husin等人208),则预工将无的然而使神网模间序的验析不不可少。先由神经黑特性Nuai等人,209),它不需要对时间序列结构的先验知识。此外,时间序列的平稳性对神经网络预测能力的影响是相当小的。相关证据表明,在应用人工神经网络进行预测时,将平稳性条件放宽到非平稳时间序列是可行的Km等人,204。因此,本文简化先数分的程,接数输模中。实验设置此部详介了何用SEsSM型行预以对型能评估细。预测方法预测过遵循Can等人2016分段测方。体来说流程括三部分。第一部分是训练环节,输入数据训练模型和更新模型参数。第二部分是验证节,使用验证集调优超参数,得到一个最优的模型设置。最后是测试环节,使用优参数设置的模型来预测数据。由于数据有限,本次实验每个环节的时间框架与Chn等人不一致。在训练环节,本文使用过去两年的数据来训练模型。接下来的三个月(一个日历季度)用于验证。在测试环节,根据流行的投资组合管理实践,本文预了个型季业绩这过从2010年10到216年9月持续6年,季预一。后,于个票数分有4季和6年预测结。测程表8所示。图表8在整个样本周期内连续进行训练、验证和测试资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,为了简化结果的展示,本文报告的是年度业绩而不是季度业绩。因此,模的预测度交回的现以6年周。于年时间的细况图表。图表96个预测年的时间间隔资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,模型表现评估此部分讨论对于模型性能的评估。本文首先展示了使用选择的三个度量指量模预的接来讨每模的利力。首先是对模型预测准确度的评估。本文遵循以往研究中uo等人214),Hieh等人01Alay等人005,enke10选的个典标A,R和ThilU衡每型的测度三指的定分为:∑|𝑡−𝑦∗∑|𝐴𝐸=

𝑁𝑡=1𝑁

𝑡

𝑡

(2)𝑁(𝑡−𝑡(𝑦∗−∗)𝑅= 𝑡=1 𝑡 𝑡

(2)𝑁(𝑡−𝑡2𝑦∗−∗2𝑡=1 𝑡 𝑡√1𝑁(𝑦−𝑦∗)2ℎ𝑒𝑖𝑙𝑈=

𝑁𝑡=1𝑡 𝑡

(3)√1𝑁(𝑦2+√1𝑁(𝑦∗2𝑁𝑡=1𝑡 𝑁𝑡=1𝑡𝑡上式𝑡和𝑦∗分是实和预值N为测E量差大,它是计算误差的相对平均。R是两个变量之间线性相关的度量。TelU是两个变量之差的对量它计偏的方给较大差大权。果R较大,明测与际相似而AE和ThilU较,说预测实际值接近Hseh人21,liel193)。𝑡接下来是对模型盈利能力的衡量。根据每个模型的预测结果制定buyndsll交易策略,希望在相同的交易策略下,找到最有价值的模型,来为投资者赚取最高的利。前业研中,uyadsl易略广用评盈表现o等人,999。Buyndell策略建议投资者在下一时期的预期价值高于当前实际价值时买入相反当测值于前实价时议资出售用学言示:𝑡+1Bsnl:𝑦∗ >𝑡 (3𝑡+1𝑡+1Selsal:𝑦∗ <𝑡 (3𝑡+1𝑡+1上式𝑡表当实值𝑦∗则是一期预值策略盈表𝑡+1𝑏 𝑠𝑡+1−𝑡+(𝑡∗𝐵+𝑡+1∗𝑆) 𝑡−𝑡+1+(𝑡+1∗𝐵+𝑡∗𝑆)R=100×(∑ +∑

(3)𝑡−1

𝑡

𝑡−1

𝑡其中R表投策获的回b和s别买入卖的天B和S分别是买出的易本。由于在现货市场做空一篮子股票的难度较大,且交易成本巨大,因此本文相应的指数期货合约来执行这一策略,而非股票指数。从而带来一个问题:股指期货的走势是否与其相关股票指数密切相关。事实上,无论是理论文献还是实证文献都证明了股票指数与其对应的指数期货之间存在着密切的联系Kwlr等人1987),izi等人19),og等人016),hi等人209),hag等人2010)。外为了更有力证据本进步检验六个票数其相应的指数期货之间的长期关系,Spaman相关和整检验的结果如图表10所示,可以看出,所有指数与其对应的指数期货之间存在稳定的长期关系。因此,可以确信对货场预结可以功应到应指数来场。图表0指数与相应指数期货之间的关系资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,根据上述交易规则,本文在预测价格低于当前价格时做空指数期货合约,测价格高于当前价格时买入合约。值得注意的是,有些市场有不止一个期货产品市场上交易。例如,恒生指数和&P00指数都有两种期货产品:标准期货合和迷期合。前个市不的,国有标的深30数货因此,了场间一性,文择准货品来行易略。为了使结果更加真实,本文考虑了交易成本对利润的影响。由于不同市场本费率是不同的,并且出于监管的目的会偶尔进行调整,因此在样本期内将样本场的成本费率统一为一个费率,以简化计算程序。最后,选择单边交易的成本率001%。除了byadsll易略文结了byadhold交策,据往文献Chn和hraideh016),lay和Samn205),mnke210),ao等人999,Can和Roaah016),在测试模型的盈利能力时提供了一个基准线。每种模型的交易收益将与buyndod策略的收益进行比较。由于长期持有期货合约在现实中风险较大,所以在现货股市交易,而非在指数期货市场交易,执行buyandod策略。现货市场交易成本的计算过程遵循上述规律。最后,现货场统成是入025,出05。结果展示图表1各股票指数在0-201.09.30的实际数据和四个模型的预测数据资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,对于每个股票指数,本文在图中展示了了四个模型的年度预测数据和相应实际数。表1第年的果第至六的其数可在表120中找到从中以比于SEsTM和LT,TM和N更大的误和实数的离。外与LTM比AsLTM的更:WAsLTM的波动性较小,且比LM更接近实际交易数据。具体而言,WAsLTM欠达场的势发市更明显。四个模型的准确性测试结果见图表214,每个包含相似市场条件下的个股票数测结,个表的个Pael都示了个度标一结,同时别告个票数的6年绩和6年值。图表2模型在发展中市场的预测准确度资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,图表3模型在相对发达市场的预测准确度资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,图表4模型在发达市场的预测准确度资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,图表12记了型测SI300和Niy50的表。表可看,WAsLTM在预测这两种股票指数时的表现要比其他三个模型好得多。例如,在预测沪深0指数时,SEsTM的AE和hilU的平均值分别为0019和013远其他个型标R平均为04,四模型中最高的。事实上,SELSM不仅在平均水平上,而且在每年的表现上都优于其他个为证这结稳性本检了SEsSM其三模型之差的计著。具来,将AsLTM与外个的每个精度指标的4季度结果进行了比较(使用t检验)。最后,统计结果证明,WAsLTM与其余三个模型在发展中市场的两个指数中均在5%的水平上存在显著异。图表3和表4示模型其四股指中的现表3模型香和京场表现图表15报了P500数道斯的结。与图表12中现结相似无是平值是从结来,AELSM的AE和ThlU然最而R仍高他三模。样,As-LTM模型与其他三个模型之间的差异在5显著水平上通过了统计检验。由此见,无论市场状况如WAsTM均能稳定地获得较低的预测误差和较高的预测精度。除了上述发现外,本文还从数据中发现了一个有趣的规律:一个特定模型测两个市场条件接近的股票指数时,性能差异很小,而当两个股票指数来自发展状不同市时这差会增。如WEsSTM在测S&P00和JA时PE为0,预测SI300和iy50时PE增到019其余三个模型也存在类似的现象。且市场状况对不同模型的影响程度也是不同的。例如市场况乎对N很大影。平均E在6股中为018~0066。这意味着N的最差预测表现只有最佳预测表现的四分之一左右。WLTM和STM表出与NN相性比之AsLTM场上的现这种型比要定多这能因为AEs在理声据面比其他三种更强大。这些发现的含义是,本文提出的模型在预测不太成熟和波动性较高的系统方面可比他模型更有价值。资料来源:《Adeeplarnngramewokforfnaciltiesriessigstcedauoecorsandongshortermmeoy》,盈利能力测试结果如图表15所示。样的,该时报告年回报率和年的平均回报率,每个Pal展示了模型在特定市场条件下获得的交易收益,每个Pael最一报在交特股指时yandold策的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论