零基础入门AI量化交易学习笔记_第1页
零基础入门AI量化交易学习笔记_第2页
零基础入门AI量化交易学习笔记_第3页
零基础入门AI量化交易学习笔记_第4页
零基础入门AI量化交易学习笔记_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、零基础入门量化交易学习笔记AI量化学习笔记1.量化基础1.量1化投资理解。量化投资就是借助统计学、数学的方法,运用计算机等工具,从海量历史数据中寻找能够带来超额收益的多种“大概率”策略,并纪律严明地按照这些策略所构建的数量化模型来指导投资,力求取得稳定的、可持续的、高于市场平均的超额回报。”量化投资与传统投资的区别传统投资:经验判断(中医,望闻问切)量化投资:统计规律(西医,仪器测量)传统投资的投资经验、投资理念用数量化的工具实现,就是量化投资传统投资并不是量化投资的对立面,主观交易才是量化投资的对立面量化投资是投资从艺术走向科学的必经之路*量化投资的代表人物:詹姆斯西蒙思,1989-2008

2、年年均收益33%,大帐超越巴菲特、索罗斯等人,充分说明量化投资的先进性1.量2化交易策略量化投资的优势纪律性:严格执行投资策略。不随投资者情绪的变化而随意变更,可以克服人性弱点,如贪婪、恐惧、侥幸心理,也可以克服认知偏差。及时性:及时跟踪市场变化。不断发现能够提供超额收益的新的统计模型,寻找新的交易机会。系统性:通过多层次的量化模型多角度去观察及海量数据的处理,捕捉大量投资机会。多层次,大类资产配置、品种选择、精选种类多角度,宏观周期、市场结构、估值、成长、盈利质量、分析师盈利预测、市场情绪等。多数据,海量数据的处理。准确性:准确客观评价交易机会,克服主观情绪偏差,从而盈利分散化:充当分散化投

3、资的工具。从历史中挖掘未来重复的历史规律,且这些历史规律都是较大概率取胜的策略。依靠筛选出股票组合来取胜,是捕捉大概率获胜的股票,而不是押宝到单个股票。量化投资的流程数据获取:完整、可靠、规范的数据,使得最终的分析和研究结论是正确的、可靠的回测:构建交易策略并在历史数据中进行撮合成交,并得到收益率曲线,以便进行回测验证。3模拟交易:策略通过回测验证后,一般不会直接实盘,而是通过模拟交易进一步验证策略。实盘交易:交易执行需要考虑资产管理、订单管理、风控管理。什么是回测?回测就是用量化策略对过去指定时间段进行模拟交易,从而得到的收益以及净值变化情况。进行回测是量化投资的一个重要特征。回测就是用量化

4、策略对过去指定时间段进行模拟交易,从而得到的收益以及净值变化情况。进行回测是量化投资的一个重要特征。以挑选优质策略、淘汰劣质策略为核心目的。为量化策略进入实盘交易提供一定的依据的作用,只是判断量化策略好坏的第一个门槛。过往绩效并不能代表未来,宏观经济、市场制度、市场结构、投资者投资水平,科学技术发展等一系列因素的不断演变。量化交易策略有哪些?(只考虑股票市场)多因子模型趋势交易统计套利算法交易价值选股择时研究事件驱动日内策略技术分析回测中常见的陷阱未来函数:当前时间点获取到了该时间点之后的信息过拟合:拟合过度,会学习和记忆噪音数据,在未来很容易失效幸存者偏差交易费用的低估:在回测中,对交易费用

5、的计算低于实际情况,使得策略收益虚高冲击成本的忽略:交易本身会引起市场变化,带来冲击成本,尤其资金量比较大时,冲击成本的考虑更应该严谨小样本视角:数量量小,分析结论普适性不强偷价漏价:在一定时间点上按照价格的最高价和最低价撮合(这在实盘中是不切实际的)策略评估:指的是我们应该采用一种客观统一的衡量标准,来评价哪些策略好,哪些策略不好。二当我们对策略进行回测,得到资金曲线,那怎么评价这条资金曲线的好坏?=资金曲线:按照固定的策略进行投资后,把每天结束后的净值画出来连成线,就成了资金曲线。:评价策略最通用的一个指标:夏普比率。它不仅考虑了收益,也考虑了风险。代表的是经风险调整后的收益。1.3量化平

6、台概述量化平台,指的是传统量化策略开发平台,也是策略回测工具量化策略,分为传统量化策略和AI量化策略量化平台的主要目的是进行回测验证,是策略想法的快速验证工具。国内量化平台大都是借鉴Quantopian,QuantStart传统量化策略特点1.数据对接:行情数据、财务数据、基本面数据,数据规模小2.策略开发:依赖研究员自身的行业经验和专业知识3.数据计算:主要在回测环节,对计算资源要求不高传统量化投资的痛点周期漫长:策略从生产、回测、验证、上线,研究人员往往需要数周甚至数月的时间来挖掘和评介新的因子,基于因子开发策略周期较长策略同质化:绝大部分策略研究过程只使用价量数据和财务数据,采用被市场广

7、泛使用的因子,策略同质化程度高3收益瓶颈:使用传统数据建模算法只能捕获数据之间线性关系,研究方法的局部视野导致无法从海量数据中挖掘更多投资机会,策略收益存在瓶颈。4.流程复杂、精力分散:研究人员无法聚焦在策略研究上,在工具、底层框架、编码实现上花费不少时间,策略开发效率低。传统量化平台运行逻辑有限的人力资源无法处理海量数据人脑在策略构建中没有得到充分解放仅凭回测功能无法提高投研效率AI量化平台运行逻辑海量数据挖掘和优质策略开发涵盖数据搜集、处理、分析等提高投研效率解放人脑,专注策略研究1.4AI量化概览AI赋能投资场景StockRanker排序模型,可以对全市场的股票按照未来一定时间段的收益率

8、进行排序,排序的依据主要是股票的行情数据和财务数据(因子)深度学习的应用DNN,全连接深度神经网络。借助DNN算法,可以对股票因子和收益率之间的相关关系进行挖掘,找到其中蕴含的关系。一般这种关系非常复杂,是非线性的。二机器学习算法,能自动从数据中挖掘因子,构建非常复杂的策略。其中GP遗传算法是比较有代表性的一个算法:CNN卷积神经网络2.AI量化2.1AI量化简介Al量化将机器学习、深度学习、强化学习为代表的AI技术应用在量化投资领域,是在智能投资时代下的科学投资方式。*投资1.0,依赖于交易员的主观经验投资2.0,理论投资(有效市场假说,基本面分析,技术面分析等)*投资3.0,量化投资(随着

9、计算机的发展,通过历史数据进行模拟,得到策略的回测结果)*投资4.0,智能投资(AI量化,模型自动从海量的数据中去寻找规律,量化研究不再局限于研究员):3.0和4.0最大的区别在于,前者以人为主导,后者以机器学习算法为主导Al在证券投资中的应用背景量化投资是机器学习的天然应用场景,证券投资对AI的应用有强烈的需求,并提供了天然的土壤。人工智能的发展和应用依赖于大数据:海量数据让统计规律可提炼算法:深度学习等算法的发展支持去寻找复杂的投资模式大算力:可以遍历几乎所有的投资模式从上图可以看到,传统策略开发周期比较长,而且只能发现部分的投资机会。而AI量化投资策略开发周期较短,将传统量化投资数周到数

10、月的开发周期缩短到数天甚至数分钟,这就大大提高了策略的研发效率。从效果和质量上也有一个提升。因为AI量化借助算法,在海量的数据中进行自动挖掘,可以发现更多的常人难以挖掘的投资机会AI量化发展面临的新趋势策略研究广度日益提升NLP应用的日趋融合,舆情、新闻、电商、文本等大数据被应用2收益的追求不再局限于对有效因子进行挖掘,同时提高策略广度(Breadth)策略研究周期尺度日益精细利用算法自动从数据中挖掘更多有价值因子高频数据对于策略研究和投资交易重要性不断提升:AI算法日益多样化,性能日益提升机器学习,深度学习、强化学习等AI算法应用在量化投资领域模型在线推理有更高的频率和时效性2.2如何开启A

11、I量化最快的途径:BigQuant人工智能量化平台进行策略研究,无门槛使用AI做更好的量化投资股票、期货、期权、基金、美股、港股在算法上,BigQuant支持主流机器学习、深度学习框架:Keras、Tensorflow、Sklearn还提供针对股票市场的专有选股排序模型Stockranker。在算力上,BigQuant提供比本机更强大的计算资源,而且配置比较灵活。AI量化课程体系主要包括这三部分复现(基础编程知识,AI量化策略构建流程)在模板策略的基础上进行创新和调整(修改参数、算法、交易逻辑)3理解(介绍因子研究体系,深度学习、机器学习最佳实践,帮助大家深刻理解策略,评估策略,理解策略的收益

12、和风险)编程语言选择Python量化交易员痛点商业软件大多收费高昂,性价比低商业软件存在太多功能方面的限制C+/Java学习曲线陡峭4使用C+语言的用户开发效率低下使用者在代码工程实践上花费大量时间python的解决方案作为开源软件,Python几乎完全免费有大量的开源第三方库,在数据挖掘、机器学习领域有大量的开源模块拥有接近伪代码的开源项目和活跃的开源社区使用者将时间精力聚焦在业务逻辑上Python和金融的不解之缘JPMorgan银行是全球最大的银行之一作为Enthought公司的早期客户,JPMorgan为Numpy等项目的发展提供了巨大的帮助08年后其It架构全面转向使用Python语言

13、开发逻辑,C+/Java仅用于实现性能需求较高的模块底层代码开发了Athena交易和风险管理系统,构建了一套基于Python的金融模型快速开发环境。NumPy,pandas两个非常有用的函数包宽客是可以实现财务自由的一个职业选择,成为一名宽客::不需要背景=不需要资历:不需要人脉:不需要关系=只需要努力2.3金融基础知识“股票投资概述股票的定义”股票(stock)是股份公司发行的所有权凭证,是股票公司为筹集资金而发行给各个股东作为持股凭证并借以取得股息和红利的种有价证券。每股股票都代表股东对企业拥有一个基本单位的所有权。每家上市公司都会发行股票。按照股票的上市地点和所面对的投资者划分A股:人民

14、币普通股票。它是由我国境内的公司发行,供境内机构、组织或个人(不含台、港、澳投资者)以人民币认购和交易的普通股股票。B股:是指那些主要生产或者经营等核心业务在中国大陆、但是在新加坡交易所上市挂牌的企业股票。H股:也称为人民币特种股票。是指那些在中国大陆注册、在中国大陆上市的特种股票。以人民币标明面值,只能以外币认购和交易。S股:是指那些在中国大陆注册、在纽约上市的外资股。N股:也称为国企股,是指国有企业在香港上市的股票。股票市场”股票市场是股票发行和交易的场所。按照证券进入市场的顺序而形成的结构关系来划分:“一级市场:筹集资金的公司将其新发行的股票销售给最初购买者的金融市场。:二级市场:对已发

15、行的证券进行买卖、转让和流通的市场。股票代码沪市A股600-深市A股000”中小企业版002”创业版300股票价格指数*股票价格指数就是用以反映整个股票市场上各种股票市场价格的总体水平及其变动情况的指标。简称为股票指数。比如:上证指数,创业版指,上证50等。通过加权平均价格计算出价格指数。3.AI量化平台3.1AI量化平台概览“传统量化策略开发平台-策略回测工具化-回测验证,是策略想法快速验证工具(传统平台:Quantopian,QuantStart)-特点:“数据对接:价量数据、基本面数据,数据规模小“策略开发:依赖研究员自身的行业经验和专业知识“数据计算:主要在回测环节,算力要求小弱传统量

16、化平台发展瓶颈有限的人力资源无法处理海量数据人脑在策略构建中没有得到充分释放仅凭回测功能无法提高投研效率:AI量化平台运行逻辑海量数据挖掘和优质策略开发涵盖数据搜集、处理、分析等提高投研效率3解放人脑,专注策略研究而不是数据“AI在量化投资中的应用”量化投资是机器学习的天然应用场景,量化投资对AI的应用有强烈的需求,并提供了天然的土壤。“大数据-海量数据使得统计规律可提练“大算力-可以遍历几乎所有的投资模式-算法-深度学习等算法的发展支持寻找复杂的投资模式”机器学习的先决条件:“算法寻找隐含模式算力实现遍历搜索“海量的数据支持“量化投资的现实问题:价格趋势的关键因素无法简单表达“有限的人力资源无法遍历大量的投资模式“金融市场存在海量的数据规模3.2AI量化策略开发平台-BigQuant“全球最大的AI量化开发社区,有10W+开发者在平台开发并研讨AI量化策略,拥有完整的学院教程和文档说明,覆盖了数据研究、AI策略构建和回测、模拟交易以及实盘对接的AI量化投资全生命周期。功能模块列表数据输

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论