大数据策略之行业与样本内_第1页
大数据策略之行业与样本内_第2页
大数据策略之行业与样本内_第3页
大数据策略之行业与样本内_第4页
大数据策略之行业与样本内_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、研究报告选股策略2014-9-14金融工程(专题报告)大数据选股策略之行业与样本内选股报告要点分析师:(8621)68751859fanxt编号: S0490510120008大数据之于投资的应用n随着大数据的来临,海量投资数据的处理成为国内量化投资的新课题。伴随着国外的经验和积极探索,我们形成了一套大数据投资系人:统处理网络上纷繁复杂的投资数据。(8621)68751259zhuanghl媒体的数据和传播过程n人:利用长江大数据投资系统实时自动搜集网络媒体上的和投资相关(8621)68751636yangjf内容,使用语义识别、词频统计、分词、热度和模式识别等将网络媒体数据为对投资有帮助的大

2、数据。大数据应用于行业内选股n基于长江选股策略的经验,将大数据投资应用于行业内选股,相对于传统的因子,媒体因子对某些大市值行业都着较为突出的效 果。大数据应用于指数增强探索大数据是否能应用到特定样本指数增强,对市场上的主流指数做了 增强策略,效果良好。n请阅读最后评级说明和重要1 / 13金融工程(专题报告)目录大数据与投资3何为大数据3投资大数据3长江大数据投资系统4一、1.2.3.来自媒体的数据4二、1.数据源4将大数据选股思路应用于行业内选股5大数据行业内选股策略5大数据行业内选股表现6将大数据选股应用于指数增强9大数据进行指数增强9大数据选股指数增强表现10三、1.2.四、1.2.图表

3、目录图图图图图图图1:大数据行业内增强效果申万银行62:大数据行业内增强效果申万非银73:大数据行业内增强效果申万采掘74:大数据行业内增强效果申万房地产85:大数据行业内增强效果行业中性组合96:大数据选股中证 500 增强效果107:大数据选股中证 800 增强效果11请阅读最后评级说明和重要2 / 13金融工程(专题报告)一、 大数据与投资1. 何为大数据所谓大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流工具,在合理时间内达到撷取、管理、处理、并整理成为帮助经营决策更积极目的的资讯。大数据其概念提出起,大数据则具有了 4V 的特性,即 Volume(大量)、Velo

4、city(高速)、Variety(多样)、Value(价值)。在数据爆炸的,我们如何处理这些数据为我们的投资提供帮助,则成为量化投资的 一个新课题。2. 投资大数据我们定义投资大数据为所有对投资决策有意义的数据的总和。投资大数据:基本面:公告、研报、产业、外盘,国际等等层面:K 线,盘口,订单簿等等其实大数据投资的应用在国外已经比较普遍,相比于传统策略研究、行业研究和精选个股,新型大数据投资往往搜集更为复杂,并且有效的使用计算机进行批量处理,以下是一些成熟市场的大数据投资,:n 高频算法关注盘口和 order book 等微观市场数据。n 产业大数据通过衡量产量、实时抓取官方数据等。n 媒体w

5、eb,网络社区(如 twriter,等)。n 海量数据统计全球产业周期、货币流入,外贸数据核对等。国外的大数据处理案例也有很多:n 海外数据挖掘在 2005 年之后趋于完善,相继出现、路透等财经数据方提供以挖掘为主的成熟,其售价不菲。销售的 news analysis 和路透的处理模块。n 国外学术报告提到和冲击对于个股的影响。、正规媒体的,具体学术文章见链接。请阅读最后评级说明和重要3 / 13金融工程(专题报告)n 国外使用(2013 年在 2013 年数据进行投资的MARLIN FUND LP47.77%),SFP VALUE REALIZATION FUND 等,其排行榜中均名列前茅。

6、国内这方面的探索也是这两年开始兴起,现在所有的方向大致为:n 雪球网利用情绪分析推出情绪宝n 万得资讯、同花顺、Choice 资讯等打造大数据平台n 先前一些券商对大盘指标、网络文本进行和分析n 南方基金经、广发基金与基金与互联网企业合作)。指数(南方基金与新浪财3. 长江大数据投资系统我们处理数据的方式是人工进行处理,而由于大数据的特点,越来越多的用机器处理数据的应用和应运而生。对此,长江证券金融工程小组基于先前的研究,在 2013 年底就打造了的大数据投资系统,并于 2014 年初开始推荐选股模型“选股模型”,取得了广泛的关注。截止 2014 年 9 月 12 日,该投资组合于 2014

7、年收获了 65.48%的绝对,远超当期大盘和所有指数表现,可以说是第一个落地的真正大数据选股策略,也是今年量化策略中表现最好,思路比较新颖的策略。如此优异的表现也得益于我们对大数据投资系统的构建,其网络爬虫、词频统计、语义分析、文件分析、热点分析等几个模块。将互联网上的相关大数据获取、筛选和,并形成有效的投资策略,在市场也得到了检验,在大数据投资领域做了一次探索。详见【长江证券金融工程】选股策略之选股一文。二、 来自1. 数据源由于市场媒体的数据源头众多,我们需要选取合适的源进行分析。大型财经和大型投资者互动平台包含着较为完整的过去的链接,因此我们倾向于选择此类源作为我们的数据源头。请阅读最后

8、评级说明和重要4 / 13金融工程(专题报告)通常来说,其他源头的数据也有一定意义,但是或多或少着缺陷:1)成立时间有限有些和论坛成立时间较短,并且无法获得其相应的历史数据,无法其是否有效,因此剔除选择。2)数据结构复杂某些数据源( 如迈博汇金)中夹杂着数种格式的数据(如 txt,word,pdf),进行数据处理时容错率较低,因此剔除。3)受众有限某些数据源(如 CNBC),其为国外财经媒体或者受众面较小的财经网站,我们认为其影响力不足,不能从其中出响,因此剔除。对于投资者的影4)质量不佳某些数据源,其数据中真假难辨,和噪音较多。质量不佳不利于提取分析个股的市场关注度,因此剔除综上考虑,我们选

9、取了多家财经媒体和投资者互动平台作为我们的数据源,有门户类财经(如和讯,腾讯财经,新浪财经等)也有投资者互动平台(如雪球网和股吧等)。三、 将大数据选股思路应用于行业内选股1. 大数据行业内选股策略基于【长江证券金融工程】选股策略之选股一文中的策略组合,我们也可以使用大数据对行业进行增强。具体做法为:(1)初始使得某行业(申万一级)内股票权重与其行业指数内权重一致(2)利用长江大数据投资系统实时分析所有数据源中出现的个股新闻,自动其利好或者利空。(3)如果某只股票出现利好,则将其本身权重再加上原有行业所请阅读最后评级说明和重要5 / 13金融工程(专题报告)重的 5%(超配 5%行业权重)持续

10、 5 天。同时其他股票按比例减去应重。(4)如果同时出现 10 个以上超配权重的股票出现(即 5 日内有 10 个或者以上股票有利好),则不再识别利好,直到有超配权重的股票重新回到原来权重(超配 5 天后)2. 大数据行业内选股表现根据上述对所有申万一级行业进行增强,发现对于某些大行业,其效果比传统因子增强效果要好而且。以下是一些行业的增强表现,如图 1:大数据行业内增强效果申万银行数据来源:wind,天软,长江证券研究部分年统计20102011201220132014银行超额11.45%0.70%5.44%6.29%5.59%请阅读最后评级说明和重要6 / 13金融工程(专题报告)图 2:大

11、数据行业内增强效果申万非银数据来源:wind,天软,长江证券研究部分年统计20102011201220132014非银超额6.19%-0.06%4.42%5.52%9.98%图 3:大数据行业内增强效果申万采掘数据来源:wind,天软,长江证券研究部请阅读最后评级说明和重要7 / 13金融工程(专题报告)分年统计20102011201220132014采掘超额2.12%2.81%7.01%6.60%8.52%图 4:大数据行业内增强效果申万房地产数据来源:wind,天软,长江证券研究部分年统计20102011201220132014房地产超额6.40%11.93%10.32%10.75%8.1

12、1%以上我们均考虑了费用,日为出现后的 T+1 日,成交价为均价,费率选择双边千分之三来计算。我们列出了几个大行业内的增强效果,比较突出,其他小行业的增强效果 也比较出色,最后有对所有行业进行行业增强以后做了一个大数据选股的行业中性版本,表现也是非常优异,对回撤的较好。比较好,使得整个策略的性请阅读最后评级说明和重要8 / 13金融工程(专题报告)图 5:大数据行业内增强效果行业中性组合数据来源:wind,天软,长江证券研究部分年统计20102011201220132014行业中性超额7.15%13.36%14.08%15.02%8.74%此处我们使用的超额基准为沪深300,2014 年截至到

13、 6 月份,已经获得了 8.74%的超额,比例也高达 3.5。四、 将大数据选股应用于指数增强1. 大数据进行指数增强基于【长江证券金融工程】选股策略之选股一文中的,我们也可以使用大数据对特定样本进行增强(中证 500为:800)具体做法(1)利用长江大数据投资系统实时分析所有数据源中出现的个股新闻,自动其利好或者利空,排除过去 5 天有利空的股票。(2)每周一根据过去 5 天热度增速对样本内股票进行排序(中证 500 800),热度增速靠前的股票排名靠前。选取特定样本内前20%的股票(中证 500 选 100 支,中证 800 选 160 支)选取进行周请阅读最后评级说明和重要9 / 13金

14、融工程(专题报告)度换仓的增强(每周一换仓,以均价成交)。2. 大数据选股指数增强表现根据上述中证 500800 进行增强,发现其效果也十分和有效。因此我们认为,大数据选股对于行业增强和指数增强均有稳健的效果。权 重按照流通市值加权。图 6:大数据选股中证 500 增强效果数据来源:wind,天软,长江证券研究部请阅读最后评级说明和重要10 / 13分年统计增强中证 500超额201042.28%23.96%18.32%2011-13.81%-34.34%20.53%20128.08%4.78%3.30%201327.21%16.65%10.56%201426.73%19.68%7.05%金融

15、工程(专题报告)图 7:大数据选股中证 800 增强效果数据来源:wind,天软,长江证券研究部请阅读最后评级说明和重要11 / 13分年统计增强中证 800超额201037.12%15.76%21.36%2011-13.63%-28.18%14.55%201213.02%7.47%5.56%201319.24%-3.07%22.32%201421.47%9.97%11.50%长江证券研究部对评价请反馈至长江证券机构客户部周志德主管(8621) 68751807zhouzd1甘露副主管(8621) 68751916ganlu杨忠华东区总经理(8621) 68751003yangzhong鞠雷华

16、南区总经理(8621) 68751863julei程杨华北区总经理(8621) 68753198chengyang1张晖私募总经理(0755) 82766999zhanghui1投资评级说明报告发布日后的 12内行业股票指数的涨跌幅度相对同期沪深 300 指数的涨跌幅为基准,投资建议的评级标准为行业评级看好:相对表现优于市场中性:相对表现与市场持平看淡:相对表现弱于市场报告发布日后的 12内公司的涨跌幅度相对同期沪深 300 指数的涨跌幅为基准,投资建议的评级标准为:公司评级推荐:相对大盘涨幅大于 10%谨慎推荐:相对大盘涨幅在 5%10%之间中性:相对大盘涨幅在-5%5%之间减持:相对大盘涨

17、幅小于-5%无投资评级: 由于我们无法获取必要的资料,或者公司我们无法给出明确的投资评级。无法预见结果的不确定性,或者其他,致使12 / 13分工研究部/机构客户部上海浦东新区世纪大道 1589 号长(200122): 传真:际金融21 楼市新华路特 8 号长江证券(430015)传真:9 楼西城区金融大街 17 号(100032)传真:寿中心 606 室市福田区福华(518000)传真:6 号免税商务18 楼重要长江证券作者是基于具有证券投资咨询业务资格,经营证券业务证编号:Z24935000。、客观、公正和审慎的原则制作。均来源于公开资料,本公司对这些的准确性和完整性不作任何保证,也不保证所包含和建议不发生任何变更。本公司已力求报告内容的客观、公正,但文中的观点、结论和建议参考,不包含作者对证券价格涨跌或市场走势的确定性司和作者无关。报告中的或意见并不所述证券的出价或征价,投资者据此做出的任何投资决策与本公本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌,过往表现不应作为日后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论