大数据系列策略指数i300和i100发布及介绍_第1页
大数据系列策略指数i300和i100发布及介绍_第2页
大数据系列策略指数i300和i100发布及介绍_第3页
大数据系列策略指数i300和i100发布及介绍_第4页
大数据系列策略指数i300和i100发布及介绍_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据系列策略指数 i300 和 i100 发布及介绍【根据网上资料整理】【编制方案】大数据系列指数编制方案 (2014 年 9 月)为反映大数据选股策略的市场表现, 向市场提供更丰富的指数化投资标的, 编制大数据 系列指数。 大数据系列指数包括纯价格指数和全收益指数, 纯价格指数通过深交所行情系统 发布实时行情数据,全收益指数通过巨潮指数网发布收盘行情数据。一、指数代码与名称指数代码: 399415指数简称: i100指数中文名称:大数据 100 指数指数英文名称: CNI BIG DATA 100 INDEX指数代码: 399416指数简称: i300指数中文名称:大数据 300 指数指数

2、英文名称: CNI BIG DATA 300 INDEX二、基日与基点大数据系列指数以 2010 年 1 月 29 日为基日,基日指数为 1000 。三、选股原则大数据系列指数样本股分别由在深圳证券交易所微博 、上海证券交易所 微博 上市的 100 只、300 只 A 股组成,按照下列原则选取:1. 入围标准(1) 非 ST、 *ST 的 A 股;(2) 有一定上市交易日期,一般为一年。2. 选样方法对样本空间的股票, 按照财务因子得分、 市场驱动因子得分和大数据得分进行模型 优化,然后将计算的综合得分从高到低排序,选取排名在前 100 名的股票构成大数据 100 指数初始样本股,选取排名在前

3、 300 名的股票构成大数据 300 指数初始样本股。在综合得分排名相似的情况下,综合考虑公司的行业代表性及所属行业的发展前 景、公司盈利记录等,优先选取指标优良的上市公司股票作为样本股。单个股票的综合评分如下:(1) 财务因子得分:计算最新市盈率 PE、净资产收益率ROE、年度营业收入同比增长率、年度净利润同比增长率,剔除PE、 ROE 排名靠后的股票、剔除营业收入同比增长为负和年度净利润同比增长为负的股票; 计算主营业收入和净利润同比和环比预测结果增 长相对上期该指标的幅度变化作为业绩加速得分; 通过因子模型计算上述得分作为财务因子 总得分。(2) 市场驱动因子得分:计算最近一个月股票换手

4、率、波动率、价格变化率、 流动性因子,通过量化因子模型计算得分作为市场驱动因子的总得分。(3) 新浪大数据得分:根据新浪财经频道下的股票页面访问热度计算单个股票的热度得分、 根据财经频道下的新闻报道正负面影响计算单个股票新闻报道得分、根据股票在微博上的正负面文章影响计算单个股票微博得分, 综合上述得分并根据历史回测优化结果 作为大数据得分。四、指数计算方法大数据系列指数平均分配样本股权重, 采用派氏加权法, 依据下列公式逐日连锁实时计算:公式样本股:指纳入指数计算范围的股票。样本股权数:为样本股的自由流通量,子项和母项的权数相同。等权重因子:见“六、样本股权重调整” 。分子与分母: 分子项中的

5、乘积为样本股经过权重调整后的实时自由流通市值, 项中的乘积为样本股经过权重调整后的上一交易日收市自由流通市值。2:是指对纳入指数计算的样本股经过权重调整后的自由流通市值进行汇总。自由流通量: 是上市公司实际可供交易的流通股数量, 它是无限售条件股份剔除 股比例超过 5% 的下列三类股东及其一致行动人所持有的无限售条件股份”后的流通股数 量:国有(法人)股东;战略投资者;公司创建者、家族或公司高管人员。自由流通市值:股票价格乘以自由流通量。股票价格选取: 每个交易日集合竞价开市后用样本股的开市价计算开市指数, 在交易时间内用样本股的实时成交价计算实时指数,收市后用样本股的收市价计算收市指 数。样

6、本股当日无成交的,取上一交易日收市价。样本股暂停交易的,取最近成交价。五、样本股调整1. 样本股定期调整方法大数据系列指数样本股实施月度定期调整,实施时间定于每月的第一个交易日。2. 样本股临时调整方法(1) 样本股暂停上市的,从其暂停上市日起,将相应样本股从指数计算中剔除, 并选择选样空间中排名最高的非样本股补足。分母其后(2) 样本股终止上市的,从进入退市整理期的第一个交易日起,将相应样本股 从指数计算中剔除,并选择样本空间中排名最高的非样本股补足。(3) 若样本股公司因重大违规行为 (如财务报告重大造假 )而可能被暂停或者终 止交易的, 将依据指数专家委员会的决定将其在指数样本中及时剔除

7、, 并选取选样空间中排 名最高的非样本股作为样本股。(4) 样本股公司发生收购、 合并、分拆情形的处理, 同巨潮 100(2604.261, 6.13, 0.24%) 指数。六、样本股权重调整1. 样本股权重分配 在指数计算中,设置等权重因子使每只样本股每期初始权重相等。2. 等权重因子定期调整 当指数样本股发生定期调整时, 指数同步进行相应的等权重因子调整, 以调整实施 日前倒数第 5 个交易日的收盘自由流通市值来计算调整时的等权重因子。3. 等权重因子临时调整 在下一个定期调整日之前,等权重因子一般固定不变。当出现样本股临时调整时, 新进指数的股票继承被删除股票在调整前最后一个交易 日的权

8、重,据此计算新进股票的等权重因子。当样本股出现退市或暂停上市时,其他样本股的权重调整因子不进行调整。 当样本股股本结构出现显著变化或者其它原因导致其权重发生突变时, 将决定是否 对权重调整因子进行临时调整。七、指数的调整计算同巨潮 100 指数。八、指数的发布与管理微博、新浪财大数据系列指数由深圳证券信息有限公司与南方基金管理有限公司经联合编制,其发布与管理同巨潮100指数。九、免责声明同巨潮100指数。【发布会现场主要嘉宾发言实录】2014年9月12日,由南方基金、新浪财经和深圳证券信息公司三方联合编制的南方-新浪大数据100指数、大数据300指数在深圳交易所新大楼举办敲钟仪式及新闻发布会。

9、深交所总经理宋丽萍在致辞中表示, 资本市场蕴藏着巨大的数据资源,大数 据技术的应用将为我们认识市场提供一把新的钥匙, 也为提升市场的效率、市场 的质量,降低市场运作成本、保护投资者合法权益提供了新的机制。以下为其发言实录:尊敬的曹董事长、吴董事长、邓颂总经理,大家上午好!欢迎各位来宾来参加今天大数据100指数、大数据300指数的挂牌上市仪式,我谨代表深交所对指数发布表示衷心的祝 贺,对各位嘉宾的光临表示热烈的欢迎。正如刚刚播完的中央电视台十集专题片互联网时代,我两次看到曹董事长接受采访,讲得非常好。正如专题片展示的那样,中国已经进入互联网时代,也正在进入大数据时代, 互联网和大数据正在深刻改变

10、着我们的工作方式和生活方式,也对传统的金融产生了一定的冲击,我们注意到了去年以来,互联网金融开始成为资本市场的热点,资本市场蕴藏着巨大的数据资源,大数据技术的应用将为我们认识市场提供一把新的钥匙,也为提升市场的效率、市场的质量,降低市场运作成本、保护投资者合法权益提供了新的机制。新浪作为我国互联网的龙头企业,拥有海量的数据资源,而南方基金作为国内首批基金 管理公司之一具有丰富的投资实践经验, 这两家公司其实也是深交所长期的合作伙伴, 长期 支持深交所的工作。 这次新浪、 南方基金和深圳证券信息公司通力合作, 联合开发大数据指 数,是互联网与交易信息有效结合的积极探索。 深交所一直以来高度重视数

11、据的分析、 挖掘 和应用, 在利用大数据进行市场监察方面也取得了一定的成效, 今后我们将继续以开放的心 态积极支持创新, 与市场的各类主体通力合作, 共同推动互联网信息技术与资本市场的融合。最后,衷心祝愿南方新浪大数据指数挂牌上市圆满成功,谢谢大家。南方基金董事长吴万善在致辞中表示, 大数据指数基于对大数据及多种变量 进行定量分析,旨在发现具有超额收益的股票,凸显出互联网与金融的优势。以下为其发言实录:各位来宾,今天大数据 100 指数和大数据 300 指数在深交所上市,这不仅仅是南方基 金、新浪财经合作在指数类的里程碑, 也是一项创新成果, 非常感谢大家与我们共同见证这 一重要时刻, 共同分

12、享南方新浪大数据指数, 通过南方基金和新浪财经对大数据进行定量分 析,结合企业财务、 技术等基本指标,发现具有超额收益的股票, 凸显出互联网与金融的优 势。南方基金已经成长为综合竞争力最强、 市场规模最大和具有影响力的基金公司之一, 公 司在产品开发、 客户服务等方面取得了领先了优势, 也是首家定制指数的基金公司, 在指数 的编制、推广、跟踪方面,新浪网是国内著名的大型门户网站,用户遍布全国乃至全球,新 浪财经是最具影响的主流财经平台, 双方的雄厚实力我们对大数据的未来充满信心, 对双方 的战略合作前景充满期待。今天大数据指数成功登录资本市场, 为南方基金的指数化和互联网金融发展翻开了新的在追

13、求稳健、较一页, 我们将紧紧抓住这一宝贵机遇,始终保持强烈的使命感和创业精神, 快发展的同时, 我们还将继续研发、 跟踪大数据指数的基金产品, 为投资者提供工具, 希望 更多的投资者参与进来, 并成功涉猎, 分享我们三方共同打造的互联网精彩理财盛宴, 谢谢 大家。新浪网董事长兼 CEO 曹国伟致辞并表示,互联网数据应用对互联网金融创 新起到核心推动作用,这也是大数据指数的秘密所在。以下为其发言实录: 尊敬的宋丽萍总经理,尊敬的吴万善董事长,女士们,先生们,早上好!很高兴参加今 天早上大数据的发布仪式, 很荣幸新浪、 南方基金一同发布了大数据指数, 成为了国内第一 个在交易所挂牌的大数据指数,我

14、们感到非常高兴、非常荣幸。依托南方基金这样一个量化研究平台, 数据的研究平台, 对我们新浪数千万的网民、 数 亿的新浪微博的行为进行大数据分析, 我们对股票的热度、 股票预期、 股票升值的预期和股 票价格的关联,构建出大数据的指数,就是我们今天说的互联网大数据指数。我们在这里特别要感谢南方基金, 在这方面专业的研究是这个指数能成功的关键。 也要 感谢新浪很多网民, 正是大家的参与, 使这个指数成为可行的指数, 我们也希望对于这样的 指数, 我们研究出相应的产品, 有一天能够反馈给我们的网民。 其实这正是我们互联网的使 命所在, 因为我们很多东西从网络中来, 我们也希望很多的结果能回到网络中去,

15、 使网民能 够受益。今天就像刚才宋总经理讲的, 互联网在改变我们生活的方方面面, 中国进入的互联网时 代,互联网已经改变了我们获取信息的方式, 改变了我们的沟通方式、 通信方式, 也改变了 我们交易的方式。同时, 互联网也正在和将来颠覆我们所有的,一个又一个的传统行业,这里面也包括金融行业。我想说互联网对传统行业的颠覆和改变, 并不是说让互联网取代传统行业, 其实更多的 是通过互联网技术、 互联网平台去提升我们传统行业的效率, 而这里面大数据又起到了非常 关键的作用。通过大数据的应用, 其实互联网正在让我们很多很多的传统行业效率正在不断提升, 同 时通过大数据的利用, 它也在我们很多传统行业产

16、品和服务创新方面起到关键的作用, 从而 让我们传统行业更好、更有效的向前发展。我们今天看到的互联网金融是非常热门的行业, 非常热门的话题, 互联网金融并不是像 我们想象的那样, 把传统的金融产品放在互联网上卖, 让互联网变成一个电商的渠道, 这仅 仅是第一步, 而更多的是我们通过互联网的创新、 互联网的技术, 特别是互联网的数据能够 切入到我们所说的互联网金融产品生产领域, 能真正起到关联作用和创新作用, 这是我们说 数据对于互联网金融所起到的核心推动作用,这也是我们今天看到的大数据指数的秘密所 在。今天很荣幸,这样一个大数据指数, 是数据在互联网金融里面的创新, 是一个典范。这 里有很多第一

17、个, 这是中国第一个中国互联网大数据的指数, 第一个中国互联网情绪的指数, 也是第一个中国权益类的互联网指数,很多的“第一” ,对此我们感到很兴奋、也很骄傲, 我们也清醒的认识到, 这仅仅是一个开始, 我们今后的路还非常长, 我们特别期待在这里能 进一步和南方基金合作, 能生产和创造更多基于互联网数据、 互联网创新的金融产品, 我们 也特别希望能够和各类的金融机构合作, 在互联网数据应用方面能进行全方位的探索, 成为 互联网金融新领域的开拓者,谢谢大家。南方基金总经理助理、权益投资总监史博在新闻发布会上表示,大数据投资是对现有投资的有效补充, 补充基础上大数据投资做得好, 有可能对传统投资会

18、产生颠覆式的影响。以下为其发言实录:曹总、 邓总以及各位新闻媒体的朋友, 今天非常荣幸能够和大家交流一下对大数据投资 南方基金的看法。我们看传统的投资, 传统的投资分成两大类, 主动投资和被动投资, 主动投资实际上又 可以把它分成两大方向, 一种是基于基本面的投资, 一种是基于技术分析的投资, 如果把传 统投资统一一下,其实传统投资都是基于数据的投资。基于基本面的投资, 统投资价值投资, 基本面分析的投资者注重企业的经营数据的分析, 企业的历史经营效率、企业的收入、 企业的毛利率、净资产收益的水平,这些都是企业日常 经营过程中产生的数据。技术分析注重投资过程中, 不同投资额产生的数据, 投资者

19、共同产生交易量的数据, 形 成的股价变化的数据,这是技术分析面进行投资的基础。我们来看主动投资本质来讲依托的是数据, 对数据进行分析, 指数化投资把企业, 根据 它的市值情况和收入的情况进行选股, 进行划分以后构建出指数、 指数组合进行投资。 传统 的投资也是基于数据的投资, 大数据时代我们要做投资应该说是对传统投资不断的补充甚至 是超越。 我们基于数据不仅仅是传统投资中的企业财务报表中的数据,不仅仅是企业投资者在投资过程中形成的股票交易量、股票的交易价格变化的数据。同时我们关注投资者对数据的反映, 基本面的数据是否超越的投资者的预期, 投资者是 否会对交易的数据如何进行反映, 对于公司相关的

20、报表, 投资者的观点是什么, 都会产生新 一轮的数据, 基于对数据的反映。 我们认为大数据投资是对现有投资的有效补充, 补充基础 上大数据投资做得好,有可能对传统投资会产生颠覆式的影响。我们收集历史上的数据, 2005 年一直到今天以来,资本市场、 A 股市场表现得有好、 有坏,表现最好的是 2006 、2007 年市场平均的收益率在 100% 以上,表现比较差的比如 说 2008 年,市场下跌了 63% , 2011 年下跌了 22% ,我们把历年超越市场 30% 的股票拿 出来,这些股票数量有多有少,多的是2013 、2011 年 2013 年有 810 只, 2014 年有 535只,少

21、的时候 2011 年有 77 只,超越市场 30% 的股票,即便在市场最不好的 2008 年,超 过市场 30% 的收益率也有 1.09% ,整个市场下跌了 63% ,能够超越市场 30% 的股票平均 收益率仍然是这么多。 2006 、2007 年市场比较好的时候, 这些股票的收益率甚至可以达到 300% 以上。如果我们真的能够找到相对表现比较好的股票,市场表现好、表现差都能给投 资者带来比较丰厚的收益。问题出来了,如何能找到表现比较好的股票?市场是由人形成的,由人的行为形成的, 基于的数据不仅仅是企业的经营数据, 不仅仅是市场的成交量数据、 价格的数据, 同时要了 解整个市场的参与者对这些股

22、票、 对成交量、 对股票价格有什么样的反映, 这些反映往往只 能通过现在的大数据进行体现。 同时, 我们看到随着数据量的增加, 数据的分析难度也越来 越大。南方想通过有效的量化平台, 通过我们的量化股票投资的平台和新浪财经的大平台有效 融合, 通过有效的融合分析我们获得的大数据, 随着数据数量的增加, 对数据的分析来讲压 力值越来越大了,如何能快速的分析数据,得出有效的结论, 这种价值也会越来越高。 南方 的量化股票投资平台, 传统来讲是基于价值成长和企业质量的因子, 这些因子是会筛选股票 的行业属性, 筛选股票行业指标的数据以及筛选市场反映的数据, 同时我们会把新浪财经的 大数据也结合进来,

23、 新浪财经的大数据, 我们会把个股的热度、 市场报表和文章反映个股的 情绪都结合进来。同时我们会找出股票的热度预期、成长预期、估值提升预期,这些预期将会影响股价将来的预期, 把这些预期形成权重, 对这些权重构成动态的调整, 形成指数构成 的基础。在指数的过程中, 样本的选择空间是非常大的, 全市场所有的股票中我们扣除三类股票,ST股票扣除以及*ST股票,上市不满一年的股票我们也扣除,至少在目前的情况下, 上市不满一年数据量有些时候是不够充足, 利用大数据分析偏差可能比较大。 选股因子包括 三大因子: 一是企业的财务因子;二是大数据的因子;三是市场的驱动因子。财务因子包括 最新的市盈率的指标,

24、净资产收益率的情况, 企业年度收入和净利润增长率, 以及对这些指 标变化的预测。 市场驱动因子包括股票近期的换手率、 波动率、股价变化率、 成交量变化率。 对于新浪大数据因子包括以下几个方面, 新浪财经频道下的页面点击量, 微博正负面文章报 道,以及文章报道的影响。 南方基金想利用自身强大的投资量化平台, 把这些因子进行优化, 优化权重后最终创造出我们的 i 指数。我们对 i 指数的历史收益和历史表现做了分析, 2010 年以来到现在,对于大数据 的 100 权重指数和 300 指数进行回撤,我们对标的百发 100 都进行了比较分析,过去五年 大数据 100 等权重的话, 大数据 100 的等

25、额收益是 222.4% ,大数据 300 有 148.58% 的收 益率, 百发有 137.15% 的收益率, 沪深 300(2432.122, 8.67, 0.36%) 指数、深证 100 指数, 中小板指 (7606.982, 61.07, 0.81%) 数和 A 股指数都是负的。我们想比较不同的大数据效果也是一致的, 我用一个原理说一下, 世界上存在一些集合, 集合类的数据是无穷多的, 比如说 0到1之间有多少个小数, 可以说是无穷多的, 0.1 , 0.01 、 0.001 ,无穷多之间是否可以比较呢?也有数据是无穷多的, 无穷多的数值也是可以比较的, 数值再多也是可以比较的, 0 和

26、 1 的无穷多比 1 和 2 之间的无穷多还要多,不同的大数据 质量有可能是千差万别的, 新浪的大数据质量在我们看来, 财经数据里是非常优秀的, 它不 仅有新闻报道、 事件报道的数据, 而且有投资者对数据的反映, 这种反映往往过去的时候我们认为关注度的反映, 关注度的反映很重要, 同时在投资过程中, 正面关注和负面关注也是 非常重要的。 而微博的数据不断的可以看到关注度, 而且能分出是正面的关注度还是负面的 关注度,这对我们来讲是非常重要的一点。构建大数据的指数除了看历史收益以外, 我们也对数据指数的波动性做了分析, 所谓指 数的波动性做这个分析最重要的要看风险调整后指数的情况, 这个了数据分

27、析我们做的下图 比率做了计算, 下图比率是指指数的预期收益率, 减去无风险收益以后和指数波动的方差进 行比较,数值越高认为你在同等风险下能创造收益的水平是越高的。按照我们回撤的下幅比例,大数据 100 的下跌指数是 7.35% ,300 下跌是 5.63 , 百发 100 的下跌幅度是 5.03 ,其他的指数像 A 股指数、沪深 300 、中证 100(2200.151, 6.03, 0.27%) 都是负值。通过指数的风险特征我们可以看出,利用大数据不仅可以给投资者带来 很好的收益, 而且是风险调整较好的收益率, 风险低同时收益比较高。 新浪和南方基金共同 构造的大数据 i 指数充满信心,我们

28、南方基金也会推出大数据 i 指数产品,占领一席之地。在大数据时代, 信息可能不再昂贵了, 海量信息中获取信息将变得昂贵, 希望南方基金 和新浪携手共进,创造更好的投资产品,为广大投资者创造福利,谢谢大家。深圳证券交易所首席分析师邢精平在新闻发布会上表示, 情绪就是市场的一 个先导性指标。短期来看,市场 90% 的波动都是由情绪驱动的,长期来看市场 受基本面的影响, 这是资本市场运作的规律。 如果你能掌握市场的情绪, 你就相 当于预知了未来。以下为其发言实录:大家好!投资者有这样的梦想,能预知未来,今天就看到明天的报纸,知道哪些会涨,哪些会跌,走在时代的前面,大数据时代的来临之前是不可能的。大多

29、数要走在曲线的前面只能靠运气。我的演讲主题是走在曲线的前面,主要分为四个方面:第一,传统的模式,被动式投资70年代推出来,这三十年得到了快速的发展,巴菲特从来不推荐股票,他多次推荐指数基金,甚至他有预言,以后90%的资产都用来投资指数基金。指数基因能获得比较好的收益有什么条件?我做了一个总结,指数基金是比较适合于成长性市场,也就是我们说的牛市。我们看上面这张图是标准普尔指数80年代到现在30多年的指数,80年代到2000年波澜壮阔的大牛市,这点上是指数基金可以战胜80%的流动基金。振荡的市场,2000年指数基金到今天这十多年可能是收入非常的甚微,尽管连续创高点,收益是非常小的,这是第一个。传统

30、的指数都是以市值的加权,大公司大权重大影响,小公司影响很小。传统指数要获得比较好的收益,我感觉有三个条件:一是市场比较成熟,比较理性,按质论价,好公司好价钱,如果炒垃圾股这样的情况下指数基金不会获得很好的收益。二是公司的规模,指数被 少数公司控制, 少数公司不涨指数就不涨, 这也不适合做指数化公司, 整个指数就被少数公 司控制了。 三是产业的结构比较合理, 如果一个经济体的产业结构还处在转型中, 可能转型 的过程中对指数有非常大的影响。 这三个条件很难达成, 我们就会得到右边的结果, 右边的 结果可以看到两条线,下面这条线改变我们的沪深 300 指数,上面这条线知道是怎么选出 来的股票吗? 7

31、 月的收益率 24% ,甚至 25% ,是用 羊驼 选出来的。这个值得思考。第二, 转型市场的指数化投资。 指数投资的收益来自于指数的上涨, 指数的上涨受两种 原因的影响,一是成分股上涨;二是权重的影响。我们举一个例子,如果 1 万亿市值的股 票和一百亿市值的股票, 一百亿市值的股票天天涨停, 也就是翻倍, 指数能涨多少?指数只 涨 1% 。这样的结构是小公司对整个指数影响很小,收益也只有 1% ,那只股票已经翻倍了。我们看一下上证股票的十大权重股占了 33% 的权重, 这些公司大家都比较熟悉, 像中石油、 银行。产业结构的影响, 如果经过产业结构的转换, 大公司从 1 万亿市值变成了 500

32、0 亿, 中 小公司从 100 亿市值变成了 5000 亿的市值,整个市场的市值规模没有变,产业结构得到 了提升,但是指数会变吗?指数也不会变。新型产业的公司已经涨了 50 倍,但是指数没有 任何的变化。我们看了一下,做了中美上市公司的比较,我们发现沪深 300 金融、地产接 近了 40% ,而在美国标准普尔中只占 15% ,也就是说我们高出将近 25 个百分点。信息技 术我们占 14.4% ,美国的市场将近 20% ,我们在这方面低了 10% 。产业结构要转型, 转型是不是意味着传统的产业要下降, 新兴产业会上升?至少这么说, 金融、 地产占的比重不会再提升,再提升结构就变得更加的扭曲。 这

33、个角度看,很难在转型 的市场上,要做指数投资肯定会受结构转型的影响, 如果是一个新型产业的指数涨了 50 倍, 市值加权的指数就没有涨。第三, 如何走在曲线的前面?我们要走在曲线的前面就要预知未来,预知未来肯定要知道现在,现在是怎么形成的?预知现在才能预知未来。 要预知现在要明确现在是怎么形成的, 明确因果关系, 现在的现状是由什么造成的, 这就是因果。要找到因果关系要找到因, 也就 是市值化导致今天的结果。我们做了下面三张图,相应代表未来、当前、历史。对应资本市 场的三个关系就是市场情绪、市值、 基本面。你看到的市值是当前的,经过大家交易所产生 的结果,为什么有交易?是因为投资者有行动,为什

34、么投资者有行动?因为投资者有情绪, 有交易的心理, 心理驱动行为, 行为产生结果,就是当前的市值。 情绪就是市场的一个先导 性指标。短期来看,市场 90% 的波动都是由情绪驱动的,长期来看市场受基本面的影响, 这是资本市场运作的规律。如果你能掌握市场的情绪,你就相当于预知了未来。大数据指数就是把这个理论和我刚才讲的这套理论综合起来, 传统的指数是以当前的数 据也就是市值选股, 市值选股有三个条件, 三个条件影响很大, 在这三个条件还能满足的时 候我们先前的创新主要是基本面角度, 基本面指数总体上走得不怎么样。 现在如果有大数据 的背景下, 我们把投资者的情绪加在前面,相当于了解明天的走势,综合

35、三个因素,三个因 素就是我们今天的 i100 、 i300 。加入投资者情绪指标,降低指数对市场有效性的依赖,即 使市场很难满足我们三个条件,我们依然可以找到表现比较好的公司,然后把它编成指数, 这就是刚才史总讲的, 即使行情不好的情况下, 也有很多公司表现很好。 通过这个方法也许 我们可以把它找到。第四,我们实践的结果,我爱大数据指数,大数据指数基本的特征是以 2010 年 1 月 29 号作为起点,从这一天开始,基点是 1000 点,加权方式和传统的指数有点不一样,传 统的大公司占大市值,中石油公司很大,占 8% 多。加权方式做了创新,每家公司分配的投 资金额是相等的。 调整和传统的指数也

36、有一些不一样的地方, 传统的指数通常是按半年调整 一次,比较稳定, 我们为了捕捉市场的热点, 抓住轮动的机会, 指数的调整是一个月调一次, “i ”就是我的指数,也是我爱指数。得出了这样的指数。下经过这个方法,综合的方法既考虑未来又考虑当前又考虑历史,面蓝色的指数是著名的沪深300,上面橙色的指数是这次做重大创新的i100指数,它的收益从2010年的1月底以来已经是258%的收益,这是挺好的、吉祥的数字,寓意你我都发。I WkI 一张图读懂新浪-南方“大数据扌斷t 宀- I > :MillMil 小"按照这个方法选择的股票是不是波动特别大?我们做了测试,波动鉴于市场的指数之间,

37、相对来于中小板、创业板,特别是相对于创业板要低一些,包括上海、深圳,要高一些, 高得很有限。一个是 23.6%,一个是21%,相差不大。mm大曲1C»大刑沪深300W1OO柯M2010 年35.06-2.376.13?5.59117720114-17X-23.15-25.01-30S9-17.092012 年16.314687.SS1.9S-138-2,142013483846330-Z65175*82.73年松33324.250.87-U50 592.94222A14L.S8-2OS*29.8705M>45350. 0%也就是说风险提升不大的话,收益提升得很大,下浮指数都是七

38、点几,非常惊人,这个数字和史总讲的有点差异, 主要是截至日期有些差异,这是非常惊人的结果。 刚才邓总说的如果发基金他要买,如果要通过银行发的话我也要买,通过股票帐户发的话我没开帐户买不了,如果通过银行我也可以买。指标大拥100大熬掲300巨 A期中小*ftfli创业质指fl收站*掾播螢i.n1.47IJ2日內收44瞩0.1190004-0.02200030.W7F1救(1畢标辭爭 年ft23.7721492L7323 192429.797J55MJL18一张区读懂新浪-南方“大碧据指数"指数表现受行业结构的影响,我们把行业结构做了比较,i100比重特别大的、特别明显的是金融、地产比例

39、很低,沪深300的比重将近40%,而我们i100的比重只是3.8%,相差10倍。但是有些行业比重特别高,比如说信息技术,比如说消费、原材料,明显偏新新型产业结构的角度。这个结构有很好的前瞻意义,反映了行业的升级。 还有一个是调仓的比例,这是一种策略的指数,和传统的指数有一点不一样,调仓的时间特别大,为了捕捉市40%左右,我们可以根场的热点,我们做了研究,做了统计分析,平均的调仓比例都是在 据市场的热点捕捉市场的热点,走在曲线的前面,不然就太晚了,谢谢大家。新浪网副总编辑邓庆旭在新闻发布会上表示,新浪财经大样本是更好的市场代表。以下为其发言实录:各位来宾、朋友们!非常高兴大家能在此共同见证两只大

40、数据指数挂牌上市!新浪财经作为指数的联合开发者,奉献的主要是基于新浪平台的财经大数据。这些大数据包括新浪财经用户对股票行情的关注度,股票新闻及股票微博博文的多空分析。关于指数的技术性介绍, 南方基金领导已经做了很精要的概括,在这,我想与大家分享新浪财经在开发这只指数前后的一些思路、设想。依托新浪平台,经过15年发展,新浪财经目前是国内投资者首选互联网资讯、行情获取平台。在资本市场报导上,我们以“快速、全面、准确、客观”为准绳,为投资者提供第一时间的新闻、优质的解读。我们可以非常自信地说, 了解证券市场最新发生的事,上新浪财经, 就够了。在行情、数据方面,我们不断追加投入,建设了优秀的财经产品、

41、技术团队,持续拓展 行情数据的深度与广度。 例如, 我们是国内第一家引入美股实时行情的财经类网站;首家在不同终端把股票行情图都做成可交互的开发者。这两年,互联网金融大热。 目前,主要仍集中于销售渠道竞争,即金融企业在扼守流量 入口的各大平台售卖理财产品,做流量转化。新浪财经如何参与到互联网金融竞争, 为投资者创造更大价值?我们也可以采用以千分 之一甚至更低的转化率去卖产品;我们也可以在“法不禁止”领域试水P2P ,甚至做互联网贵金属交易平台。 但最后我们认为, 十多年累积的海量财经用户行为数据才是我们更具特 色的优势资源。刚刚我们与合作伙伴互赠礼品,上面有一句话: “新浪财经大样本,更好的市场

42、代表” ; 还有一个公式, 这个公式非常隽永, 它是著名的伯努利大数定理的数学表达。其实,我们的 指数能不能更好地反映市场,除了样本足够大,还必须样本的代表性足够强。拉出中登公司 2013 年底的数据, 我们可以看到, 新浪财经的行情使用者分省市分布比 例与中登公司当年增量账户的分省市比例是相当接近的, 这在一个侧面说明, 我们的用户相 对于市场总体而言,是一个比较合理的“抽样” 。图注:投资者年度新增沪市 A股开户数分省比例分布与新浪财经活跃用户分省分布对照图(2013年末,中登公司、新浪财经 )倘若以10万元以下的持仓市值为“散户”标准,目前 A股85%的投资者账户属于散 户,成为市场行情

43、重要推动者。这也使得以散户样本为主的大数据分析得以更准确地代表市 场总体。如果有人对散户的力量持有怀疑,那么回想中石油a股吧,一个悲情案例:大量乐观散户成为股价推手。如果通过分析新浪财经用户对投资品种,如股票的关注与该其价格表现关系,找到一个反映这种关系的具有先导性的指标,那么就等于发现了一把帮助投资者打开财富之门的钥匙。大数据系列指数就是在这样的背景下诞生的。我想,大数据指数在深交所微博挂牌,是证券投资领域值得记载的一个里程碑事件,这种产品创新投资策略也只有在中国市场当前的特殊发展阶段存在有效性。我们从回测数据看, 大数据指数表现很优异, 说明新浪财经用户样本在代表国内投资者总体方面具有显著

44、优势。大数据指数是不是一把“金钥匙”,历史数据说了不全算,让我们留待市场检验。发力做出更大特色。我展望未来,新浪财经会在财经数据应用领域继续发挥自身优势,们抱着平台化、开放化的态度,与金融机构建立不同层次的合作关系,与跟我们有同样理念、带有创新精神的专业数据提供商深度合作,我们的目标是为投资者提供更多创新金融产品, 为数据使用者提供更丰富的、成本更低的数据产品。数据就像深埋在地表下的石油, 开采需要专业化的力量, 而开放协作是提升开采效率的 有效途径。数据应用则是多样化的, 就像成品油有不同的品位,供应给不同的引擎。不同的 数据使用者可以以更低的成本获取所需的数据,大量的投资者能以更轻松的方式

45、在数据海洋中找到自己关注点。 新浪财经通过核心产品不断沉淀更多优质数据,为金融产品的大数据创新提供源源不断的能源。最近报道说,中国股市醒了,我们很高兴能在股市醒来之前,三强联合完成这样一个指数。我们也希望以此为新的起点, 在金融产品创新方面有更多的强强合作成果产生,更好地服务于投资者。谢谢大家!【大数据I指数产品介绍】“大数据i指数”产品介绍捋数代码与名称指数中文名称:大数据4 00扌讖指数英文名称:CM BIG DATA 100 INDEX指数简称:1100指数代码:399415 指数中文名称:大数据300扌讖指数英文名称:CNI BIG DATA 300 INDEX指数简称:i300指数代码:399416指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论