版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计假设检验在量化交易中的应用程序化交易假设检验的基本原理:如果假设A成立,那么事件 B发生的概率低于5%(当然也可以用10%或者1%等标准)。实际 随机抽样检测中B发生了,我们可以在0.05的显著性下认为 假设A不成立。在实际应用中我们要注意的是,第一,样本 书越大,越容易验证条件 A是否成立;第二,观察事件B是 否发生时,一定是要随机抽样的。 比如上面那个硬币的例子, 如果不是随机抛硬币,而是由一个硬币抛掷高手来有认为控 制硬币抛掷后的结果,那么得由来的结论对于硬币是否标准 这一假设是没有参加价值的。为什么很多历史数据中表现很 好的交易系统在后期的实盘时效果很差,很大一个原因就在 于针对历
2、史数据所设计的交易系统不符合抽样随机性。交易 应用示例: 写了这么多,还没有写到交易上,可能有些朋 友急了。稍安勿躁,有了上面的基础,再来谈交易模型的假 设检测,就很容易了。先看一种最简单的量化交易模型,就是止盈和止损是同样比例的量化交易模型。比如西蒙斯曾 经谈到过八十年代他们曾经靠一个很简单的模型赚过很多 钱,就是跳空高开(或低开)后短时间内价格反向运动的概率 很高,他们的交易策略就是高开后做空,低开后做多。现在 我们来根据这个思路尝试做一个交易模型:跳空高开(或低开)x%后开盘入场做空(或做多),盈利或者亏损y%后就由场。为了便于讨论,我们先假设不存在滑点、手续费等问题,同时假设当天价格日
3、内离开盘价的波动幅度必然会超过y%,也就说日内该笔交易一定会结束,要么是盈利y%后由场,要么是亏损y%后由场。这么简化后,大家再拿这个和抛硬 币的例子对比,是不是完全一样了。现在来运用假设检验的方法来验证这个量化交易模型。如果这个交易模型是无效 的,那么交易盈利或者亏损 y%的概率应该是各50%(如果亏 损大于50%可以反向做的),和硬币的例子中两种结果的概率 完全一样。现在我们拿检验硬币的思路来检验这个模型到底 是不是无效的。我们拿这个交易模型去历史数据中测试,假如总共有50次交易记录,其中盈利的次数达到了32次以上或者18次以下(这样情况就把模型反着写,即高开后做多低 开后做空),那么,在
4、5%的显著性下我们可以拒绝模型无效 这一假设,这个交易模型是有效的。有的朋友可能会问了,这个模型中的x和y这两个参数到底取什么值呢?这就涉及 到模型训练的问题了。 x和y具体取什么值最合适,不通过 数据测试,我们是无法知道的。 通用的统计学方法(通讯、搜 索引擎等领域也是这个方法)是,选取大量的训练数据, 对模 型各个参数进行测试,选择表现最佳的参数。 具体到交易上, 就是选取足够多的历史数据,进行参数优化,综合考虑收益 率、最大回撤、稳定性等因素,选择相对最合适的。不同参数之间的好坏差异的比较在统计学上也是有方法的,相对复 杂一点,以后有机会再写一篇详谈这个。既然是量化交易模型训练后的最佳参
5、数,问题也就来了,这个最佳参数是非 随机产生的,而是人为训练选择的,这违背了我们在做硬币 检测时所强调的随机抽样。那么,如何验证这个模型的有效 性呢?统计学的方法是拿这个模型对新的数据(与原有训练数据完全独立)做测试,如果测试的结果仍然拒绝模型无效这 一假设,那么,我们可以认为模型在很大的概率上是有效的。 具体到交易而言,就是把历史数据分为训练数据和盲测数据 两部分,训练数据用于模型训练,如果在训练数据上训练好 的拒绝无效假设的交易模型在盲测数据中仍然表现为拒绝 无效假设,那么,可以认为模型在很大的概率上有效。当然,还有进一步更严格的方式是,让模型继续在未来的新的数据 上测试,如果表现仍然很好
6、,则再可以考虑分配一定比例的 资金开始实际运作。我们在做程序化交易中经常谈到量化交易模型的衰败。那么,用什么标准来判断模型的衰败呢? 我的个人思路是:继续用假设检验这个方法来检验。就是如 果你在不断的交易过程中你的后期的一系列交易数据已经 无法拒绝交易模型无效这一假设了,那么,这个时候即使你 的量化交易模型仍然还是盈利的,你也要小心了,至少应该 降低仓位了。 这个高低开的日内交易模型是很简单的一种 模型了 ,止盈止损都是一个额度,50%对半开的随机假设,这个直接套用硬币的例子就可以。还有更复杂一点的,比如 趋势交易模型,这种模型由于其趋势交易追求高盈亏比的理 念,这种模型的胜率是低于 50%的
7、,一般在35%左右,但是 盈亏比可能高于3: 1。这种模型就不同于硬币的例子了,无 法直接套用硬币的计算结果,但是思路是一致的,有兴趣的 朋友可以自己思考一下这种情况下应该如何计算。注意事项:1.不可忘记或者因为莫些利益因素故意忘记抽样统计中 的随机原则。概率法则有效的前提是随机抽样。如果人为影 响样本的抽取过程甚至制造假的样本,则样本对于总体的预 测价值是0甚至是相反的。在做量化交易模型测试时,务必 至少要有训练数据和盲测数据,在训练数据上表现优异的模 型必须在盲测数据上也能足够优秀到可以拒绝模型无效的 假设,才可以考虑将模型运用到实战中。网上有不少卖模型 的人,给由的模型在历史数据上的交易
8、曲线几乎是一条无回 撤的上涨直线,但是,一旦实盘交易,就开始大幅度回撤, 很大的可能就是在于这个模型针对历史数据做了非随机性 的定向优化,同时因为利益的关系模型开发者故意没有做盲 测这一个过程。2.牢记假设检验的原则,宁可错过,不可做 错。任何一个模型,在没有足够的数据证明这个模型是有效 前,均假设该模型为无效的。 这就是量化交易的痛苦的地方, 量化交易者最容易生现的情况是,花了很多时间,在训练数 据上挖掘由了一系列的可以拒绝无效假设的交易模型,跑到盲测数据上一一测试,均无法在0.05的显著性水平上拒绝模 型无效的检验,心拔凉拔凉的,感觉这么多时间的付由浪费 了,心有不甘。再怎么心有不甘,也不
9、能自欺欺人的把没有 拒绝无效假设的模型上线, 心有不甘总比亏钱好。3.要有风险意识。即便是在0.05的显著性水平下在训练数据、 盲测数 据甚至是新的实盘交易数据上全部拒绝无效假设,也不代表 这个模型一定是永远有效的。一方面,这是由于这种将低概 率事件近视为“不可能事件”的假设检验方式决定的。另一 方面,也是很重要的一方面,就是可能随着时间的变迁,市 场本质特征发生变化了,你这个模型背后所体现的那个影响 市场的因素发生变化了。说到量化交易模型背后所体现的因素,我展开多说一点。近几日和小鱼在微博上讨论了概率 是否在金融市场上可以运用和市场是否可以预测的问题。否 认市场可以预测的一个很有力的论据就是
10、影响市场走势的 因素千千万,交易者根本无法一一识别这些因素,更加难以 识别这些因素中每个因素的权重影响,故无法预测。那么, 有没有可能存在这样一种情况,就是我无法直接知道是哪些 因素影响了市场,但是我可以间接的通过一种方式预测市场 会以什么样的概率运动。我先说统计学上一个有趣的例子。在美国的中西部的一个小镇上,人们发现一个很有趣的不合 逻辑的现象,就是冰激淋的消费量越高,犯罪率越高。这个 具体的两个变量间的线性相关程度统计学里面是有专门的公式的。总之,就是经过统计发现,犯罪率的高低与冰激淋 的消费量存在强的正相关,即冰激淋销量高时犯罪率高,冰 激淋销量低时犯罪率低。现在两个问题:1.冰激淋销量
11、是否可以预测犯罪率;2.如果人为控制改变冰激淋销量,是否可 以改变犯罪率。 对于第2个问题,我想任何一个有生活常 识的人都会知道,犯罪率与冰激淋销量完全无关,人为改变 冰激淋销量并不能改变犯罪率。对于第1个问题,就会比较困惑了。因为常识告诉我们,冰激淋与犯罪无关,但是统计 学的数据又表明二者是正相关,那么到底是什么原因呢?慢 慢的,人们终于想到了天气这一共同因素。冰激淋的销量与 天气紧密相关,天气越热销量越高,同时,天气越热,人越 容易在室外活动,越容易开窗(导致偷盗概率增加),女性越 容易穿着暴露(导致性犯罪增加),人的心情也越烦躁(导致冲 动型犯罪增加)。于是,我们知道了,因为天气这一共同
12、因素, 只要没有人为的刻意影响冰激淋的消费量,冰激凌的消费量 是可以预测犯罪率的。其实,只要我们没有人为的刻意影响 冰激淋的消费量,即使我们不知道是因为天气这一共同因 素,我们也可以用冰激淋销量来预测犯罪率。现在说回到量化交易。假如,有这样一个量化模型,无论是在训练数据 上还是盲测数据上还是在新的实盘交易数据上,均可以在0.05的显著下拒绝模型无效的假设, 那么,我们有必要认为, 在95以上的概率上,这个量化模型背后存在一种共同的影响因子能够较大的影响市场的短期走势,尽管,这个影响因 子到底是什么我们不知道,但只要这个因子在,这个量化模 型就仍然有效。因为我们不知道这个因子是什么,所以我们 更加不可能直接的发现这个因子是否已经变化了,我们仍然 只能通过这个量化模型的之后的表现来间接预测。如果量化 模型一直在0.05的显著下拒绝无效的假设, 那么可以认为这 个因子
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度车库停车场环境治理合同4篇
- 二零二五年度房地产创业合伙人合作协议4篇
- 2025年非接触温度计项目提案报告
- 2025版离婚房产分割及租金分配协议示范文本3篇
- 2025年中国重庆旅游行业发展趋势及投资前景预测报告
- 二零二五年建行车辆按揭贷款合同范本3篇
- 2025年中国工业滤纸行业深度调研与投资战略规划分析报告
- 2025年绿色金融存款居间业务合作协议书4篇
- 二零二五年度物流仓储出借咨询与管理合同4篇
- 2025版彩礼退还与婚姻解除条件协议书范本3篇
- 2024年医销售药销售工作总结
- GB/T 44888-2024政务服务大厅智能化建设指南
- 2023-2024学年江西省萍乡市八年级(上)期末物理试卷
- 四则混合运算100道题四年级上册及答案
- 四川省高职单招电气技术类《电子基础》历年考试真题试题库(含答案)
- 2024年江西生物科技职业学院单招职业技能测试题库带解析答案
- 桥本甲状腺炎-90天治疗方案
- (2024年)安全注射培训课件
- 2024版《建设工程开工、停工、复工安全管理台账表格(流程图、申请表、报审表、考核表、通知单等)》模版
- 酒店人防管理制度
- 油田酸化工艺技术
评论
0/150
提交评论