替代数据的股票回报率为35%



使用替代(非标准)数据进行交易正变得流行和有希望。 前几天,我从莫斯科交易所(Moscow Exchange)手中获得了一个有趣的关于热门股票的数据集。 经过肤浅的研究,我们取得了诱人的结果,并获得了良好的回报。 细节剪下

数据集内容


数据集每天包含三个值pv30,pv70,pv100,并显示了当天最大的30个,70个和100个最大交易者的一组的买卖差额。 即 回答了这个问题,今天的大公司做了什么? 更多购买或出售? 例如,pv100 = 500表示一组总计前100名的交易者购买了500个单位。 超过出售。

在交易所网站上,您可以查看数据集的完整描述并获取历史值

数据覆盖率:

  • 10股:SBER,GAZP,LKOH,GMKN,MGNT,ALRS,AFL​​T,ROSN,SBERP,VTBR
  • 4年:2014年-2017年(交易网站上的开放数据)

此外,我们将仅考虑SBER的数据,以下附录中其余9股的结果

资料总览


SBER的PV值的统计描述:



动态数据及其分布:



所有这三个值pv30,pv70和pv100彼此高度相关(> 0.95),并以接近零的中心接近法线分布。 pv30的最大四分位数范围。

SBER价格和PV100累计金额:



今天的产量与今天〜0.8的pv值密切相关。 因此,我们可以假设价格是由获得较大头寸的参与者移动的。 明天的价格走势和当前pv值之间的相关性是〜0.1,这意味着它们之间的相关性很弱,您可以尝试根据今天的pv数据来预测明天价格走势的方向。

交易模式


如果今天的值pv> 0,我们将构造一个简单的模型,我们假设价格明天将上涨,否则价格将下跌。 将pv值与零进行比较,因为平均值和中值pv值分布在零附近。 简而言之,如果今天主要的玩家在第二天购买(pv> 0),我们也购买,反之亦然。

模型特点:

  1. 模型中仅使用pv值,而不使用资产价格信息。
  2. 我们将在收盘竞价中的18:40-18:50开仓,并在第二天同时平仓。 选择开仓时间,因为pv值在18:30发布
  3. 如果pv> 0,则建仓(买入)。 如果pv <0,则建仓(卖出)
  4. 如果pv连续两天以上为正/负,则不执行任何操作(保持)。 因此,未平仓头寸的大小始终是恒定的
  5. 假设交易费用为0.025%
  6. 每日收益将由收盘价至收盘价(收盘价)

交易模型结果


让我们根据SBER比较“买入并持有”策略(基本)和根据pv30,pv70和pv100的值在4年内的获利能力:


回报-模型收益为4年
夏普-夏普比率,无风险收益率rf = 6%
CAGR-年平均增长率
最大跌幅-最大跌幅
交易-已完成的交易数
获利/亏损天数-猜到未猜到价格变动的天数
动力学模型比较:



基本模型“买入并持有”与光伏指标的季度获利比较



其余九种工具的相似结果可在下面的附录中找到。

股票投资组合


以SBER为例,相对于资产本身,我们获得了很高的回报,但是,尽管如此,我们发现整个2015年都有大量亏损。 在不同时间也可以观察到其他股票的此图(请参阅附录)。 但是,如果您将资金分散在全部十股上怎么办? 这样一来,我们就可以避免大幅缩水。

您可以平均分散,也可以与相应的流动性和工具容量成比例地分散。 基于流动性和简单性,我选择了以下权重:{SBER:0.25; GAZP,LKOH:0.15; M + H 2O。 GMKN,MGNT:0.1,ROSN,ALRS,SBERP,AFLT,VTBR:0.05},并比较了购买和持有策略和pv100的收益:



由pv100控制的10只证券的投资组合显示,年收益率为35%,且亏损比买入持有策略要少。

权衡可以得到15%和50%,但是重要的是,通过将资金分散在许多资产上,我们避免了交易模型中的大幅亏损。

资料之外的观察


  • 基于pv的微分值也显示出良好的回报率(良好=高于市场):短期内的sma,脉冲,体积配比以及技术分析中的其他类似技术
  • 在波动性降低期间,pv值的脉冲会更好地表现出来
  • Pv值对罕见的强劲价格变动具有很好的敏感性,即 猜测价格变动超过3%的百分比达到〜75%,而猜测的总百分比为〜50%
  • 星期几中pv的分布是不同的,尤其是从星期一到星期五。 大概在一周开始时会有一组头寸,在交易结束时
  • 在上面讨论的交易模型中,将pv值与0进行了比较,尽管0不是最大化获利能力的最佳点
  • 10股股份中的每一股都有其自身的特征

我的发现


在光伏方面追随大玩家的假说是一天的滞后,这一假设表明,结果高于2014-2017年的细分市场。 可以肯定地说这将是永远的。 新数据将是什么? 一方面,没有任何理由可以破坏所有内容,另一方面,谁知道:)为了获得更大的信心,您需要更多的积分和最新的数据。

通过调整现有数据,可以使模型更复杂并获得可观的回报,但是过拟合的风险很高。

给听众一些问题,您如何看待:

  • 为什么这些数据可以工作?
  • 为什么这些数据不起作用?

应用程式

应用程式


加兹普








ko








GMKN








MGNT








罗森








阿尔斯








SBERP








AFLT








VTBR







Source: https://habr.com/ru/post/zh-CN443616/


All Articles