A propriedade de simetria da relação de cointegração

O objetivo deste artigo é compartilhar resultados paradoxais no estudo da co-integração de séries temporais : se as séries temporais Um co-integrado com as proximidades B linha B nem sempre co-integrado com um número Um .

Se estudarmos a cointegração puramente teoricamente, é fácil provar que, se a série Um co-integrado com B então remar B co-integrado com Um . No entanto, se começamos a estudar a cointegração empiricamente, verifica-se que os cálculos teóricos nem sempre são confirmados. Por que isso está acontecendo?

Simetria


Atitude Um chamado simétrico se Um s u b s e t e q Um - 1  onde A - 1 - a razão inversa definida pela condição: x A - 1 e equivalente a y A x . Em outras palavras, se a relação x A y então a relação y A x .

Considere dois I ( 1 ) um número de x t e y t , t = 0 , p o n t o s , T  . A cointegração é simétrica se y t = b e t a 1 x t + v a r e p s i l o n 1 t   implica xt= beta2yt+ varepsilon2t isto é, se a presença de regressão direta leva à presença do inverso.

Considere a equação yt= beta1xt+ varepsilon1t ,  beta1 neq0 . Troque os lados esquerdo e direito e subtraia  varepsilon1t de ambas as partes:  beta1xt=yt varepsilon1t . Desde  beta1 neq0 por definição, divida as duas partes em  beta1 :

xt= frac1 beta1yt frac varepsilon1t beta1.



Substitua 1/ beta1 em  beta2 e  varepsilon1t/ beta1 em  varepsilon2t nós temos xt= beta2yt+ varepsilon2t . Portanto, a relação de cointegração é simétrica.

Daqui resulta que se a variável X cointegrado com variável Y então a variável Y deve ser co-integrado com a variável X . No entanto, o teste de cointegração de Angle-Granger nem sempre confirma essa propriedade de simetria, pois às vezes uma variável Y não co-integrado com variável X de acordo com este teste.

Testei a propriedade de simetria nos dados de 2017 das trocas de Moscou e Nova York usando o teste de Angle-Granger. Havia 7.975 pares de ações co-integrados na Bolsa de Moscou. Para 7731 (97%) pares cointegrados, a propriedade de simetria foi confirmada; para 244 (3%) pares cointegrados, a propriedade de simetria não foi confirmada.

Havia 140.903 pares de ações co-integrados na Bolsa de Nova York. Para 136586 (97%) pares cointegrados, a propriedade de simetria foi confirmada, para 4317 (3%) pares cointegrados, a propriedade de simetria não foi confirmada.

Interpretação


Esse resultado pode ser interpretado pela baixa potência e alta probabilidade de erro do segundo tipo do teste de Dickey-Fuller, no qual o teste de Angle-Granger se baseia. A probabilidade de um erro do segundo tipo pode ser denotada por  beta=P(H0|H1) então o valor US $ 1 - \ beta $ chamado o poder do teste. Infelizmente, o teste Dickey-Fuller não consegue distinguir séries temporais não estacionárias e quase não estacionárias.

O que é uma série temporal quase instável? Considere a série temporal xt= phixt1+ varepsilont . Uma série temporal estacionária é uma série em que 0< phi<1 . Uma série temporal não estacionária é uma série em que  phi=1 . Uma série temporal quase instável é uma série em que o valor  phi perto de um.

No caso de séries temporais quase não estacionárias, geralmente não somos capazes de rejeitar a hipótese nula de não estacionária. Isso significa que o teste Dickey-Fuller apresenta um alto risco de um erro de segundo tipo, ou seja, a probabilidade de não rejeitar a hipótese nula falsa.

Teste KPSS


Uma possível resposta à fraqueza do teste de Dickey-Fuller é o teste KPSS, que deve esse nome às iniciais dos cientistas de Kvyatkovsky, Phillips, Schmidt e Sheen. Embora a abordagem metodológica deste teste seja completamente diferente da abordagem de Dickey-Fuller, a principal diferença deve ser entendida na permutação das hipóteses nulas e alternativas.

No teste KPSS, a hipótese nula afirma que a série temporal é estacionária, versus a alternativa sobre a presença de não estacionariedade. Séries temporais quase não estacionárias, que muitas vezes foram identificadas como não estacionárias usando o teste Dickey-Fuller, podem ser corretamente identificadas como estacionárias usando o teste KPSS.

No entanto, devemos estar cientes de que quaisquer resultados de testes estatísticos são meramente probabilísticos e não devem ser confundidos com um certo julgamento verdadeiro. Sempre existe uma probabilidade diferente de zero de que estamos enganados. Por esse motivo, propõe-se combinar os resultados dos testes Dickey-Fuller e KPSS como um teste ideal para não estacionariedade.

imagem

Devido à baixa potência, o teste Dickey-Fuller geralmente identifica erroneamente uma série como não estacionária, portanto, o conjunto de séries temporais resultante identificado pelo teste Dickey-Fuller como instável acaba sendo maior em comparação com muitas séries temporais identificadas como não estacionárias usando o teste KPSS. Portanto, a ordem de teste é importante.

Se a série temporal for identificada como estacionária usando o teste Dickey-Fuller, provavelmente também será identificada como estacionária usando o teste KPSS; neste caso, podemos assumir que a série é realmente estacionária.

Se a série temporal foi identificada como instável usando o teste KPSS, provavelmente também será identificada como instável usando o teste Dickey-Fuller; neste caso, podemos assumir que a série é realmente instável.

No entanto, muitas vezes acontece que uma série cronológica identificada como não estacionária usando o teste Dickey-Fuller será marcada como estacionária usando o teste KPSS. Nesse caso, devemos ter muito cuidado com nossa conclusão final. Podemos verificar o quão forte é a base da estacionariedade no caso do teste KPSS e a instabilidade no caso do teste Dickey-Fuller e tomar uma decisão apropriada. Obviamente, também podemos deixar a questão da estacionariedade de uma série temporal desse tipo sem solução.

A abordagem de teste KPSS assume séries temporais yt testado quanto à estacionariedade em relação a uma tendência pode ser decomposto na soma de uma tendência determinística  betat passeio aleatório rt e erro estacionário  varepsilont :

yt= betat+rt+ varepsilont,rt=rt1+ut,


onde ut - processo de identificação normal com média e variância zero  sigma2 ( ut simN(0, sigma2) ) Valor inicial r0 tratado como fixo e desempenha o papel de membro livre. Erro estacionário  varepsilont pode ser gerado por qualquer processo ARMA comum, ou seja, pode ter forte autocorrelação.

Semelhante ao teste de Dickey-Fuller, a capacidade de levar em conta uma estrutura arbitrária de autocorrelação  varepsilont muito importante porque a maioria das séries temporais econômicas depende muito do tempo e, portanto, possui uma forte autocorrelação. Se quisermos verificar a estacionariedade em relação ao eixo horizontal, o termo  betat apenas excluído da equação acima.

A partir da equação acima, segue-se que a hipótese nula H0 sobre estacionariedade yt equivalente à hipótese  sigma2=0 , a partir do qual se segue rt=r0 para todos t ( r0 É uma constante). Da mesma forma, uma hipótese alternativa H1 não estacionariedade é equivalente à hipótese  sigma2 neq0 .

Para testar a hipótese H0 :  sigma2=0 (séries temporais estacionárias) versus alternativas H1 :  sigma2 neq0 (séries temporais não estacionárias) os autores do teste KPSS recebem estatísticas unidirecionais do teste multiplicador de Lagrange. Eles também calculam sua distribuição assintótica e modelam os valores críticos assintóticos. Não consideramos detalhes teóricos aqui, mas apenas descrevemos brevemente o algoritmo de execução de teste.

Ao executar o teste KPSS para uma série temporal yt , t=1, pontos,T o método dos mínimos quadrados (mínimos quadrados) é usado para estimar uma das seguintes equações:

yt=a0+ varepsilont,yt=a0+ betat+ varepsilont.



Se queremos verificar a estacionariedade em relação ao eixo horizontal, avaliamos a primeira equação. Se planejamos verificar a estacionariedade em relação à tendência, escolhemos a segunda equação.

Sobras et da equação estimada são usados ​​para calcular as estatísticas do teste dos multiplicadores de Lagrange. O teste do multiplicador de Lagrange é baseado na idéia de que, quando a hipótese nula for cumprida, todos os multiplicadores de Lagrange deverão ser iguais a zero.

Teste multiplicador de Lagrange


O teste multiplicador de Lagrange está associado a uma abordagem mais geral da estimativa de parâmetros, usando o método da máxima verossimilhança (ML). De acordo com essa abordagem, os dados são considerados evidências relacionadas aos parâmetros de distribuição. A evidência é expressa como uma função de parâmetros desconhecidos - uma função de probabilidade:

L(X1,X2,X3, pontos,Xn; Phi1, Phi2, pontos, Phik),


onde Xi Os valores observados e  Phii - parâmetros que queremos avaliar.

A função de máxima verossimilhança é a probabilidade conjunta de observações amostrais.

L(X1,X2,X3, pontos,Xn; Phi1, Phi2, pontos, Phik)=P(X1 terrenoX2 terrenoX3 pontosXn).



O objetivo do método de máxima verossimilhança é maximizar a função de verossimilhança. Isso é obtido diferenciando a função de probabilidade máxima para cada um dos parâmetros estimados e equiparando as derivadas parciais a zero. Os valores dos parâmetros nos quais o valor da função é máximo é a estimativa desejada.

Geralmente, para simplificar o trabalho subseqüente, o logaritmo da função de probabilidade é primeiro obtido.

Considere um modelo linear generalizado Y= betaX+ varepsilon onde se assume que  varepsilon normalmente distribuído N(0, sigma2) isso é Y betaX simN(0, sigma2) .

Queremos testar a hipótese de que o sistema q ( q<k ) restrições lineares independentes R beta=r . Aqui R - famoso q vezesk matriz de classificação q e r - famoso q vezes1 vetor.

Para cada par de valores observados X e Y em condições normais, uma função de densidade de probabilidade da seguinte forma existirá:

f(Xi,Yi)= frac1 sqrt2 pi sigma2e frac12 left( fracYi betaXi sigma right)2.



Sujeito a n observações conjuntas X e Y a probabilidade total de observar todos os valores na amostra é igual ao produto dos valores individuais da função densidade de probabilidade. Assim, a função de probabilidade é definida da seguinte maneira:

L( beta)= prod limitsni=1 frac1 sqrt2 pi sigma2e frac12 left( fracYi betaXi sigma right)2.



Como é mais fácil diferenciar a soma do que o produto, o logaritmo da função de verossimilhança é geralmente usado, assim:

 lnL( beta)= sum limitsni=1 left( ln frac1 sqrt2 pi sigma2 frac12 sigma2(Yi betaXi)2 direita).



Essa conversão útil não afeta o resultado final, porque  lnL É uma função crescente L . Então o valor  beta o que maximiza  lnL também irá maximizar L .

Pontuação ML para  beta em regressão com restrição ( R beta=r ) é obtido maximizando a função  lnL( beta) sujeito a R beta=r . Para encontrar essa estimativa, escrevemos a função Lagrange:

 psi( beta)= lnL( beta)g(R betar),


onde através g= left(g1, dots,gq right) vetor marcado q Multiplicadores de Lagrange.

Estatísticas de teste do multiplicador de Lagrange indicadas por  eta mu em caso de estacionariedade em relação ao eixo horizontal e através  eta tau no caso de estacionariedade relativa à tendência, é determinada pela expressão

 eta mu/ tau=T2 frac1s2(l) sum limitsTt=1S2t,


onde

St= soma limitesti=1ei


e

s2(l)=T1 soma limitesTt=1e2t+2T1 soma limitesl1w(s,l) sum limitsTt=s+1etets,


onde

w(s,l)=1 fracsl+1.



Nas equações acima St - o processo de saldos parciais et da equação estimada; s2(l) - avaliação da dispersão a longo prazo de resíduos et ; mas w(s,l) - a chamada janela espectral de Bartlett, onde l - parâmetro de truncamento de atraso.

Nesta aplicação, a janela espectral é usada para estimar a densidade espectral de erros para um determinado intervalo (janela), que se move ao longo de toda a faixa da série. Dados fora do intervalo são ignorados, pois a função window é igual a zero fora de algum intervalo selecionado (window).

Estimativa de Variância s2(l) depende do parâmetro l e desde l aumenta e mais de 0, pontuação s2(l) começa a considerar uma possível autocorrelação em resíduos et .

Finalmente, as estatísticas de teste do multiplicador Lagrange  eta mu ou  eta tau compara com valores críticos. Se as estatísticas do teste multiplicador de Lagrange excederem o valor crítico correspondente, a hipótese nula H0 (séries temporais estacionárias) diverge em favor de uma hipótese alternativa H1 (séries temporais não estacionárias). Caso contrário, não podemos rejeitar a hipótese nula H0 sobre estacionariedade de uma série temporal.

Os valores críticos são assintóticos e, portanto, são mais adequados para amostras grandes. No entanto, na prática, eles também são usados ​​para uma pequena amostra. Além disso, os valores críticos são independentes do parâmetro l . No entanto, as estatísticas do teste multiplicador de Lagrange dependerão do parâmetro l . Os autores do teste KPSS não oferecem nenhum algoritmo geral para escolher o parâmetro apropriado. l . O teste geralmente é realizado para l no intervalo de 0 a 8.

Com aumento l é menos provável que rejeitemos a hipótese nula H0 sobre estacionariedade, que parcialmente leva a uma diminuição no poder do teste e pode gerar resultados contraditórios. No entanto, em geral, podemos dizer que se a hipótese nula H0 estacionariedade da série temporal não é rejeitada, mesmo em valores pequenos l (0, 1 ou 2), concluímos que as séries temporais verificadas são estacionárias.

Comparação dos resultados dos testes


A metodologia a seguir foi desenvolvida para avaliar a probabilidade de simetria.

  1. Todas as séries temporais são verificadas quanto à integrabilidade de 1ª ordem, usando o teste Dickey-Fuller no nível de significância de 0,05. Somente séries integráveis ​​de primeira ordem são consideradas abaixo.
  2. As séries integráveis ​​de primeira ordem obtidas na Seção 1 compreendem pares combinando sem repetição.
  3. Os pares de ações estabelecidos na cláusula 2 são testados quanto à cointegração usando o teste de Angle-Granger. Como resultado, pares cointegrados são identificados.
  4. Os resíduos de regressão obtidos como resultado do teste no parágrafo 3 são testados quanto à estacionariedade usando o teste KPSS. Assim, os resultados dos dois testes são combinados.
  5. As séries temporais nos pares cointegrados da Seção 2 são trocadas e verificadas novamente quanto à cointegração usando o teste de Angle-Granger, ou seja, examinamos se a relação entre séries temporais é simétrica.
  6. As séries temporais nos pares co-integrados do item 4 são trocadas e os resíduos da regressão são verificados novamente quanto à estacionariedade usando o teste KPSS, ou seja, examinaremos se a relação entre as séries temporais é simétrica.

Todos os cálculos são realizados usando o pacote MATLAB. Os resultados são apresentados na tabela abaixo. Para cada teste, temos várias relações simétricas de acordo com os resultados do teste (marcadas S ); temos vários relacionamentos que não são simétricos de acordo com os resultados do teste (marcados ¬S ); e temos uma probabilidade empírica de que a proporção seja simétrica de acordo com os resultados do teste ( P ( S ) = f r a c S S + ¬ S  )

Na Bolsa de Moscou:
TesteADFADF + KPSS
S773116
¬ S2441
P ( S )97%94%


Na Bolsa de Nova York:
TesteADFADF + KPSS
S136586182
¬ S43177
P ( S )97%96%


Comparação de resultados de backtest


Vamos comparar os resultados de uma estratégia de negociação de dados históricos para pares co-integrados selecionados usando o teste Angle-Granger e para pares co-integrados selecionados usando o teste KPSS.
CritériosADFADF + KPSS
O número de pares simétricos6417205
Lucro máximo340,31%287,35%
Perda máxima-53,28%-46,35%
Vapor negociado em mais2904113
Vapor negociado a zero2933
Vapor negociado em menos322089
Retorno médio anual13,51%22,72%

Como se pode observar na tabela, devido a uma identificação mais precisa dos pares de ações co-integrados, foi possível aumentar o rendimento médio anual ao negociar um par co-integrado separado em 9,21%. Assim, a metodologia proposta pode aumentar a lucratividade da negociação algorítmica usando estratégias neutras de mercado.

Interpretação alternativa


Como vimos acima, os resultados do teste de Angle-Granger são uma loteria. Para alguns, meus pensamentos parecerão excessivamente categóricos, mas acho que faz muito sentido não adotar a hipótese nula, confirmada pela análise estatística, sobre fé.

O conservadorismo do método científico para testar hipóteses é que, ao analisar os dados, podemos apenas fazer uma conclusão válida: a hipótese nula é rejeitada no nível de significância selecionado. Isso não significa que a alternativa seja verdadeira. H 1 - acabamos de receber evidências indiretas de sua credibilidade com base em uma típica "evidência do contrário". No caso em que é verdade H 0 , o pesquisador também é instruído a concluir cautelosamente: com base nos dados obtidos nas condições experimentais, não foi possível encontrar evidências suficientes para rejeitar a hipótese nula.

Em harmonia com meus pensamentos, em setembro de 2018, um artigo foi escrito por pessoas influentes que pediam para abandonar o conceito de "significância estatística" e o paradigma de testar a hipótese nula.

Mais importante: “Sugestões como alterar o nível do limite p - valores por padrão, usando intervalos de confiança com ênfase em se eles contêm zero ou não, ou usando o coeficiente de Bayes junto com classificações universalmente aceitas para avaliar a força da evidência que provém de todos os problemas iguais ou similares ao uso atualOs valores p com um nível de 0,05 ... são uma forma de alquimia estatística que faz uma falsa promessa de transformar a aleatoriedade em confiabilidade, a chamada “lavagem de incertezas” (Gelman, 2016), que começa com dados e termina com conclusões dicotômicas binárias sobre verdade ou falsidade - binária declarações de que "há um efeito" ou "não há efeito" - com base na conquista de algunsvalor p ou outro valor limite. Um passo crítico adiante será a aceitação da incerteza e a variabilidade dos efeitos (Carlin, 2016; Gelman, 2016), o reconhecimento de que podemos aprender mais (muito mais) sobre o mundo, abandonando a falsa promessa de certeza oferecida por essa dicotomização. ”



Conclusões


Vimos que, embora a propriedade de simetria da relação de cointegração deva ser satisfeita teoricamente, os dados experimentais divergem dos cálculos teóricos. Uma das interpretações desse paradoxo é a baixa potência do teste de Dickey-Fuller.

Como nova metodologia para identificar pares de ativos co-integrados, foi proposto testar os resíduos de regressão obtidos pelo teste de estacionariedade de Angle-Granger usando o teste de KPSS e combinar os resultados desses testes; e combine os resultados do teste de Angle-Granger e o teste KPSS para regressão direta e reversa.

Os backtests foram conduzidos com os dados da Bolsa de Moscou de 2017. De acordo com os resultados dos backtests, o rendimento médio anual da metodologia de identificação de pares de ações cointegradas acima proposto foi de 22,72%. Assim, comparado à identificação de pares de ações co-integrados pelo teste de Angle-Granger, foi possível aumentar o rendimento médio anual em 9,21%.

Uma interpretação alternativa do paradoxo é não aceitar a hipótese nula, confirmada pela análise estatística, sobre fé. O paradigma de teste de hipótese nula e a dicotomia oferecida por esse paradigma nos dão uma falsa sensação de conhecimento do mercado.

Quando eu comecei minha pesquisa, pareceu-me que você pode pegar o mercado, colocá-lo no "moedor de carne" dos testes estatísticos e obter linhas saborosas filtradas na saída. Infelizmente, agora vejo que esse conceito de força bruta estatística não funcionará.

Se existe ou não cointegração no mercado - para mim essa questão permanece em aberto. Ainda tenho grandes perguntas para os fundadores dessa teoria. Eu costumava ter alguma ansiedade no Ocidente e aqueles cientistas que desenvolveram matemática financeira em um momento em que a econometria era considerada uma burguesia corrupta na União Soviética. Pareceu-me que estávamos muito atrasados, e em algum lugar da Europa e da América estavam sentados os deuses das finanças, que conheciam o sagrado graal da verdade.

Agora entendo que os cientistas europeus e americanos não são muito diferentes dos nossos, a única diferença está na escala do charlatanismo. Nossos cientistas estão sentados em um castelo de marfim, escrevem algumas besteiras e recebem doações de 500 mil rublos. No Ocidente, aproximadamente os mesmos cientistas estão sentados no mesmo castelo de marfim, escrevem sobre o mesmo absurdo e recebem "nobel" e doações no valor de 500 mil dólares por isso. Essa é toda a diferença.

No momento, não tenho uma visão clara do assunto de minha pesquisa. É errado dizer que “todos os fundos de hedge usam negociação de pares” porque a maioria dos fundos de hedge também vai à falência.

Infelizmente, você sempre precisa pensar e tomar decisões com sua própria cabeça, especialmente quando arriscamos dinheiro.

Source: https://habr.com/ru/post/pt457794/


All Articles