La propiedad de simetría de la relación de cointegración.

El propósito de este artículo es compartir resultados paradójicos en el estudio de la cointegración de series temporales : si las series temporales Un co-integrado con cercano B remar B no siempre co-integrado con un número Un .

Si estudiamos la cointegración puramente teórica, entonces es fácil demostrar que si la serie Un cointegrado con B luego remar B cointegrado con Un . Sin embargo, si comenzamos a estudiar la cointegración empíricamente, resulta que los cálculos teóricos no siempre se confirman. ¿Por qué está pasando esto?

Simetría


Actitud Un llamado simétrico si A s u b s e t e q A - 1  donde A - 1 - la relación inversa definida por la condición: x A - 1 y equivalente a y A x . En otras palabras, si la relación x A y entonces la relación y A x .

Considerar dos Yo ( 1 ) una serie de x t y y t , t = 0 , p u n t o s , T  . La cointegración es simétrica si y t = b e t a 1 x t + v a r e p s i l o n 1 t   implica xt= beta2yt+ varepsilon2t es decir, si la presencia de regresión directa conduce a la presencia de la inversa.

Considera la ecuación yt= beta1xt+ varepsilon1t ,  beta1 neq0 . Cambia los lados izquierdo y derecho y resta  varepsilon1t de ambas partes:  beta1xt=yt varepsilon1t . Desde  beta1 neq0 por definición, divida ambas partes en  beta1 :

xt= frac1 beta1yt frac varepsilon1t beta1.



Reemplazar 1/ beta1 en  beta2 y  varepsilon1t/ beta1 en  varepsilon2t tenemos xt= beta2yt+ varepsilon2t . Por lo tanto, la relación de cointegración es simétrica.

Se deduce que si la variable X cointegrado con variable Y entonces la variable Y debe cointegrarse con la variable X . Sin embargo, la prueba de cointegración Angle-Granger no siempre confirma esta propiedad de simetría, ya que a veces una variable Y no co-integrado con variable X De acuerdo con esta prueba.

Probé la propiedad de simetría en los datos de 2017 de los intercambios de Moscú y Nueva York usando la prueba Angle-Granger. Había 7.975 pares de acciones cointegradas en la Bolsa de Moscú. Para 7731 (97%) pares cointegrados, se confirmó la propiedad de simetría, para 244 (3%) pares cointegrados no se confirmó la propiedad de simetría.

Había 140,903 pares de acciones cointegradas en la Bolsa de Nueva York. Para 136586 (97%) pares cointegrados, se confirmó la propiedad de simetría, para 4317 (3%) pares cointegrados no se confirmó la propiedad de simetría.

Interpretación


Este resultado puede interpretarse por la baja potencia y la alta probabilidad de error del segundo tipo de prueba Dickey-Fuller, en la que se basa la prueba Angle-Granger. La probabilidad de un error del segundo tipo se puede denotar por  beta=P(H0|H1) entonces el valor 1 beta llamado el poder de la prueba. Desafortunadamente, la prueba de Dickey-Fuller no puede distinguir entre series de tiempo no estacionarias y casi no estacionarias.

¿Qué es una serie temporal casi inestable? Considera la serie de tiempo xt= phixt1+ varepsilont . Una serie temporal estacionaria es una serie en la que 0< phi<1 . Una serie temporal no estacionaria es una serie en la que  phi=1 . Una serie temporal casi inestable es una serie en la que el valor  phi cerca de uno

En el caso de series de tiempo casi no estacionarias, a menudo no podemos rechazar la hipótesis nula de no estacionarias. Esto significa que la prueba de Dickey-Fuller tiene un alto riesgo de un segundo tipo de error, es decir, la probabilidad de no rechazar la hipótesis nula falsa.

Prueba KPSS


Una posible respuesta a la debilidad de la prueba Dickey-Fuller es la prueba KPSS, que debe su nombre a las iniciales de los científicos de Kvyatkovsky, Phillips, Schmidt y Sheen. Aunque el enfoque metodológico de esta prueba es completamente diferente del enfoque de Dickey-Fuller, la diferencia principal debe entenderse en la permutación de las hipótesis nula y alternativa.

En la prueba KPSS, la hipótesis nula establece que la serie temporal es estacionaria, frente a la alternativa sobre la presencia de no estacionariedad. Las series temporales casi no estacionarias, que a menudo se identificaron como no estacionarias mediante la prueba Dickey-Fuller, se pueden identificar correctamente como estacionarias mediante la prueba KPSS.

Sin embargo, debemos ser conscientes de que cualquier resultado de las pruebas estadísticas es meramente probabilístico y no debe confundirse con un cierto juicio verdadero. Siempre hay una probabilidad distinta de cero de que nos equivoquemos. Por esta razón, se propone combinar los resultados de las pruebas Dickey-Fuller y KPSS como una prueba ideal para la no estacionariedad.

imagen

Debido a la baja potencia, la prueba de Dickey-Fuller a menudo identifica erróneamente una serie como no estacionaria, por lo que el conjunto resultante de series de tiempo identificadas por la prueba de Dickey-Fuller como inestable es mayor en comparación con muchas series de tiempo identificadas como no estacionarias usando la prueba KPSS. Por lo tanto, el orden de prueba es importante.

Si la serie de tiempo se identifica como estacionaria usando la prueba Dickey-Fuller, lo más probable es que también se identifique como estacionaria usando la prueba KPSS; en este caso, podemos suponer que la serie es estacionaria.

Si la serie temporal se identificó como inestable usando la prueba KPSS, entonces lo más probable es que también se identifique como inestable usando la prueba Dickey-Fuller; en este caso, podemos suponer que la serie es realmente inestable.

Sin embargo, a menudo sucede que una serie de tiempo que se ha identificado como no estacionaria usando la prueba Dickey-Fuller se marcará como estacionaria usando la prueba KPSS. En este caso, debemos ser muy cuidadosos con nuestra conclusión final. Podemos verificar cuán sólida es la base de la estacionariedad en el caso de la prueba KPSS y la inestabilidad en el caso de la prueba Dickey-Fuller y tomar una decisión adecuada. Por supuesto, también podemos dejar sin resolver la cuestión de la estacionariedad de una serie temporal de este tipo.

El enfoque de prueba de KPSS asume series de tiempo yt probado para la estacionalidad en relación con una tendencia puede descomponerse en la suma de una tendencia determinista  betat paseo al azar rt y error estacionario  varepsilont :

yt= betat+rt+ varepsilont,rt=rt1+ut,


donde ut - proceso iid normal con media y varianza cero  sigma2 ( ut simN(0, sigma2) ) Valor inicial r0 tratado como fijo y desempeña el papel de un miembro libre. Error estacionario  varepsilont puede ser generado por cualquier proceso ARMA común, es decir, puede tener una fuerte autocorrelación.

Similar a la prueba de Dickey-Fuller, la capacidad de tener en cuenta una estructura arbitraria de autocorrelación  varepsilont muy importante porque la mayoría de las series de tiempo económicas dependen mucho del tiempo y, por lo tanto, tienen una fuerte autocorrelación. Si queremos verificar la estacionaria con respecto al eje horizontal, entonces el término  betat simplemente excluido de la ecuación anterior.

De la ecuación anterior se deduce que la hipótesis nula H0 sobre estacionariedad yt equivalente a la hipótesis  sigma2=0 , de lo cual se deduce que rt=r0 para todos t ( r0 Es una constante). Del mismo modo, una hipótesis alternativa H1 la no estacionariedad es equivalente a la hipótesis  sigma2 neq0 .

Para probar la hipótesis H0 :  sigma2=0 (serie temporal estacionaria) versus alternativa H1 :  sigma2 neq0 (series de tiempo no estacionarias) los autores de la prueba KPSS reciben estadísticas unidireccionales de la prueba multiplicadora de Lagrange. También calculan su distribución asintótica y modelan los valores críticos asintóticos. Aquí no consideramos detalles teóricos, sino que resumimos brevemente el algoritmo de ejecución de la prueba.

Al realizar la prueba KPSS para una serie temporal yt , t=1, puntos,T El método de mínimos cuadrados (mínimos cuadrados) se utiliza para estimar una de las siguientes ecuaciones:

yt=a0+ varepsilont,yt=a0+ betat+ varepsilont.



Si queremos verificar la estacionariedad con respecto al eje horizontal, evaluamos la primera ecuación. Si planeamos verificar la estacionariedad con respecto a la tendencia, elegimos la segunda ecuación.

Restos et de la ecuación estimada se utilizan para calcular las estadísticas de la prueba de multiplicadores de Lagrange. La prueba del multiplicador de Lagrange se basa en la idea de que cuando se cumple la hipótesis nula, todos los multiplicadores de Lagrange deben ser iguales a cero.

Prueba de multiplicador de Lagrange


La prueba del multiplicador de Lagrange se asocia con un enfoque más general para la estimación de parámetros utilizando el método de máxima verosimilitud (ML). Según este enfoque, los datos se consideran evidencia relacionada con los parámetros de distribución. La evidencia se expresa en función de parámetros desconocidos, una función de probabilidad:

L(X1,X2,X3, dots,Xn; Phi1, Phi2, dots, Phik),


donde Xi Son los valores observados, y  Phii - parámetros que queremos evaluar.

La función de máxima verosimilitud es la probabilidad conjunta de observaciones de muestra.

L(X1,X2,X3, dots,Xn; Phi1, Phi2, dots, Phik)=P(X1 landX2 landX3 dotsXn).



El objetivo del método de máxima verosimilitud es maximizar la función de verosimilitud. Esto se logra diferenciando la función de probabilidad máxima para cada uno de los parámetros estimados y equiparando las derivadas parciales a cero. Los valores de los parámetros en los que el valor de la función es máximo es la estimación deseada.

Por lo general, para simplificar el trabajo posterior, primero se toma el logaritmo de la función de probabilidad.

Considere un modelo lineal generalizado Y= betaX+ varepsilon donde se supone que  varepsilon normalmente distribuido N(0, sigma2) eso es Y betaX simN(0, sigma2) .

Queremos probar la hipótesis de que el sistema q ( q<k ) restricciones lineales independientes R beta=r . Aqui R - famoso q vecesk matriz de rango q y r - famoso q veces1 vector

Para cada par de valores observados X y Y En condiciones normales, existirá una función de densidad de probabilidad de la siguiente forma:

f(Xi,Yi)= frac1 sqrt2 pi sigma2e frac12 left( fracYi betaXi sigma right)2.



Sujeto a n observaciones conjuntas X y Y La probabilidad total de observar todos los valores de la muestra es igual al producto de los valores individuales de la función de densidad de probabilidad. Por lo tanto, la función de probabilidad se define de la siguiente manera:

L( beta)= prod limitsni=1 frac1 sqrt2 pi sigma2e frac12 left( fracYi betaXi sigma right)2.



Como es más fácil diferenciar la suma que el producto, generalmente se toma el logaritmo de la función de probabilidad, por lo tanto:

 lnL( beta)= sum limitsni=1 left( ln frac1 sqrt2 pi sigma2 frac12 sigma2(Yi betaXi)2 right).



Esta útil conversión no afecta el resultado final, porque  lnL Es una función creciente L . Entonces el valor  beta que maximiza  lnL también maximizará L .

Puntuación de ML para  beta en regresión con restricción ( R beta=r ) se obtiene maximizando la función  lnL( beta) sujeto a R beta=r . Para encontrar esta estimación, escribimos la función Lagrange:

 psi( beta)= lnL( beta)g(R betar),


por donde g= left(g1, dots,gq right) vector marcado q Multiplicadores de Lagrange.

Estadísticas de prueba de multiplicador de Lagrange denotadas por  eta mu en caso de estacionaria con respecto al eje horizontal y a través de  eta tau en caso de estacionariedad relativa a la tendencia, está determinada por la expresión

 eta mu/ tau=T2 frac1s2(l) sum limitsTt=1S2t,


donde

St= sum limitsti=1ei


y

s2(l)=T1 sum limitsTt=1e2t+2T1 sum limitsl1w(s,l) sum limitsTt=s+1etets,


donde

w(s,l)=1 fracsl+1.



En las ecuaciones anteriores St - el proceso de saldos parciales et de la ecuación estimada; s2(l) - evaluación de la dispersión de residuos a largo plazo et ; pero w(s,l) - la llamada ventana espectral de Bartlett, donde l - parámetro de truncamiento de retraso.

En esta aplicación, la ventana espectral se usa para estimar la densidad espectral de los errores para un determinado intervalo (ventana), que se mueve a lo largo de todo el rango de la serie. Los datos fuera del intervalo se ignoran, ya que la función de ventana es una función igual a cero fuera de algún intervalo seleccionado (ventana).

Estimación de varianza s2(l) depende del parámetro l y desde l aumenta y más de 0, puntuación s2(l) comienza a tener en cuenta la posible autocorrelación en residuos et .

Finalmente, las estadísticas de prueba del multiplicador de Lagrange  eta mu o  eta tau se compara con los valores críticos Si las estadísticas de la prueba del multiplicador de Lagrange exceden el valor crítico correspondiente, entonces la hipótesis nula H0 (series temporales estacionarias) se desvía a favor de una hipótesis alternativa H1 (series de tiempo no estacionarias). De lo contrario, no podemos rechazar la hipótesis nula H0 sobre la estacionariedad de una serie temporal.

Los valores críticos son asintóticos y, por lo tanto, son más adecuados para muestras de gran tamaño. Sin embargo, en la práctica también se utilizan para una muestra pequeña. Además, los valores críticos son independientes del parámetro. l . Sin embargo, las estadísticas de la prueba del multiplicador de Lagrange dependerán del parámetro l . Los autores de la prueba KPSS no ofrecen ningún algoritmo general para elegir el parámetro apropiado. l . La prueba generalmente se realiza para l en el rango de 0 a 8.

Con aumento l somos menos propensos a rechazar la hipótesis nula H0 sobre la estacionariedad, que en parte conduce a una disminución en el poder de la prueba y puede dar resultados mixtos. Sin embargo, en general, podemos decir que si la hipótesis nula H0 la estacionariedad de la serie temporal no se rechaza incluso con valores pequeños l (0, 1 o 2), concluimos que las series de tiempo verificadas son estacionarias.

Comparación de resultados de prueba


La siguiente metodología fue desarrollada para evaluar la probabilidad de simetría.

  1. Todas las series temporales se verifican para la integrabilidad de primer orden utilizando la prueba Dickey-Fuller a un nivel de significancia de 0.05. Solo se consideran a continuación series integrables de primer orden.
  2. Las series integrables de primer orden obtenidas en la Sección 1 comprenden pares mediante la combinación sin repetición.
  3. Los pares de acciones elaborados en la cláusula 2 se prueban para la cointegración utilizando la prueba Angle-Granger. Como resultado, se identifican pares cointegrados.
  4. Los residuos de regresión obtenidos como resultado de las pruebas en el párrafo 3 se prueban para la estacionariedad utilizando la prueba KPSS. Por lo tanto, los resultados de las dos pruebas se combinan.
  5. Las series de tiempo en los pares cointegrados de la Sec. 2 se intercambian y se verifica nuevamente para la cointegración usando la prueba Angle-Granger, es decir, examinamos si la relación entre series de tiempo es simétrica.
  6. Las series de tiempo en los pares cointegrados del ítem 4 se intercambian y los residuales de la regresión se verifican nuevamente para determinar la estacionariedad utilizando la prueba KPSS, es decir, examinaremos si la relación entre las series de tiempo es simétrica.

Todos los cálculos se realizan con el paquete MATLAB. Los resultados se presentan en la tabla a continuación. Para cada prueba, tenemos una serie de relaciones simétricas de acuerdo con los resultados de la prueba (marcados S ); tenemos una serie de relaciones que no son simétricas según los resultados de la prueba (marcadas ¬S ); y tenemos una probabilidad empírica de que la relación sea simétrica de acuerdo con los resultados de la prueba ( P ( S ) = f r a c S S + ¬ S  )

En el intercambio de Moscú:
PruebaADFADF + KPSS
S773116
¬ S2441
P ( S )97%94%


En la Bolsa de Nueva York:
PruebaADFADF + KPSS
S136586182
¬ S43177 7
P ( S )97%96%


Comparación de resultados de backtest


Comparemos los resultados de una estrategia comercial en datos históricos para pares cointegrados seleccionados usando la prueba Angle-Granger y para pares cointegrados seleccionados usando la prueba KPSS.
CriteriosADFADF + KPSS
El número de pares simétricos.6417205
Máxima ganancia340,31%287,35%
Pérdida máxima-53,28%-46,35%
Steam intercambiado en plus2904113
Vapor negociado a cero2933
Steam intercambiado en menos322089
Rentabilidad media anual13,51%22,72%

Como se puede ver en la tabla, debido a una identificación más precisa de los pares de acciones cointegrados, fue posible aumentar el rendimiento anual promedio al negociar un par cointegrado por separado en un 9.21%. Por lo tanto, la metodología propuesta puede aumentar la rentabilidad del comercio algorítmico utilizando estrategias neutrales en el mercado.

Interpretación alternativa


Como vimos anteriormente, los resultados de la prueba Angle-Granger son una lotería. Para algunos, mis pensamientos parecerán excesivamente categóricos, pero creo que tiene mucho sentido no tomar la hipótesis nula, confirmada por análisis estadístico, sobre la fe.

El conservadurismo del método científico para probar hipótesis es que al analizar los datos solo podemos hacer una conclusión válida: la hipótesis nula se rechaza en el nivel de significación elegido. Esto no significa que la alternativa sea verdadera. H 1 - acabamos de recibir evidencia indirecta de su credibilidad sobre la base de una típica "evidencia de lo contrario". En el caso cuando es verdad H 0 , el investigador también tiene instrucciones de llegar a una conclusión cautelosa: en base a los datos obtenidos en las condiciones experimentales, no fue posible encontrar suficiente evidencia para rechazar la hipótesis nula.

Al unísono con mis pensamientos en septiembre de 2018, personas influyentes escribieron un artículo llamando a abandonar el concepto de "significación estadística" y el paradigma de probar la hipótesis nula.

Lo más importante: "Sugerencias como cambiar el nivel de umbral valores p por defecto, usando intervalos de confianza con énfasis en si contienen cero o no, o usando el coeficiente de Bayes junto con clasificaciones universalmente aceptadas para evaluar la fuerza de la evidencia que proviene de los mismos problemas o problemas similares al uso actualp - 0,05… , , „ “ (Gelman, 2016), — , „ “ „ “ — p - .

(Carlin, 2016; Gelman, 2016), , ( ) , , .»

Conclusiones


Vimos que, aunque la propiedad de simetría de la relación de cointegración debería cumplirse teóricamente, los datos experimentales divergen de los cálculos teóricos. Una de las interpretaciones de esta paradoja es el bajo poder de la prueba Dickey-Fuller.

Como una nueva metodología para identificar pares de activos cointegrados, se propuso probar los residuos de regresión obtenidos usando la prueba Angle-Granger para la estacionariedad usando la prueba KPSS y combinar los resultados de estas pruebas; y combine los resultados de la prueba Angle-Granger y la prueba KPSS para la regresión directa e inversa.

Se realizaron backtests sobre los datos de la Bolsa de Moscú de 2017. De acuerdo con los resultados de las pruebas retrospectivas, el rendimiento anual promedio cuando se utiliza la metodología para identificar pares de acciones cointegradas propuestas anteriormente fue del 22.72%. Por lo tanto, en comparación con la identificación de pares de existencias cointegradas mediante la prueba Angle-Granger, fue posible aumentar el rendimiento anual promedio en un 9.21%.

Una interpretación alternativa de la paradoja es no tomar la hipótesis nula, confirmada por análisis estadístico, sobre la fe. El paradigma de prueba de hipótesis nulas y la dicotomía que ofrece dicho paradigma nos dan una falsa sensación de conocimiento del mercado.

Cuando recién comencé mi investigación, me pareció que podía tomar el mercado, ponerlo en la "picadora de carne" de las pruebas estadísticas y obtener filas sabrosas filtradas a la salida. Desafortunadamente, ahora veo que este concepto de fuerza bruta estadística no funcionará.

Ya sea que haya cointegración en el mercado o no, para mí esta pregunta sigue abierta. Todavía tengo grandes preguntas para los fundadores de esta teoría. Solía ​​sentir cierta inquietud en Occidente y en aquellos científicos que desarrollaron matemáticas financieras en un momento en que la econometría se consideraba una burguesía corrupta en la Unión Soviética. Me pareció que estábamos muy lejos, y en algún lugar de Europa y América estaban sentados los dioses de las finanzas, que conocían el sagrado grial de la verdad.

Ahora entiendo que los científicos europeos y estadounidenses no son muy diferentes de los nuestros, la única diferencia está en la escala de la charlatanería. Nuestros científicos están sentados en un castillo de marfil, escriben algunas tonterías y reciben subvenciones por un monto de 500 mil rublos. En Occidente, casi los mismos científicos están sentados en el mismo castillo de marfil, escriben sobre el mismo sinsentido y obtienen "nobel" y subvenciones por la cantidad de 500 mil dólares para esto. Esa es toda la diferencia.

Por el momento, no tengo una visión clara del tema de mi investigación. Es incorrecto decir que "todos los fondos de cobertura utilizan el comercio de pares" porque la mayoría de los fondos de cobertura también quiebran.

Desafortunadamente, siempre tiene que pensar y tomar decisiones con su propia cabeza, especialmente cuando arriesgamos dinero.

Source: https://habr.com/ru/post/457794/


All Articles