El propósito de este artículo es compartir resultados paradójicos en el estudio de la
cointegración de series temporales : si las series temporales
Un co-integrado con cercano
B remar
B no siempre co-integrado con un número
Un .
Si estudiamos la cointegración puramente teórica, entonces es fácil demostrar que si la serie
Un cointegrado con
B luego remar
B cointegrado con
Un . Sin embargo, si comenzamos a estudiar la cointegración empíricamente, resulta que los cálculos teóricos no siempre se confirman. ¿Por qué está pasando esto?
Simetría
Actitud
Un llamado simétrico si
A s u b s e t e q A - 1 donde
A - 1 - la relación inversa definida por la condición:
x A - 1 y equivalente a
y A x . En otras palabras, si la relación
x A y entonces la relación
y A x .
Considerar dos
Yo ( 1 ) una serie de
x t y
y t ,
t = 0 , p u n t o s , T . La cointegración es simétrica si
y t = b e t a 1 x t + v a r e p s i l o n 1 t implica
xt= beta2yt+ varepsilon2t es decir, si la presencia de regresión directa conduce a la presencia de la inversa.
Considera la ecuación
yt= beta1xt+ varepsilon1t ,
beta1 neq0 . Cambia los lados izquierdo y derecho y resta
varepsilon1t de ambas partes:
beta1xt=yt− varepsilon1t . Desde
beta1 neq0 por definición, divida ambas partes en
beta1 :
xt= frac1 beta1yt− frac varepsilon1t beta1.
Reemplazar
1/ beta1 en
beta2 y
− varepsilon1t/ beta1 en
varepsilon2t tenemos
xt= beta2yt+ varepsilon2t . Por lo tanto, la relación de cointegración es simétrica.
Se deduce que si la variable
X cointegrado con variable
Y entonces la variable
Y debe cointegrarse con la variable
X . Sin embargo, la prueba de cointegración Angle-Granger no siempre confirma esta propiedad de simetría, ya que a veces una variable
Y no co-integrado con variable
X De acuerdo con esta prueba.
Probé la propiedad de simetría en los datos de 2017 de los intercambios de Moscú y Nueva York usando la prueba Angle-Granger. Había 7.975 pares de acciones cointegradas en la Bolsa de Moscú. Para 7731 (97%) pares cointegrados, se confirmó la propiedad de simetría, para 244 (3%) pares cointegrados no se confirmó la propiedad de simetría.
Había 140,903 pares de acciones cointegradas en la Bolsa de Nueva York. Para 136586 (97%) pares cointegrados, se confirmó la propiedad de simetría, para 4317 (3%) pares cointegrados no se confirmó la propiedad de simetría.
Interpretación
Este resultado puede interpretarse por la baja potencia y la alta probabilidad de error del segundo tipo de prueba Dickey-Fuller, en la que se basa la prueba Angle-Granger. La probabilidad de un error del segundo tipo se puede denotar por
beta=P(H0|H1) entonces el valor
1− beta llamado el poder de la prueba. Desafortunadamente, la prueba de Dickey-Fuller no puede distinguir entre series de tiempo no estacionarias y casi no estacionarias.
¿Qué es una serie temporal casi inestable? Considera la serie de tiempo
xt= phixt−1+ varepsilont . Una serie temporal estacionaria es una serie en la que
0< phi<1 . Una serie temporal no estacionaria es una serie en la que
phi=1 . Una serie temporal casi inestable es una serie en la que el valor
phi cerca de uno
En el caso de series de tiempo casi no estacionarias, a menudo no podemos rechazar la hipótesis nula de no estacionarias. Esto significa que la prueba de Dickey-Fuller tiene un alto riesgo de un segundo tipo de error, es decir, la probabilidad de no rechazar la hipótesis nula falsa.
Prueba KPSS
Una posible respuesta a la debilidad de la prueba Dickey-Fuller es la prueba KPSS, que debe su nombre a las iniciales de los científicos de Kvyatkovsky, Phillips, Schmidt y Sheen. Aunque el enfoque metodológico de esta prueba es completamente diferente del enfoque de Dickey-Fuller, la diferencia principal debe entenderse en la permutación de las hipótesis nula y alternativa.
En la prueba KPSS, la hipótesis nula establece que la serie temporal es estacionaria, frente a la alternativa sobre la presencia de no estacionariedad. Las series temporales casi no estacionarias, que a menudo se identificaron como no estacionarias mediante la prueba Dickey-Fuller, se pueden identificar correctamente como estacionarias mediante la prueba KPSS.
Sin embargo, debemos ser conscientes de que cualquier resultado de las pruebas estadísticas es meramente probabilístico y no debe confundirse con un cierto juicio verdadero. Siempre hay una probabilidad distinta de cero de que nos equivoquemos. Por esta razón, se propone combinar los resultados de las pruebas Dickey-Fuller y KPSS como una prueba ideal para la no estacionariedad.

Debido a la baja potencia, la prueba de Dickey-Fuller a menudo identifica erróneamente una serie como no estacionaria, por lo que el conjunto resultante de series de tiempo identificadas por la prueba de Dickey-Fuller como inestable es mayor en comparación con muchas series de tiempo identificadas como no estacionarias usando la prueba KPSS. Por lo tanto, el orden de prueba es importante.
Si la serie de tiempo se identifica como estacionaria usando la prueba Dickey-Fuller, lo más probable es que también se identifique como estacionaria usando la prueba KPSS; en este caso, podemos suponer que la serie es estacionaria.
Si la serie temporal se identificó como inestable usando la prueba KPSS, entonces lo más probable es que también se identifique como inestable usando la prueba Dickey-Fuller; en este caso, podemos suponer que la serie es realmente inestable.
Sin embargo, a menudo sucede que una serie de tiempo que se ha identificado como no estacionaria usando la prueba Dickey-Fuller se marcará como estacionaria usando la prueba KPSS. En este caso, debemos ser muy cuidadosos con nuestra conclusión final. Podemos verificar cuán sólida es la base de la estacionariedad en el caso de la prueba KPSS y la inestabilidad en el caso de la prueba Dickey-Fuller y tomar una decisión adecuada. Por supuesto, también podemos dejar sin resolver la cuestión de la estacionariedad de una serie temporal de este tipo.
El enfoque de prueba de KPSS asume series de tiempo
yt probado para la estacionalidad en relación con una tendencia puede descomponerse en la suma de una tendencia determinista
betat paseo al azar
rt y error estacionario
varepsilont :
yt= betat+rt+ varepsilont,rt=rt−1+ut,
donde
ut - proceso iid normal con media y varianza cero
sigma2 (
ut simN(0, sigma2) ) Valor inicial
r0 tratado como fijo y desempeña el papel de un miembro libre. Error estacionario
varepsilont puede ser generado por cualquier proceso ARMA común, es decir, puede tener una fuerte autocorrelación.
Similar a la prueba de Dickey-Fuller, la capacidad de tener en cuenta una estructura arbitraria de autocorrelación
varepsilont muy importante porque la mayoría de las series de tiempo económicas dependen mucho del tiempo y, por lo tanto, tienen una fuerte autocorrelación. Si queremos verificar la estacionaria con respecto al eje horizontal, entonces el término
betat simplemente excluido de la ecuación anterior.
De la ecuación anterior se deduce que la hipótesis nula
H0 sobre estacionariedad
yt equivalente a la hipótesis
sigma2=0 , de lo cual se deduce que
rt=r0 para todos
t (
r0 Es una constante). Del mismo modo, una hipótesis alternativa
H1 la no estacionariedad es equivalente a la hipótesis
sigma2 neq0 .
Para probar la hipótesis
H0 :
sigma2=0 (serie temporal estacionaria) versus alternativa
H1 :
sigma2 neq0 (series de tiempo no estacionarias) los autores de la prueba KPSS reciben estadísticas unidireccionales de la prueba multiplicadora de Lagrange. También calculan su distribución asintótica y modelan los valores críticos asintóticos. Aquí no consideramos detalles teóricos, sino que resumimos brevemente el algoritmo de ejecución de la prueba.
Al realizar la prueba KPSS para una serie temporal
yt ,
t=1, puntos,T El método de mínimos cuadrados (mínimos cuadrados) se utiliza para estimar una de las siguientes ecuaciones:
yt=a0+ varepsilont,yt=a0+ betat+ varepsilont.
Si queremos verificar la estacionariedad con respecto al eje horizontal, evaluamos la primera ecuación. Si planeamos verificar la estacionariedad con respecto a la tendencia, elegimos la segunda ecuación.
Restos
et de la ecuación estimada se utilizan para calcular las estadísticas de la prueba de multiplicadores de Lagrange. La prueba del multiplicador de Lagrange se basa en la idea de que cuando se cumple la hipótesis nula, todos los multiplicadores de Lagrange deben ser iguales a cero.
Prueba de multiplicador de Lagrange
La prueba del multiplicador de Lagrange se asocia con un enfoque más general para la estimación de parámetros utilizando el método de máxima verosimilitud (ML). Según este enfoque, los datos se consideran evidencia relacionada con los parámetros de distribución. La evidencia se expresa en función de parámetros desconocidos, una función de probabilidad:
L(X1,X2,X3, dots,Xn; Phi1, Phi2, dots, Phik),
donde
Xi Son los valores observados, y
Phii - parámetros que queremos evaluar.
La función de máxima verosimilitud es la probabilidad conjunta de observaciones de muestra.
L(X1,X2,X3, dots,Xn; Phi1, Phi2, dots, Phik)=P(X1 landX2 landX3 dotsXn).
El objetivo del método de máxima verosimilitud es maximizar la función de verosimilitud. Esto se logra diferenciando la función de probabilidad máxima para cada uno de los parámetros estimados y equiparando las derivadas parciales a cero. Los valores de los parámetros en los que el valor de la función es máximo es la estimación deseada.
Por lo general, para simplificar el trabajo posterior, primero se toma el logaritmo de la función de probabilidad.
Considere un modelo lineal generalizado
Y= betaX+ varepsilon donde se supone que
varepsilon normalmente distribuido
N(0, sigma2) eso es
Y− betaX simN(0, sigma2) .
Queremos probar la hipótesis de que el sistema
q (
q<k ) restricciones lineales independientes
R beta=r . Aqui
R - famoso
q vecesk matriz de rango
q y
r - famoso
q veces1 vector
Para cada par de valores observados
X y
Y En condiciones normales, existirá una función de densidad de probabilidad de la siguiente forma:
f(Xi,Yi)= frac1 sqrt2 pi sigma2e− frac12 left( fracYi− betaXi sigma right)2.
Sujeto a
n observaciones conjuntas
X y
Y La probabilidad total de observar todos los valores de la muestra es igual al producto de los valores individuales de la función de densidad de probabilidad. Por lo tanto, la función de probabilidad se define de la siguiente manera:
L( beta)= prod limitsni=1 frac1 sqrt2 pi sigma2e− frac12 left( fracYi− betaXi sigma right)2.
Como es más fácil diferenciar la suma que el producto, generalmente se toma el logaritmo de la función de probabilidad, por lo tanto:
lnL( beta)= sum limitsni=1 left( ln frac1 sqrt2 pi sigma2− frac12 sigma2(Yi− betaXi)2 right).
Esta útil conversión no afecta el resultado final, porque
lnL Es una función creciente
L . Entonces el valor
beta que maximiza
lnL también maximizará
L .
Puntuación de ML para
beta en regresión con restricción (
R beta=r ) se obtiene maximizando la función
lnL( beta) sujeto a
R beta=r . Para encontrar esta estimación, escribimos la función Lagrange:
psi( beta)= lnL( beta)−g′(R beta−r),
por donde
g= left(g1, dots,gq right)′ vector marcado
q Multiplicadores de Lagrange.
Estadísticas de prueba de multiplicador de Lagrange denotadas por
eta mu en caso de estacionaria con respecto al eje horizontal y a través de
eta tau en caso de estacionariedad relativa a la tendencia, está determinada por la expresión
eta mu/ tau=T2 frac1s2(l) sum limitsTt=1S2t,
donde
St= sum limitsti=1ei
y
s2(l)=T−1 sum limitsTt=1e2t+2T−1 sum limitsl1w(s,l) sum limitsTt=s+1etets,
donde
w(s,l)=1− fracsl+1.
En las ecuaciones anteriores
St - el proceso de saldos parciales
et de la ecuación estimada;
s2(l) - evaluación de la dispersión de residuos a largo plazo
et ; pero
w(s,l) - la llamada ventana espectral de Bartlett, donde
l - parámetro de truncamiento de retraso.
En esta aplicación, la ventana espectral se usa para estimar la densidad espectral de los errores para un determinado intervalo (ventana), que se mueve a lo largo de todo el rango de la serie. Los datos fuera del intervalo se ignoran, ya que la función de ventana es una función igual a cero fuera de algún intervalo seleccionado (ventana).
Estimación de varianza
s2(l) depende del parámetro
l y desde
l aumenta y más de 0, puntuación
s2(l) comienza a tener en cuenta la posible autocorrelación en residuos
et .
Finalmente, las estadísticas de prueba del multiplicador de Lagrange
eta mu o
eta tau se compara con los valores críticos Si las estadísticas de la prueba del multiplicador de Lagrange exceden el valor crítico correspondiente, entonces la hipótesis nula
H0 (series temporales estacionarias) se desvía a favor de una hipótesis alternativa
H1 (series de tiempo no estacionarias). De lo contrario, no podemos rechazar la hipótesis nula
H0 sobre la estacionariedad de una serie temporal.
Los valores críticos son asintóticos y, por lo tanto, son más adecuados para muestras de gran tamaño. Sin embargo, en la práctica también se utilizan para una muestra pequeña. Además, los valores críticos son independientes del parámetro.
l . Sin embargo, las estadísticas de la prueba del multiplicador de Lagrange dependerán del parámetro
l . Los autores de la prueba KPSS no ofrecen ningún algoritmo general para elegir el parámetro apropiado.
l . La prueba generalmente se realiza para
l en el rango de 0 a 8.
Con aumento
l somos menos propensos a rechazar la hipótesis nula
H0 sobre la estacionariedad, que en parte conduce a una disminución en el poder de la prueba y puede dar resultados mixtos. Sin embargo, en general, podemos decir que si la hipótesis nula
H0 la estacionariedad de la serie temporal no se rechaza incluso con valores pequeños
l (0, 1 o 2), concluimos que las series de tiempo verificadas son estacionarias.
Comparación de resultados de prueba
La siguiente metodología fue desarrollada para evaluar la probabilidad de simetría.
- Todas las series temporales se verifican para la integrabilidad de primer orden utilizando la prueba Dickey-Fuller a un nivel de significancia de 0.05. Solo se consideran a continuación series integrables de primer orden.
- Las series integrables de primer orden obtenidas en la Sección 1 comprenden pares mediante la combinación sin repetición.
- Los pares de acciones elaborados en la cláusula 2 se prueban para la cointegración utilizando la prueba Angle-Granger. Como resultado, se identifican pares cointegrados.
- Los residuos de regresión obtenidos como resultado de las pruebas en el párrafo 3 se prueban para la estacionariedad utilizando la prueba KPSS. Por lo tanto, los resultados de las dos pruebas se combinan.
- Las series de tiempo en los pares cointegrados de la Sec. 2 se intercambian y se verifica nuevamente para la cointegración usando la prueba Angle-Granger, es decir, examinamos si la relación entre series de tiempo es simétrica.
- Las series de tiempo en los pares cointegrados del ítem 4 se intercambian y los residuales de la regresión se verifican nuevamente para determinar la estacionariedad utilizando la prueba KPSS, es decir, examinaremos si la relación entre las series de tiempo es simétrica.
Todos los cálculos se realizan con el paquete MATLAB. Los resultados se presentan en la tabla a continuación. Para cada prueba, tenemos una serie de relaciones simétricas de acuerdo con los resultados de la prueba (marcados
S ); tenemos una serie de relaciones que no son simétricas según los resultados de la prueba (marcadas
¬S ); y tenemos una probabilidad empírica de que la relación sea simétrica de acuerdo con los resultados de la prueba (
P ( S ) = f r a c S S + ¬ S )
En el intercambio de Moscú:
En la Bolsa de Nueva York:
Comparación de resultados de backtest
Comparemos los resultados de una
estrategia comercial en datos históricos para pares cointegrados seleccionados usando la prueba Angle-Granger y para pares cointegrados seleccionados usando la prueba KPSS.
Como se puede ver en la tabla, debido a una identificación más precisa de los pares de acciones cointegrados, fue posible aumentar el rendimiento anual promedio al negociar un par cointegrado por separado en un 9.21%. Por lo tanto, la metodología propuesta puede aumentar la rentabilidad del comercio algorítmico utilizando estrategias neutrales en el mercado.
Interpretación alternativa
Como vimos anteriormente, los resultados de la prueba Angle-Granger son una lotería. Para algunos, mis pensamientos parecerán excesivamente categóricos, pero creo que tiene mucho sentido no tomar la hipótesis nula, confirmada por análisis estadístico, sobre la fe.
El conservadurismo del método científico para probar hipótesis es que al analizar los datos solo podemos hacer una conclusión válida: la hipótesis nula se rechaza en el nivel de significación elegido. Esto no significa que la alternativa sea verdadera.
H 1 - acabamos de recibir evidencia indirecta de su credibilidad sobre la base de una típica "evidencia de lo contrario". En el caso cuando es verdad
H 0 , el investigador también tiene instrucciones de llegar a una conclusión cautelosa: en base a los datos obtenidos en las condiciones experimentales, no fue posible encontrar suficiente evidencia para rechazar la hipótesis nula.
Al unísono con mis pensamientos en septiembre de 2018, personas influyentes escribieron
un artículo llamando a abandonar el concepto de "significación estadística" y el paradigma de probar la hipótesis nula.
Lo más importante: "Sugerencias como cambiar el nivel de umbral
valores p por defecto, usando intervalos de confianza con énfasis en si contienen cero o no, o usando el coeficiente de Bayes junto con clasificaciones universalmente aceptadas para evaluar la fuerza de la evidencia que proviene de los mismos problemas o problemas similares al uso actualp - 0,05… , , „ “ (Gelman, 2016), — , „ “ „ “ —
p - .
(Carlin, 2016; Gelman, 2016), , ( ) , , .»
Conclusiones
Vimos que, aunque la propiedad de simetría de la relación de cointegración debería cumplirse teóricamente, los datos experimentales divergen de los cálculos teóricos. Una de las interpretaciones de esta paradoja es el bajo poder de la prueba Dickey-Fuller.
Como una nueva metodología para identificar pares de activos cointegrados, se propuso probar los residuos de regresión obtenidos usando la prueba Angle-Granger para la estacionariedad usando la prueba KPSS y combinar los resultados de estas pruebas; y combine los resultados de la prueba Angle-Granger y la prueba KPSS para la regresión directa e inversa.
Se realizaron backtests sobre los datos de la Bolsa de Moscú de 2017. De acuerdo con los resultados de las pruebas retrospectivas, el rendimiento anual promedio cuando se utiliza la metodología para identificar pares de acciones cointegradas propuestas anteriormente fue del 22.72%. Por lo tanto, en comparación con la identificación de pares de existencias cointegradas mediante la prueba Angle-Granger, fue posible aumentar el rendimiento anual promedio en un 9.21%.
Una interpretación alternativa de la paradoja es no tomar la hipótesis nula, confirmada por análisis estadístico, sobre la fe. El paradigma de prueba de hipótesis nulas y la dicotomía que ofrece dicho paradigma nos dan una falsa sensación de conocimiento del mercado.
Cuando recién comencé mi investigación, me pareció que podía tomar el mercado, ponerlo en la "picadora de carne" de las pruebas estadísticas y obtener filas sabrosas filtradas a la salida. Desafortunadamente, ahora veo que este concepto de fuerza bruta estadística no funcionará.
Ya sea que haya cointegración en el mercado o no, para mí esta pregunta sigue abierta. Todavía tengo grandes preguntas para los fundadores de esta teoría. Solía sentir cierta inquietud en Occidente y en aquellos científicos que desarrollaron matemáticas financieras en un momento en que la econometría se consideraba una burguesía corrupta en la Unión Soviética. Me pareció que estábamos muy lejos, y en algún lugar de Europa y América estaban sentados los dioses de las finanzas, que conocían el sagrado grial de la verdad.
Ahora entiendo que los científicos europeos y estadounidenses no son muy diferentes de los nuestros, la única diferencia está en la escala de la charlatanería. Nuestros científicos están sentados en un castillo de marfil, escriben algunas tonterías y reciben subvenciones por un monto de 500 mil rublos. En Occidente, casi los mismos científicos están sentados en el mismo castillo de marfil, escriben sobre el mismo sinsentido y obtienen "nobel" y subvenciones por la cantidad de 500 mil dólares para esto. Esa es toda la diferencia.
Por el momento, no tengo una visión clara del tema de mi investigación. Es incorrecto decir que "todos los fondos de cobertura utilizan el comercio de pares" porque la mayoría de los fondos de cobertura también quiebran.
Desafortunadamente, siempre tiene que pensar y tomar decisiones con su propia cabeza, especialmente cuando arriesgamos dinero.