Series temporales para pronosticar la demanda, la carga de CC, recomendaciones de productos y encontrar anomalías

El artículo analiza el alcance de las series de tiempo, las tareas a resolver y los algoritmos utilizados. El pronóstico de series de tiempo se utiliza en tareas como el pronóstico de la demanda, la carga en el centro de contacto, el tráfico por carretera e Internet, la resolución del problema de arranque en frío en los sistemas de recomendación y la búsqueda de anomalías en el comportamiento del equipo y los usuarios.

Consideremos las tareas con más detalle.



1) Previsión de la demanda.


Propósito: reducir los costos de almacén y optimizar los horarios de trabajo del personal.

Cómo resolverlo: teniendo un pronóstico de compras de bienes y el número de clientes, minimizamos la cantidad de bienes en el almacén y almacenamos exactamente lo mismo que compran en un rango de tiempo determinado. Conociendo el número de clientes en cada momento, elaboraremos un horario de trabajo óptimo para que con un mínimo de costos, haya un número suficiente de personal.

2) Predicción de la carga en el servicio de entrega.


Propósito: evitar el colapso de la logística en las cargas máximas.

Cómo resolverlo: prediciendo el número de pedidos, lleve el número óptimo de automóviles y correos a la línea.

3) Pronosticar la carga en el centro de contacto


Propósito: a un costo mínimo del fondo salarial para garantizar la disponibilidad requerida de un centro de contacto.

Cómo resolver: prediciendo el número de llamadas a lo largo del tiempo, haremos el horario óptimo para los operadores.

4) previsión de tráfico


Propósito: predecir el número de servidores y el ancho de banda para una operación sostenible. Para que su servicio no caiga el día del estreno de una serie popular o un partido de fútbol;)

5) Predicción del tiempo óptimo de los cajeros automáticos de cobro de efectivo


Propósito: minimizar la cantidad de efectivo almacenado en la red de cajeros automáticos

6) Soluciones de arranque en frío en sistemas de recomendación.


Propósito: Recomendar productos relevantes a nuevos usuarios.

Cuando un usuario ha realizado varias compras, se puede construir un algoritmo de filtrado colaborativo para recomendaciones, pero cuando no hay información del usuario, es óptimo recomendar los productos más populares.

Solución: La popularidad de los productos depende del momento en que se hace la recomendación. El uso de pronósticos de series de tiempo ayuda a identificar productos relevantes en un momento dado.

Los trucos de la vida para construir sistemas de recomendación se discutieron en un artículo anterior .

7) Búsqueda de anomalías


Propósito: identificar problemas en la operación de equipos y situaciones no estándar en los negocios
Solución: si el valor medido se elimina del intervalo de confianza del pronóstico, se detecta una anomalía. Si se trata de una planta de energía nuclear, es hora de aumentar el cuadrado de la distancia;)

Algoritmos para resolver el problema.


1) media móvil


El algoritmo más simple es la media móvil. Calculemos el promedio de los últimos elementos y hagamos una predicción. En el pronóstico del tiempo para más de 10 días, se utiliza un enfoque similar.



Cuando es importante que los últimos valores de la fila aporten más peso, introducimos los coeficientes dependiendo de la lejanía de la fecha, obteniendo un modelo ponderado:



Por lo tanto, puede establecer el coeficiente W para que el peso máximo caiga en los últimos 2 días y la entrada.

Factores cíclicos

La calidad de las recomendaciones puede verse afectada por factores cíclicos, como la coincidencia con el día de la semana, la fecha, las vacaciones anteriores, etc.


Fig. 1. Un ejemplo de la descomposición de una serie temporal en una tendencia, un componente estacional y ruido

El suavizado exponencial es una solución a la consideración de los factores cíclicos.

Considere 3 enfoques básicos

1. Alisado simple (modelo marrón)


Es un cálculo del promedio ponderado de los últimos 2 elementos de la serie.

2. Doble anti-aliasing (modelo Holt)


Tiene en cuenta el cambio de tendencia y las fluctuaciones en los valores residuales en torno a esta tendencia.



Calculamos la predicción de cambios en los residuos ® y la tendencia (d). El valor final de y es la suma de estas dos cantidades.

3. Triple suavizado (modelo Holt-Winters)


El suavizado triple también tiene en cuenta las fluctuaciones estacionales.



Fórmulas de suavizado triple.

Algoritmo ARIMA y SARIMA


Una característica de la serie temporal para el uso de ARIMA es la conexión de valores pasados ​​relacionados con el presente y el futuro.

SARIMA es una extensión para series estacionales. SARIMAX es una extensión que incluye un componente de regresión externo.

Los modelos ARIMA le permiten simular series de tiempo integradas o diferenciales estacionarias.

El enfoque de ARIMA para las series de tiempo es que la estacionariedad de la serie se evalúa primero.

A continuación, la serie se transforma tomando la diferencia del orden correspondiente y ya se está construyendo algún modelo ARMA para el modelo transformado.

ARMA es un modelo lineal de regresión múltiple.

Es importante que la fila sea estacionaria, es decir la media y la varianza no cambiaron. Si la serie es inestable, debe reducirse a una forma estacionaria.

XGBoost: donde sin él


Si una serie no tiene una estructura interna pronunciada, pero hay factores externos que influyen (administrador, clima, etc.), entonces puede usar de forma segura modelos de aprendizaje automático como impulso, bosques aleatorios, regresión, redes neuronales y SVM.

Según la experiencia del equipo DATA4 , las series temporales de pronóstico son una de las principales tareas para resolver la optimización de los costos de almacén, los costos de personal, la optimización del mantenimiento de las redes ATM, la logística y los sistemas de recomendación de edificios. Los modelos sofisticados como SARIMA ofrecen resultados de alta calidad, pero requieren mucho tiempo y son adecuados solo para una determinada gama de tareas.

En el próximo artículo, consideraremos los principales enfoques para la búsqueda de anomalías.

Para que los artículos sean relevantes para sus intereses, complete la encuesta a continuación o escriba en los comentarios sobre qué temas escribir los siguientes artículos.

Source: https://habr.com/ru/post/477206/


All Articles