O artigo discute o escopo das séries temporais, as tarefas a serem resolvidas e os algoritmos usados. A previsão de séries temporais é usada em tarefas como previsão de demanda, carga no contact center, tráfego rodoviário e na Internet, resolvendo o problema de partida a frio em sistemas de recomendação e buscando anomalias no comportamento de equipamentos e usuários.
Vamos considerar as tarefas com mais detalhes.

1) Previsão de demanda.
Objetivo: reduzir os custos do armazém e otimizar os horários de trabalho da equipe.
Como resolver: com uma previsão de compras de mercadorias e o número de clientes, minimizamos a quantidade de mercadorias no armazém e armazenamos exatamente o que compram em um determinado intervalo de tempo. Conhecendo o número de clientes a cada momento, elaboraremos um horário de trabalho ideal para que, com um mínimo de custos, haja um número suficiente de pessoal.
2) Previsão da carga no serviço de entrega
Objetivo: evitar o colapso da logística em cargas de pico.
Como resolver: prever o número de pedidos, trazer o número ideal de carros e correios para a linha.
3) Previsão da carga no contact center
Objetivo: a um custo mínimo do fundo salarial, para garantir a disponibilidade necessária de um contact center.
Como resolver: prevendo o número de chamadas ao longo do tempo, faremos o cronograma ideal para as operadoras.
4) previsão de tráfego
Objetivo: prever o número de servidores e a largura de banda para uma operação sustentável. Para que seu serviço não caia no dia da estréia de uma série popular ou partida de futebol;)
5) Previsão do horário ideal para caixas eletrônicos de cobrança
Objetivo: minimizar a quantidade de dinheiro armazenada na rede ATM
6) Soluções de arranque a frio em sistemas de recomendação
Objetivo: recomendar produtos relevantes para novos usuários.
Quando um usuário faz várias compras, um algoritmo de filtragem colaborativo pode ser criado para recomendações, mas quando não há informações do usuário, é ideal recomendar os produtos mais populares.
Solução: A popularidade dos produtos depende do momento em que a recomendação é feita. O uso da previsão de séries temporais ajuda a identificar produtos relevantes a qualquer momento.
Os hackers de vida para a construção de sistemas de recomendação foram discutidos em um
artigo anterior .
7) Procure anomalias
Objetivo: identificar problemas na operação de equipamentos e situações não padronizadas nos negócios
Solução: se o valor medido for eliminado do intervalo de confiança da previsão, uma anomalia é detectada. Se esta é uma usina nuclear, é hora de aumentar o quadrado da distância;)
Algoritmos para resolver o problema
1) Média Móvel
O algoritmo mais simples é a média móvel. Vamos calcular a média dos últimos elementos e fazer uma previsão. Na previsão do tempo por mais de 10 dias, uma abordagem semelhante é usada.

Quando é importante que os últimos valores da linha contribuam com mais peso, apresentamos os coeficientes dependendo do afastamento da data, obtendo um modelo ponderado:

Assim, você pode definir o coeficiente W para que o peso máximo caia nos últimos 2 dias e a entrada.
Fatores cíclicosA qualidade das recomendações pode ser afetada por fatores cíclicos, como coincidência com o dia da semana, a data, os feriados anteriores, etc.
Fig. 1. Um exemplo da decomposição de uma série temporal em tendência, componente sazonal e ruído
A suavização exponencial é uma solução para a consideração de fatores cíclicos.
Considere 3 abordagens básicas
1. Alisamento simples (modelo Brown)
É um cálculo da média ponderada dos 2 últimos elementos da série.
2. Anti-aliasing duplo (modelo Holt)
Leva em consideração a mudança de tendência e as flutuações nos valores residuais em torno dessa tendência.

Calculamos a previsão de mudanças nos resíduos ® e a tendência (d). O valor final de y é a soma dessas duas quantidades.
3. Alisamento triplo (modelo Holt-Winters)
A suavização tripla também leva em consideração as flutuações sazonais.

Fórmulas de suavização triplas.
Algoritmo ARIMA e SARIMA
Um recurso da série temporal para o uso do ARIMA é a conexão de valores passados relacionados ao atual e ao futuro.
SARIMA é uma extensão para séries sazonais. SARIMAX é uma extensão que inclui um componente de regressão externo.
Os modelos ARIMA permitem simular séries temporais integradas ou estacionárias diferenciais.
A abordagem do ARIMA para as séries temporais é que a estacionariedade das séries é avaliada primeiro.
Em seguida, a série é transformada tomando a diferença da ordem correspondente e algum modelo ARMA já está sendo construído para o modelo transformado.
ARMA é um modelo de regressão linear múltipla.
É importante que a linha seja estacionária, ou seja, a média e variância não mudaram. Se a série for instável, ela deverá ser reduzida para uma forma estacionária.
XGBoost - onde sem ele
Se uma série não possui uma estrutura pronunciada interna, mas existem fatores de influência externos (gerente, clima, etc.), podemos usar com segurança modelos de aprendizado de máquina, como reforço, florestas aleatórias, regressão, redes neurais e SVM.
Com a experiência da equipe
DATA4 , a previsão de séries temporais é uma das principais tarefas para solucionar a otimização dos custos de armazém, custos com pessoal, otimização da manutenção de redes ATM, sistemas de recomendação de logística e construção. Modelos sofisticados, como o SARIMA, fornecem resultados de alta qualidade, mas consomem tempo e são adequados apenas para uma determinada gama de tarefas.
No próximo artigo, consideraremos as principais abordagens para a busca de anomalias.
Para que os artigos sejam relevantes para seus interesses, faça a pesquisa abaixo ou escreva nos comentários sobre quais tópicos escrever os seguintes artigos.