Séries chronologiques dans la prévision de la demande, la charge sur les CC, les recommandations de produits et la recherche d'anomalies

L'article discute de l'étendue des séries chronologiques, des tâches à résoudre et des algorithmes utilisés. La prévision de séries chronologiques est utilisée dans des tâches telles que la prévision de la demande, la charge sur le centre de contact, le trafic routier et Internet, la résolution du problème de démarrage à froid dans les systèmes de recommandation et la recherche d'anomalies dans le comportement des équipements et des utilisateurs.

Examinons les tâches plus en détail.



1) Prévision de la demande.


Objectif: réduire les coûts d'entrepôt et optimiser les horaires de travail du personnel.

Comment résoudre ce problème: en ayant une prévision des achats de marchandises et du nombre de clients, nous minimisons la quantité de marchandises dans l'entrepôt et stockons exactement autant qu'ils achètent dans un intervalle de temps donné. Connaissant le nombre de clients à chaque instant, nous établirons un horaire de travail optimal afin qu'avec un minimum de coûts, il y ait un nombre suffisant de personnel.

2) Prévision de la charge sur le service de livraison


Objectif: empêcher l'effondrement de la logistique aux pointes de charge.

Comment résoudre: prévoir le nombre de commandes, amener le nombre optimal de voitures et de coursiers à la ligne.

3) Prévision de la charge sur le centre de contact


Objet: à un coût minimum de la caisse salariale pour assurer la disponibilité requise d'un centre de contact.

Comment résoudre: en prédisant le nombre d'appels dans le temps, nous ferons le planning optimal pour les opérateurs.

4) prévisions de trafic


Objectif: prédire le nombre de serveurs et la bande passante pour un fonctionnement durable. Pour que votre service ne tombe pas le jour de la première d'une série ou d'un match de football populaire;)

5) Prévision de l'heure optimale des distributeurs automatiques de billets


Objectif: minimiser le montant d'argent stocké dans le réseau ATM

6) Solutions de démarrage à froid dans les systèmes de recommandation


Objectif: recommander des produits pertinents aux nouveaux utilisateurs.

Lorsqu'un utilisateur a effectué plusieurs achats, un algorithme de filtrage collaboratif peut être créé pour les recommandations, mais lorsqu'il n'y a pas d'informations sur l'utilisateur, il est optimal de recommander les produits les plus populaires.

Solution: La popularité des produits dépend du moment où la recommandation est faite. L'utilisation de prévisions chronologiques permet d'identifier les produits pertinents à tout moment.

Les hacks de vie pour la construction de systèmes de recommandation ont été discutés dans un article précédent .

7) Recherche d'anomalies


Objectif: identifier les problèmes de fonctionnement des équipements et les situations atypiques en entreprise
Solution: si la valeur mesurée est éliminée de l'intervalle de confiance de la prévision, une anomalie est détectée. S'il s'agit d'une centrale nucléaire, il est temps d'augmenter le carré de la distance;)

Algorithmes pour résoudre le problème


1) Moyenne mobile


L'algorithme le plus simple est la moyenne mobile. Calculons la moyenne des derniers éléments et faisons une prédiction. Dans les prévisions météorologiques à plus de 10 jours, une approche similaire est utilisée.



Lorsqu'il est important que les dernières valeurs de la ligne apportent plus de poids, nous introduisons les coefficients en fonction de l'éloignement de la date, en obtenant un modèle pondéré:



Ainsi, vous pouvez définir le coefficient W de sorte que le poids maximum tombe sur les 2 derniers jours et l'entrée.

Facteurs cycliques

La qualité des recommandations peut être affectée par des facteurs cycliques, tels que la coïncidence avec le jour de la semaine, la date, précédant les vacances, etc.


Fig. 1. Un exemple de décomposition d'une série chronologique en une tendance, une composante saisonnière et le bruit

Le lissage exponentiel est une solution à la prise en compte des facteurs cycliques.

Considérez 3 approches de base

1. Lissage simple (modèle marron)


Il s'agit d'un calcul de la moyenne pondérée pour les 2 derniers éléments de la série.

2. Double anticrénelage (modèle Holt)


Tient compte du changement de tendance et des fluctuations des valeurs résiduelles autour de cette tendance.



Nous calculons la prédiction des changements dans les résidus ® et la tendance (d). La valeur finale de y est la somme de ces deux quantités.

3. Triple lissage (modèle Holt-Winters)


Le triple lissage tient également compte des fluctuations saisonnières.



Formules à triple lissage.

Algorithme ARIMA et SARIMA


Une caractéristique de la série chronologique pour l'utilisation d'ARIMA est la connexion des valeurs passées liées au présent et au futur.

SARIMA est une extension pour les séries saisonnières. SARIMAX est une extension qui comprend un composant de régression externe.

Les modèles ARIMA vous permettent de simuler des séries temporelles intégrées ou différentielles stationnaires.

L'approche d'ARIMA pour la série chronologique est que la stationnarité de la série est évaluée en premier.

Ensuite, la série est transformée en prenant la différence de l'ordre correspondant et un modèle ARMA est déjà en cours de construction pour le modèle transformé.

ARMA est un modèle de régression multiple linéaire.

Il est important que la rangée soit immobile, c'est-à-dire la moyenne et la variance n'ont pas changé. Si la série est instable, elle doit être réduite à une forme stationnaire.

XGBoost - où sans lui


Si une série n'a pas de structure interne prononcée, mais qu'il existe des facteurs d'influence externes (gestionnaire, météo, etc.), nous pouvons utiliser en toute sécurité des modèles d'apprentissage automatique tels que le boosting, les forêts aléatoires, la régression, les réseaux de neurones et la SVM.

D'après l'expérience de l'équipe DATA4 , la prévision des séries chronologiques est l'une des principales tâches pour résoudre l'optimisation des coûts d'entrepôt, les coûts de personnel, l'optimisation de la maintenance des réseaux ATM, la logistique et les systèmes de recommandation de construction. Des modèles sophistiqués tels que SARIMA donnent des résultats de haute qualité, mais prennent du temps et ne conviennent qu'à une certaine gamme de tâches.

Dans le prochain article, nous considérerons les principales approches de la recherche d'anomalies.

Pour que les articles correspondent à vos intérêts, répondez à l'enquête ci-dessous ou écrivez dans les commentaires sur quels sujets écrire les articles suivants.

Source: https://habr.com/ru/post/fr477206/


All Articles