Der Artikel beschreibt den Umfang der Zeitreihen, die zu lösenden Aufgaben und die verwendeten Algorithmen. Die Zeitreihenprognose wird bei Aufgaben wie der Bedarfsprognose, der Belastung des Contact Centers, des Straßen- und Internetverkehrs, der Lösung des Kaltstartproblems in Empfehlungssystemen und der Suche nach Anomalien im Verhalten von Geräten und Benutzern verwendet.
Lassen Sie uns die Aufgaben genauer betrachten.

1) Bedarfsprognose.
Zweck: Reduzierung der Lagerkosten und Optimierung der Arbeitszeiten der Mitarbeiter.
Lösung: Mit einer Prognose der Warenkäufe und der Anzahl der Kunden minimieren wir die Warenmenge im Lager und lagern genau so viel, wie sie in einem bestimmten Zeitraum kaufen. Da wir die Anzahl der Kunden zu jedem Zeitpunkt kennen, werden wir einen optimalen Arbeitsplan aufstellen, damit bei einem Minimum an Kosten genügend Personal zur Verfügung steht.
2) Vorhersage der Belastung des Lieferservices
Zweck: Verhinderung des Zusammenbruchs der Logistik bei Spitzenlasten.
Lösung: Vorhersagen der Anzahl der Bestellungen, Bringen Sie die optimale Anzahl von Autos und Kurieren auf die Linie.
3) Prognose der Belastung des Contact Centers
Zweck: zu minimalen Kosten der Lohnkasse, um die erforderliche Verfügbarkeit eines Contact Centers sicherzustellen.
Lösung: Wenn Sie die Anzahl der Anrufe im Laufe der Zeit vorhersagen, erstellen wir den optimalen Zeitplan für die Betreiber.
4) Verkehrsprognosen
Zweck: Vorhersage der Anzahl der Server und der Bandbreite für einen nachhaltigen Betrieb. Damit Ihr Service nicht auf den Tag der Premiere einer beliebten Serie oder eines Fußballspiels fällt;)
5) Vorhersage des optimalen Zeitpunkts von Geldautomaten
Zweck: Minimierung der im Geldautomaten-Netzwerk gespeicherten Bargeldmenge
6) Kaltstartlösungen in Empfehlungssystemen
Zweck: Neuen Benutzern relevante Produkte empfehlen.
Wenn ein Benutzer mehrere Käufe getätigt hat, kann ein kollaborativer Filteralgorithmus für Empfehlungen erstellt werden. Wenn jedoch keine Benutzerinformationen vorhanden sind, empfiehlt es sich, die beliebtesten Produkte zu empfehlen.
Lösung: Die Beliebtheit von Produkten hängt von der Zeit ab, zu der die Empfehlung abgegeben wird. Mithilfe von Zeitreihenprognosen können relevante Produkte zu einem bestimmten Zeitpunkt identifiziert werden.
In einem
früheren Artikel wurden Life-Hacks für den Bau von Empfehlungssystemen erörtert.
7) Suche nach Anomalien
Zweck: Identifizierung von Problemen beim Betrieb von Geräten und nicht standardmäßigen Situationen in der Geschäftswelt
Lösung: Wenn der gemessene Wert aus dem Konfidenzintervall der Prognose herausgeschlagen wird, wird eine Anomalie erkannt. Wenn dies ein Atomkraftwerk ist, ist es Zeit, das Quadrat der Entfernung zu vergrößern;)
Algorithmen zur Lösung des Problems
1) gleitender Durchschnitt
Der einfachste Algorithmus ist der gleitende Durchschnitt. Lassen Sie uns den Durchschnitt der letzten Elemente berechnen und eine Vorhersage treffen. In der Wettervorhersage für mehr als 10 Tage wird ein ähnlicher Ansatz verwendet.

Wenn es wichtig ist, dass die letzten Werte in der Zeile mehr Gewicht beisteuern, führen wir die Koeffizienten in Abhängigkeit von der Entfernung des Datums ein und erhalten ein gewichtetes Modell:

Sie können also den Koeffizienten W so einstellen, dass das Maximalgewicht auf die letzten 2 Tage und die Eingabe fällt.
Zyklische FaktorenDie Qualität der Empfehlungen kann durch zyklische Faktoren beeinflusst werden, z. B. Übereinstimmung mit dem Wochentag, dem Datum vor den Feiertagen usw.
Abb. 1. Ein Beispiel für die Zerlegung einer Zeitreihe in einen Trend, eine saisonale Komponente und ein Rauschen
Die exponentielle Glättung ist eine Lösung für die Berücksichtigung zyklischer Faktoren.
Betrachten Sie drei grundlegende Ansätze
1. Einfaches Glätten (braunes Modell)
Es ist eine Berechnung des gewichteten Durchschnitts für die letzten 2 Elemente der Serie.
2. Double Anti-Aliasing (Holt-Modell)
Berücksichtigt die Trendänderung und Schwankungen der Restwerte rund um diesen Trend.

Wir berechnen die Vorhersage von Änderungen der Residuen ® und des Trends (d). Der Endwert von y ist die Summe dieser beiden Größen.
3. Dreifache Glättung (Holt-Winters-Modell)
Die Dreifachglättung berücksichtigt zusätzlich saisonale Schwankungen.

Dreifache Glättungsformeln.
ARIMA- und SARIMA-Algorithmus
Ein Merkmal der Zeitreihe für die Verwendung von ARIMA ist die Verknüpfung von Vergangenheitswerten in Bezug auf Gegenwart und Zukunft.
SARIMA ist eine Erweiterung für saisonale Serien. SARIMAX ist eine Erweiterung, die eine externe Regressionskomponente enthält.
Mit ARIMA-Modellen können Sie integrierte oder differentiell-stationäre Zeitreihen simulieren.
ARIMAs Herangehensweise an die Zeitreihe besteht darin, dass die Stationarität der Reihe zuerst bewertet wird.
Als nächstes wird die Reihe transformiert, indem die Differenz der entsprechenden Reihenfolge genommen wird, und es wird bereits ein ARMA-Modell für das transformierte Modell konstruiert.
ARMA ist ein lineares multiples Regressionsmodell.
Es ist wichtig, dass die Reihe stationär ist, d.h. der Mittelwert und die Varianz änderten sich nicht. Wenn die Reihe instabil ist, sollte sie auf eine stationäre Form reduziert werden.
XGBoost - wo ohne
Wenn eine Reihe keine interne ausgeprägte Struktur aufweist, aber externe Einflussfaktoren (Manager, Wetter usw.) vorliegen, können Sie maschinelle Lernmodelle wie Boosting, Zufallswälder, Regression, neuronale Netze und SVM sicher verwenden.
Nach den Erfahrungen des
DATA4- Teams ist die Vorhersage von Zeitreihen eine der Hauptaufgaben bei der Lösung der Optimierung von Lagerkosten, Personalkosten, der Optimierung der Wartung von ATM-Netzen, Logistik- und Gebäudeempfehlungssystemen. Anspruchsvolle Modelle wie SARIMA liefern qualitativ hochwertige Ergebnisse, sind jedoch zeitaufwändig und nur für bestimmte Aufgabenbereiche geeignet.
Im nächsten Artikel werden wir die Hauptansätze für die Suche nach Anomalien betrachten.
Nehmen Sie an der folgenden Umfrage teil, oder geben Sie in den Kommentaren an, zu welchen Themen die folgenden Artikel verfasst werden sollen, damit die Artikel für Ihre Interessen relevant sind.