In der Netologie erschien die Richtung der Datenwissenschaft im Jahr 2016. Als wir anfingen, gab es Befürchtungen: Das Feld war neu, die Nachfrage nach Wissenschaftlerdaten für die Unternehmen war anständig, aber es gab nicht viele Leute, die in die Sphäre eintreten wollten, und es gab auch viele kostenlose englischsprachige Ressourcen für das Selbststudium im Netzwerk, also gingen wir Risiken ein.
Aber heute gibt es bereits 10 Kurse in verschiedenen Spezialisierungen im Umgang mit Daten, und die Zahl der Absolventen beträgt mehr als 800. Wir haben uns entschlossen, einen dieser Absolventen nach seiner Arbeit mit Daten zu fragen, wie er auf das Gebiet gekommen ist und wie sich maschinelles Lernen entwickelt Loco Bank und welche Art von Leuten er in seinem Team sucht.
Vyacheslav Potapov, Leiter Datenanalyse und maschinelles Lernen bei der Loko Bank und Absolvent des Data Scientist- Kurses :
Ich habe an der Moskauer Staatlichen Technischen Universität studiert. Bauman in der Spezialität "Raumschiff" und Oberstufe im Jahr 2011. Danach arbeitete er 7 Jahre an verschiedenen Orten als Analyst, Datenbankentwickler und Lagerarchitekt. Während dieser Zeit habe ich viel über Datenverarbeitung und -speicherung gelernt, aber irgendwann wollte ich mich mehr mit Analysen befassen - um zu verstehen, was all diese Zahlen bedeuten, was ich speichere und verarbeite.
Ich begann nach Wachstumsrichtungen zu suchen: Ich studierte verwandte Positionen in der IT, untersuchte, wie hoch die Gehälter in der Branche sind und was mehr gefragt ist. Es gab viele Artikel über Habr und Videos auf Youtube. In gewissem Maße haben sie mir geholfen, die Essenz der Arbeit mit Daten zu verstehen und zu verstehen, wie meine damals vorhandenen Fähigkeiten nützlich sein könnten.
Dann traf ich mich mit Data Science (DS) und Machine Learning (ML), aber die grundlegende Grundlage reichte nicht aus. Das Feld ist sehr breit und wenn Sie sich einige Videos oder Artikel ansehen, erhalten Sie nur fragmentarisches Wissen, aber im Allgemeinen gibt es kein Verständnis dafür, was das Wesentliche der Spezialität ist, welche Anweisungen, Methoden und Werkzeuge es gibt. So liest man ein dickes Lehrbuch über Mathematik für Universitäten, aber ohne Erklärung und Übung wird es schwierig sein, die gewonnenen Kenntnisse anzuwenden.
Ein Kollege erzählte mir von Netologiya, wo es ein großes Vollzeitprogramm in Data Science gab, und ich traf auf dem russischsprachigen Markt nicht auf solche geeigneten Angebote. Infolgedessen verlernte und verteidigte er erfolgreich seine These zum Thema „Bilderkennung mit neuronalen Netzen“. Wie ich mich jetzt erinnere, war es sehr schwierig, ich hatte nicht die Praxis, vollwertige Aufgaben zu lösen, und ich wollte wirklich nicht nur eine pädagogische Arbeit machen, sondern ein voll funktionsfähiges Projekt.
Parallel zu seinem Studium versuchte er, Probleme mit Kaggle zu lösen und Arbeitsprojekte durchzuführen.
Und gleich nach dem Kurs suchte ich nach einem Ort, an dem ich mich voll und ganz mit Datenanalysen befassen konnte, da es schwierig ist, die Arbeit des BI-Systemarchitekten und die Praxis in DS zu kombinieren.
Nach einer Reihe von Interviews entschied er sich für die Loko-Bank und die Leitung von DS.
Es scheint mir, dass Data Science als Analogon des Forschungsinstituts Vertrauen, Geduld und Verständnis für die Perspektiven des Managements benötigt.
In der Loko-Bank sahen sie diese Aussichten - also begann ich im Digital Business Block zu arbeiten, der die Richtung der Analytik entwickelt.
Was Analysten und Data Scientist bei der Loko Bank tun
Jetzt verfügt die Bank über eine klassische IT-Abteilung, die für die Infrastruktur und die Datenspeicherung verantwortlich ist. Andere Abteilungen verwenden diese Datenquellen und legen Anforderungen für die Integration neuer fest. Insgesamt arbeiten im Unternehmen rund 40 Mitarbeiter mit Analytics.
Bei der Loko Bank werden Prozessautomatisierung, Datenanalyse und Aufbau einer datengetriebenen Wirtschaft zu den Prioritäten des Unternehmens. Ich hoffe, dass wir auf der Grundlage der Informationen in der Lage sein werden, Verkäufe korrekter aufzubauen, Risikobewertungen durchzuführen und das gesamte Unternehmen.
In der Geschäftseinheit ist die Arbeit mit Analytics in zwei Bereiche unterteilt: Classic Analytics - BI, dessen Spezialisten die geplanten und tatsächlichen Indikatoren des Unternehmens analysieren, Berichte über Umsatz, Salden, Einnahmen und Ausgaben sowie die ML-Richtung erstellen.
Maschinelles Lernen konzentriert sich auf die Erstellung von Algorithmen, die Vorhersagen auf der Grundlage von Beweisen klassischer Analysten treffen, neue Daten generieren und nach versteckten Abhängigkeiten und Anomalien suchen. Dies ist die Abteilung, für die ich verantwortlich bin.
ML in der Bank beginnt sich gerade zu entwickeln. Aber ich habe das Ziel, ein System aufzubauen, das dem Unternehmen hilft und es Ihnen ermöglicht, alle modernen Ansätze zu nutzen, um den Umsatz zu steigern und die Kosten zu senken. Wir müssen die Geschäftsprozesse komplett ändern und nach Möglichkeiten suchen, Tools für maschinelles Lernen in die vorhandene IT-Architektur zu implementieren. Dies kann schwierig sein, da die Architektur gestern nicht entworfen wurde und einige der Anforderungen einfach nicht darin festgelegt wurden.
Zum Beispiel Anforderungen zum Sammeln von Protokollen, damit Kunden eine mobile Bank betreten können. Für die klassische Analytik werden sie nicht benötigt, daher wurden sie nie gesammelt oder gespeichert. Ich erklärte, dass wir anhand dieser Protokolle das Modell trainieren können, um Vorhersagen über die Plattformlast zu treffen und den Zusammenhang zwischen der Nutzung einer mobilen Bank und der Rentabilität des Kunden zu erkennen. Und wenn es nicht die Entwicklung von ML gäbe, gäbe es solche Analysen einfach nicht, weil sich niemand mit diesem Problem befassen würde. Was benötigt wurde, war ein Leitfaden, der erklärte, warum und warum, Anweisungen gab, wie Architektur erstellt wurde, wie Daten gesammelt wurden, wie Modelle erstellt wurden und wo sie angewendet wurden.
Mit der Einführung des maschinellen Lernens möchte ich eine Kultur der Arbeit mit Daten in der gesamten Bank aufbauen: deren Erfassung, Verarbeitung sowie die Integration neuer Quellen. Gleichzeitig lösen wir bereits die Aufgaben der Predictive Analytics für Kunden, wir beschäftigen uns mit deren Segmentierung, um dann die Tarife zu optimieren und den Umsatz des Unternehmens zu steigern.
Wir beschäftigen uns auch mit der Finanzüberwachung und analysieren verdächtige Kunden und Transaktionen. Jetzt gibt das Unternehmen eine enorme Menge an personellen und finanziellen Ressourcen für diese Aufgabe aus. Und wir wollen diese Prozesse vereinfachen und effizienter gestalten.
Wenn wir darüber sprechen, was bereits getan wurde, haben wir begonnen, Daten zu sammeln und zu speichern, insbesondere Benutzerprotokolle, über die ich oben geschrieben habe. Jetzt speichern wir Informationen zur Änderungshistorie der Kundenkarte im Bundessteuerdienst.
Derzeit entwickeln wir ein Modell zur Ermittlung des negativen Verhaltens von Kunden (juristische Personen und Einzelunternehmer) und haben bereits erste gute Ergebnisse erzielt. Die Punktzahl für eine der beliebtesten Metriken beträgt 0,86. Von den Algorithmen verwenden wir die Gradientenverstärkung. In naher Zukunft planen wir, Stabilität in seiner Arbeit zu erreichen, auch durch den Anschluss zusätzlicher Quellen. Dieses Modell soll dazu beitragen, Unternehmensrisiken zu reduzieren und die Kosten für die Suche nach unehrlichen Kunden zu optimieren.
Welche Spezialisten werden für die ML-Leitung benötigt?
Unser Team wird erst gebildet, also versuche ich jetzt, die Generalisten zu nehmen. Natürlich mag eine Person eher dazu neigen, Geschäftsanalysen zu entwickeln oder umgekehrt, aber dennoch muss sie den Prozess der Erstellung einer Lösung als Ganzes verstehen und ihre Rolle darin verstehen. Dies ist eine gute Option für diejenigen, die sich in verschiedenen Rollen versuchen möchten.
Es ist wichtig, dass eine Person weiß, wie man echte praktische Probleme löst, und zumindest den Ansatz und die Schritte erklären kann. Bei den Interviews versuche ich, logische Probleme zu geben, und ich bitte um ein allgemeines Verständnis von Algorithmen und Techniken ohne Mathematik.
Da ich selbst Ingenieur bin, versuche ich, Leute mit einem technischen Hintergrund in meinem Team zu suchen, obwohl dies kein Tabu ist. Ich kenne Beispiele, als Menschen ohne technische Ausbildung in den Beruf kamen.
Das Erstellen einer ML-Lösung ist keine triviale Aufgabe. Es reicht also nicht aus, nur alle Daten zu übernehmen, sie in den Algorithmus zu werfen und auf ein Wunder zu warten. Sie müssen in der Lage sein, in den Themenbereich einzutauchen, zu kommunizieren, zu fragen und zuzuhören. Irgendwo können sich diese Fähigkeiten als noch wertvoller als technische herausstellen.
Insbesondere interessiert sich die Abteilung jetzt hauptsächlich für Big Data-Ingenieure. Neuronale Netze und xgboosts sind gut, aber zuerst müssen Sie Spezialisten finden, die die richtigen, vorbereiteten Daten in großen Mengen sammeln können. Ohne sie wird kein maschinelles Lernen funktionieren. Ich brauche mindestens zwei Leute in diese Richtung. Das Unternehmen hat jedoch viele Anforderungen an sie: Sie müssen ETL-Tools und SQL kennen und Erfahrung im Aufbau von Storefronts und Data Warehouses haben sowie in der Lage sein, Optimierungsprobleme zu lösen.
Es wäre auch schön, die Mitarbeiter mit zwei Analysten zu ergänzen, vorzugsweise mit Erfahrung im Bankensektor. Und obwohl Data Science Priorität hat, kann das Feld jedes sein.
Das Hauptproblem des Marktes ist der Mangel an Menschen, die die Bedürfnisse des Unternehmens in eine sinnvolle ML-Aufgabe umsetzen und manchmal proaktiv eine Lösung vorschlagen können.
Um dieses Problem zu lösen, müssen Sie das Unternehmen selbst und die vorhandenen Tools verstehen und über gute Soft Skills verfügen, um die Lösung des Problems korrekt darzustellen. Und es ist äußerst schwierig, solche zu finden.
Wo zu entwickeln
Da wir ML gerade erst in Unternehmen einführen, müssen wir eine Reihe von Entscheidungen treffen, von denen weiteres Vertrauen in den gesamten Bereich abhängen wird. Diese Entscheidungen stehen im Zusammenhang mit der Begründung für die Existenz einer Geschäftsabteilung. Maschinelles Lernen ist mittlerweile allen bekannt und daher von besonderem Interesse.
Nach der erfolgreichen Implementierung von ML-Tools in meiner Abteilung planen wir, den Aufgabenpool und das Personal von Spezialisten in der gesamten Bank zu erweitern.
Eine Bank ist in erster Linie ein großer Datenfluss, ein großer Kundenstamm und dementsprechend eine große Verantwortung.
Einerseits gibt es Kunden, die einen guten Service erhalten und ihre Daten speichern möchten, und andererseits gibt es immer Personen, die auf Speichereinrichtungen zugreifen möchten, um vertrauliche Informationen zu erhalten.
Meiner Meinung nach ist angesichts der wachsenden Arbeitsbelastung und Komplexität der Prozesse die Übertragung einiger Verantwortlichkeiten und Funktionen auf Maschinen die einzig mögliche Voraussetzung für ein stabiles Wachstum des Unternehmens.
Und wer im Bankensektor in Richtung maschinelles Lernen gehen will, muss in der Lage sein, ML-Arbeitsaufgaben in erster Linie mit den Hauptzielen der Bank zu korrelieren.
Tipps für diejenigen, die das Feld Maschinelles Lernen betreten möchten
Zunächst lohnt es sich, sich die Frage zu beantworten, was genau Sie tun möchten, und erst danach zu prüfen, was dafür erforderlich ist. DS ist ein riesiger Entwicklungsbereich, und einerseits ist es gut, andererseits kann man sehr lange wandern und nicht zu etwas Bestimmtem kommen.
Am Anfang würde ich nicht empfehlen, tief in die Mathematik einzutauchen. Konzentrieren Sie sich auf die Lösung praktischer Probleme und Werkzeuge (Bibliotheken, Methoden). Die Erfahrung mit der Entwicklung von Datenbanken, der Bereinigung und Verarbeitung von Daten sowie der ersten Analyse hat mir sehr geholfen. In der realen Arbeit ist es die Datenerfassung und -aufbereitung, die die meiste Zeit in Anspruch nimmt, und eine qualitativ hochwertige Arbeit in dieser Richtung wird die Qualität von ML-Lösungen in Zukunft erheblich verbessern.
Es ist großartig, dass wir in einer Zeit leben, in der Informationen leicht zu finden sind. Das Netzwerk bietet zahlreiche Kurse in verschiedenen Bereichen an. In regelmäßigen Abständen finden Konferenzen und Workshops statt. Aber Sie müssen verstehen, dass ML eine junge Disziplin ist, sie wird nur gebildet und es gibt keinen grundlegenden Ansatz für das Lernen. Daher müssen Entwicklungspfade sorgfältig ausgewählt werden: um verschiedene Trainingsprogramme zu studieren, um die richtigen Akzente für sich selbst zu setzen. Ich hatte Glück - ich habe einen Kurs gewählt, der meinen Anforderungen und Erwartungen entsprach und zur Entwicklung einer großen und vielversprechenden Richtung in der Loko-Bank führte.
Von den Redakteuren