Forscher am Sberbank AI Laboratory - über Data Science und RnD-Aufgaben



Neuronale Netze unterhalten nicht nur Prisma und FindFace. Maschinelles Lernen und Big Data sind heute in der Lage, echte Geschäftsprobleme zu lösen. Dmitry Babaev, ehemaliger Leiter der Abteilung Data Science bei MTS, Entwickler des Algorithmus zum Ausfüllen von Abfragen in der Yandex-Suchmaschine, kennt sich mit neuen Technologien im B2B-Bereich aus.

Jetzt arbeitet er als Forscher im Labor für künstliche Intelligenz in der Sberbank. Leider sind die meisten Entwicklungen der Bank ein Geschäftsgeheimnis, aber der Spezialist erzählte eifrig von allem, was zulässig war.

Interviewer: Daria Kozlova
Befragter: Dmitry Babaev

Welche russischen Unternehmen haben ein eigenes KI-Labor und Big Data?

In Russland haben nur wenige Unternehmen ähnliche Labors, da dies größtenteils eine akademische Geschichte ist. Yandex hat definitiv eine Forschungseinheit. Sie sind auch in ausländischen Unternehmen erhältlich - zum Beispiel bei Google, Microsoft, Facebook. Große und einige mittelständische Unternehmen haben Data Science-Abteilungen, aber sie widmen der theoretischen Forschung normalerweise nicht viel Aufmerksamkeit.

Welche Aufgaben versuchen sie zu lösen?

Die Abteilungen von Data Science befassen sich mit den Herausforderungen, die Unternehmen benötigen. Bevor sie eine Aufgabe übernehmen, bewerten sie die wirtschaftlichen Auswirkungen ihrer Umsetzung, auf deren Grundlage sie entscheiden, ob sie etwas tun oder nicht. In Forschungsabteilungen ist dies jedoch einfacher - der potenzielle Nutzen der Lösung von Forschungsproblemen wird bereits als recht hoch angesehen.

Wirst du einige Beispiele geben?

Die übliche Aufgabe von Data Science zeigt ein Beispiel aus dem Bereich Telekommunikation: Menschen zu finden, die sich für den neuen Tarif interessieren. Ein weiteres Beispiel: Optimierung des Warensortiments in Einzelhandelsketten. Oft schaffen es Unternehmen, sehr große Mengen einzusparen, indem sie einfach das richtige Sortiment in die richtigen Geschäfte bringen, z. B. teure Waren in das Geschäft schicken, in dem sie gekauft werden, und nicht in das Geschäft, in dem sie Staub in den Regalen sammeln.

Forschungsaufgaben können anders aussehen. Ein Beispiel für eine solche Aufgabe ist zu verstehen, warum ein neuronales Netzwerk die eine oder andere Prognose liefert - für die eine oder andere Eingabedaten. Im Allgemeinen sind die RnD-Aufgaben jedoch sehr unterschiedlich.

Welche Beträge werden in Entwicklungen im Zusammenhang mit KI und maschinellem Lernen investiert?

Kommt auf das Unternehmen an. In großen Unternehmen sind sie bereit, mehr Geld dafür auszugeben, in kleinen weniger. In der Telekommunikation benötigt nach meinen Beobachtungen ein großes Projekt, bei dem das Datenvolumen Hunderte von Terabyte beträgt, zehn bis Hunderte Millionen Rubel. Auf der anderen Seite sind der Perfektion keine Grenzen gesetzt (Lächeln - ca. Ed.) .

Bei Yandex haben Sie einen Mechanismus zur automatischen Vervollständigung von Suchanfragen entwickelt. Kann dies als neuronale Netzwerktechnologie angesehen werden? Wie funktioniert der Algorithmus?

Nein, es war ein klassischer Ansatz für maschinelles Lernen (ML), der auf Statistiken zu Suchanfragen basiert. Abhängig vom eingegebenen Start der Abfrage und typischen Benutzerabfragen wurden die am besten geeigneten Optionen für das automatische Hinzufügen der häufigsten Suchanfragen aus der Datenbank ausgewählt. Dies war vor neuronalen Netzen, als alle sie als Sackgasse betrachteten. Dann waren sie den Algorithmen der klassischen ML noch unterlegen.

Erzählen Sie uns von den wichtigsten russischen Errungenschaften auf dem Gebiet der KI.

Das bekannteste Beispiel ist Prisma. Das Unternehmen ist nicht in Russland registriert, aber das Rückgrat des Staates sind inländische Spezialisten. Die Wissenschaftler, die die in Prisma verwendete Bildverarbeitungsmethode entwickelt haben, stammen übrigens auch aus Russland (Victor Lempitskys Gruppe).

Bei Yandex stehen KI-Algorithmen im Mittelpunkt der Rangfolge der Suchergebnisse. Der Ranking-Algorithmus für die Nähe des Abfragetextes und der Site unter Verwendung des neuronalen Netzwerks heißt Palekh.

Ein weiteres bekanntes Beispiel ist FindFace von NTechLab. Dies sind Demonstrationen der Funktionsweise ihres Gesichtserkennungsalgorithmus, den sie als kommerzielles Produkt verkauft.

Auf dem Weltmarkt sind auch russische Unternehmen bekannt, die sich mit Sprachtechnologien beschäftigen, beispielsweise das Center for Speech Technologies.

In der Sberbank wird übrigens seit mehreren Jahren die Technologie der Gesichtsbiometrie eines der russischen Unternehmen eingesetzt. Es wird zur Bekämpfung von Identitätsdiebstahl bei Privatkrediten eingesetzt. Das Labor beschäftigt die Personen, die an diesem Projekt teilgenommen haben.

Der Übergang zu neuen Technologien erfordert den Austausch von Hardware und Software, die der Endbenutzer in Form von Netzwerkfehlern und -fehlern für sich empfindet. Wie kann die Übergangsphase für den Kunden so unauffällig wie möglich durchgeführt werden?

Tatsächlich ist dies eine klassische Aufgabe in der Entwicklung, die sie schon lange lösen konnten. Eine Methode ist das Testen. Vor der Einführung der neuen Version wird diese lange getestet: Sie überprüfen die Grenzfälle sowie die Frage, ob die Software der erforderlichen Belastung standhält, und öffnen dann die neue Version für eine kleine Gruppe von Benutzern. In diesem Fall leidet der kleinste Prozentsatz der Benutzer, wenn etwas schief geht.

Ist AI in der Lage, Fehler und Abstürze im System unabhängig zu beheben?

Es gibt Algorithmen, die nur für solche Situationen entwickelt wurden. Ihre Aufgabe ist es jedoch nicht, den Fehler zu erkennen oder zu beheben, sondern vorherzusagen, dass er bald eintreten wird - um abnormale Muster im System zu erkennen. Normalerweise gibt es in einem komplexen System viele Indikatoren dafür, in welchem ​​Zustand es sich gerade befindet. Nachdem künstliche Intelligenz ein abnormales Muster entdeckt hat, kann sie eine Nachricht an Administratoren senden: Es läuft etwas schief - schauen Sie, was - es muss etwas getan werden. Wenn beispielsweise die Last zugenommen hat, müssen Leerlaufkapazitäten hinzugefügt werden, damit das System dieser Belastung standhält.

Heute hat KI einen Beobachtungscharakter und eine Erkennungsfunktion „im Voraus“ (zum Beispiel zwei Stunden). Aber um das Problem zu beheben, wird immer noch eine Person benötigt.

Woran arbeiten sie gerade im Labor der AI Sberbank?

Das Sberbank AI Laboratory wurde gegründet, um die AI-Kompetenz in der Organisation zu entwickeln. Mit dem Aufkommen effektiver Lehrmethoden für tiefe neuronale Netze hat dieser Bereich große Fortschritte gemacht. Große Unternehmen brauchen Menschen, die sich mit neuen KI-Technologien auskennen, um mit dem schnellen Fortschritt Schritt zu halten. Es ist auch wichtig zu verstehen, in welchen Bereichen KI sinnvoll ist, um Aufwand und Geld zu investieren. Das Labor wird Ihnen dabei helfen, dies herauszufinden.

Eine weitere wichtige Aufgabe des Labors ist die eigene Forschung in diesem Bereich sowie die Schaffung neuer Technologien, die der Bank zugute kommen. Natürlich betreiben wir Forschung, die bei der Bank angewendet werden kann, versuchen aber auch sicherzustellen, dass unsere Ergebnisse nicht nur im Finanzbereich nützlich sind. Zum Beispiel interessiert uns die Richtung der Zeitreihenanalyse; Im Bankwesen gibt es viele Daten mit einer solchen Struktur (Transaktions- und andere). Von den Arbeiten mit einer größeren wissenschaftlichen Komponente kann man sich an die Forschung zur Schaffung neuer Methoden zur Interpretation der Ergebnisse der Arbeit des neuronalen Netzwerks erinnern.

Mit wem arbeitet die Sberbank zusammen?

Die Bank arbeitet mit mehreren Universitäten zusammen: dem Moskauer Institut für Physik und Technologie, der HSE und der Moskauer Staatlichen Universität. Jetzt hören wir iPavlov, ein gemeinsames Projekt mit MIPT. Dies ist ein Projekt zur Entwicklung von Dialogsystemen für die Kommunikation mit einem Computer in einer natürlichen Sprache. Es gibt auch sehr interessante Aktivitäten mit anderen Universitäten, von der Lösung komplexer Optimierungsprobleme bis hin zu grundlegenden Entwicklungen zur Verbesserung von Deep-Learning-Algorithmen. Es gibt noch viele Aktivitäten zum Lernen und Fördern von Wissen - zum Beispiel KI-Vorlesungen für Studenten.

Was ist die Spezifität von Sberbank AI-Algorithmen?

Es gibt einen klassischen Bankbereich. Das Scoring ist beispielsweise eine Beurteilung der Kreditwürdigkeit eines Kunden. In allen Ländern wird es von den Zentralbanken reguliert und basiert daher weitgehend auf gut interpretierten Methoden - logistische Regression und Entscheidungsbäume. Diese klassischen Methoden sind zuverlässig und stabil. Wir hoffen, dass die Regulierungsbehörde in Zukunft die Anwendung komplexerer Methoden zulässt. Dazu muss nachgewiesen werden, dass die neuen Methoden zuverlässig genug sind.

Im AI-Labor der Sberbank beschäftigen wir uns mit komplexeren Methoden, hauptsächlich tiefen neuronalen Netzen und AI-Algorithmen für banktypische Daten. Eine typische Art von Daten für Banken ist eine Zeitreihe: zum Beispiel der Preis eines Produkts (Preis gestern, vorgestern usw.).

Am 19. April werden Sie als Redner auf der AI-Konferenz sprechen. Was erzählen Sie den Besuchern?

In den letzten Jahren haben Deep-Learning-Methoden enorme Erfolge gezeigt. Sie lösen bereits Probleme, vor denen sie Angst hatten. Zum Beispiel haben sie ein Niveau menschlicher Qualität bei Sprache-zu-Text und Text-zu-Sprache bei der Bilderkennung erreicht. Aber sie haben ihre eigenen Einschränkungen, die sie daran hindern, weiterzumachen. Ich möchte darüber sowie über Ansätze sprechen, aufgrund derer sie möglicherweise umgangen werden können. In vielerlei Hinsicht ist dies immer noch ein Forschungsbereich und keine fertige Lösung für den Einsatz in der täglichen Arbeit. Es gibt jedoch vernünftige Erwartungen für die Zukunft mit noch effektiveren KI-Technologien.

Source: https://habr.com/ru/post/de411431/


All Articles