
Les réseaux de neurones ne divertissent pas seulement Prisma et FindFace. Aujourd'hui, l'apprentissage automatique et le Big Data sont capables de résoudre de vrais problèmes commerciaux. Dmitry Babaev, l'ancien chef de la division Data Science chez MTS, le développeur de l'algorithme pour effectuer des requêtes dans le moteur de recherche Yandex, connaît les nouvelles technologies dans le secteur B2B.
Maintenant, il travaille comme chercheur au laboratoire d'intelligence artificielle de Sberbank. Malheureusement, la plupart des développements de la banque sont un secret commercial, mais le spécialiste a dit avec empressement tout ce qui était permis.
Intervieweuse: Daria Kozlova
Partie défenderesse: Dmitry Babaev
Quelles entreprises russes ont leur propre laboratoire d'IA et Big Data?En Russie, peu d'entreprises ont des laboratoires similaires, car il s'agit en grande partie d'une histoire académique. Yandex a définitivement une unité de recherche. Ils sont également disponibles dans des sociétés étrangères - par exemple, Google, Microsoft, Facebook. Les grandes et certaines moyennes entreprises ont des divisions de Data Science, mais elles n'accordent généralement pas beaucoup d'attention à la recherche théorique.
Quelles tâches pensez-vous qu'ils essaient de résoudre?Les divisions de Data Science répondent aux défis dont les entreprises ont besoin. Avant d'entreprendre une tâche, ils évaluent l'effet économique de sa mise en œuvre, sur la base duquel ils décident de faire ou non quelque chose. Mais dans les départements de recherche, cela est plus facile - les avantages potentiels de la résolution des problèmes de recherche sont déjà considérés comme assez élevés.
Allez-vous donner quelques exemples?La tâche habituelle de la Data Science peut être illustrée par un exemple dans le domaine des télécoms: trouver des personnes intéressées par le nouveau tarif. Autre exemple: l'optimisation de l'assortiment de produits dans les chaînes de distribution. Souvent, les entreprises parviennent à économiser de très grandes quantités en apportant simplement le bon assortiment aux bons magasins, par exemple en envoyant des produits coûteux au magasin où ils seront achetés, et non à celui où ils ramasseront la poussière sur les étagères.
Les tâches de recherche peuvent sembler différentes. Un exemple d'une telle tâche est de comprendre pourquoi un réseau de neurones donne l'une ou l'autre prévision - pour l'une ou l'autre des données d'entrée. Mais en général, les tâches RnD sont très diverses.
Quels montants sont investis dans les développements liés à l'IA et au machine learning?Dépend de l'entreprise. Dans les grandes entreprises, elles sont prêtes à dépenser plus d'argent pour cela, dans les petites - moins. Dans les télécommunications, selon mes observations, un grand projet, où les volumes de données sont des centaines de téraoctets, a besoin de dizaines à des centaines de millions de roubles. D'un autre côté, il n'y a pas de limite à la perfection
(sourires - Ed. Env.) .
Chez Yandex, vous avez développé un mécanisme pour l'auto-complétion des requêtes de recherche. Cela peut-il être considéré comme une technologie de réseau neuronal? Comment fonctionne l'algorithme?Non, il s'agissait d'une approche classique d'apprentissage automatique (ML) basée sur des statistiques de requête de recherche. En fonction du début de la requête saisi et des requêtes utilisateur typiques, les options les plus appropriées pour l'ajout automatique dans la base de données des requêtes de recherche les plus fréquentes ont été sélectionnées. C'était avant les réseaux de neurones, quand tout le monde les considérait comme une technologie sans issue. Ils étaient alors encore inférieurs aux algorithmes du ML classique.
Parlez-nous des réalisations russes les plus importantes dans le domaine de l'IA.L'exemple le plus célèbre est Prisma. L'entreprise n'est pas enregistrée en Russie, mais, néanmoins, l'épine dorsale de l'État est constituée de spécialistes nationaux. Soit dit en passant, les scientifiques qui ont développé la méthode de traitement d'image utilisée dans Prism viennent également de Russie (groupe de Victor Lempitsky).
Chez Yandex, les algorithmes d'IA sont au cœur du classement des résultats de recherche. L'algorithme de classement pour la proximité du texte de la requête et du site utilisant le réseau neuronal est appelé Palekh.
Un autre exemple bien connu est FindFace de NTechLab. Ce sont des démonstrations du fonctionnement de son algorithme de reconnaissance faciale, qu'elle vend comme produit commercial.
Les entreprises russes engagées dans les technologies vocales, par exemple le Center for Speech Technologies, sont également connues sur le marché mondial.
À Sberbank, en passant, la technologie de la biométrie faciale de l'une des sociétés russes est utilisée depuis plusieurs années. Il est utilisé pour lutter contre le vol d'identité dans les prêts aux particuliers. Le laboratoire emploie les personnes qui ont participé à ce projet.
La transition vers les nouvelles technologies nécessite le remplacement du matériel et des logiciels que l'utilisateur final ressent sur lui-même sous la forme de défaillances et d'erreurs de réseau. Comment réaliser la phase de transition le plus discrètement possible pour le client?En fait, c'est une tâche classique dans le développement, ils ont pu la résoudre depuis longtemps. Une méthode consiste à tester. Avant d'introduire la nouvelle version, elle est testée longtemps: ils vérifient les cas limites, ainsi que si le logiciel peut supporter la charge requise, puis ouvrent la nouvelle version pour un petit groupe d'utilisateurs. Dans ce cas, en cas de problème, le plus petit pourcentage d'utilisateurs en souffrira.
L'IA est-elle capable de corriger indépendamment les erreurs et les plantages du système?Il existe des algorithmes qui sont juste conçus pour de telles situations. Mais leur tâche n'est pas de détecter ou de réparer la panne, mais de prévoir qu'elle se produira bientôt - de voir des modèles anormaux dans le système. Habituellement, dans un système complexe, il existe de nombreux indicateurs de son état actuel. Après avoir découvert un modèle anormal, l'intelligence artificielle peut envoyer un message aux administrateurs: quelque chose ne va pas - regardez quoi - quelque chose doit être fait. Par exemple, la charge a augmenté, il est nécessaire d'ajouter des capacités inactives pour que le système puisse y résister.
Aujourd'hui, l'IA a un caractère d'observation et une fonction de détection «à l'avance» (par exemple, deux heures). Mais pour résoudre le problème, une personne est toujours nécessaire.
Sur quoi travaillent-ils maintenant dans le laboratoire d'AI Sberbank?Sberbank AI Laboratory a été créé pour développer les compétences en IA dans l'organisation. Maintenant, avec l'avènement de méthodes d'enseignement efficaces pour les réseaux de neurones profonds, ce domaine a fait de grands progrès. Les grandes entreprises ont besoin de personnes qui connaissent les nouvelles technologies de l'IA pour suivre les progrès rapides. Il est également important de comprendre dans quels domaines l'IA a du sens à investir des efforts et de l'argent. Le laboratoire vous aidera à le découvrir.
Une autre mission importante du laboratoire est sa propre recherche dans ce domaine, ainsi que la création de nouvelles technologies qui bénéficieront à la banque. Bien sûr, nous sommes engagés dans des recherches qui peuvent être appliquées à la banque, mais nous essayons également de nous assurer que nos résultats sont utiles non seulement dans le domaine financier. Par exemple, nous nous intéressons à la direction de l'analyse des séries chronologiques; Il y a beaucoup de données avec une telle structure (transactionnelle et autre) dans le secteur bancaire. Parmi les travaux à composante scientifique plus large, on peut rappeler les recherches sur la création de nouvelles méthodes d'interprétation des résultats des travaux du réseau neuronal.
Avec qui travaille Sberbank?La Banque collabore avec plusieurs universités: Institut de physique et de technologie de Moscou, HSE, Université d'État de Moscou. Maintenant, j'entends iPavlov, un projet commun avec le MIPT. Il s'agit d'un projet visant à développer des systèmes de dialogue pour communiquer avec un ordinateur dans un langage naturel. Il existe également des activités très intéressantes avec d'autres universités, de la résolution de problèmes d'optimisation complexes aux développements fondamentaux pour améliorer les algorithmes d'apprentissage en profondeur. Il existe encore de nombreuses activités d'apprentissage et de promotion des connaissances - par exemple, des cours d'IA pour les étudiants.
Quelle est la spécificité des algorithmes d'IA de Sberbank?Il existe une section bancaire classique. Par exemple, la notation est une évaluation de la solvabilité d’un client. Dans tous les pays, il est réglementé par les banques centrales et est donc largement basé sur des méthodes bien interprétées - régression logistique et arbres de décision. Ces méthodes classiques sont fiables et stables. À l'avenir, nous espérons que le régulateur permettra l'utilisation de méthodes plus complexes. Pour ce faire, il est nécessaire de prouver que les nouvelles méthodes sont suffisamment fiables.
Au laboratoire d'IA de Sberbank, nous traitons des méthodes plus complexes, principalement des réseaux de neurones profonds et des algorithmes d'IA pour des données typiques des banques. Un type typique de données pour les banques est une série chronologique: par exemple, le prix d'un produit (prix hier, veille, etc.).
Le 19 avril, vous prendrez la parole en tant qu'orateur à la conférence AI . De quoi parlez-vous aux visiteurs?Au cours des dernières années, les méthodes d'apprentissage en profondeur ont connu un énorme succès. Ils résolvent déjà des problèmes qu'ils avaient peur d'aborder auparavant. Par exemple, ils ont atteint un niveau de qualité humaine dans la reconnaissance de la parole à texte et de la synthèse vocale à la reconnaissance d'image. Mais ils ont leurs propres limites qui les empêchent d'avancer. Je veux en parler, ainsi que des approches en raison desquelles elles peuvent éventuellement être contournées. À bien des égards, il s'agit toujours d'un domaine de recherche et non de solutions toutes faites pour une utilisation dans le travail quotidien. Cependant, il y a des attentes raisonnables pour l'avenir avec des technologies d'IA encore plus efficaces.