Dmitry Muromtsev, chef du
laboratoire international «Méthodes de traitement intelligent de l'information et technologies sémantiques» ITMO et chef
du département IPM , a parlé de l'essence de la modélisation ontologique, de l'utilisation des graphes de connaissances dans les processus d'affaires et du travail de création d'intelligence conversationnelle.
Intervieweur: Anna Angelova (A.A.)
Partie défenderesse: Dmitry Muromtsev (D.M.)
AA: Quelle est l'essence de la modélisation ontologique et comment se passe la compilation des graphiques de connaissances?
DM: La modélisation ontologique est la compilation de modèles d'information sous forme de descriptions conceptuelles de domaines qui satisfont à certaines normes. Il existe des langages spéciaux pour les ontologies, ils sont standardisés et sont déjà utilisés dans l'industrie. Le principal objectif des ontologies est de décrire des schémas de données et de connaissances pouvant exister dans une grande variété de sources. Le problème est qu'il y a beaucoup de ces sources, elles diffèrent grandement dans le type de stockage de données, dans l'architecture logicielle, etc. Pour les connecter dans un seul espace d'information, des mécanismes d'intégration spéciaux sont nécessaires - ce sont précisément les ontologies. Ils sont utilisés lors de l'intégration de bases de données, décrivant des données mal structurées sur Internet, lors de la création de bases de connaissances sur un sujet spécifique ou de grandes bases de connaissances non thématiques - par exemple, basées sur des informations Wikipédia.
Le processus de création lui-même implique la participation d'experts du domaine: les experts sont toujours impliqués dans les questions pour lesquelles les données seront présentées dans la colonne des connaissances. Par exemple, il peut s'agir de problèmes liés au patrimoine culturel, à la médecine, à l'éducation ou à toute production.
Ces experts identifient des concepts clés - des objets qui sont d'une importance cruciale pour un domaine donné. Par exemple, le patrimoine culturel est les objets d'art, les créateurs de ces objets, le processus de création, les processus de restauration ou une sorte de modification (s'il s'agit d'un objet architectural, il pourrait être reconstruit), ce sont des questions d'exposition, de stockage, etc. Tout ce qui est important pour une description complète du sujet domaines formulés par un expert. Désigne en outre la relation, la relation entre ces objets. Cette description formalisée permet par la suite de se renseigner sur des graphes de connaissances.
Sur le plan technologique, la procédure de transformation peut être assez complexe et comprendre de nombreux outils: outils de traitement du langage naturel, apprentissage automatique, reconnaissance de formes et un certain nombre d'autres outils. En fin de compte, nous obtenons un réseau ou un graphique d'objets interconnectés. La principale caractéristique d'un tel système, contrairement aux bases de données, est que ce réseau est auto-descriptif et auto-documenté. Il n'a pas besoin d'explications supplémentaires
de la part du développeur .
AA: Quelle est la portée des graphiques de connaissances?
D.M .: Presque tout. Maintenant, il existe des graphiques de connaissance du contenu universel (le plus célèbre est Google), il y a Wikidata, Dbpedia, qui rappellent plus Wikipédia en termes de couverture. Il existe des graphiques de connaissances spécialisés: sur la médecine, sur le patrimoine culturel, selon les données ouvertes de l'État. Il existe des colonnes sur les connaissances institutionnelles - elles sont du domaine public.
AA: Parlez-nous du projet pour DataFabric. De quoi avaient-ils besoin et quels résultats ont été obtenus?
DM: Levons la question un peu plus largement. Le projet DataFabric en est un exemple, nous en avions plusieurs. Nous avons commencé notre activité il y a environ 8 ans. Nous consacrons une partie importante de notre temps à la vulgarisation des technologies sémantiques, à l'organisation de divers
événements scientifiques et éducatifs , hackathons, etc. Nous rencontrons régulièrement des représentants de l'industrie. Des dizaines de ces réunions ont lieu chaque année, et certains représentants de l'industrie sont intéressés.
Dans la situation avec DataFabric, principalement leurs spécialistes ont travaillé, que nous avons consultés en termes de méthodologie et recommandé certaines technologies et outils. Nous avons également vérifié leurs résultats - une analyse de la façon dont tout a été fait correctement. Le projet de cette entreprise elle-même est intéressant en ce qu'il est le premier exemple en Russie où une entreprise a investi ses propres fonds dans le développement de graphiques de connaissances, dans le développement de technologies de données connexes et a réussi à prouver qu'elle peut être rentable. Pour autant que je sache, l'entreprise continue d'utiliser le graphique de connaissances créé et prévoit de le développer. D'après les discours de ses représentants, nous pouvons conclure que grâce au graphique des connaissances, ils ont pu automatiser une grande quantité de travail manuel. Mais pour des informations plus précises, il est préférable de contacter directement l'entreprise.
Sergey Isaev,
PDG DataFabric
Nous voulions créer un système intelligent de vérification des contreparties et collecter des informations sur l'entreprise. Nous étions une très petite entreprise et voulions obtenir un avantage concurrentiel. Nos concurrents - Spark Interfax, Kontur.Fokus - sont très grands, puissants, sont sur le marché depuis de nombreuses années, et juste comme ça, "de front", il est impossible de rivaliser avec eux.
Nous collectons toutes les mêmes informations sur l'entreprise que nos concurrents: données du Federal Tax Service, Rosstat et d'autres sources. Nous les chargeons dans une seule base de données. Puisque nous avons un graphique, les connexions entre tous les objets y apparaissent. Le système utilise une modélisation ontologique: nous lui décrivons la valeur de toutes les données avec lesquelles il travaille. Par conséquent, elle commence à comprendre le contexte, la charge sémantique de certaines données. Grâce à cela, on peut même lui poser des questions ouvertes, par exemple: "Montrez-moi toutes les entreprises qui risquent de faire faillite l'année prochaine." Puisqu'elle comprend la signification de chaque mot dans cette affaire, elle donnera une liste.
Je ne sais pas combien de concurrents consacrent temps, argent et énergie à résoudre leurs problèmes. Mais je sais qu'ils ont des centaines de développeurs, et nous n'avons que 12 personnes, et nous avons fait notre système en un an et demi. Maintenant, il vous permet de prototyper rapidement de nouveaux cas, de nouveaux services, car il est plus intelligent et flexible.
AA: Il y a beaucoup de partenaires sur le site du laboratoire que vous dirigez. Lesquels d'entre eux collaborent sur des projets en cours?
DM: Si nous prenons la coopération dans le sens le plus large du terme, alors le Conseil des données ouvertes de la Fédération de Russie sera le principal en termes de temps alloué. Nous essayons d'y effectuer des travaux méthodologiques et de recherche visant à promouvoir les graphiques de connaissances auprès des autorités fédérales et d'autres structures qui sont tenues de publier des données ouvertes. Maintenant, l'exigence de la loi pour la publication des données ouvertes est assez formelle et limitée. Nous essayons de prouver que cela peut être fait de manière beaucoup plus efficace et que cela apportera des avantages beaucoup plus importants à l'économie. Nous coopérons également activement sur les technologies éducatives e-learning avec différentes structures, il existe des projets de recherche avec plusieurs universités en Allemagne, Finlande, Autriche.
AA: Quelles activités des entreprises de l'industrie devraient être contrôlées?
DM: Pour la communauté dans son ensemble. Il est clair que les grandes entreprises sont, en un sens, un indicateur de la maturité des technologies. Mais lors de la dernière conférence de l'
ISWC en Autriche - et il s'agit de la plus grande conférence du monde sur les technologies sémantiques - un rapport de Google a soulevé de nombreuses questions: les problèmes qu'ils se sont posés ont souvent déjà été résolus par des entreprises ayant une orientation plus scientifique.
En règle générale, les grands joueurs ne font généralement pas de recherche à partir de zéro. Ils posent un problème spécifique, puis trouvent une équipe qui peut résoudre ce problème et commencent à coopérer avec lui ou à l'acheter s'il s'agit d'une sorte de démarrage. Autrement dit, les grands acteurs sont plus susceptibles de jouer un rôle systémique.
Et si vous suivez la communauté dans son ensemble, vous pouvez voir de nombreux groupes de recherche, entreprises et startups intéressants qui offrent les solutions les plus innovantes. Par exemple, il y a maintenant une tendance très sérieuse
dans le développement de robots de discussion , d'interfaces vocales et d'autres systèmes, qui, après un certain temps, seront pratiquement des assistants à part entière, des assistants.
AA: Votre laboratoire développe également des projets de traitement de la parole. Deux d'entre eux sont indiqués sur le site: l'un est terminé, l'autre se poursuit. Parlez-nous d'eux.[note: «Développement de la morphologie informatique pour les études de cas d'un texte variable», 2015-2016; «Développement d'un analyseur syntaxique de la parole spontanée russe à l'aide de méthodes d'exploration de données utilisant des bases de connaissances sémantiques», 2015-2018]DM: Le premier projet a été lancé par le Center for Speech Technologies - la création d'un gestionnaire de dialogue intelligent. Les solutions qui existent actuellement sont assez primitives. Ils sont confrontés lorsqu'un client appelle une organisation ou une banque et qu'il doit passer d'une ligne à une autre pendant longtemps. Des systèmes plus avancés sont capables d'analyser le texte obtenu lors de la reconnaissance - par exemple, Siri, Amazon Alexa. Mais le contenu de ce texte pour la machine reste inconnu. En Russie, soit dit en passant, le projet iPavlov a été récemment lancé, mais jusqu'à présent, il existe peu de données sur leurs résultats.
De plus, dès que nous reconnaissons le signal vocal, nous devons comprendre quel type de question il contient. Le problème est que lorsque les gens communiquent, le canal d'interaction de la parole n'est que l'un des nombreux. À titre d'information, il n'est pas le plus chargé. Il existe des canaux de communication non verbale, des connaissances générales sur le monde, un contexte qu'une personne comprend, etc. En l'absence d'informations supplémentaires, il est presque impossible de comprendre de quoi il s'agit. Si nous prenons les transcriptions des textes et essayons de les remettre à quelqu'un, en excluant complètement le contexte, même une personne ne sera probablement pas en mesure de les comprendre. Par conséquent, nous essayons maintenant de créer des analyseurs qui traiteront efficacement la parole et identifieront les objets et les relations entre eux - c'est-à-dire créer des modèles d'information du message contenu dans le texte. Et d'autres travaux sont prévus pour enrichir ces modèles d'informations provenant d'autres sources.
AA: Pouvez-vous élaborer? Quelle est la différence entre les axes de recherche du projet achevé et le projet en cours?
DM: Ce sont des directions interconnectées. Il est impossible de faire une analyse qualitative sans études de cas, car vous devez enseigner les modèles d'algorithme de reconnaissance des modèles dans le texte. C'est ce que nous avons fait dans le premier projet. Le second étudie les principes de formation des objets. Le texte contient une description de certains concepts. Ces concepts eux-mêmes peuvent être plus informatifs que les informations qui les concernent dans le texte. En conséquence, vous devez contacter d'autres bases de connaissances et graphiques et essayer de compléter ces informations à partir d'autres sources.
Supposons qu'un client appelle le support et parle d'un problème. Il peut ne pas nommer correctement l'appareil ou le processus d'utilisation du système. L'utilisateur n'est pas tenu de posséder l'intégralité des informations techniques. Lors de la compréhension du contexte, le système peut compléter les données utilisateur avec des informations provenant de ses sources. Cela simplifie considérablement le processus d'identification des problèmes.
Le premier projet était de petite taille, réalisé en collaboration avec le Center for Speech Technology. Nous y avons prouvé que l'utilisation combinée de l'ontologie, d'un système de reconnaissance de la parole et d'un analyseur de texte peut conduire à la formation de l'intelligence dite conversationnelle. Nous avons montré avec succès comment cela fonctionne. L'étape suivante consiste à approfondir la recherche dans chacun de ces domaines. Dans le domaine de la modélisation ontologique, nous n'avons plus travaillé avec la parole en général, mais avec des informations issues d'Internet dans le domaine du patrimoine culturel: comment les modéliser, les enrichir, et comment faire une recherche structurée de ces informations. Dans le domaine de l'analyse, le travail se poursuit. Nous avons obtenu de bons résultats sur la qualité du traitement de texte.
L'étape suivante est la combinaison de ces domaines et la création d'un système d'enrichissement des données provenant de diverses sources, y compris les modalités non textuelles.
AA: Dernière question: sur quoi le laboratoire prévoit-il travailler l'année prochaine?
DM: Deux directions se sont cristallisées en nous: l'Internet des objets et l'intelligence conversationnelle. La deuxième direction deviendra dominante. L'Internet des objets est une direction de soutien: c'est la création d'interfaces vocales et textuelles (chat bots) pour l'interaction avec divers appareils, robots, systèmes d'information.
Tout cela rendra l'interaction humaine avec les objets d'information plus transparente et naturelle.