🚡 👨🏾‍✈️ 👩🏿‍🤝‍👨🏼 Tendances et prévisions dans le traitement du langage naturel 🆎 🍬 〽️

Tendances et prévisions dans le domaine de la PNL (Natural Language Processing)

Cet article porte sur les tendances et les prévisions de notre Almanach de septembre «Intelligence artificielle» n ° 2, qui est consacré à une revue du marché des technologies et des entreprises dans le domaine de la PNL et de la reconnaissance-synthèse vocale en Russie.

Pour cette étude, nous avons mené une enquête d'expert sur l'industrie et, en particulier, posé des questions sur les prévisions du développement des deux technologies et de l'utilisation de l'IA dans divers domaines. Il n'y a pas eu tant de réponses, mais néanmoins, une tendance générale peut être formulée. Dans cet article, nous avons résumé ces réponses et montré les principales tendances.

Tendances technologiques générales

Résolution de problèmes de PNL de bout en bout

De plus en plus de solutions seront basées sur l'approche de bout en bout, par exemple, le modèle de réseau neuronal reçoit un signal acoustique (ondes sonores) en entrée et produit un signal acoustique en sortie, sans phase intermédiaire du texte. Cela accélérera considérablement l'exécution des modèles et leur qualité, tout en aggravant la «transparence» et notre compréhension de «ce qu'il y a à l'intérieur».

Approche de la qualité de la reconnaissance et de la génération de la parole à l'homme

Dans les années à venir, une amélioration significative de la qualité de la reconnaissance vocale sera réalisée. Le nombre d'erreurs de reconnaissance approchera du niveau humain. La reconnaissance du discours mixte de plusieurs personnes parlant avec des accents différents dans un environnement bruyant s'améliorera. Une analyse des scènes sonores avec reconnaissance du sexe et de l'âge des locuteurs, de la coloration émotionnelle de leur discours et de la nature de l'environnement sera ajoutée.

La parole synthétisée sera indiscernable de la parole humaine, et il sera possible de synthétiser la voix de toute personne.

Le multilinguisme

Dans un avenir proche, des modèles de traduction multilingues apparaîtront, notamment en raison de l'utilisation de l'apprentissage par transfert et en raison de l'utilisation de monocorpres beaucoup plus grands en plus des cas parallèles. En conséquence, la qualité de la traduction pour les langues à faibles ressources augmentera de manière significative (avec des tableaux relativement petits d'échantillons d'apprentissage).

La traduction manuelle sera complètement remplacée par la traduction automatique en raison d'une meilleure compréhension par la machine du contexte et de l'objet des documents. Avec la croissance des technologies de reconnaissance et de synthèse de la parole, l'interprétation simultanée des machines apparaîtra à l'horizon de 5 à 10 ans.

Comprendre la signification des textes

D'autres applications basées sur la compréhension de la signification spécifique au contexte apparaîtront sur le même horizon dans 5 à 10 ans: différents types de dialogue et des services d'aide qui peuvent comprendre le contexte du dialogue, répondre intelligemment aux questions des utilisateurs et orienter le dialogue dans la bonne direction. Une compréhension plus approfondie de la langue par la machine amènera à un nouveau niveau le traitement automatique des flux de texte sur Internet et dans les réseaux sociaux: la collecte et la compilation des faits, leur analyse pour la cohérence et la fiabilité.

Génération de texte

Les réseaux de neurones de bout en bout remplaceront universellement le pipeline NLG classique. L'utilisation de modèles de niveau GPT2 permet déjà de créer des articles assez longs sur des sujets arbitraires dans une zone donnée avec un contenu contrôlé. Sur un horizon de 5 ans, les modèles de réseaux de neurones seront capables de générer des textes pas pire que les humains. Et puis le contenu automatique va inonder le monde.

Plateformes et multiplateformes

De nombreuses solutions deviendront standard, il y aura de nombreuses plateformes pour construire des applications basées sur des interfaces vocales. Les plateformes cloud s'amélioreront en termes de temps de réponse, de charges de travail et de sécurité. La croissance des investissements n'est pas prévue dans des services interactifs séparés (chatbots), mais dans des plates-formes multifonctionnelles et des solutions multiplateformes, grâce auxquelles l'assistant vocal pourra travailler de manière égale sur différents appareils. Ainsi, nous pourrons entamer une conversation avec notre assistant dans la «maison intelligente», la poursuivre sur la route en voiture puis au travail avec notre ordinateur sur le lieu de travail, le tout sans perdre le contexte de communication.

Technologies de petites données

La valeur des méthodes d'apprentissage automatique qui fonctionnent efficacement dans des conditions de faible quantité de données brutes va croître: transfert d'apprentissage, transfert de connaissances. Dans de telles applications, on s'attend également à une utilisation plus large des GAN (réseaux génératifs antagonistes) pour générer des données pour la formation de modèles.

Architectures avec moins d'exigences informatiques

Avec la transition des modèles de réseaux de neurones des murs des laboratoires vers les centres de données commerciaux, les exigences pour leur efficacité énergétique augmenteront. De nouvelles architectures informatiques plus efficaces sont attendues. Par exemple, des réseaux clairsemés combinant les meilleures qualités de calculs distribués et symboliques, dont les modèles de complexité s'adaptent à la quantité de données d'apprentissage.

Tendances du marché

Implémentation omniprésente des interfaces vocales

Le développement des technologies de synthèse vocale sera la première étape pour simplifier les tâches de bureau (par exemple, planifier le temps du responsable, rechercher des documents, traiter des informations confidentielles). Avec une précision de reconnaissance croissante, une compréhension approfondie et une qualité de synthèse vocale, les interfaces vocales seront intégrées dans presque tous les appareils: systèmes de dialogue dans une maison intelligente, voiture, appareils électroménagers, robots avatar, robots assistants.

Croissance explosive des robots vocaux

Nous attendons la croissance explosive du nombre d'assistants intelligents dans divers secteurs d'activité, y compris les services commerciaux des banques, des détaillants, des télécommunications et d'autres entreprises qui interagissent activement avec les clients. Toutes les communications verbales avec un public de masse dans les services les plus populaires seront effectuées par des robots. Les robots apprendront à reconnaître les émotions avec sensibilité, notamment en utilisant une évaluation multimodale des émotions et utiliseront eux-mêmes la composante émotionnelle dans la conversation.

Recherche d'informations en langage naturel

Il y a une demande croissante de recherche intelligente avec la possibilité de faire des requêtes dans un langage naturel. De plus en plus d'organisations souhaitent trouver rapidement des données non structurées dans toutes les sources internes, déterminer automatiquement leur contenu et mettre en évidence des faits importants dans des textes juridiques ou financiers spécialisés. En raison du développement de modèles profonds pour extraire des faits à partir de textes et résumer leur contenu, la qualité de la recherche d'informations s'améliorera considérablement.

À la maison

Très probablement, les grandes entreprises - banques, télécoms, industrie - développeront et augmenteront leur propre expertise dans le domaine de l'IA, y compris en conversation avec leur propre équipe de linguistes, de scientifiques des données, d'ingénieurs PNL, etc. Les exemples d'externalisation de tâches individuelles dans un avenir proche resteront limités. Nous constatons une croissance rapide des équipes d'IA de nombreuses grandes entreprises. Bon ou mauvais est un sujet pour un article séparé, mais c'est une tendance claire.

Tendances de l'industrie

Finance et assurances

À court terme, les banques se concentreront sur la maximisation des avantages des données déjà accumulées par les banques utilisant l'IA en général et la PNL en particulier. À long terme, il existe une tendance constante à l'unification et à la simplification des processus bancaires qui peuvent être effectués sans ou avec une participation minimale (ouverture d'un compte, évaluation des risques, création d'un dossier de crédit, notation, etc.). La PNL sera associée à d'autres technologies (vision par ordinateur, RPA, identification à distance, etc.).

Industrie et logistique

Grâce aux technologies PNL, on peut s'attendre à une nouvelle génération de concepteurs de documentation de projet, ainsi qu'à l'émergence de systèmes qui évaluent la cohérence des documents décrivant des objets techniques complexes. De plus, il est possible de prédire l'émergence de systèmes de planification de contrôle automatisés sur la base d'une analyse de la documentation et des normes du projet à l'aide de la PNL.

Avec l'avènement des systèmes de compréhension du sens des textes, à l'horizon de 5 à 10 ans, une solution définitive au problème de la normalisation des nomenclatures est attendue.

Médecine

L'introduction généralisée d'interfaces vocales libérera considérablement le médecin des entrées de texte et créera des dossiers médicaux balisés automatiquement. L'apparition de grands corpus de textes marqués permettra l'émergence de SPPVR (systèmes d'aide à la décision médicale) d'une nouvelle classe basée sur les technologies de la PNL.

Informatique et télécommunications

L'utilisation répandue des technologies de biométrie vocale (authentification et autorisation d'une personne par la voix) devrait fournir des services basés sur des données personnalisées. Les opérateurs télécoms auront l'opportunité de prendre une position unique dans l'écosystème des services numériques, disposant d'un canal de communication vocal avec le client. D'un autre côté, les messagers vocaux s'appuient sur les mêmes technologies de base pour la reconnaissance et la synthèse de la parole. Nous attendons une période intéressante de batailles des géants de l'industrie des télécommunications avec des messageries instantanées sur le canal vocal avec le client.

Pratique juridique

À l'horizon de 3 à 5 ans, nous pouvons nous attendre à une adoption généralisée des technologies de vérification automatique des contrats et, plus largement, à l'automatisation du travail contractuel, y compris la vérification du respect des obligations, etc.

Dans les 5 à 10 prochaines années, on peut s'attendre à l'apparition de modèles de compréhension des textes juridiques. Sur cette base, nous nous attendons à l'émergence de systèmes qui émettent une question d'un utilisateur posée dans un langage naturel, une réponse qui est un résumé concis de la documentation réglementaire existante, y compris les incohérences et les différentes versions.

L'ordinateur d'un avocat cessera d'être une référence et deviendra un véritable outil d'aide à la décision. L'une des principales tâches de l'ordinateur d'un avocat sera de prédire l'issue du procès avec la construction d'un arbre de décision probabiliste basé sur la pratique existante. La plupart de ces travaux se dérouleront probablement dans le cloud sur des modèles entraînés de taille énorme.

L'émergence massive de services ponctuels, de produits et d'entreprises qui résolvent un problème spécifique sur le plan juridique.

Nous pouvons nous attendre à une intégration plus approfondie des solutions RPA avec les technologies NLP, ce qui conduira au transfert de tâches de routine pour le traitement des informations et la saisie des données vers des robots logiciels.
Et enfin, la perspective de contrats intelligents sur la blockchain, générés automatiquement sur la base de l'analyse de documents juridiquement contraignants, tels que des contrats ou des NDA, semble absolument envoûtante. Une telle combinaison de technologies peut donner vie à des documents juridiques auto-exécutoires qui, en soi, ressemblent jusqu'à présent à de la science-fiction, mais pas loin de leur mise en œuvre.

Médias et publicité

Nous attendons l'introduction généralisée du marketing personnalisé basé sur l'analyse en ligne de l'empreinte numérique d'une personne. Il comprendra une analyse approfondie des textes humains et de leur tonalité: une évaluation négative et positive du texte n'est pas en général, mais en relation avec un produit ou une marque spécifique.

Chaque personne aura un assistant d'achat personnel qui prendra jusqu'à 90% des achats de routine.

Il y aura des services de génération automatique de nouvelles pour une entreprise particulière, en fonction de son histoire, des événements internes et externes.

Science et éducation

Dans les 5 à 10 prochaines années, nous pouvons nous attendre à l'émergence de modèles de compréhension des textes scientifiques. Nous attendons l'émergence de systèmes qui fournissent une réponse à la question d'un utilisateur posée dans un langage naturel, qui est un bref résumé de la littérature scientifique existante sur cette question, y compris les contradictions trouvées et différentes versions. Une autre application de ces modèles est les systèmes de recommandation pour la recherche ou l'analyse du paysage des brevets.

Ces systèmes changeront radicalement le paysage technologique et accéléreront le transfert de technologies, en analysant et en identifiant des experts et des communautés d'experts dans un domaine donné sur la base d'une analyse des sources d'informations scientifiques et en matière de brevets.

A l'horizon de 5 à 10 ans également, nous attendons l'émergence d'enseignants assistants à part entière pour chaque discipline et, en général, pour les établissements d'enseignement. D’autre part, les assistants personnels de l’élève apparaîtront qui guideront la personne sur le chemin de l’éducation tout au long de la vie. L'interaction de ces agents intelligents est également susceptible d'être en langage naturel.

État et sécurité

Les États déplacent de plus en plus leurs activités dans l'espace médiatique et les réseaux sociaux. Le concept de «guerres de l'information», qui a émergé ces dernières années, a pris des formes tout à fait concrètes et nécessite de nouveaux types «d'armes» et de «protection». Une tendance puissante est déjà observée et la demande de détection de fausses nouvelles ne fera qu'augmenter. Malheureusement, on peut également prédire avec confiance la croissance de la demande pour la génération automatisée de divers types de fausses nouvelles. L'utilisation de l'IA se développera à la fois pour créer des robots sur les réseaux sociaux et pour les identifier.

L'intelligence n'est pas moins importante. L'IA sera de plus en plus utilisée pour analyser de grandes quantités d'informations sur les entreprises, les personnes et les transactions sous diverses formes afin de résoudre des problèmes appliqués tels que la recherche d'affiliations et les relations implicites entre les entreprises et les individus.

Avec l'augmentation du nombre de personnes, la tâche d'automatiser la communication avec un citoyen afin de lui fournir certains services devient de plus en plus urgente pour l'État. L'IA, probablement sous la forme d'agents intelligents, sera activement utilisée pour personnifier et personnaliser les services publics et municipaux pour chaque citoyen - les soi-disant «villes cognitives» et «l'État en tant que service».

L'almanach complet «Intelligence artificielle» sur la PNL et la reconnaissance / synthèse vocale peut être téléchargé ici.

Tendances et prévisions dans le traitement du langage naturel