La solution au problème de la compréhension du contexte de l'intelligence artificielle. Partie 1
Comprendre le langage naturel est une tâche complète de l'IA . Un aspect de cette compréhension est la compréhension du contexte. Dans cet article, je vais expliquer quels types de contexte notre esprit met de côté, comment cela fonctionne avec un type de contexte et comment nous recréons ce processus dans notre technologie d'intelligence artificielle.Le trophée ne rentre pas dans la valise marron car il est trop [petit / grand].
Qu'est-ce qui est trop [petit / grand]?
Réponses: La valise / le trophée.
Le défi du schéma Winograd
L' article précédent décrit notre approche du développement de l'IA et ce que nous avons déjà fait jusqu'à présent. Permettez-moi de vous rappeler que nous créons l'IA en copiant directement les structures et les processus de la psyché humaine.Deux types de contexte
D'après les commentaires sur l'article précédent, nous avons vu que le terme «contexte» est utilisé pour décrire des situations très différentes. Nous considérons ce terme en le divisant en deux types.Le premier type de contexte concerne la compréhension découlant des concepts exprimés dans cette phrase. Ce sont des situations de choisir l'une des significations des homonymes, choisir un synonyme, choisir l'une des nuances de sens, etc. Par exemple: «Ses yeux étaient larmoyants quand elle coupait des oignons pour une salade» et «Le tir à l'arc moderne est divisé en plusieurs directions». Une personne "à la volée" comprend quand il s'agit d'oignons, de plantes et lorsqu'il s'agit d'oignons - une variété d'armes.Le deuxième type de contexte est celui de la compréhension de la nécessité de distinguer une certaine catégorie, souvent non représentée dans le texte lui-même ou pas particulièrement mise en évidence. C'est cette catégorie qui nous permet de formuler une certaine «idée», généralisant l'expression de ce qui se dit.Par exemple, si dans le livre de Lev Tolstoï vous tombez sur la phrase "Il a imprimé une lettre ...", pour la bonne compréhension du texte, vous utilisez la catégorie "19ème siècle" et concluez qu'il ne s'agit pas d'une imprimante. Ce type de contexte implique que, pour comprendre et interpréter le texte, non seulement le texte entier, mais aussi les données qui lui sont associées peuvent être analysés.La résolution de problèmes associés à différents types de contextes est servie par des processus mentaux complètement différents. Nous répétons la même division dans notre développement de l'IA. Pour résoudre les problèmes du premier type, une méthode est utilisée basée sur les caractéristiques du stockage des connaissances. Pour résoudre les problèmes du deuxième type, un algorithme plus complexe basé sur l'expérience est implémenté (dans le cas de l'intelligence artificielle, nous parlons d'algorithmes qui compensent le manque d'expérience humaine réelle dans le système) et suggérant une plus grande quantité de calcul.La psyché humaine essaie le plus souvent d’appliquer la première méthode, car il nécessite beaucoup moins de ressources informatiques. Si la solution ne semble pas adéquate, la psyché utilise la seconde. De plus, plus l'intelligence est élevée, plus la seconde méthode est utilisée et plus le nombre de contextes possibles est pris en compte. Les enfants, compte tenu de la complexité et de l'intensité des ressources de la deuxième méthode, ainsi que les adultes qui ne sont pas habitués au travail mental, préfèrent la première.Nous décrirons comment notre technologie d'IA fonctionne avec le premier type de contexte. La façon dont nous travaillons avec le second, plus complexe, sera décrite dans le prochain article.Plus longue est cette tresse qui a moins de liens
Pour illustrer, prenons une situation de dialogue:«Je marche le long de la promenade et j'ai vu une faux. Je me demande quelle tresse est la plus longue? "Une solution basée sur des réseaux de neurones, en raison des limitations imposées par la méthode elle-même, ne sera probablement pas en mesure de répondre de manière adéquate. Même si beaucoup de textes sont chargés à l'Assemblée nationale pour chercher une réponse, alors, en fonction de la probabilité, le chiffre «5,6 mètres» retentira.Permettez-moi de vous rappeler que nous développons notre technologie d'IA en copiant séquentiellement la psyché et ses processus. Le réseau sémantique que nous utilisons pour stocker les connaissances reflète les particularités du stockage humain et du traitement de l'information. Par conséquent, dans le cadre de notre approche, le problème est résolu tout simplement.Dans une solution correspondant à l'âge de sept ans, l'algorithme accède au réseau sémantique et trouve le sommet qui se trouve au nœud auquel appartiennent les mots entendus précédemment. Dans l'exemple ci-dessus, il est nécessaire de choisir correctement l'un des homonymes: une tresse (coiffure) et une tresse (bande terrestre reliée à la côte) tresse (outil). Pour ce faire, il est analysé quel nœud du réseau sémantique a été discuté précédemment. C'est-à-dire La procédure la plus simple pour calculer la distance minimale aux concepts utilisés dans le texte précédent est effectuée. Dans notre réseau, la distance est fonction du nombre de connexions (en proportion directe) et de leur probabilité (inversement).
La distance entre la «tresse (bande de terre)» et le «remblai» sera de deux ordres de grandeur inférieure à celle de la «tresse (coiffure)» à l'un de ces concepts. AI donnera la réponse "110 km".Il convient de noter que ce problème est également résolu de la deuxième manière, avec la séparation de la catégorie, par exemple, "la Volga, à côté de laquelle notre interlocuteur".Les déménageurs voient les valises différemment
Regardons un exemple du schéma Vinohrad au début de l'article:«Le trophée ne rentre pas dans la valise marron car il est trop petit. Qu'est-ce qui est trop petit? "
Le lien entre «ne convient pas» et la combinaison «trop petit» - «valise» est un ordre de grandeur plus probable qu'entre «ne correspond pas» et «trop petit» - «trophée». AI donnera la réponse "valise".La présence d'une forte probabilité d'une telle relation, qui suppose un ordre de grandeur de distance plus petite dans la chaîne «ne correspond pas» - «trop petit» - «valise», est due à l'expérience humaine. Comme la plupart des gens, j'ai souvent rencontré une situation où quelque chose ne rentre pas dans une valise, car il est trop petit. Par conséquent, j'ai une telle connexion. Les mêmes connexions se forment dans le processus d'apprentissage de l'IA (nous décrirons plus en détail la formation de divers types de connexions dans la psyché dans l'un des articles suivants sur notre réseau sémantique)."Le trophée ne rentre pas dans la valise marron car il est trop grand. Qu'est-ce qui est trop grand? "
Le lien entre «ne convient pas» et la combinaison «trop grand» - «trophée» est beaucoup plus probable qu'entre «ne correspond pas» et «trop grand» - «valise». AI donnera la réponse "trophée".Je note une caractéristique - chez les déménageurs, qui rencontrent souvent une situation où vous devez mettre une valise trop grande, la psyché utilise la deuxième méthode pour comprendre le contexte. Parce que pour eux, le lien «trop gros» - «valise» est plus pertinent. Dans le même temps, un autre système fonctionne pour les touristes - avec une augmentation de l'expérience des situations où il est difficile de placer une valise quelque part, l'impossibilité de la construction augmente "vous ne pouvez pas mettre quelque chose dans une valise parce que la valise est trop grande".Pour une solution correspondant à 12 ans, la formule est un peu plus compliquée. De plus, l'approche formée par cet âge est également mise en œuvre chez un adulte - après 12 ans, cette partie du réseau d'algorithmes ne devient pas plus compliquée.En fait, la facilité de décision est déterminée par les spécificités de notre voyage. Toutes les situations liées à la communication, toutes les linguistiques, se forment avec la participation des structures de la psyché humaine. En fait, toutes les spécificités dans le domaine de la langue sont déterminées par ces structures. Certes, il y a un processus inverse, lorsque le langage détermine la structure. Il y a une commotion mutuelle. Il n'est pas surprenant qu'avec l'aide de ces structures (mentales) les problèmes qui se posent soient résolus de la manière la plus simple. L'écrou doit être dévissé avec une clé, ils sont créés l'un pour l'autre. Pas une cuillère.Je note qu'en plus de grands avantages, notre approche du développement de l'IA présente certaines difficultés. L'architecture computationnelle ne correspond pas à la base physiologique, et nous résolvons périodiquement des problèmes techniques pour l'affichage qualitatif des processus et des structures de la psyché sous forme numérique. En outre, en raison des hypothèses et des ajustements existants, certaines des ressources sont consacrées à assurer l'identité du réseau sémantique et des algorithmes d'IA aux structures et algorithmes de la psyché réelle.Le prochain article portera sur le second type de contexte et sera malheureusement beaucoup plus lourd. Nous ne pouvons pas nous passer d'une immersion profonde dans les processus psychologiques lors de la description d'algorithmes pour travailler avec le deuxième type de contexte dans notre technologie.Source: https://habr.com/ru/post/fr399111/
All Articles