Développer une IA forte en copiant les structures et les processus de la psyché humaine
Dans cet article de revue, je parle de mon expérience dans le développement de l'intelligence artificielle (reconstruction de la psyché humaine), quels résultats ont été obtenus (processus cognitifs humains de base, comprend le texte et peut poser des questions de clarification), et dans quelles solutions la technologie est applicable à ce stade de développement (l'IA est déjà prête remplacer les consultants en ligne en direct et peut être un assistant virtuel pour les programmeurs).Comprendre dans le contexte de l'IA
La compréhension est l'une des capacités importantes de l'intelligence. L'importance du concept de compréhension pour l'intelligence artificielle peut être retracée dans les idées d'Alan Turing, Marvin Minsky et Ray Kurzweil.Selon Wikipédia, «la compréhension est une opération de pensée universelle associée à l'assimilation de nouveaux contenus, à leur inclusion dans le système des idées et des idées établies» . Nous pensons que la clé de cette formulation est la nécessité pour l'IA d'avoir un «système d'idées et d'idées établies». Pour que l'IA comprenne comment est une personne, le système de connaissance de l'IA doit être identique ou très proche du système de connaissance humain. Sinon, la personne sera perçue, mais ne sera pas comprise.Sur le plan pratique, la mise en œuvre de la compréhension en IA offre des opportunités:- enseigner à l'IA un éventail de contenus créés par l'homme pour l'homme;- interagir avec l'IA dans un langage naturel;- Recevoir des conclusions de l'IA basées sur une compréhension de «comme un être humain» (la réponse «42» n'est pas toujours ce dont nous avons besoin).Par conséquent, nous avons adopté le concept de compréhension comme étant le principal dans notre approche du développement de l'IA.Les principales approches du développement de l'IA sont «top-down» et «bottom-up»
Il existe deux principales approches du développement de l'IA. Le premier vise à reproduire les capacités cognitives d’une personne dans un ordinateur sans recourir au niveau des neurones individuels. Cette approche est appelée top-down. La deuxième approche vise à construire l'intelligence des neurones aux niveaux généraux des processus cognitifs, et est appelée, respectivement, «ascendante».Quant aux tendances générales du développement de l'IA, c'est désormais l'approche ascendante qui prévaut. L'appareil mathématique utilisé dans les réseaux de neurones artificiels est probablement plus compréhensible pour les scientifiques, les développeurs et les passionnés.Nous utilisons la première approche - «descendante». Habituellement, cette direction du développement de l'IA est compliquée par l'absence d'une théorie générale, plus ou moins harmonieuse, cohérente et complète des processus mentaux humains.J'ai réuni une équipe pour travailler sur une telle théorie en 2003, puis toujours à des fins non liées ni à l'intelligence artificielle ni aux technologies de l'information en général. Un groupe de psychologues et de psychothérapeutes universitaires et praticiens s'est donné pour tâche de rationaliser les concepts théoriques et les méthodes pratiques disponibles en psychologie. J'ai dû revoir de manière critique toutes les connaissances scientifiques disponibles sur ce sujet. Plus de 30 personnes ont participé au projet à différentes étapes.En 2008, nous avons développé le soi-disant le modèle de la psyché est un concept cohérent de l'organisation de la psyché et de ses processus. Le modèle s'est avéré complexe compte tenu du grand nombre d'éléments en interaction, mais il y avait aussi un avantage - il était bien algorithmisé. C'est-à-dire le modèle fonctionne avec certains éléments et décrit la nature de leur interaction selon des lois mathématiques compréhensibles.Les résultats du développement ont été testés dans plusieurs solutions de produits. En particulier, nous avons modélisé le comportement des utilisateurs d'Internet lors du choix d'un article d'actualité, lors du choix d'un résultat à partir des résultats de recherche, et avons également distribué les utilisateurs à des groupes de consommateurs de différents types de biens en fonction de besoins simulés. Comme données d'entrée pour la modélisation, nous avons utilisé l'historique des visites de sites par chaque utilisateur individuel. Soit dit en passant, ces données sont suffisantes pour calculer une centaine de caractéristiques d'une personne avec laquelle un psychologue opère - extraversion, compulsivité, etc. Le sexe est également une caractéristique psychologique, mais pas pour tous les pays. Par exemple, pour la Suède, la précision de la détermination est au maximum de 65%,tandis que pour les pays d'Europe de l'Est, nous pouvons déterminer le sexe de l'utilisateur en fonction de l'historique de navigation avec une précision de 95%.Nous comprenons bien quels processus se produisent dans la psyché, nous avons des outils qui nous permettent d'étudier et d'analyser ces processus. Nous utilisons la méthode phénoménologique (1). Cette méthode vous permet de mettre en évidence les processus de la psyché, de les séparer entre eux, d'observer la dynamique. Pour nous, la psyché n'est pas une boîte noire, c'est pour la plupart une structure complexe mais compréhensible.Je note également que l'approche de notre équipe implique l'universalité de l'IA en cours de développement, contrairement à l'IA spécialisée axée sur la résolution des mêmes problèmes.Stockage et traitement des connaissances en IA
La première tâche que nous avons commencé à résoudre est le développement d'un réseau sémantique pour stocker les connaissances sous la forme dans laquelle elles sont stockées dans la psyché humaine. Dans le même temps, la structure du réseau sémantique devrait fournir non seulement un stockage de données, mais aussi le fonctionnement efficace d'algorithmes répétant des processus cognitifs et autres.Les sommets du réseau sont tous les phénomènes que la conscience peut mettre en évidence. Les sommets se présentent sous différentes formes, par exemple, un objet, une action, un signe, un concept abstrait. Des exemples de pics sont l'ordinateur portable, la voile, le noir, l'espace.Les connexions entre les sommets reflètent le type d'interaction de ces phénomènes dans le psychisme. Dans l'expression «boule bleue» entre les deux pics «bleu» et «boule», il y a un lien caractéristique. Les liens peuvent également être de plusieurs types.Dans ses travaux sur la formation de structures de réseaux sémantiques, c'est-à-dire pour ajouter de nouveaux types de pics et de connexions, nous suivons le processus d'ontogenèse des fonctions cognitives humaines. Nous clarifions cela avec un exemple. Jusqu'à un certain point, il n'y a pas de connexion «instrumentale» entre les phénomènes de la psyché, car la psyché ne résout pas les problèmes correspondants - un enfant peut taper sur un jouet avec son omoplate et il ne perçoit pas l'omoplate comme un instrument. Après un certain temps, imitant ce qui a été vu et accumulant des connaissances, un nouveau type de connexion se forme dans la psyché - instrumentale, l'enfant comprend que vous pouvez creuser avec une pelle. Ainsi, la psyché répond à la complexité des opérations, à une augmentation de la quantité de données, et optimise son travail en formant un nouveau type de connexion.La formation de nouveaux types de communication a lieu en relation avec un nouveau type d'activité et en relation avec l'apparition de néoplasmes dans la psyché (2) Un exemple d'un nouveau type d'activité - avec un designer professionnel, la couleur n'est pas seulement une caractéristique, mais aussi un outil professionnel, qui forme un type de connexion distinct. Un exemple de néoplasme dans la psyché est la pensée abstraite.Tout d'abord, nous avons identifié deux étapes dans la formation du psychisme - préverbal, lorsque des structures sont formées pour lesquelles les mots ne sont pas utilisés (de la naissance à 2 ans), et verbales, lorsque le mot est utilisé comme identifiant. La division en étapes indiquées est conditionnelle, car chacune d'elles a également ses propres périodes distinctes de formation de structure.La reproduction des structures préverbales s'est avérée être une tâche assez difficile. Nous avons été obligés de reconstruire des concepts et des connexions à partir de structures que nous connaissions ultérieurement. Par exemple, le plaisir d'un enfant de six mois ne contient pas encore d'expériences différenciées (que ce soit le plaisir sexuel, le plaisir de la satiété, le plaisir de l'intimité, etc.). Dans le développement des structures préverbales, nous nous sommes limités à celles qui ont des connexions avec des structures formées dans les étapes suivantes. Notez que bien que la méthodologie pour la formation de structures préverbales pour le réseau sémantique ait été élaborée, cette tâche nécessite un travail important de la part des psychologues. A ce stade, nous avons identifié 3 types de sommets et 4 types de connexions.Une fois que le mot est devenu l'identifiant principal de l'information, il est devenu plus facile de former des structures. Vous pouvez toujours vous tourner vers la source - la psyché elle-même, en posant des questions à une personne de l'âge approprié. A noter qu'au stade verbal, la psyché ne se limite pas à une augmentation importante du nombre de phénomènes. De nouveaux types de phénomènes apparaissent également, par exemple, abstraits, fictifs, etc., ce qui entraîne une modification de la structure du réseau.À ce jour, plusieurs développements cherchent à répéter le principe du stockage des connaissances par l'homme à l'aide du réseau sémantique. Notre méthode de formation de la structure du réseau est basée sur les outils que nous avons développés pour l'étude des processus mentaux (y compris cognitifs). Nous n'avons introduit dans la structure du réseau que ce qui est réellement disponible dans la psyché de l'âge correspondant. En conséquence, le réseau sémantique qui recrée la structure cognitive de la psyché d'un enfant de sept ans contient 17 types de sommets et 15 types de communication. À cet âge chez l'homme, la plupart des formes de communication ont déjà été formées.Dans le processus de création d'un réseau sémantique, nous avons identifié plusieurs caractéristiques intéressantes:1.Le réseau sémantique a quelques astuces - des éléments qui déterminent la distribution inégale des relations. Autour d'eux, la plupart des chaînes de ces maillons sont orientées. Ce sont des besoins humains.2. Avec chaque néoplasme, la structure des connaissances est reconstruite. La nouvelle période d'âge entraîne la nécessité de modifier de manière significative la structure des relations entre les éléments.3. En créant une sorte de réseau de référence, nous avons enregistré des différences personnelles. Ces différences sont typiques. Autrement dit, le nombre d'invariants est très limité et est dû à des caractéristiques individuelles ou à l'influence de l'environnement. Ce sont des types psychologiques.Acquérir de nouvelles connaissances et former des réponses aux questions
Les algorithmes qui mettent en œuvre des opérations de réflexion liées à la compréhension de nouvelles connaissances sont basés sur la structure du réseau sémantique.Initialement, le texte est traité par un analyseur développé à l'Université de Stanford.. Ensuite, nous vérifions la disponibilité des sommets et connexions correspondants et, si nécessaire, en formons de nouveaux. Lors de la formation d'une réponse ou d'une question de clarification, les algorithmes sont guidés par les données disponibles dans le réseau sémantique. Le fonctionnement simplifié des algorithmes peut être démontré par l'exemple suivant. Après avoir lu le texte «Les ours polaires s'attaquent aux phoques», l'IA, connaissant déjà chacun de ces phénomènes séparément, établit une connexion spéciale dans le réseau sémantique qui fixe l'exclusivité - ce sont les ours polaires qui s'attaquent aux phoques. Après avoir reçu la question «Brown porte-t-il des proies aux phoques?» L'IA répondra «Non», car il n'y aura pas de structure dans le réseau sémantique qui remplira toutes les conditions spécifiées «L'ours brun chasse les phoques».Dans un premier temps, nous avons développé des algorithmes correspondant aux processus cognitifs d'un enfant de trois ans. Sur la base des algorithmes, nous avons écrit un programme qui peut comprendre un texte très simple et répondre à plusieurs types de questions, voici un programme de démonstration . Le programme nous a permis de configurer les connexions du réseau sémantique sur de grandes quantités de données et a confirmé la correspondance directe de la réaction du système et de la psyché d'une personne vivante.En septembre, nous avons terminé la modélisation des processus cognitifs d'un enfant de sept ans. Alors que nous n'avons pas les ressources pour programmer l'ensemble du système, nous nous sommes donc temporairement limités à un réseau sémantique et plusieurs types d'algorithmes. Si les algorithmes à ce niveau peuvent être calculés «manuellement», cela ne peut pas être fait avec le réseau sémantique - il contient environ 10 000 sommets et 40 000 liens. Après avoir terminé la programmation de tous les algorithmes, cette solution sera un système cognitif suffisamment puissant pour travailler avec des informations textuelles. Notre système peut fournir une compréhension des nouvelles connaissances décrites en langage naturel et fonctionnant au même niveau qu'une personne de l'âge approprié.Prochaines étapes de développement
La prochaine étape dans le développement de notre technologie, nous voyons dans la reconstruction de la pensée abstraite de l'homme. Maintenant, l'IA peut fonctionner avec des concepts abstraits auxquels elle a été enseignée, mais ne peut en former indépendamment de nouveaux. Par exemple, voici le texte utilisé pour enseigner le poisson: Lepoisson est un animal. Le poisson a un corps allongé. Le poisson a un corps aplati. Le poisson a la tête, les mâchoires, les branchies, la queue et les écailles d'argent. Le poisson vit dans l'eau. Les poissons peuvent nager, dormir, manger, ressentir la douleur, la peur. Le poisson ne parle pas. Si le poisson est hors de l'eau, il meurt. Le poisson utilise des branchies pour respirer. Le poisson utilise des nageoires pour nager. Le saumon, la truite et le requin sont des poissons. Chat, ours, coyote, alligator, phoque, pélican chassent les poissons.La formation indépendante de concepts abstraits élargira considérablement les possibilités d'enseignement de l'IA et la portée de son utilisation. Nous avons déjà développé les principes de base et prévoyons de détailler les processus dans un proche avenir. L'ajout de la pensée abstraite nécessitera également la modernisation du réseau sémantique de nouveaux types de communication seront ajoutés.De plus, nous prévoyons de développer des algorithmes pour la formation indépendante de nouveaux types de communication par l'intelligence artificielle. Cela ajoutera de la flexibilité au réseau sémantique et une certaine "autonomie" dans la formation de l'IA d'une équipe d'experts.Application de la technologie AI
La solution développée est capable de comprendre un texte simple, par exemple, la plupart des articles de Simple English Wikipedia peuvent être compris par le système. De plus, notre solution peut répondre aux questions concernant les connaissances existantes et poser des questions de clarification si elle trouve une contradiction. À partir des restrictions à ce stade - les textes et les questions doivent être construits grammaticalement correctement. De plus, le système doit être formé par nos experts aux concepts abstraits dans un nouveau domaine. Avec cette approche de l'apprentissage, la solution développée est indiscernable dans le dialogue d'une personne réelle.Parmi les caractéristiques de notre approche de l'apprentissage - il n'y a pas besoin d'une grande quantité de données de formation. De nouveaux concepts abstraits et de nouvelles connaissances dans un domaine spécifique, le système est formé par une seule lecture du texte.Les processus cognitifs recréés dans notre IA sont déjà suffisants pour une utilisation dans les robots intelligents, le support de texte en ligne, les PNJ dans les jeux, etc. C'est-à-dire dans les systèmes où la communication dans un domaine distinct en langage naturel est nécessaire. Maintenant, les réponses à ces décisions sont formées par des déclarations ou des scripts en direct. Notre système forme une réponse à partir des connaissances existantes de la même manière qu'une personne.Nous pouvons ajouter certains types d'algorithmes cognitifs et former le domaine correspondant, afin que l'IA puisse effectuer, par exemple, des tâches de programmation d'entrée de gamme. Nous parlons d'un assistant virtuel qui assumera certaines des tâches de programmation de routine - comprendra la tâche dans un langage naturel, analysera le code existant, en rédigera un nouveau. Tout d'abord, nous parlons de problèmes algorithmiques avec une bonne formulation et avec un faible degré d'incertitude.Les ressources propres ne sont déjà pas suffisantes, c'est pourquoi nous envisageons un partenariat avec d'autres entreprises. Nous pouvons fournir entièrement la partie technologique pour les produits ou les plates-formes, et de la part des partenaires, nous nous attendons à voir l'expertise des produits et les ressources à implémenter dans le code. L'équipe sera également ravie des développeurs proches des idées présentées dans l'article.Dans les commentaires, veuillez écrire sur les aspects de la technologie que vous aimeriez en savoir plus, dans les articles suivants, j'essaierai d'en tenir compte.1. Husserl E. Études logiques / Per. avec lui. E. A. Bernstein, éd. S. L. Frank. Nouvelle édition de R. A. Gromov. - M.: Projet académique, 2011.2. Piaget J. Discours et pensée d'un enfant. - M., 1994.Source: https://habr.com/ru/post/fr398779/
All Articles