
Les ordinateurs ont transformé le travail et le divertissement, les transports et la médecine, les jeux et les sports. Et malgré toute leur puissance, ces machines ne sont toujours pas en mesure d'effectuer les tâches les plus simples qu'un enfant peut gérer - par exemple, se déplacer dans une pièce inconnue ou utiliser un crayon.
Enfin, une solution à ce problème devient disponible. Il apparaîtra à l'intersection de deux domaines de recherche: le développement inverse du cerveau et le champ luxuriant de l'intelligence artificielle. Au cours des 20 prochaines années, ces deux domaines fusionneront et lanceront une nouvelle ère de machines intelligentes.
Pourquoi devons-nous comprendre comment fonctionne le cerveau pour construire des voitures intelligentes? Bien que les techniques d'apprentissage automatique telles que les réseaux de neurones profonds aient récemment donné des résultats impressionnants, elles sont encore très loin d'être intelligentes, de pouvoir comprendre et agir dans le monde qui nous entoure comme nous le faisons. Le seul exemple d'intelligence, la capacité d'apprendre, de planifier et d'exécuter un plan est le cerveau. Par conséquent, nous devons comprendre les principes qui sous-tendent l'intelligence humaine et les utiliser dans le développement de machines vraiment intelligentes.
Notre entreprise
Numenta , située à Redwood City, pc. En Californie, nous étudions le
néocortex (le nouveau cortex) - le plus grand des composants du cerveau et le principal responsable de l'intelligence. Notre objectif est de comprendre comment cela fonctionne et d'identifier les principes qui sous-tendent la conscience humaine. Ces dernières années, nous avons obtenu un grand succès dans notre travail en définissant plusieurs propriétés de l'intelligence biologique qui, selon nous, devraient être intégrées dans les futures machines à penser.
Pour comprendre ces propriétés, vous devez commencer par les bases de la biologie. Le cerveau humain est similaire au cerveau des reptiles. Ils ont une moelle épinière qui contrôle les réflexes; un tronc cérébral qui contrôle un comportement autonome, comme la respiration et la fréquence cardiaque; cerveau moyen, contrôlant les émotions et le comportement simple. Mais les humains et tous les mammifères ont quelque chose que les reptiles n'ont pas: un néocortex.
Neocortex est une feuille pliée de 2 mm d'épaisseur. Si elle pouvait être étirée, elle aurait la taille d'une grande serviette. Chez l'homme, il occupe 75% du cerveau. C'est cette partie qui nous rend intelligents.
À la naissance, le néocortex ne sait presque rien, il apprend par l'expérience. Tout ce que nous apprenons sur le monde - conduire une voiture, faire du café dans un distributeur automatique et des milliers d'autres choses avec lesquelles nous interagissons quotidiennement - est stocké dans le néocortex. Il apprend ce que sont ces objets, où ils se trouvent et comment ils se comportent. Le néocortex génère des commandes de motilité, donc lorsque vous cuisinez des aliments ou écrivez un programme, c'est le néocortex qui contrôle ce comportement. Un langage est également créé et compris par le néocortex.
Le néocortex, comme l'ensemble du cerveau et du système nerveux, est constitué de cellules appelées neurones. Par conséquent, pour comprendre le fonctionnement du cerveau, nous devons commencer par les
neurones . Votre néocortex contient environ 30 milliards de neurones. Un neurone typique a un
axone en forme de queue et plusieurs extensions en forme d'arbre - les
dendrites . Si vous imaginez qu'un neurone est un certain système de signaux, alors un axone est un émetteur et les dendrites sont des récepteurs. Sur les branches des dendrites, il y a 5 000 à 10 000 synapses, chacune se connectant aux mêmes synapses d'autres neurones. Au total, il y a plus de
100 billions de connexions synaptiques dans le cerveau.
Votre expérience avec le monde extérieur - que vous reconnaissez le visage de votre ami, appréciez la musique, tenez du savon dans votre main - est apparue à la suite de la contribution des yeux, des oreilles et d'autres sens qui sont passés à votre néocortex et à des groupes de neurones forcés pour travailler. Lorsqu'un neurone se déclenche, son explosion électrochimique se déplace le long de l'axone et passe à travers les synapses vers d'autres neurones. Si le neurone récepteur reçoit suffisamment d'impulsions d'entrée, il peut se déclencher en réponse et activer d'autres neurones. Sur les 30 milliards de neurones contenus dans le néocortex, 1 à 2% fonctionnent à tout moment, ce qui signifie que des millions de neurones sont actifs à tout moment. L'ensemble des neurones actifs change lorsque vous vous déplacez et interagissez avec le monde. Votre sentiment de paix, ce que vous pouvez considérer comme une expérience raisonnable, est déterminé par le schéma en constante évolution des neurones actifs.
Dans le néocortex, ces dessins sont stockés en raison de la formation de nouvelles synapses. Leur stockage vous permet de reconnaître les visages et les lieux lorsque vous les revoyez et de les rappeler de mémoire. Par exemple, lorsque vous pensez au visage de votre ami, un motif de neurones déclenchés apparaît dans le néocortex, semblable au motif qui apparaît lorsque vous voyez vraiment son visage.
Il est étonnant de constater à quel point le néocortex est à la fois simple et complexe. Il est complexe car il est divisé en dizaines de sites, chacun étant responsable de différentes fonctions conscientes. Dans chaque région, il existe de nombreuses couches de neurones, ainsi que des dizaines de types de neurones, et ces neurones sont connectés en complexes complexes.
Neocortex peut être appelé simple, car les détails de chaque site sont presque les mêmes. Au cours de l'évolution, un seul algorithme est apparu qui s'applique à tout ce que fait le néocortex. L'existence d'un tel algorithme universel est un fait passionnant, car si nous pouvons le déchiffrer, nous pouvons accéder à l'essence du concept d '«intelligence» et introduire cette connaissance dans les futures machines.
Mais n'est-ce pas ce que fait l'IA? Toutes les IA ne sont-elles pas construites sur des "
réseaux de neurones " similaires à celles qui existent dans le cerveau? Pas vraiment. Les technologies de l'IA font référence à la neurobiologie, mais elles utilisent un modèle de neurones simplifié à l'extrême qui ne tient pas compte des principaux aspects des neurones réels, et elles ne sont pas connectées de la même manière que dans une architecture cérébrale réelle et complexe. Il existe de nombreuses différences et elles comptent. C'est pourquoi les IA d'aujourd'hui font du bon travail avec le balisage d'image ou la reconnaissance vocale, mais ne peuvent pas raisonner, planifier et agir de manière créative.
Les progrès récents dans la compréhension du fonctionnement du néocortex nous amènent à spéculer sur la manière dont les machines à penser du futur peuvent être organisées. J'essaierai de décrire ces aspects de l'intelligence biologique qui sont nécessaires, mais absents de l'IA moderne. Il s'agit de formations au remontage, de représentations distribuées et de mise en œuvre liées à l'utilisation du mouvement pour enseigner les réalités du monde.
Apprentissage par recâblage: le cerveau présente des propriétés d'apprentissage étonnantes. Tout d'abord, nous apprenons vite. Deuxièmement, la formation est progressive. Nous pouvons apprendre quelque chose de nouveau sans entraîner le cerveau à partir de zéro et sans oublier ce que nous avons déjà appris. Troisièmement, le cerveau apprend constamment. Se déplacer dans le monde, planifier et agir, nous ne cessons d'apprendre. Une formation rapide, progressive et continue sont des ingrédients indispensables qui permettent aux systèmes intelligents de s'adapter à un monde en évolution. Les neurones sont responsables de l'apprentissage, et la complexité des vrais neurones en fait une puissante machine d'apprentissage.
Ces dernières années, les neuroscientifiques ont appris des faits intéressants sur les dendrites. Chacune de ses branches fonctionne comme un ensemble de reconnaissance de formes. Il s'avère que 15 à 20 synapses actives sur la branche sont suffisantes pour reconnaître un modèle d'activité dans un grand nombre de neurones. Par conséquent, un seul neurone peut reconnaître des centaines de modèles différents. Certains d'entre eux le font fonctionner, tandis que d'autres changent l'état interne de la cellule et fonctionnent comme des prédictions d'actions futures.
À un moment donné, les neuroscientifiques croyaient que l'apprentissage se produisait uniquement en modifiant l'efficacité des synapses existantes de sorte que lorsqu'un signal entrant arrive, la probabilité qu'un neurone s'active par une synapse diminue ou augmente. Mais maintenant, nous savons déjà que la majeure partie de la formation est due à la culture de nouvelles synapses entre les cellules - il y a un «réassemblage» du cerveau. Jusqu'à 40% des synapses neuronales sont remplacées quotidiennement par de nouvelles. De nouvelles synapses conduisent à l'émergence de nouveaux schémas de communication entre les neurones et, par conséquent, à de nouveaux souvenirs. Étant donné que les branches des dendrites sont pratiquement indépendantes, lorsqu'un neurone apprend à reconnaître un nouveau modèle sur l'une des dendrites, cela n'empêche pas le neurone d'apprendre déjà avec d'autres dendrites.
C'est pourquoi nous pouvons apprendre de nouvelles choses sans briser de vieux souvenirs, et nous n'avons pas besoin de former notre cerveau à partir de zéro chaque fois que nous apprenons quelque chose de nouveau. Les réseaux de neurones d'aujourd'hui n'ont pas de telles capacités.
Les machines intelligentes n'ont pas à simuler toute la complexité des neurones biologiques, mais les opportunités offertes par les dendrites et la formation par le réassemblage sont indispensables. Ces capacités devraient être présentes dans les futurs systèmes d'IA.
Vues réparties: le cerveau et l'ordinateur présentent les informations de différentes manières. Toute combinaison de zéros et de uns est potentiellement possible dans la mémoire de l'ordinateur, donc si vous changez un bit, cela peut entraîner un changement complet de sens - tout comme le remplacement des lettres «o» par «et» dans le mot «cat» produira quelque chose qui ne lui est pas lié. le mot "baleine". Cette vue n'est pas fiable.
Le cerveau utilise ce qu'on appelle
représentations réparties clairsemées (SDR). Ils sont appelés clairsemés car à un moment donné l'activité est relativement peu de neurones. L'activité des neurones change constamment lorsque vous bougez ou pensez, mais leur pourcentage est toujours faible. Si nous imaginons que chaque neurone est un bit, le cerveau utilise des milliers de bits pour représenter des informations (bien plus qu'une représentation 8 bits ou 64 bits dans un ordinateur), mais seule une petite partie des bits à un moment donné est 1; tous les autres sont 0.
Supposons que vous souhaitiez introduire le concept d'un chat en utilisant SDR. Vous pouvez utiliser 10 000 neurones, dont 100 seront actifs. Chacun des neurones actifs représente un certain aspect du chat, par exemple «animal», «moelleux», «griffé». Si plusieurs neurones meurent, ou que plusieurs nouveaux se joignent, alors le nouveau SDR sera toujours une bonne idée du chat, car pour la plupart les neurones actifs seront les mêmes. Ainsi, au lieu d'une représentation peu fiable, le SDR est résistant aux erreurs et au bruit. Lorsque nous construisons des versions en silicium du cerveau, elles auront une tolérance d'erreur inhérente.
Je veux mentionner deux caractéristiques de SDR. Premièrement, le chevauchement facilite la comparaison de deux choses et vous permet de comprendre en quoi elles sont similaires et en quoi elles diffèrent. Supposons qu'un SDR représente un chat et l'autre un oiseau. Dans les deux SDR, les mêmes groupes de neurones seront actifs, représentant "animal de compagnie" et "griffé", mais pas "moelleux". L'exemple est simplifié, mais la propriété de superposition est importante, car grâce à elle, le cerveau comprend immédiatement la similitude et la différence des objets. Cette propriété lui donne la possibilité de généraliser ce qui manque aux ordinateurs.
La deuxième propriété, l'association, permet au cerveau de représenter simultanément plusieurs idées. Imaginez que je vois un animal courir dans les buissons, mais je ne pouvais que le voir brièvement, donc je ne suis pas sûr de ce que j'ai vu. Ce pourrait être un chat, un chien ou un singe. Étant donné que le SDR est distribué, un ensemble de neurones peut activer les trois SDR en même temps, et ne pas les confondre les uns avec les autres, car les SDR n'interfèrent pas entre eux. La capacité des neurones à former constamment des pools de SDR en fait un bon outil pour gérer les incertitudes.
Ces propriétés SDR sont fondamentales pour comprendre, penser et planifier dans le cerveau. Nous ne pouvons pas créer de machines intelligentes sans utiliser le SDR.
Mode de réalisation: le néocortex reçoit une entrée des sens. Chaque fois que nous bougeons nos yeux, nos membres ou notre torse, l'apport des sens change. Cette entrée en constante évolution est le principal mécanisme utilisé par le cerveau pour l'apprentissage. Imaginez vous donner un objet que vous n'avez jamais vu auparavant. Que ce soit une agrafeuse. Comment allez-vous l'étudier? Vous pouvez le contourner en le regardant sous différents angles. Vous pouvez soulever, tenir avec vos doigts, tourner dans vos mains. Vous pouvez pousser et tirer pour voir comment il se comporte. Dans ce processus interactif, vous étudiez la forme de l'agrafeuse, vos sentiments à son sujet, son apparence et son comportement. Vous faites des mouvements, vous sentez le changement d'entrée, vous en faites un de plus, vous sentez à nouveau le changement, etc. L'apprentissage par le mouvement est le principal moyen d'apprendre le cerveau. Ce sera le composant central de tout système vraiment intelligent.
Je ne veux pas dire qu'une machine intelligente a besoin d'un corps physique - juste qu'elle peut changer les sensations par le mouvement. Par exemple, une IA virtuelle peut «se déplacer» sur le Web, en suivant des liens et en ouvrant des fichiers. Il peut étudier la structure du monde virtuel à travers des mouvements virtuels, similaires à la façon dont nous nous promenons dans un bâtiment.
Cela nous amène à l'importante découverte faite à Numenta l'année dernière. Dans le néocortex, les données de sensation sont traitées par une hiérarchie de tracés. Lorsque les données passent d'un niveau de la hiérarchie à un autre, des entités de plus en plus complexes en sont extraites, jusqu'à ce qu'à un moment donné, il ne soit plus possible de reconnaître l'objet. Les réseaux d'apprentissage en profondeur utilisent également la hiérarchie, mais ils nécessitent souvent 100 niveaux de traitement pour la reconnaissance d'image, et un néocortex pour obtenir le même résultat ne coûte que quatre. Les réseaux d'apprentissage profond nécessitent également des millions d'exemples de formation, et le néocortex peut apprendre de nouveaux objets en quelques mouvements et sensations. Le cerveau fait quelque chose de fondamentalement différent de ce que fait un réseau neuronal artificiel typique - mais quoi?
L'Allemand Helmholtz , un physicien allemand du XIXe siècle, a été l'un des premiers à répondre à cette question. Il a vu que bien que nos yeux bougent de trois à quatre fois par seconde, notre perception visuelle reste stable. Il a calculé que le cerveau prend en compte les mouvements oculaires, sinon il nous semblerait que le monde entier saute ici et là. De même, si vous touchez quelque chose, vous seriez déconcerté si votre cerveau ne manipulait que des sensations tactiles et ne savait pas que vos doigts bougeaient. Ce principe de combinaison de mouvements avec des changements de sensations est appelé
intégration sensorimotrice . Comment et où l'intégration sensorimotrice se produit dans le cerveau était un mystère.
Nous avons découvert que l'intégration sensorimotrice se produit dans toutes les parties du néocortex. Ce n'est pas une étape distincte, mais une partie intégrante du traitement des sensations. L'intégration sensomotrice est un élément clé de «l'algorithme intelligent» du néocortex. Nous avons une théorie et un modèle sur la façon dont les neurones peuvent le faire, et cela chevauche bien l'anatomie complexe de la région du néocortex.
Quelles sont les implications de cette découverte pour l'intelligence artificielle? Considérez deux types de fichiers que vous pouvez trouver sur un ordinateur. L'une est l'image prise par l'appareil photo et l'autre est une conception développée sur un ordinateur, par exemple, un fichier Autodesk. Une image est un tableau bidimensionnel de détails visuels. Un fichier CAO est également un ensemble de pièces, mais chacune d'elles est associée à une disposition dans un espace tridimensionnel. Un fichier CAO simule des objets tridimensionnels et non l'apparence de l'objet dans une certaine perspective. Avec un fichier CAO, vous pouvez prédire l'apparence d'un objet à tout point de vue et déterminer comment il va interagir avec d'autres objets tridimensionnels. Vous ne pouvez pas faire cela avec une image. Nous avons découvert que chaque section du néocortex apprend des modèles tridimensionnels d'objets de la même manière qu'un programme de CAO. Chaque fois que votre corps bouge, le néocortex perçoit la commande de motilité actuelle, la convertit en une position dans le système de coordonnées de l'objet et combine cette position avec des données obtenues des sens pour construire des modèles tridimensionnels du monde.
Rétrospectivement, cette observation est logique. Les systèmes intelligents doivent apprendre des modèles multidimensionnels du monde. L'intégration sensomotrice ne se produit pas dans plusieurs parties du cerveau - c'est le principe principal de son fonctionnement, qui fait partie de l'algorithme d'intelligence. Les machines intelligentes doivent faire exactement cela.
Ces trois principaux aspects du néocortex - formation au réassemblage, vues distribuées et intégration sensorimotrice - seront les pierres angulaires de l'intelligence artificielle. Les machines à penser de l'avenir peuvent ignorer de nombreux aspects de la biologie, mais pas ces trois. Sans aucun doute, d'autres découvertes dans le domaine de la neurobiologie nous attendent, mettant en lumière d'autres caractéristiques de la conscience qui devront être incluses dans de telles machines à l'avenir, mais vous pouvez commencer avec ce que nous savons aujourd'hui.
Dès les premiers jours de l'IA, les critiques ont rejeté l'idée d'essayer d'imiter le cerveau humain, arguant généralement que «les avions ne battent pas des ailes».
En fait, Wilbur et Orville Wright ont étudié les oiseaux en détail. Pour créer un ascenseur, ils ont étudié la forme des ailes des oiseaux et les ont testées dans une soufflerie. Pour une force motrice, ils se sont tournés vers un domaine autre que l'aviation - une hélice et un moteur. Pour contrôler le vol, ils ont regardé les oiseaux tourner leurs ailes pour créer un roulis et utiliser leur queue pour maintenir l'altitude. C'est ce qu'ils ont fait. Jusqu'à présent, les avions utilisent cette méthode, bien que nous ne tournions qu'un seul bord sur les ailes. En bref, les frères Wright ont étudié les oiseaux et ont ensuite décidé quels éléments du vol étaient nécessaires pour le vol des personnes et lesquels pouvaient être ignorés. C'est exactement ce que nous allons faire, créer des machines à penser.En pensant à l'avenir, je m'inquiète du fait que nos objectifs ne soient pas assez ambitieux. C'est formidable pour les ordinateurs d'aujourd'hui de classer les images et de reconnaître la parole, mais nous ne sommes pas près de créer des machines vraiment intelligentes. Je pense qu’il est vital pour nous de le faire. Les succès futurs et même la survie de l'humanité peuvent en dépendre. Par exemple, si nous voulons peupler d'autres planètes, nous aurons besoin de machines fonctionnant en notre faveur pour des vols dans l'espace, la construction d'installations, l'extraction de ressources et la solution indépendante de problèmes complexes dans un environnement dans lequel les gens ne peuvent pas survivre. Sur Terre, nous sommes confrontés aux problèmes de maladie, de climat et de manque d'énergie. Les voitures intelligentes peuvent nous aider. Par exemple, il est possible de fabriquer des machines intelligentes, sensibles et capables de travailler à l'échelle moléculaire.Ils pourraient parler du repliement des protéines et de l'expression des gènes de la même manière que nous parlons des ordinateurs et des agrafeuses. Ils pouvaient penser et agir un million de fois plus vite que les humains. De telles machines pourraient traiter des maladies et maintenir notre monde dans un état habitable.Dans les années 40, les pionniers de l'ère informatique ont estimé que les ordinateurs iraient loin et seraient très utiles, et qu'ils étaient susceptibles de transformer la société humaine. Mais ils ne pouvaient pas prédire avec précision comment les ordinateurs changeraient nos vies. De la même manière, nous pouvons être sûrs que des machines vraiment intelligentes transformeront notre monde pour le mieux, même si aujourd'hui nous ne pouvons pas prédire exactement comment. Après 20 ans, nous regardons en arrière et réalisons qu'à notre époque, des percées dans la théorie du cerveau et de l'apprentissage automatique ont commencé l'ère de la véritable intelligence de la machine.