Intelligence artificielle, forte et peu
Du 4 au 7 avril, une conférence organisée par NVIDIA, dédiée au calcul parallèle et à l'intelligence artificielle, s'est tenue à San José. Ensuite, je voudrais partager mes réflexions sur l'état et les perspectives d'évolution dans le domaine de l'IA, inspirées par cet événement.Le raisonnement sur l'intelligence artificielle peut être divisé en deux types. Le premier type parle de ce qui se passera lorsque les ordinateurs pensants apparaîtront et quel sera le sort de l'espèce humaine. Explore les options possibles pour la relation de l'homme et de la machine à penser. Les sujets de l'immortalité liés au transfert possible de la conscience humaine vers la coque de l'ordinateur sont discutés. Peut-être que la question principale se pose - si une personne crée un esprit bien supérieur au sien, qui sera-t-il avec cet esprit? Maître, esclave, impasse de l'évolution ou acteur de la symbiose?Le deuxième type est une discussion des moyens qui, en théorie, devraient conduire à la création d'une intelligence artificielle à part entière et de méthodes qui aident déjà à résoudre des problèmes intellectuels complexes.Le bassin versant principal passe par le «critère de rationalité» des machines. C'est ce qu'on appelle la division de l'intelligence artificielle en fort et faible. Une IA faible signifie la capacité des ordinateurs à résoudre des problèmes d'information, par exemple, à déterminer ce qui est montré dans l'image ou à traduire le son d'une voix dans le texte correspondant. Une IA forte implique qu'un ordinateur ne fonctionne pas seulement sur des informations, mais, à un degré ou à un autre, comprend sa signification. Par exemple, si un traducteur informatique d'une langue à une autre remplace simplement un mot par une autre selon des règles inchangées prédéterminées, alors c'est une IA faible, mais si elle vient de la compréhension de la signification des phrases, elle est déjà plus proche de forte.Le critère d'une IA forte est le fameux test de Turing. Si, tout en communiquant avec un ordinateur via un canal de communication anonyme, vous ne pouvez pas comprendre qui est à l'autre bout de la ligne, une personne ou une machine, alors nous pouvons supposer qu'un tel ordinateur interlocuteur pense vraiment. L'essence de ce test est que combien ne se souviennent pas des réponses que les gens donnent à certaines questions et combien n'accumulent pas de phrases pertinentes à certains moments, il y aura toujours une situation où une réponse «mécanique» sera impossible.Un exemple récent de «non-réussite au test» est un chatbot de Microsoft Tay. Vous pouvez discuter avec lui via Twitter ou les messagers Kik et GroupMe. Après une journée de communication avec les utilisateurs, le bot de discussion est devenu agressif, a commencé à louer Hitler et à gronder les Juifs.
La raison de ce comportement n'est pas du tout que les gens qui lui parlaient «lui aient ouvert les yeux». La raison - jusqu'à présent, l'incapacité des machines se rapprochera de la compréhension du sens des phrases. Lorsque le chatbot se souvient de quelque chose de similaire à la conversation en cours, il peut utiliser les phrases que les gens ont dites dans de telles situations, dans l'espoir d'obtenir quelque chose de raisonnable. Ou le robot peut essayer de déterminer le sujet de la conversation, par exemple, à quel point les mots et la formulation utilisés par l'interlocuteur conseillent l'un ou l'autre sujet. Après avoir déterminé le sujet de la conversation, il peut essayer de sélectionner des phrases à partir de conversations avec un sujet similaire ou d'utiliser les connaissances dans ce domaine intégrées ou glanées sur Internet. Cette stratégie vous permet de créer l'apparence d'une conversation raisonnable, mais uniquement la visibilité. Mais ce n'est peut-être pas mal. Parfois, dans une entreprise après la cinquième ou la sixième fois,quand il n'est pas du tout nécessaire pour la communication d'écouter attentivement la personne à qui vous parlez, et si à ce moment quelqu'un est remplacé par un chatbot, alors peut-être que cela ne sera pas immédiatement remarqué.Bien mieux que de parler d'un sujet gratuit, les ordinateurs peuvent comprendre les commandes et les requêtes formalisées. Si la machine attend un traitement très précis, la tâche est grandement simplifiée. Selon ce principe, à la fois Siri et Ok, Google fonctionne avec succès.Il y avait beaucoup d'activité lors de la conférence consacrée au supercalculateur IBM Watson. L'idée principale de Watson est de comprendre la conversation dans un langage naturel, de la traduire en une description informatisée, d'utiliser des bases de connaissances dans divers domaines pour trouver des réponses adéquates.
En février 2011, Watson a remporté l'émission de télévision Jeopardy! (l'homologue russe est «Mon jeu»). De plus, il a battu non seulement ses rivaux, mais deux détenteurs de records, Brad Rutter - le propriétaire de la plus grande victoire du programme et Ken Jennings - détenteur du record pour la durée d'une série gagnant-gagnant. L'ordinateur a remporté un prix de 1 million de dollars. NVIDIA a plaisanté sur le fait de gagner qu'ils ne savent pas ce que l'ordinateur fera avec un million, mais du point de vue de la méthode d'entraînement par renforcement, il faut dire que c'est un bon renforcement. Il a été particulièrement noté que Watson était sur un pied d'égalité avec les joueurs dans le sens où il n'était pas connecté à Internet. En mémoire de Watson, «tout Internet» a été téléchargé à l'avance, au moins une partie importante de la taille de 4 téraoctets. Pour les données structurées, c'est beaucoup, il suffit de tenir compte du fait que l'ensemble de Wikipédia prend 17 gigaoctets.
La chose la plus importante dans le jeu était que les questions étaient posées sans aucune simplification ni clarification supplémentaire. Cela signifie que l'ordinateur a en effet pu dans certains cas déterminer correctement ce qui lui était demandé et le retrouver dans sa base de connaissances. Mais Watson a-t-il vraiment compris l'essence des questions posées? Non, je ne comprenais pas, du moins pas comme les gens le comprennent. Quelle était l'essence du combat? Les gens comprenaient chaque question posée, mais ne trouvaient pas toujours la réponse dans leur mémoire. L'ordinateur n'a pas compris la signification des questions, mais, à l'aide d'algorithmes, les a traduites dans une certaine forme de recherche, par laquelle il a trouvé une correspondance assez précise dans sa mémoire structurée. La victoire de Watson a montré qu'un algorithme et une bonne mémoire peuvent donner un plus grand pourcentage de réponses correctes que la compréhension et une mauvaise mémoire.Si les gens avaient accès à Internet et ne fixaient pas de délai serré, le résultat du jeu serait différent.IBM Watson ne peut pas encore être attribué à une IA forte, mais cela n'enlève rien à ses mérites. Le principal problème associé à la compréhension du langage naturel est la multiplicité des interprétations qui peuvent se produire dans le même mot selon le contexte de la phrase. Mais si la conversation va dans un domaine plus spécial, il s'avère que de nombreux domaines déterminent presque les seules interprétations possibles. Et à ce stade, le succès de l'ordinateur augmente considérablement. Conscient de cela, les développeurs de Watson se sont concentrés sur des sujets individuels. Par exemple, la plus grande avancée du supercalculateur d'IBM est peut-être liée aux diagnostics médicaux. Une conversation sur un sujet médical dans un langage naturel est donnée à Watson assez facilement, car tout ce qui est dit est interprété exclusivement dans un sens médical. Avec une énorme base de données de dossiers médicaux,des diagnostics et des traitements, l'ordinateur a pu se montrer au niveau des bons médecins, et dans certains domaines, par exemple en oncologie, au niveau des excellents. Cela ne signifie pas que les médecins vivants devraient maintenant être ignorés, mais plutôt compris afin que les médecins aient une occasion précieuse de vérifier leurs résultats ou d'obtenir des idées supplémentaires en consultant Watson. J'apporterai le vélo au sujet.Moscou Milieu des années 80.Une conférence médicale sur l'utilisation des ordinateurs en médecine. Tous les participants ont convenu que bientôt les ordinateurs remplaceront les médecins ... Ils feront des diagnostics, et les gens n'auront que des mesures procédurales.Et à la toute fin de la conférence, un médecin très âgé a exprimé le désir de parler, d'ailleurs, d'un académicien et d'un praticien. Avec de grands applaudissements, il est à peine monté sur le podium ... Les éléments du parti présents à l'événement ont considéré que le soutien d'une telle innovation par un médecin respecté serait un bon signe ... Il est sorti et a déclaré: «Au début des années vingt, une femme très importante a été amenée à mon professeur pour examen Commissaire du peuple au parti. C'était un cas très difficile, huit médecins précédents n'ont pas pu diagnostiquer le patient. Un coup d'œil sur cette femme fut suffisant pour mon professeur, il ordonna immédiatement une analyse de la réaction de Wasserman. Alors dites-moi, chers collègues, quel type d'ordinateur peut diagnostiquer instantanément la syphilis chez un seul type de patient *?Revenons à Watson. IBM a pris le chemin de la créationune API ouverte où n'importe qui peut utiliser les connaissances et l'interface en langage naturel de Watson pour s'intégrer dans son entreprise. IBM essaie de créer de nombreux services cognitifs tels que la reconnaissance de la parole et des images, un service de classification des requêtes dans un langage naturel, la traduction dans une autre langue, la détermination de la coloration émotionnelle du discours et des textes, etc. À l'avenir, ils voient que de nombreuses entreprises seront en mesure de transférer la majeure partie de leur assistance client vocale à la technologie Watson, ce qui offre d'énormes économies. En bref, de nombreux Indiens des centres d'appels peuvent se retrouver sans travail.L'idée que l'IA commence à bien mieux fonctionner lorsqu'il est possible de passer à une tâche spéciale qui rétrécit l'espace d'interprétation s'applique non seulement à l'analyse du langage naturel, mais aussi, par exemple, à l'analyse d'image. En principe, c'est la base pour construire un système de contrôle de voiture sans chauffeur. Lorsque le système de vision artificielle est montré une image, et qu'il détermine ce qui est dans cette image, alors la détermination se produit avec une certaine probabilité. Et à propos d'un chien avec une cape de tigre, le système peut dire que c'est un tigre. Tout est plus facile sur la route, le nombre d'objets qui peuvent être rencontrés n'est pas grand, et donc le choix et les interprétations sont très limités: un piéton, une voiture, un bus, une signalisation routière, des marquages, mais pas un tigre, pas une baleine, et pas un gâteau de mariage.Le contrôle des véhicules sans pilote utilise de nombreuses technologies, en voici quelques-unes:- Reconnaissance de formes, il est chargé de reconnaître divers objets sur la route;
- Traitant une série d'images avec un décalage, il vous permet de sélectionner des objets individuels sur le fond des autres;
- Le traitement d'image stéréoscopique vous permet de construire une carte de profondeur et de distance;
- L'utilisation du lidar complète la construction d'une carte des distances ou vous permet de la construire à partir de zéro, par exemple, dans l'obscurité totale. L'autre jour, Ford s'est distingué ;
- Formation renforcée, dispense une formation sur la conduite et les règles de conduite.
Dans le hall de la conférence se trouvaient trois véhicules sans pilote d'Audi, Volvo et BMW. Tous, et pas seulement eux, ont un contrôle basé sur la solution NVIDIA DRIVE . La solution elle-même se compose de trois composants:- NVIDIA DRIVE PX - plateforme de pilote automatique;
- NVIDIA DRIVE CX - un ordinateur de bord avec un système de navigation, si PX sait comment s'y rendre, alors CX sait où aller et comment divertir le passager;
- NVIDIA DIGITS DEV BOX est un système d'apprentissage en profondeur qui vous permet de former des réseaux de neurones pour PX.

La conduite automatique fait forte impression. L'IA dans toute sa splendeur. J'ai particulièrement aimé la vidéo que Toyota a montré sur la façon d'apprendre à conduire leur voiture sans pilote. Au début, comme un chaton aveugle, il a fouillé dans toutes les directions et a constamment freiné, puis il s'est déplacé avec plus de confiance et, enfin, après 3000 miles de course, il a commencé à courir avec confiance sur toutes les routes.
Toyota était représentée à la conférence par le biais du Toyota Research Institute. Le PDG de l'Institut, Gill Pratt, a annoncé que le constructeur automobile avait l'intention d'investir 1 milliard de dollars au cours des cinq prochaines années dans la recherche liée à l'IA. L'approche de Toyota est intéressante. Ils disent qu'ils ne considèrent pas le pilote automatique complet comme une priorité absolue. Désormais, le pilote automatique, implémenté, par exemple, dans Tesla, nécessite le mode «mains sur le volant». Autrement dit, il peut conduire, mais nécessite une surveillance constante par le conducteur. Ce mode est plutôt ennuyeux que d'ajouter du plaisir au voyage. Toyota se concentre sur les systèmes d'aide à la conduite, c'est-à-dire que le pilote automatique n'interfère pas avec le contrôle pendant que tout se passe bien, mais si la situation devient incontrôlable, le pilote automatique prend tout en main et enregistre la situation. Peu de conducteurs ont l'expérience de la conduite dans des situations extrêmes,la conduite normale n'a pas grand-chose à voir avec ce qu'il faut faire dans une situation critique. Le pilote automatique peut simplement être très bien formé précisément pour de tels cas. 1 200 000 décès routiers par an - de telles statistiques sur la planète Terre. Selon Toyota, leur système réduira ce chiffre à presque zéro. Comme le rappelle Gill Pratt (rappel): "La demande pour notre système ne devrait pas être prise en compte pour les voitures, les consommateurs qui en ont désespérément besoin sont de 1 200 000 personnes par an.""La demande pour notre système ne doit pas être prise en compte pour les voitures, les consommateurs qui en ont désespérément besoin sont 1 200 000 personnes par an.""La demande pour notre système ne doit pas être prise en compte pour les voitures, les consommateurs qui en ont désespérément besoin sont 1 200 000 personnes par an."Mais un pilote automatique, quelle que soit la surprise d'une voiture voyageant sans chauffeur, n'est pas une IA puissante. Jusqu'à présent - c'est un ensemble de bonnes méthodes et algorithmes. Il est possible que davantage ne soit pas nécessaire pour cette tâche.De nombreuses tâches, telles que la conduite sans pilote, peuvent être résolues avec succès sans utiliser une IA puissante. Les réseaux de neurones avec apprentissage en profondeur (ou apprentissage en profondeur, si vous aimez une telle traduction de l'apprentissage en profondeur) sont très bien adaptés lorsque la «programmation dans le front» s'arrête et il s'avère qu'il est beaucoup plus facile de «nourrir» un réseau de neurones avec un large éventail d'exemples et de sujets de formation. afin de lui apprendre la bonne classification que d'essayer de décrire tous les modèles et la réaction à eux.Mais les miracles ne se produisent pas, la simplicité d'obtention d'un résultat est compensée par la complexité de la formation. La formation d'un réseau neuronal d'un grand nombre d'éléments sur un grand nombre d'exemples nécessite une énorme quantité de calcul. Les processeurs traditionnels sont trop lents pour de tels calculs. Le seul salut est la parallélisation massive des calculs, car les réseaux de neurones sont très bons dans ce domaine. Les GPU créés à l'origine pour former des images graphiques étaient presque parfaits à ces fins. La demande sur le marché des réseaux de neurones a obligé les fabricants de GPU à prendre en compte les caractéristiques d'une telle application dans l'architecture de fer et les a incités à créer des logiciels appropriés qui facilitent la vie des développeurs. Lors de la conférence, NVIDIA, en tant que principal fabricant de GPU, a tenté de convaincre tout le mondequ'ils ont créé une pile complète de logiciels nécessaires, assurant le support de toutes les étapes du développement des réseaux de neurones.Comme je l'ai déjà écrit , lors de la conférence, NVIDIA a présenté une percée dans le domaine de la formation des réseaux de neurones profonds - le supercalculateur DGX-1. Une percée est une augmentation de 12 fois la productivité des tâches d'apprentissage par rapport à ses prédécesseurs.
En conséquence, l'écosystème comprend non seulement du fer, mais également un ensemble complet de programmes optimisés pour le deep learning (https://developer.nvidia.com/deep-learning#source=pr).La suite logicielle DGX-1 comprend le NVIDIA Deep Learning GPU Training System (DIGITS), un système interactif complet pour créer des réseaux de neurones profonds (DNN), ainsi qu'une bibliothèque accélérée par GPU de primitives pour créer des DNN - le NVIDIA CUDA Deep Neural Network (cuDNN) version 5 .En outre, le système contient des versions optimisées de plusieurs cadres d'apprentissage en profondeur largement utilisés - Caffe, Theano et Torch. DGX-1 donne également accès à des outils de gestion basés sur le cloud, à des mises à jour logicielles et à une banque d'applications de conteneurs. »En général, lors de la conférence, NVIDIA a clairement tenté de transmettre à tout le monde l'idée qu'ils ne sont pas seulement depuis longtemps un fabricant de puces spécialisées, mais une entreprise qui a une vision de la technologie en général et propose des solutions intégrées dans lesquelles le fer n'est qu'un et non le fait que le plus composant principal.En bref, l'IA avance à pas de géant. Mais pour l'instant, tout cela est une IA faible. Le terme faible ne doit pas être considéré comme une évaluation négative. Ce n'est qu'un raffinement de la technologie utilisée. Notre distance par rapport à une IA forte est facile à juger par les systèmes de traduction informatique. Pendant la traduction du texte technique ou d'un autre texte bien interprété, le traducteur automatique est à la hauteur. Mais il vaut la peine de donner un exemple qui nécessite de comprendre le sens de la phrase, comment la traduction correcte devient une question de hasard et aucune méthode statistique ne sauve la situation.Deep Blue d'IBM a remporté un jeu d'échecs de 6 matchs en 1997 contre le champion du monde Garry Kasparov. L'AlphaGo de Google a récemment battu le joueur de Go le plus puissant du monde. Dans quelle mesure cela indique-t-il que l'ère de l'IA forte approche? Un grand pas pour un robot, mais peu de progrès pour l'humanité. Nous voyons un bon travail de méthodes d'enseignement avec renforcement, mais avec un «mais» significatif. Le fait est que les échecs et Go permettent une description assez simple et précise de la position. La stratégie comportementale repose sur la compréhension que le poste nous est familier à un degré ou à un autre et que nous pouvons utiliser l'expérience que nous avons acquise pour prendre des décisions. Afin de ne pas calculer toutes les options, une évaluation de la qualité de la situation est introduite jusqu'au bout, ce qui vous permet d'évaluer la position sans calculer les options pour une éventuelle poursuite. Dans les deux cas, il s'avèrece qui est le plus important, c'est de pouvoir obtenir tous les éléments sémantiques influençant son évaluation à partir d'une description formelle d'un poste. Pour les échecs et Guo, bien que ce ne soit pas facile, cela a fonctionné. Dans la vie, tout est beaucoup plus compliqué. Une description «brute» externe de ce qui se passe n'aide pas beaucoup à déterminer une stratégie comportementale et à évaluer la qualité d'une situation. Vous ne pouvez pas juger de la similitude des situations par la coïncidence de certains des signes. Cela nécessite une compréhension de la signification de ce qui se passe. Tout détail mineur peut être essentiel pour déterminer ce qui se passe. Ainsi, le google-mobile continuera à rouler le long de la route s'il n'y a pas d'obstacles, les règles de circulation ne sont pas violées et l'itinéraire est suivi. Et il ne sera pas confus ni par le champignon nucléaire à l'horizon, ni par la foule de zombies qui se tiennent nerveusement sur la touche.mais il s'est avéré. Dans la vie, tout est beaucoup plus compliqué. Une description «brute» externe de ce qui se passe n'aide pas beaucoup à déterminer une stratégie comportementale et à évaluer la qualité d'une situation. Vous ne pouvez pas juger de la similitude des situations par la coïncidence de certains des signes. Cela nécessite une compréhension de la signification de ce qui se passe. Tout détail mineur peut être essentiel pour déterminer ce qui se passe. Ainsi, le google-mobile continuera à rouler le long de la route s'il n'y a pas d'obstacles, les règles de circulation ne sont pas violées et l'itinéraire est suivi. Et il ne sera pas confus ni par le champignon nucléaire à l'horizon, ni par la foule de zombies qui se tiennent nerveusement sur la touche.mais il s'est avéré. Dans la vie, tout est beaucoup plus compliqué. Une description «brute» externe de ce qui se passe n'aide pas beaucoup à déterminer une stratégie comportementale et à évaluer la qualité d'une situation. Vous ne pouvez pas juger de la similitude des situations par la coïncidence de certains des signes. Cela nécessite une compréhension de la signification de ce qui se passe. Tout détail mineur peut être essentiel pour déterminer ce qui se passe. Ainsi, le google-mobile continuera à rouler le long de la route s'il n'y a pas d'obstacles, les règles de circulation ne sont pas violées et l'itinéraire est suivi. Et il ne sera pas confus ni par le champignon nucléaire à l'horizon, ni par la foule de zombies qui se tiennent nerveusement sur la touche.Tout détail mineur peut être essentiel pour déterminer ce qui se passe. Ainsi, le google-mobile continuera à rouler le long de la route s'il n'y a pas d'obstacles, les règles de circulation ne sont pas violées et l'itinéraire est suivi. Et il ne sera pas confus ni par le champignon nucléaire à l'horizon, ni par la foule de zombies qui se tiennent nerveusement sur la touche.Tout détail mineur peut être essentiel pour déterminer ce qui se passe. Ainsi, le google-mobile continuera à rouler le long de la route s'il n'y a pas d'obstacles, les règles de circulation ne sont pas violées et l'itinéraire est suivi. Et il ne sera pas confus ni par le champignon nucléaire à l'horizon, ni par la foule de zombies qui se tiennent nerveusement sur la touche.La création d'une IA forte est directement liée non seulement à la capacité de fonctionner algorithmiquement (en utilisant des méthodes traditionnelles) avec des informations, mais aussi à la capacité de comprendre sa signification. Cette tâche semble difficile, d'autant plus qu'elle est directement liée à la compréhension du travail du cerveau, car ce mécanisme est précisément capable de travailler avec le sens. Une IA forte arrivera-t-elle bientôt? Peut-être très bientôt. Dans le prochain article, je décrirai le développement de notre groupe concernant la formalisation mathématique du concept de sens et la construction d'un modèle basé sur cela, qui prétend avoir une très bonne description du cerveau, et de sorte qu'il montre de manière convaincante un bon échantillon de travail. Donc, peut-être bientôt dans le magasin, vous entendrez un tel dialogue:Vendeur: Il s'agit d'une nouveauté, un implant cérébral, qui supprime la moitié de la charge mentale.Acheteur: Super! Vendez-moi un couple.Source: https://habr.com/ru/post/fr393071/
All Articles