Il y a des capacités, mais pas de raison: des tâches auxquelles l'IA ne peut pas faire face

"La voiture doit décider qui sacrifier - ceux qui sont à l'intérieur de la voiture, ou ceux qui se sont précipités sous les roues", Tatyana Gavrilova, professeur au Département de technologie de l'information de l'Université d'État de Saint-Pétersbourg, explique quels algorithmes sous-tendent l'intelligence artificielle et quelles difficultés rencontrent ses développeurs.

Du cerveau vivant à l'intelligence artificielle


Au cours des cinq dernières années, une grande vague de publications, de discours, de craintes, ainsi que de battage médiatique - discussions, battage médiatique et publicité agressive s'est développée autour de l'intelligence artificielle. Cela indique principalement la spéculation et le blasphème. Les portails de nouvelles qui s'affrontent racontent comment un réseau de neurones a appris une autre astuce incroyable. Il faut comprendre qu'un réseau neuronal artificiel n'est pas un modèle du cerveau. Les neurophysiologues notent que le mécanisme du cerveau est encore mal connu et que son modèle est loin d'être formalisé mathématiquement.

En 2013, la Commission européenne a évalué le projet de recherche Human Brain Project et alloué une subvention d'un milliard de dollars à la recherche. Le but de ce projet est de créer un modèle informatique entièrement fonctionnel du cerveau humain. Présentez la complexité du cerveau: comment les neurones se connectent et interagissent les uns avec les autres, comment les souvenirs se forment et les décisions sont prises. Lors de la Conférence européenne de 2019, une présentation a été faite par le neuroscientifique, directeur et fondateur du Human Brain Project, Henry Markram. Lui et l'équipe ont montré des images du cerveau, éclairées sur un tomographe de différents côtés, soulignant que plus elles s'enfonçaient dans le cerveau, moins il devenait clair comment cela fonctionne. Pendant tout ce temps, ils ont suivi la voie de la miniaturisation, mais il est évident qu'un macro-modèle du cerveau est nécessaire. Ici, vous pouvez faire une analogie avec la métaphore bien connue: peu importe combien la fourmi a rampé à l'intérieur du téléviseur, elle ne comprend toujours pas de quel type d'appareil il s'agit.

Les chatbots parlent mais ne comprennent pas


Le premier programme conversationnel "Eliza" a été développé dans les années 60. Son travail était comme une séance de psychothérapie. Un exemple de dialogue pourrait ressembler à ceci:
- Bonjour. Comment te sens-tu
- Ma tête me fait mal.
- À quelle fréquence cela se produit-il?
"Chaque fois que je parle à ma mère."
"Vous avez un problème avec votre maman." Dites-nous en plus à ce sujet.

Le programme contient un ensemble de blancs. Identifie le mot-clé dans chaque phrase et crée l'illusion d'une conversation, sans aucun sens. Ainsi, Eliza pouvait habilement maintenir une conversation pendant plusieurs heures, faisant bonne impression sur les gens.

Aujourd'hui, Alice de Yandex est la même Elisa, avec une plateforme de service connectée et un vocabulaire beaucoup plus riche. Toute l'intelligence de ces robots de discussion se résume à un recyclage. Si nous leur identifions les réponses comme étant mauvaises, inadaptées, cela les éliminera à l'avenir et en laissera de bonnes qui conviennent. Le véritable caractère raisonnable du programme, sa capacité non seulement à déterminer ce qui est montré dans l'image ou à convertir le discours oral en texte, mais à comprendre le sens de l'information et de penser, n'apparaîtront que lorsqu'ils seront connectés à une base de connaissances. C'est une certaine compréhension de l'ordre mondial. Aucun programme ne peut encore le faire. L'intelligence artificielle travaillant avec une base de connaissances s'appelle l'IA symbolique (IA symbolique).

Désormais, deux directions sont activement utilisées: le réseau de neurones artificiels et l'apprentissage automatique. Leur développement n'est pas effectué dans des laboratoires scientifiques sous la direction de scientifiques, mais dans des sociétés informatiques. Les programmeurs et les développeurs de réseaux de neurones artificiels admettent qu'il n'y a rien d'autre à penser que le cerveau. Par conséquent, s'ils veulent créer un système intelligent, ils sont obligés de simuler le cerveau, car il n'y a plus rien. Mais une percée cardinale sera pour ceux qui sont capables de croiser des modèles de représentation des connaissances et d'apprentissage automatique.
Soit dit en passant, certaines entreprises utilisent déjà activement des robots pour le placement. Ils sont particulièrement bons lors des projections de masse, qui reçoivent plus de 1000 CV. Le robot analyse les questionnaires et évalue la pertinence des candidats, mais la décision finale est toujours prise par la personne. Des scientifiques du Georgia Institute of Technology ont découvert dans quel cas les gens font volontiers confiance au robot. Cela se produit si on leur dit à l'avance qu'il est conçu pour effectuer une tâche spécifique. Ces robots effectuent également des interviews le week-end. Les gens ont un dialogue plus franc avec la machine sur les raisons du licenciement et sur les difficultés rencontrées dans le processus de travail. Ainsi, les robots collectent de très bons commentaires, et surtout des commentaires significatifs. De plus, les gens ont peur de mentir à un robot. Ils pensent que les voitures ont plus d'informations. Par exemple, les deux principales questions pour sélectionner les commerçants étaient: avez-vous un casier judiciaire et buvez-vous de l'alcool? Et les gens sans se cacher ont répondu à ces questions au robot.

Quel est le problème avec les drones


Les véhicules sans pilote modernes sont imparfaits et présentent plusieurs inconvénients. Le plus évident réside dans la vision industrielle. Le problème n'est même pas dans la sphère technique, le problème de la vision industrielle n'a pas été résolu conceptuellement. Les caméras et les capteurs traitent certains signaux à grande vitesse, ce qui entraîne la formation d'images binaires dans la mémoire de l'ordinateur, qui doivent être interprétées. C'est la principale difficulté. Si, par exemple, un piéton traverse la route, tout conducteur le considère facilement. Non pas parce que sa vision est meilleure que celle d'une caméra de drone, mais parce que le conducteur a en tête un modèle de personne en mouvement. Les modèles de vision n'existent pas encore. On ne sait pas comment une personne traite les informations visuelles. Des dispositifs de modélisation sont en cours de conception qui permettent de reconnaître avec un certain degré de confiance un certain nombre d'objets.

Imaginez que vous ayez demandé à une personne qui ne comprend rien dans les voitures d'apporter le triangle. De toute évidence, il ne pourra pas le faire. Parce qu'il n'est pas mécanicien automobile et qu'il n'a pas de modèle à levier dans la tête. Mais si vous dites que c'est un morceau de fer de forme incurvée - une personne l'apportera. Tout le monde sait ce qu'est un morceau de fer et comprend à quoi ressemble une «forme incurvée». Même après explication, le robot ne résiste pas. Pour ce faire, vous devez le former, en définissant les concepts de tous ces objets sous différents angles et avec différents degrés d'accès.

Au bureau, une personne n'a pas à éloigner la chaise de la table pour identifier l'article. Regardez juste à l'arrière. Seulement parce que les gens ont un modèle complet de la chaise, et nous, dans une partie, recréons le tout. Nous savons qu'une chaise est un attribut essentiel d'un intérieur de bureau. Par conséquent, parmi une vaste sélection d'objets pouvant être recréés à partir de ce fragment, nous en sélectionnons un. Il n'y a aucun programme universel qui pourrait le faire. Aucune intelligence artificielle ne contient désormais un modèle du monde et des connaissances qui lui permettent d'interpréter sans ambiguïté l'image qu'elle voit.

Supposons que quelque part derrière les buissons se cache un homme, prêt à courir sur la route. Une partie de son corps est cachée derrière un feuillage dense. La partie visible ne sera pas suffisante pour que la machine puisse considérer cela comme un danger potentiel. De plus, si vous voyez un éléphant se cacher derrière les buissons, vous déciderez probablement que c'est un homme au masque d'éléphant, car il n'y a pas d'éléphants dans notre région. Eh bien, la voiture n'a certainement pas cette connaissance.

Le problème des interprétations approche de sa résolution, en tout cas il y a des progrès. Dans l'algorithme d'apprentissage automatique sur des échantillons énormes, vous pouvez mettre 100 voitures, et il est clair que 101, même d'une marque différente, avec une forte probabilité, le programme reconnaîtra correctement. Bien que cette voiture n'y soit pas spécifiquement prévue. Il convient également de noter que pour la formation du programme, il est important d'observer la variété de la sélection. Si, par exemple, vous n'apprendrez le programme que dans les berlines, puis qu'un cabriolet montera, il ne le reconnaîtra probablement pas, car il n'y avait pas de voitures sans toit dans l'échantillon.

Le deuxième défi est un dilemme éthique dans lequel une machine doit faire un choix moral. Disons que les véhicules sans pilote transportent un passager. Un homme a sauté pour se rencontrer et le seul moyen d'éviter une collision était de pénétrer dans un pilier voisin. La voiture doit décider qui sacrifier - ceux qui sont à l'intérieur de la voiture ou ceux qui se sont précipités sous les roues. C'est une tâche absolument insoluble pour elle. Il y a déjà des premiers accidents et même des victimes. En Arizona, un SUV sans pilote appartenant à Uber a tué un piéton. Leur faute est qu'ils ont sorti un algorithme brut qui n'a pas réussi tous les tests sur la piste.

Le problème des drones est d'abord le manque d'idées de base sur le monde. Les gens prennent toujours des décisions en contexte. Aucune intelligence artificielle n'a une image complète du monde qu'une personne a à l'âge de 18 ans. Pour cette raison, un permis de conduire est délivré précisément à partir de l'âge de 18 ans [en Russie], bien que la vision soit déjà bien formée à 14 ans. Avant d'atteindre l'âge adulte, une personne ne peut pas prendre des décisions éclairées, y compris éthiques et émotionnelles.

Nous avons affaire à des algorithmes très jeunes et immatures qui nécessitent un raffinement. Ils sont capables de fonctionner correctement, mais exclusivement sous contrôle humain.

Intelligence artificielle polygraphique


Sur le marché de l'intelligence artificielle, les principales sociétés mondiales investissent activement dans le domaine de l'informatique émotionnelle. Cette technologie révèle les changements les plus invisibles dans les expressions faciales. Le programme sélectionne un certain nombre de points sur le visage et le compare à la base de données de photographies dans laquelle l'émotion est déjà reconnue.

Microsoft a déclaré avoir un algorithme similaire, mais il ne le donnera pas au gouvernement. Il s'agit d'un outil très dangereux qui peut être utilisé contre les humains. Imaginez que vous entrez dans le bureau du patron, et il voit que vous le détestez et pensez mal de lui. Il y a un grave problème éthique.

Il y aura beaucoup plus de programmes similaires de "reconnaisseurs". Beau, merveilleux y compris. Ils seront utiles, notamment en médecine. Les voitures aident déjà les médecins à diagnostiquer les maladies. Disons que le programme américain IBM Watson rend les diagnostics diagnostiques meilleurs que certains médecins novices. En tant qu'échantillon de formation, six mille histoires de cas y ont été déposées. C'est un travail titanesque et, bien sûr, beaucoup d'argent.

La machine sait-elle composer


La machine n'est pas en mesure de générer quelque chose de qualitativement nouveau. Paroles originales, vers, compositions musicales - tout cela est basé sur le principe de la permutation, ou, plus simplement, de la permutation. Quant à la poésie, l'algorithme des actions est le suivant: le programme trouve des moments communs et certaines combinaisons. Il prend des mots clés, leur ajoute les mots d'autres auteurs et les tord au rythme souhaité. La langue russe est complexe, mais si vous ne vous souciez pas de la rime, vous pouvez alors "composer" un vers blanc.

Avec la musique, c'est encore plus facile. Le programme détermine quels accords sont les plus caractéristiques d'un artiste particulier et les utilise, mais dans une séquence différente. La base de cette "créativité" est le remaniement de l'échelle et le rejet de la cacophonie manifeste.
Il y avait des programmes qui composaient des contes populaires. Pour ce faire, nous avons effectué une analyse des scénarios à l'aide du livre de Vladimir Propp «Morphologie d'un conte». Il s'est avéré que le modèle de développement des événements comprend plusieurs éléments évidents: les contes de fées ont toujours des caractères positifs et négatifs. Il y a aussi un donateur, une route, un obstacle et une fin heureuse à la fin. Un trait distinctif de ces contes était l'éclectisme. Le programme a combiné les héros et leurs actions, racontant, par exemple, Ivan le Fou, qui se bat avec le Serpent Gorynych. Un inconvénient absolu était la mauvaise langue de l'histoire. Les auditeurs s'ennuyaient. Un conteur vivant ajoutera toujours de l'humour et quelque part une vitesse de parole amusante. Pour la même raison, le programme ne peut pas traduire des métaphores ou des unités phraséologiques dans d'autres langues. Les traducteurs en ligne travaillent avec de gros volumes d'informations. Il convient de noter que la qualité de leur traduction s'est considérablement améliorée ces dernières années. Maintenant, ils ne traduisent pas chaque mot individuellement, comme ils le faisaient auparavant, mais recherchent la phrase entière quelque part dans les textes. La plus grande difficulté vient de la sémantique. Cela nécessite une base de connaissances pour comprendre la signification des expressions. Par exemple: les poulets sont prêts pour le dîner. Il n'est pas clair comment traduire correctement cette phrase si vous ne savez pas où se trouve la personne à ce moment - à la ferme de poulet (les poulets sont prêts pour le dîner) ou dans un restaurant (les poulets sont préparés pour le déjeuner).

Sans connaissance humaine, aucune activité intellectuelle n'est possible. La connaissance ne peut être remplacée par rien. La question est de savoir comment numériser ces compétences. Comment transformer l'expérience en un schéma significatif, qui pourrait être partagé avec la machine.

Source: https://habr.com/ru/post/fr473564/


All Articles