Noam Chomsky: où l'intelligence artificielle s'est-elle trompée?

Commentaire du traducteur: Une interview détaillée du linguiste légendaire, publiée il y a 6 ans, mais qui n'a pas perdu de sa pertinence. Noam Chomsky - «Einstein moderne», comme on l'appelle, partage ses réflexions sur la structure de la pensée et du langage humains, l'intelligence artificielle et l'état des sciences modernes. L'autre jour, il a eu 90 ans, et cela semble être une bonne raison de publier un article. L'interview est menée par un jeune cogniticien Yarden Katz, lui-même connaît bien le sujet, la conversation est donc très informative et les questions sont aussi intéressantes que les réponses.


Si nous nous fixons pour objectif de compiler une liste des tâches intellectuelles les plus grandes et les plus inaccessibles, alors la tâche de nous «décoder» - comprendre la structure interne de notre esprit et de notre cerveau, et comment l'architecture de ces éléments sont encodés dans notre génome - serait certainement au sommet. Cependant, divers domaines de connaissances qui ont assumé cette tâche, de la philosophie et la psychologie à l'informatique et aux neurosciences, sont submergés par des désaccords sur l'approche qui est la bonne.

En 1956, l'informaticien John McCarthy a inventé le terme «intelligence artificielle» (IA) pour décrire la science de l'étude de l'esprit en reconstruisant ses attributs clés sur un ordinateur. La création d'un système rationnel utilisant des équipements artificiels, au lieu de nos propres «équipements» sous forme de cellules et de tissus, était censée illustrer une compréhension totale et impliquer des applications pratiques sous la forme d'appareils intelligents ou même de robots.

Cependant, certains collègues de McCarthy, de disciplines connexes, étaient plus intéressés par le fonctionnement de l'esprit chez les humains et les autres animaux. Noam Chomsky et ses collègues ont travaillé sur ce qui est devenu plus tard connu sous le nom de science cognitive - la découverte des représentations mentales et des règles qui sous-tendent nos capacités cognitives et mentales. Chomsky et ses collègues ont renversé le paradigme comportementaliste alors dominant, dirigé par le psychologue de Harvard B.F. Skinner, dans lequel le comportement des animaux était réduit à un simple ensemble d'associations entre l'action et ses conséquences sous forme d'encouragement ou de punition. Les lacunes du travail de Skinner en psychologie sont devenues connues dans la critique de Chomsky de 1959 sur son livre Verbal Behavior, dans lequel Skinner a tenté d'expliquer les capacités linguistiques en utilisant des principes comportementaux.

L'approche de Skinner a souligné les associations entre le stimulus et la réponse animale - une approche facilement présentée comme une analyse statistique empirique prédisant l'avenir comme une conséquence du passé. Le concept du langage de Chomsky, quant à lui, était axé sur la complexité des représentations internes codées dans le génome et leur développement dans le processus d'obtention de données dans un système informatique complexe qui ne peut pas être simplement décomposé en un ensemble d'associations. Le principe comportementaliste des associations ne pouvait expliquer la richesse des connaissances linguistiques, notre utilisation infiniment créative de celles-ci, ni pourquoi les enfants les maîtrisent rapidement à partir des données minimales et bruyantes que leur fournit l'environnement. La «compétence langagière», comme l’appelait Chomsky, faisait partie du fonds génétique du corps, comme le système visuel, le système immunitaire et le système cardiovasculaire, et nous devrions l’étudier de la même manière que nous étudions d’autres systèmes biologiques plus banals.

David Marr, un expert en neurosciences, collègue de Chomsky au MIT, a défini l'approche générale de l'étude des systèmes biologiques complexes (tels que le cerveau) dans son livre acclamé Vision, et l'analyse de Chomsky de la compétence langagière s'inscrit plus ou moins dans cette approche. Selon Marr, un système biologique complexe peut être compris à trois niveaux différents. Le premier niveau ("niveau de calcul") décrit les entrées et les sorties du système, qui déterminent la tâche exécutée par le système. Dans le cas du système visuel, l'entrée peut être une image projetée sur notre rétine, et la sortie peut être l'identification d'objets dans l'image par notre cerveau. Le deuxième niveau («niveau algorithmique») décrit la procédure par laquelle l'entrée est transformée en sortie, c'est-à-dire: comment l'image sur notre rétine peut être traitée pour réaliser la tâche décrite au niveau informatique. Enfin, le troisième niveau («niveau d'implémentation») décrit comment notre équipement biologique à partir de cellules effectue la procédure décrite au niveau algorithmique.

L'approche de Chomsky et Marr pour comprendre comment fonctionne notre esprit est aussi loin que possible du béhaviorisme. Ici, l'accent est mis sur la structure interne du système, ce qui lui permet de mener à bien la tâche, plutôt que sur l'association externe entre le comportement passé du système et l'environnement. Le but est de pénétrer la «boîte noire» qui contrôle le système et de décrire sa structure interne, approximativement comment un programmeur peut vous expliquer le principe d'un produit logiciel bien développé, et également expliquer comment l'exécuter sur un ordinateur personnel.

Comme elle est maintenant généralement acceptée, l'histoire des sciences cognitives est l'histoire de la victoire évidente de l'approche de Chomsky sur le paradigme comportementaliste de Skinner - un événement qui est souvent appelé la «révolution cognitive», bien que Chomsky lui-même nie ce nom. Cela reflète fidèlement la situation en sciences cognitives et en psychologie, mais dans d'autres sciences connexes, la pensée comportementale ne va pas mourir. Les paradigmes expérimentaux comportementaux et les explications associatives du comportement animal sont utilisés par les spécialistes des neurosciences, dont le but est d'étudier la neurobiologie du comportement des animaux de laboratoire tels que les rongeurs, où l'approche systémique à trois niveaux proposée par Marr n'est pas applicable.

En mai 2011, en l'honneur du 150e anniversaire du Massachusetts Institute of Technology, le Symposium sur les cerveaux, les esprits et les machines a eu lieu, au cours duquel d'importants informaticiens, psychologues et experts en neurosciences se sont réunis pour discuter l'intelligence artificielle passée et future et sa relation avec les neurosciences.

Il était entendu que la réunion inspirerait à tous un enthousiasme interdisciplinaire pour relancer la question scientifique à partir de laquelle tout le domaine de l'intelligence artificielle est né: comment fonctionne l'esprit? Comment notre cerveau a-t-il créé nos capacités cognitives et peut-il jamais être incarné dans une machine?

Noam Chomsky, s'exprimant lors d'un symposium, n'était pas enthousiaste. Chomsky a critiqué le domaine de l'IA pour avoir adopté une approche similaire au behaviorisme uniquement sous une forme plus moderne et complexe sur le plan informatique. Chomsky a déclaré qu'il est peu probable que s'appuyer sur des techniques statistiques pour rechercher des modèles dans de grandes quantités de données nous donne les éclaircissements explicatifs que nous attendons de la science. Pour Chomsky, la nouvelle IA - axée sur l'utilisation de techniques d'entraînement statistique pour mieux traiter les données et faire des prédictions basées sur elles - est peu susceptible de nous donner des conclusions générales sur la nature des créatures intelligentes ou sur le fonctionnement de la pensée.

Cette critique a provoqué la réponse détaillée de Chomsky du directeur de recherche de Google et chercheur de renom sur l'IA, Peter Norwig, qui a préconisé l'utilisation de modèles statistiques et a fait valoir que les nouvelles méthodes d'IA et la définition même des progrès n'étaient pas si éloignées de ce qui se passait. et dans d'autres sciences.

Chomsky a répondu qu'une approche statistique peut être d'une valeur pratique, par exemple, pour un moteur de recherche utile, et c'est possible avec des ordinateurs rapides capables de traiter de grandes quantités de données. Mais d'un point de vue scientifique, estime Chomsky, cette approche est inadéquate ou, à proprement parler, superficielle. Nous n'avons pas appris à l'ordinateur à comprendre ce que signifie l'expression «physicien Sir Isaac Newton», même si nous pouvons construire un moteur de recherche qui renvoie des résultats plausibles aux utilisateurs qui y entrent.

Il s'avère que les biologistes tentent également de comprendre des systèmes biologiques plus traditionnels. Alors que la révolution informatique a ouvert la voie à l'analyse de grandes quantités de données, sur lesquelles repose toute la "nouvelle IA", la révolution du séquençage en biologie moderne a généré des champs florissants de génomique et de biologie des systèmes. Le séquençage à haut débit - une technique par laquelle des millions de molécules d'ADN peuvent être lues rapidement et à moindre coût - a transformé le séquençage du génome d'une installation coûteuse de 10 ans en une routine accessible au laboratoire. Au lieu d'étudier péniblement des gènes isolés individuels, nous pouvons maintenant observer le comportement d'un système de gènes agissant dans l'ensemble des cellules, dans des centaines, des milliers de conditions différentes.

La révolution du séquençage vient de commencer, et une énorme quantité de données a déjà été reçue, apportant avec elle un émoi et de nouvelles perspectives prometteuses pour une nouvelle thérapie et un nouveau diagnostic des maladies humaines. Par exemple, lorsqu'un médicament conventionnel n'aide pas un certain groupe de personnes, la réponse peut être dans le génome des patients, et il peut y avoir une particularité qui empêche le médicament de fonctionner. Lorsque suffisamment de données ont été collectées pour comparer les caractéristiques pertinentes du génome chez ces patients et que les groupes de contrôle sont correctement sélectionnés, de nouveaux médicaments personnalisés peuvent apparaître, ce qui nous conduit à quelque chose comme la «médecine personnalisée». Il est entendu que s'il existe des outils statistiques suffisamment développés et un ensemble de données suffisamment grand, des signaux intéressants peuvent être tirés du bruit créé par des systèmes biologiques grands et peu étudiés.

Le succès de phénomènes tels que la médecine personnalisée et d'autres conséquences de la révolution du séquençage et de l'approche systémique biologique, est basé sur notre capacité à travailler avec ce que Chomsky appelle «une masse de données brutes» - et cela place la biologie au centre de la discussion, comme celle de psychologie et intelligence artificielle depuis les années 1960.

La biologie des systèmes a également rencontré le scepticisme. Le grand généticien et lauréat du prix Nobel Sydney Brenner l'a une fois défini ainsi: «entrée faible, haut débit, pas de science de sortie» (dans une traduction gratuite: «il y a beaucoup de bruit venant de rien, et aucune science basée sur les résultats»). Brenner, un contemporain de Chomsky qui a également participé à ce symposium sur l'IA, était sceptique quant à la nouvelle approche systémique pour comprendre le cerveau. Décrivant une approche systémique populaire pour cartographier les circuits cérébraux, appelée Connectomique, qui tente de décrire les connexions de tous les neurones dans le cerveau (c'est-à-dire, il trace un diagramme de la façon dont certaines cellules nerveuses sont connectées à d'autres), Brenner l'a appelé une `` forme d'aliénation mentale ''.

Les attaques spirituelles de Brenner contre la biologie des systèmes et les approches connexes en neurosciences ne sont pas loin des critiques de Chomsky sur l'IA. Contrairement à l'apparence, la biologie des systèmes et l'intelligence artificielle sont confrontées à la même tâche fondamentale de l'ingénierie inverse d'un système très complexe, dont la structure interne, pour la plupart, est un mystère. Oui, les technologies en évolution fournissent un grand nombre de données liées au système, dont seule une partie peut être pertinente. Faut-il s'appuyer sur de puissantes capacités de calcul et des approches statistiques pour isoler le signal du bruit, ou devons-nous rechercher des principes plus fondamentaux qui sous-tendent le système et expliquer son essence? Le désir de collecter plus de données est imparable, bien qu'il ne soit pas toujours clair dans quelle théorie ces données peuvent s'intégrer. Ces discussions soulèvent la question séculaire de la philosophie des sciences: qu'est-ce qui rend une théorie ou une explication scientifique satisfaisante? Comment le succès en science est-il déterminé?

Nous nous sommes assis avec Noam Chomsky un après-midi d'avril dans un salon de discussion plutôt en désordre, nous cachant dans un coin secret du bâtiment étourdi du MIT Architecture Center de Frank Gehry. Je voulais mieux comprendre la critique de Chomsky à l’égard de l’intelligence artificielle et pourquoi, selon lui, elle va dans la mauvaise direction. Je voulais également étudier l'application de cette critique à d'autres domaines scientifiques, tels que les neurosciences et la biologie des systèmes, qui travaillent tous à la tâche de l'ingénierie inverse de systèmes complexes - et où les scientifiques se retrouvent souvent au milieu d'une mer de données en expansion infinie. Une partie de la motivation de l'interview était que Chomsky est maintenant rarement interrogé sur la science. Les journalistes s'intéressent trop à son opinion sur la politique étrangère des États-Unis, du Moyen-Orient, de l'administration Obama et d'autres sujets ordinaires. Une autre raison était que Chomsky appartient à ce type rare et spécial d'intellectuels qui s'éteint rapidement. Depuis la publication du célèbre essai d'Isaiah Berlin, il est devenu un passe-temps favori dans la communauté universitaire de placer divers penseurs et scientifiques sur le continuum Lisa-Hedgehog: le hérisson est méticuleux et spécialisé, visant à des progrès cohérents dans un cadre clairement défini, contre Lisa, plus rapide, motivée par des idées un penseur qui saute de question en question, ignorant la portée du sujet et appliquant ses compétences le cas échéant. Chomsky est spécial car il transforme cette distinction en un vieux cliché inutile. La profondeur de Chomsky ne va pas à la place de la flexibilité ou de l'étendue, bien qu'il ait pour l'essentiel consacré toute sa carrière scientifique au début à l'étude de certains sujets en linguistique et en sciences cognitives. Le travail de Chomsky a eu un impact énorme sur plusieurs domaines en plus du sien, y compris l'informatique et la philosophie, et il n'hésite pas à discuter et à critiquer l'influence de ces idées, ce qui le rend particulièrement intéressant pour interviewer les gens.

Je veux commencer par une question très simple. À l'aube de l'intelligence artificielle, les gens étaient optimistes quant aux progrès dans ce domaine, mais cela s'est avéré différent. Pourquoi la tâche est-elle si difficile? Si vous demandez aux experts en neurosciences pourquoi il est si difficile de comprendre le cerveau, ils vous donneront des réponses intellectuelles complètement insatisfaisantes: il y a des milliards de cellules dans le cerveau, et nous ne pouvons pas toutes les lire, etc.

Chomsky: Il y a quelque chose dedans. Si vous regardez le développement de la science, toutes les sciences sont comme un continuum, mais elles sont divisées en domaines séparés. Les plus grands progrès sont réalisés par les sciences, qui étudient les systèmes les plus simples. Prenons, par exemple, la physique - elle fait d'énormes progrès. Mais l'une des raisons est que les physiciens ont un avantage que l'on ne trouve dans aucune autre science. Si quelque chose devient trop compliqué, ils le transmettent à quelqu'un d'autre.

Par exemple, les chimistes?

Chomsky: Si la molécule est trop grosse, vous la donnez aux chimistes. Chimistes, si pour eux la molécule est trop grosse ou le système devient trop gros, donnez-la aux biologistes. Et si c'est trop grand pour eux, ils le donnent aux psychologues, et finalement c'est entre les mains des critiques littéraires, etc. Donc tout ce qui est dit en neurosciences n'est pas complètement faux.

Mais peut-être - et de mon point de vue, c'est très probable, bien que les experts dans le domaine des neurosciences n'aiment pas cela - que les neurosciences soient sur la mauvaise voie depuis quelques centaines d'années. Il y a un livre assez récent du très bon scientifique cognitif neuroscientifique Randy Gallistel, avec Adam King ( "La mémoire et le cerveau informatique: pourquoi la science cognitive transformera les neurosciences" - environ trad. ), Dans lequel il prétend - à mon avis, crédible - que les neurosciences développé, étant emporté par l'associationnisme et des idées connexes sur la façon dont les gens et les animaux sont organisés. En conséquence, ils ont recherché des phénomènes ayant les propriétés de la psychologie associative.

Comment est la ductilité du Hobb? [Théorie attribuée à Donald Hebb: les associations entre un stimulus environnemental et une réponse à un stimulus peuvent être codées en améliorant les connexions synaptiques entre les neurones - env. Ed.]

Chomsky: Oui, comme un renforcement des connexions synaptiques. Gallistel a passé des années à expliquer: si vous voulez étudier correctement le cerveau, vous devez, comme Marr, demander d'abord quelles tâches il effectue. Par conséquent, il s'intéresse principalement aux insectes. Donc, si vous voulez étudier, disons, la neurologie d'une fourmi, vous demandez ce que fait la fourmi? Il s'avère que les fourmis font des choses assez compliquées, par exemple, construire un chemin. Regardez les abeilles: leur navigation nécessite des calculs assez complexes, notamment la position du soleil, etc. Mais en général, avec quoi discute-t-il: si vous prenez les capacités cognitives d'un animal ou d'une personne, ce sont des systèmes informatiques. Vous devez donc examiner les unités atomiques de calcul. Prenez une machine de Turing, c'est la forme de calcul la plus simple, vous devez trouver des atomes qui ont les propriétés "lire", "écrire" et "adresse". Ce sont les unités de calcul minimales, vous devez donc les rechercher dans le cerveau. Vous ne les trouverez jamais si vous recherchez des connexions synaptiques ou des propriétés de champ accrues, etc. Vous devez commencer par cela: voir ce qui existe déjà et ce qui fonctionne, et vous pouvez le voir du plus haut niveau de la hiérarchie Marra.

C'est vrai, mais la plupart des neuroscientifiques ne s'assoient pas et ne décrivent pas les apports et les conclusions du phénomène qu'ils étudient. Au lieu de cela, ils placent la souris dans une tâche d'apprentissage en laboratoire et enregistrent autant de neurones que possible, ou découvrent si le gène X est nécessaire pour apprendre la tâche, etc. Des déclarations de ce genre découlent de leurs expériences.

Chomsky: C'est tellement ...

Y a-t-il une erreur conceptuelle à ce sujet?

Chomsky: Eh bien, vous pouvez obtenir des informations utiles. Mais s'il existe vraiment une sorte de calcul impliquant des unités atomiques, vous ne les trouverez pas de cette façon. Il s'agit de savoir comment rechercher des clés perdues sous une autre lampe, simplement parce qu'il est plus léger là-bas (une référence à une blague bien connue - environ Transl. ). C'est une question discutable ... Je ne pense pas que la position de Gallistel ait été largement acceptée par les neurobiologistes, mais c'est une position plausible, et elle a été faite dans l'esprit de l'analyse de Marr.Ainsi, lorsque vous étudiez la vision, dit-il, vous demandez d'abord quel type de tâches informatiques le système résout. Ensuite, vous recherchez un algorithme qui pourrait faire ces calculs, et à la fin, vous recherchez des mécanismes qui permettent à l'algorithme de fonctionner. Sinon, vous ne trouverez jamais rien. Il existe de nombreux exemples de cela, même dans les sciences exactes, et très certainement dans les sciences humaines. Les gens essaient d'apprendre ce qu'ils savent étudier - je veux dire, cela semble raisonnable. Vous avez certaines techniques expérimentales, vous avez un certain niveau de compréhension, vous essayez de repousser les limites du possible - et c'est bien, je ne critique pas, les gens font ce qu'ils peuvent. D'un autre côté, ce serait bien de savoir si vous vous dirigez dans la bonne direction. Et il peut arriver que si nous prenons le point de vue de Marra-Gallistel comme base,que je sympathise personnellement, vous travaillerez différemment, rechercherez des expériences d'un type différent.

Donc, je pense que l'idée clé de Marr est, comme vous l'avez dit, de trouver des unités atomiques appropriées pour décrire le problème, en d'autres termes, un «niveau d'abstraction» approprié, si je puis dire. Et si nous prenons un exemple concret d'un nouveau domaine des neurosciences appelé Connectomique, où le but est de trouver un diagramme des connexions d'organismes très complexes, de trouver les connexions de tous les neurones dans le cortex du cerveau humain ou de la souris. Cette approche a été critiquée par Sydney Brenner, qui est fortement [historiquement] l'un de ses auteurs. Les partisans de ce domaine ne s'arrêtent pas et ne demandent pas si le schéma de connexion est un niveau d'abstraction approprié - peut-être pas. Quelle est votre opinion à ce sujet?

Chomsky: Il y a des questions beaucoup plus simples. Par exemple, ici au MIT, il y avait un programme interdisciplinaire sur les nématodes (ver rond - env. perev. ) C. elegans depuis plusieurs décennies, et, si je comprends bien, même avec cette petite créature que vous connaissez tout le schéma de connexion, il y a environ 800 neurones ...

Je pense que 300 ..

Chomsky: ... Quoi qu'il en soit, vous ne savez pas Vous pouvez prédire ce que [C. nematode C. elegans] va faire. Peut-être que vous n'y regardez pas.



Je voudrais passer au sujet des différentes méthodologies en IA. Ainsi, la «Good Old Artificial Intelligence» (GOFAI), comme on l'appelle maintenant, était basée sur des formalismes stricts dans la tradition de Gotlob Frege et Bertrand Russell, sur la logique mathématique, par exemple, ou sur ses branches, comme le raisonnement non monotone, etc. Du point de vue de l'histoire de la science, il est intéressant de noter que ces approches ont été presque complètement exclues du courant dominant et ont été remplacées - dans le domaine qui s'appelle désormais IA - par des modèles probabilistes et statistiques. Ma question est: comment expliquer ce changement et est-ce un pas dans la bonne direction?

Chomsky: J'ai écouté le rapport de Pat Winston à ce sujet il y a un an. L'un des points qu'il avait soulevés était: l'IA et la robotique ont atteint le stade où vous pouvez faire des choses vraiment utiles, alors l'attention s'est tournée vers les applications pratiques, et donc des questions scientifiques plus fondamentales ont été mises de côté, simplement parce que tout le monde a été capturé par le succès de la technologie réalisation de certains objectifs.

Autrement dit, tout est entré dans l'ingénierie ...

Chomsky: Oui, c'est ... Et c'est tout à fait compréhensible, mais, bien sûr, cela éloigne les gens des questions initiales. Je dois admettre que j'étais très sceptique à propos de ces œuvres originales ( dans le nouveau paradigme de l'IA probabiliste - environ Transl. ). Il me semblait que tout était trop optimiste, on supposait que vous seriez en mesure d'obtenir des résultats qui nécessitent une réelle compréhension des systèmes à peine étudiés, et que vous ne pouvez pas arriver à leur compréhension en y jetant simplement une machine compliquée. Si vous essayez de le faire, vous arrivez au concept de réussite auto-renforçante, car vous obtenez le résultat, mais c'est très différent de la façon dont cela se fait dans les sciences.

Par exemple, prenons le cas limite, supposons que quelqu'un veuille abolir la faculté de physique, et faites-le bien. Mais la «bonne chose» est de prendre beaucoup de vidéos sur ce qui se passe dans le monde extérieur et de les alimenter sur l'ordinateur le plus grand et le plus rapide, sur des gigaoctets de données, et de faire une analyse statistique complète - enfin, vous savez, les méthodes bayésiennes, dans les deux sens. (Une approche moderne de l'analyse des données basée sur la théorie des probabilités - N.D.E.)- et vous obtiendrez quelque chose comme une prédiction sur ce qui se passera en dehors de votre fenêtre dans la seconde suivante. En fait, vous obtiendrez une prédiction de bien meilleure qualité que le département de physique pourrait vous donner. Eh bien, si le succès est déterminé en obtenant l'approximation la plus proche sur une masse de données brutes chaotiques, alors, bien sûr, c'est une bien meilleure façon que les physiciens travaillent habituellement - eh bien, vous savez, plus d'expériences de pensée sur une surface parfaitement plane, etc. . Mais vous n'obtiendrez pas le niveau de compréhension qui a toujours été le but de la science - vous n'obtiendrez qu'une approximation de ce qui se passe.

Et cela se fait partout. Supposons que vous souhaitiez prédire la météo de demain. Une façon: OK, j'ai des probabilités statistiques a priori, par exemple: il y a une forte probabilité que demain le temps sera le même qu'hier à Cleveland, et je l'utilise, et la position du soleil aura un peu plus d'influence, et je l'utilise aussi, donc , vous avez fait plusieurs de ces hypothèses, vous menez une expérience, vous regardez les résultats encore et encore, vous corrigez avec les méthodes bayésiennes, vous obtenez les meilleures probabilités a priori. Vous obtenez une assez bonne approximation de la météo de demain. Mais ce n'est pas ce que font les météorologues - ils veulent juste comprendre comment cela fonctionne. Et ce ne sont que deux concepts différents de ce qu'est le succès, ce qu'est la réussite. Dans ma science, la science du langage, c'est tout le temps. En science cognitive computationnelle,appliqué à la langue, le concept de réussite n'est que cela. Autrement dit, vous obtenez de plus en plus de données, de meilleures statistiques, vous obtenez une approximation de plus en plus précise d'un corps gigantesque de texte, par exemple, toutes les archives du Wall Street Journal - mais vous n'apprenez rien sur la langue.

Une approche complètement différente, qui je pense est juste, est d'essayer de voir si vous pouvez comprendre quels sont les principes fondamentaux et leur relation avec les propriétés clés, et de voir que dans la vie réelle, des milliers de variables différentes vont interférer avec vous - comme ce qui se passe maintenant - et vous les traiterez plus tard si vous voulez une approximation plus précise. Ce ne sont que deux concepts différents de la science. La seconde est ce que la science a été depuis Galilée, c'est la science moderne. L'approximation des données brutes est comme une nouvelle approche, mais en réalité, des choses similaires existaient dans le passé. Il s'agit d'une nouvelle approche, qui est accélérée par l'existence de grandes quantités de mémoire, un traitement très rapide, qui vous permet de faire des choses que vous ne pouviez pas faire manuellement auparavant. Mais je pensequ'il mène des domaines comme les sciences cognitives computationnelles dans le sens d'une applicabilité peut-être pratique ...

… ?

:... Mais cela éloigne de la compréhension. Oui, peut-être même une ingénierie efficace. Et c'est d'ailleurs intéressant ce qui est arrivé à l'ingénierie. Quand je suis arrivé au MIT dans les années 50, c'était une université d'ingénierie. Il y avait une très bonne faculté de mathématiques et de physique, mais c'étaient des facultés de service. Ils ont enseigné aux ingénieurs toutes sortes de trucs qu'ils pouvaient utiliser. À la Faculté de génie électronique, vous avez étudié comment assembler un circuit. Mais des années 1960 à nos jours, tout est complètement différent. Peu importe votre spécialité en génie - vous étudiez toutes les mêmes sciences fondamentales et mathématiques. Et puis, vous apprendrez peut-être un peu comment l'appliquer. Mais c'est une approche complètement différente. C'est devenu possible, grâce au fait que pour la première fois dans l'histoire de l'humanité, les sciences fondamentales, comme la physique, pouvaient vraiment aider les ingénieurs. Aussiles technologies ont commencé à changer très rapidement, il est donc peu logique d'étudier les technologies d'aujourd'hui si elles changent de toute façon dans 10 ans. Par conséquent, vous étudiez la science fondamentale, qui sera applicable, quelle que soit la prochaine étape. Et à peu près la même chose s'est produite en médecine. Donc, au siècle dernier, encore une fois, pour la première fois, la biologie avait quelque chose à dire dans la médecine pratique, et donc vous deviez connaître la biologie si vous vouliez devenir médecin, plus la technologie a changé. Je pense que c'est une transition de quelque chose comme l'art que vous apprenez à appliquer - une analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue dans le New Time grosso modo, la science de Galileo.si après 10 ans ils changent encore. Par conséquent, vous étudiez la science fondamentale, qui sera applicable, quelle que soit la prochaine étape. Et à peu près la même chose s'est produite en médecine. Donc, au siècle dernier, encore une fois, pour la première fois, la biologie avait quelque chose à dire dans la médecine pratique, et donc vous deviez connaître la biologie si vous vouliez devenir médecin, plus la technologie a changé. Je pense que c'est une transition de quelque chose comme l'art que vous apprenez à appliquer - une analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue dans le New Time grosso modo, la science de Galileo.si après 10 ans ils changent encore. Par conséquent, vous étudiez la science fondamentale, qui sera applicable, quelle que soit la prochaine étape. Et à peu près la même chose s'est produite en médecine. Donc, au siècle dernier, encore une fois, pour la première fois, la biologie avait quelque chose à dire dans la médecine pratique, et donc vous deviez connaître la biologie si vous vouliez devenir médecin, plus la technologie a changé. Je pense que c'est une transition de quelque chose comme l'art que vous apprenez à appliquer - une analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue dans le New Time grosso modo, la science de Galileo.Et à peu près la même chose s'est produite en médecine. Donc, au siècle dernier, encore une fois, pour la première fois, la biologie avait quelque chose à dire dans la médecine pratique, et donc vous deviez connaître la biologie si vous vouliez devenir médecin, plus la technologie a changé. Je pense que c'est une transition de quelque chose comme l'art que vous apprenez à appliquer - une analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue dans le New Time grosso modo, la science de Galileo.Et à peu près la même chose s'est produite en médecine. Donc, au siècle dernier, encore une fois, pour la première fois, la biologie avait quelque chose à dire dans la médecine pratique, et donc vous deviez connaître la biologie si vous vouliez devenir médecin, plus la technologie a changé. Je pense que c'est une transition de quelque chose comme l'art que vous apprenez à appliquer - une analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue dans le New Time grosso modo, la science de Galileo.que vous apprenez à appliquer - l'analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue à l'époque moderne, en gros, la science de Galileo.que vous apprenez à appliquer - l'analogie sera la comparaison de données que vous ne comprenez pas, d'une manière particulière, et peut-être même la construction de quelque chose qui fonctionne - la transition vers la science, qui est apparue à l'époque moderne, en gros, la science de Galileo.

Je vois. Revenons au sujet des statistiques bayésiennes dans les modèles de langage et de cognition. Il y avait un différend bien connu avec votre participation, vous avez fait valoir que parler de la probabilité d'une proposition n'était pas raisonnable en soi ...

Chomsky: ... Eh bien, vous pouvez obtenir un nombre si vous le souhaitez, mais cela ne veut rien dire.

Cela ne veut rien dire. Mais il semble qu'il existe un moyen presque trivial d'unifier la méthode probabiliste, en supposant qu'il existe des représentations mentales internes très riches constituées de règles et d'autres structures symboliques, et le but de la théorie des probabilités est simplement de connecter les données bruyantes et fragmentées de notre monde avec ces données internes. structures symboliques. Et vous n'êtes pas obligé de dire quoi que ce soit sur la façon dont ces structures sont apparues - elles pourraient exister initialement, ou certains paramètres y sont ajustés - cela dépend de votre concept. Mais la théorie des probabilités fonctionne comme une colle entre des données bruyantes et des représentations mentales très riches.

Chomsky: Il n'y a rien de mal à la théorie des probabilités, aux statistiques.

Mais a-t-elle un rôle?

Chomsky:Si vous pouvez l'utiliser, très bien. Mais la question est, pourquoi l'utilisez-vous? Tout d'abord, la toute première question, est-il judicieux de comprendre les données bruyantes? Est-il sensé de comprendre ce qui se passe à l'extérieur, à l'extérieur de la fenêtre?

Mais nous sommes bombardés de ces données. C'est l'un des exemples de Marr: nous rencontrons constamment des données bruyantes, depuis notre rétine jusqu'à ...

Chomsky:C'est vrai. Mais voici ce qu'il dit: Demandons-nous comment le système biologique sélectionne l'important parmi le bruit. La rétine n'essaie pas de dupliquer le bruit entrant. Elle dit: je vais maintenant chercher ceci dans l'image, ceci et cela. C'est comme apprendre une langue. Un nouveau-né est entouré par une variété de bruits, comme William James, "le désordre fleuri et bourdonnant", a déclaré. Si un singe, un chaton, un oiseau, n'importe qui, entend ce bruit, c'est tout. Cependant, l'enfant en quelque sorte, immédiatement, par réflexe, sélectionne dans le bruit une partie distincte qui est liée à la langue. Ceci est la première étape.Comment le fait-il? Pas à l'aide d'une analyse statistique, car le singe peut également effectuer sous une forme grossière la même analyse probabiliste. Il cherche une chose spécifique. Ainsi, les psycholinguistes, les neurolinguistes et d'autres tentent de découvrir des détails spécifiques du système informatique et de la neuropsychologie, qui sont en quelque sorte liés à des aspects spécifiques de l'environnement. Ainsi, il s'avère qu'il existe vraiment des circuits neuronaux qui répondent à certains types de rythme, qui se manifestent dans la langue - comme la longueur des syllabes et ainsi de suite. Et il y a des preuves que l'une des premières choses que le cerveau d'un enfant recherche, ce sont les structures rythmiques. Et en revenant à Gallistel et Marr, le cerveau a un certain système informatique à l'intérieur, qui dit: "OK, c'est ce que je ferai avec ces choses,"et après environ neuf mois, l'enfant type excluait déjà - retiré de son stock - les différences phonétiques qui ne sont pas dans sa propre langue. Autrement dit, il s'avère que, dès le début, tout enfant est à l'écoute de n'importe quelle langue. Mais, disons, un enfant japonais à l'âge de neuf mois ne réagira pas à la différence entre "P" et "L", il serait éliminé. Le système considère donc de nombreuses possibilités et les limite uniquement à celles qui font partie de la langue, et il s'agit d'un ensemble très étroit. Vous pouvez trouver un anti-langage dans lequel un enfant ne peut jamais faire cela, et bien plus encore. Par exemple, si nous parlons du côté plus abstrait du langage, il existe actuellement des preuves solides qu'une chose aussi simple qu'un ordre de mots linéaire - ce qui vient après quoi - n'est pas incluse dans les systèmes informatiques syntaxiques et sémantiques,leur appareil est simplement tel qu'ils ne recherchent pas un ordre linéaire. On peut voir que des concepts plus abstraits de distance sont principalement utilisés et ce n'est pas une distance linéaire, et une confirmation neurophysiologique peut être trouvée pour cela. Vous pouvez donner un exemple: si vous venez avec un langage artificiel qui utilise un ordre de mots linéaire, comme, par exemple, vous rendez la phrase affirmative négative en faisant quelque chose avec le troisième mot. Les gens pourront résoudre ce casse-tête, mais apparemment, les parties linguistiques standard du cerveau ne sont pas activées - d'autres zones sont activées, c'est-à-dire que les gens perçoivent cela comme un casse-tête et non comme une tâche de langage. Et pour le résoudre, les gens doivent faire plus d'efforts ...que des concepts plus abstraits de distance sont principalement utilisés et ce n'est pas une distance linéaire, et une confirmation neurophysiologique peut être trouvée pour cela. Vous pouvez donner un exemple: si vous venez avec un langage artificiel qui utilise un ordre de mots linéaire, comme, par exemple, vous rendez la phrase affirmative négative en faisant quelque chose avec le troisième mot. Les gens pourront résoudre ce casse-tête, mais apparemment, les parties linguistiques standard du cerveau ne sont pas activées - d'autres zones sont activées, c'est-à-dire que les gens perçoivent cela comme un casse-tête et non comme une tâche de langage. Et pour le résoudre, les gens doivent faire plus d'efforts ...que des concepts plus abstraits de distance sont principalement utilisés et ce n'est pas une distance linéaire, et une confirmation neurophysiologique peut être trouvée pour cela. Vous pouvez donner un exemple: si vous venez avec un langage artificiel qui utilise un ordre de mots linéaire, comme, par exemple, vous rendez la phrase affirmative négative en faisant quelque chose avec le troisième mot. Les gens pourront résoudre ce casse-tête, mais apparemment, les parties linguistiques standard du cerveau ne sont pas activées - d'autres zones sont activées, c'est-à-dire que les gens perçoivent cela comme un casse-tête et non comme une tâche de langage. Et pour le résoudre, les gens doivent faire plus d'efforts ...vous rendez la phrase affirmative négative en faisant quelque chose avec le troisième mot. Les gens pourront résoudre ce casse-tête, mais apparemment, les parties linguistiques standard du cerveau ne sont pas activées - d'autres zones sont activées, c'est-à-dire que les gens perçoivent cela comme un casse-tête et non comme une tâche de langage. Et pour le résoudre, les gens doivent faire plus d'efforts ...vous rendez la phrase affirmative négative en faisant quelque chose avec le troisième mot. Les gens pourront résoudre ce casse-tête, mais apparemment, les parties linguistiques standard du cerveau ne sont pas activées - d'autres zones sont activées, c'est-à-dire que les gens perçoivent cela comme un casse-tête et non comme une tâche de langage. Et pour le résoudre, les gens doivent faire plus d'efforts ...

, ...

: …C'est une preuve, et bien sûr, vous en voulez plus. Mais cette évidence est telle que vous regardez du côté de la linguistique comment les langues fonctionnent - il n'y a pas de choses comme le troisième mot d'une phrase. Prenons une phrase simple: «Les aigles volant instinctivement nagent», ici «instinctivement» est lié au mot «nager», et non pas au mot «volant», même si la phrase entière n'a pas de sens. Et voici l'effet du réflexe. "Instinctivement", un adverbe, ne recherche pas le verbe le plus proche, il recherche un verbe structurellement plus adapté. Il s'agit d'un calcul beaucoup plus compliqué. Mais c'est le seul calcul généralement utilisé. L'ordre linéaire est un calcul très simple, mais il n'est jamais utilisé. Il existe de nombreuses preuves comme celle-ci et très peu de preuves neurolinguistiques, mais elles vont dans le même sens.Et quand vous regardez des structures plus complexes, vous en trouvez de plus en plus.

À mon avis, c'est une façon de comprendre comment le système fonctionne réellement, comment cela s'est passé avec le système de vision dans le laboratoire Marr: des gens comme Shimon Ullman ont découvert des choses tout à fait remarquables comme le principe de rigidité. Vous ne pourrez pas le trouver en utilisant l'analyse des données statistiques. Il a trouvé cela avec des expériences soigneusement planifiées. Ensuite, vous recherchez en neurophysiologie et voyez si vous pouvez trouver quelque chose qui effectue ces calculs. Je pense la même chose en langage, la même chose en étudiant nos capacités arithmétiques, en planifiant, presque partout. Travailler uniquement avec des données brutes - vous n’irez nulle part avec cela, et Galileo ne serait pas venu. En fait, revenons à cela, au 17ème siècle, il n'était pas facile pour des gens comme Galileo et d'autres grands scientifiques de convaincre la National Science Foundation de cette époque - à savoir, les aristocrates - queque leur travail avait du sens. Je veux dire: pourquoi étudier comment une balle roule sur un plan parfaitement plat sans frottement, car elles n'existent pas. Pourquoi ne pas étudier comment poussent les fleurs? Si vous essayez d'étudier la croissance des fleurs à cette époque, vous obtiendrez probablement une analyse statistique de la façon dont tout fonctionne.

Il est important de se rappeler qu'en sciences cognitives nous sommes encore à l'ère pré-galiléenne, nous commençons tout juste à faire des découvertes. Et je pense que quelque chose peut être appris de l'histoire des sciences. L'une des principales expériences de l'histoire de la chimie en 1640 environ, lorsque quelqu'un a prouvé, pour le plaisir du monde scientifique tout entier, jusqu'à Newton, que l'eau peut être transformée en matière vivante. Voici comment ils l'ont fait - bien sûr, personne ne savait quoi que ce soit sur la photosynthèse - ils ont pris un tas de terre et l'ont chauffé pour que toute l'eau s'évapore. Il l'a pesé, a inséré une branche de saule et a arrosé l'eau par le haut, mesurant le volume de cette eau. Lorsque tout est prêt et que le saule a grandi, vous prenez à nouveau la terre et vous en évaporez l'eau - comme auparavant. Ainsi, vous avez montré que l'eau peut se transformer en chêne ou autre chose. C'est une expérience, et cela semble même vrai, mais vous ne savez pas ce que vous cherchez.Et cela était inconnu jusqu'à ce que Priestley découvre que l'air est une composante du monde, qu'il contient de l'azote, etc., et que vous avez appris la photosynthèse et ainsi de suite. Ensuite, vous pouvez répéter l'expérience et comprendre ce qui se passe. Mais vous pouvez facilement vous laisser entraîner dans la mauvaise direction par une expérience qui semble réussie car vous ne comprenez pas assez bien ce que vous devez rechercher. Et vous irez même dans le mauvais sens si vous essayez d'étudier la croissance des arbres comme ceci: il suffit de prendre un tableau de données sur la croissance des arbres, de les alimenter à un ordinateur puissant, de mener une analyse statistique et d'obtenir une approximation de ce qui s'est passé.Mais vous pouvez facilement vous laisser entraîner dans la mauvaise direction par une expérience qui semble réussie car vous ne comprenez pas assez bien ce que vous devez rechercher. Et vous irez même dans le mauvais sens si vous essayez d'étudier la croissance des arbres comme ceci: il suffit de prendre un tableau de données sur la croissance des arbres, de les alimenter à un ordinateur puissant, de mener une analyse statistique et d'obtenir une approximation de ce qui s'est passé.Mais vous pouvez facilement vous laisser entraîner dans la mauvaise direction par une expérience qui semble réussie car vous ne comprenez pas assez bien ce que vous devez rechercher. Et vous irez même dans le mauvais sens si vous essayez d'étudier la croissance des arbres comme ceci: il suffit de prendre un tableau de données sur la croissance des arbres, de les alimenter à un ordinateur puissant, de mener une analyse statistique et d'obtenir une approximation de ce qui s'est passé.

En biologie, considérez-vous le travail de Mendel comme un exemple réussi de la façon de prendre des données bruyantes - il est important que les chiffres soient numériques - et de sauter pour postuler un objet théorique ...

Chomsky: ... Et jeter une énorme quantité de données qui n'ont pas fonctionné.

... Mais après avoir vu la corrélation qui avait du sens, développez une théorie.

Chomsky:Oui, il a tout fait correctement. Il a permis à la théorie de gérer les données. Il y avait également des preuves qui contredisaient la théorie, qui a été plus ou moins rejetée, vous savez - que vous n'incluez généralement pas dans l'article. Et lui, bien sûr, a parlé de choses que personne ne pouvait trouver, tout comme il était impossible de trouver des unités dont il avait prouvé l'existence. Mais oui, c'est ainsi que fonctionne la science. C'est donc en chimie. La chimie, avant mon enfance, il n'y a pas si longtemps, était considérée comme la science de l'informatique. Parce qu'il ne peut pas être réduit à la physique. Par conséquent, ce n'est qu'un moyen de calculer le résultat des expériences. L'atome de Bohr était ainsi perçu. Une façon de calculer le résultat des expériences, mais cela ne peut pas être de la vraie science, car cela ne peut pas être réduit à la physique, et tout à coup, cela s'est avéré vrai, parce que la physique était fausse. Quand la physique quantique est née,il est devenu possible de combiner avec une chimie inchangée. Autrement dit, l'ensemble du projet avec la réduction était tout simplement incorrect. Le bon projet était de voir comment ces deux visions du monde pouvaient être combinées. Et il s'est avéré que, surprise - ils étaient unis par des changements radicaux dans la science en aval. Peut-être exactement la même chose avec la psychologie et les neurosciences. Je veux dire, les neurosciences ne sont même plus aussi avancées aujourd'hui que la physique il y a un siècle.

Et ce sera un départ de l'approche réductionniste avec la recherche de molécules ...

Chomsky: Oui. En fait, l'approche réductionniste s'est déjà trompée à plusieurs reprises. Une approche d'unification est logique. Mais l'unification peut différer de la réduction, car la science fondamentale peut être défectueuse, comme c'est le cas avec la physique et la chimie, et je soupçonne avec un haut degré de probabilité la même chose dans le cas des neurosciences et de la psychologie. Si Gallistel a raison, il est logique de dire que oui, ils peuvent être combinés, mais avec une approche différente des neurosciences.

Faut-il viser une unification rapide, ou vaut-il mieux développer ces zones en parallèle jusqu'à présent?

Chomsky:L'unification est une telle recherche intuitive de l'idéal, faisant partie du mysticisme scientifique, si vous voulez. C’est comme chercher une théorie générale du monde. Peut-être qu'elle n'existe pas, peut-être que les différentes parties fonctionnent différemment, mais il y a une hypothèse, jusqu'à ce que l'on me donne une réfutation convaincante, mon hypothèse est qu'il existe une théorie générale du monde, et ma tâche est d'essayer de la trouver. L'unification peut ne pas se manifester par la réduction, et cela arrive souvent. C'est la logique principale de l'approche de David Marr: ce que vous découvrez au niveau informatique doit être combiné avec ce que vous trouverez autrefois au niveau des mécanismes, mais peut-être pas dans les termes dans lesquels nous comprenons maintenant ces mécanismes.

Et Marra implique que vous ne pouvez pas travailler aux trois niveaux en parallèle [niveau de calcul, d'algorithmique et d'implémentation], vous devez vous déplacer de haut en bas, et c'est une exigence très stricte, étant donné que ce n'est généralement pas le cas en science.

Chomsky: Il ne pouvait pas dire que tout devait être difficile. Par exemple, la découverte de quelque chose de nouveau sur les mécanismes peut vous conduire à un changement dans le concept de l'informatique. L'ordre logique ne coïncide pas nécessairement avec l'ordre de la recherche, car dans la recherche, tout se passe en même temps. Mais je pense qu'en gros, l'image est vraie. Même si je dois dire que le concept Marra a été développé pour les systèmes d'entrée ...

Systèmes de traitement de l'information ...

Chomsky:Oui, comme la vision. Il y a des données - c'est un système de traitement de données - et quelque chose s'y passe. Et cela ne fonctionne pas très bien pour les systèmes cognitifs. Prenons votre capacité arithmétique ...

C'est très faible, mais d'accord ...

Chomsky: Bien [rires]. Mais c'est une capacité interne, vous savez que votre cerveau est l'unité de contrôle de quelque chose comme une machine de Turing, et il a accès à des données externes, telles que la mémoire, le temps ... Théoriquement, vous pouvez multiplier n'importe quoi, mais en pratique, bien sûr, cela non. Si vous essayez d'étudier le type de système interne dont vous disposez, la hiérarchie Marr ne fonctionne pas très bien. Vous pouvez parler du niveau de calcul: peut-être que les règles en moi sont des axiomes de Peano [ env. éd.: théorie mathématique (du nom du mathématicien italien Giuseppe Peano), qui décrit le cœur des règles de base des nombres arithmétiques et naturels, dont vous pouvez dériver de nombreux faits arithmétiques utiles] ou autre chose, cela n'a pas d'importance - c'est le niveau de calcul. Théoriquement, bien que nous ne sachions pas comment, vous ne pouvez parler que du niveau neurophysiologique, personne ne sait comment, mais il n'y a pas de véritable niveau algorithmique. Parce qu'il n'y a pas de calcul des connaissances, c'est simplement un système de connaissances. On ne sait pas comment comprendre la nature du système de connaissances: il n'y a pas d'algorithme, car il n'y a pas de processus. Cela ne peut se faire qu'en utilisant un système de connaissances dans lequel il existe un processus, mais ce sera déjà quelque chose de complètement différent.

Mais puisque nous commettons des erreurs, cela signifie-t-il que le processus va mal?

Chomsky:Il s'agit du processus d'utilisation du système interne. Mais le système interne lui-même n'est pas un processus, car il n'a pas d'algorithme. Prenez des mathématiques ordinaires. Si vous prenez les axiomes et les règles d'inférence de Peano, ils définissent tous les calculs arithmétiques, mais il n'y a pas d'algorithme. Si vous demandez comment le spécialiste de la théorie des nombres les applique, il y a bien sûr de nombreuses options: par exemple, vous ne commencez pas avec des axiomes, mais avec des règles d'inférence. Vous prenez le théorème et voyez si le lemme peut être déduit, et si cela fonctionne, alors voyez s'il s'avère baser ce lemme sur quelque chose, et finalement vous obtenez une preuve - un objet géométrique.

Mais c'est une activité fondamentalement différente, différente de l'ajout de petits nombres dans ma tête - et bien sûr, j'ai une sorte d'algorithme dans ma tête.

Chomsky:Pas forcément. Ce processus a un algorithme dans les deux cas. Mais il n'y a pas d'algorithme du système lui-même, c'est une erreur catégorique. Vous ne demandez pas quel processus définissent les axiomes et les règles d'inférence de Peano; il n'y a pas de processus là-bas. Il peut y avoir un processus pour les utiliser. Et cela peut être un processus compliqué, et cela est vrai dans le cas de vos calculs. Le système interne que vous avez n'est pas une question de processus. Mais si vous utilisez votre système interne, la question se pose et vous pouvez effectuer la multiplication de plusieurs manières. Par exemple, si vous ajoutez 7 et 6, un algorithme dit: "Je vais voir combien il faut pour arriver à 10" - il en faut 3, et maintenant il en reste 3 de plus, donc je vais passer de 10 et en ajouter 3 de plus, et il y aura 13. Il s'agit d'un algorithme d'addition - en fait, c'est comme ça qu'on m'a enseigné à la maternelle. C'est une façon d'ajouter des nombres.

Mais il existe d'autres façons d'ajouter - il n'y a pas de bon algorithme. Ce sont des algorithmes pour effectuer le processus du système cognitif dans votre tête. Et maintenant, pour ce système, vous ne vous interrogez pas sur les algorithmes. Vous pouvez vous interroger sur le niveau de calcul, sur le niveau des mécanismes. Mais le niveau algorithmique de ce système n'existe pas. La même chose avec la langue. Le langage est comme une capacité arithmétique. Il existe un système qui détermine le son et la signification d'un éventail infini de phrases possibles. Mais il n'est pas question de savoir quel type d'algorithme existe. Il n'est pas non plus question de savoir quel système arithmétique formel vous indique comment prouver les théorèmes. L'utilisation du système est un processus, et vous pouvez l'étudier en termes de niveaux de Marr. Mais il est important de désigner conceptuellement ces différences.

Cela semble être une tâche incroyable de passer de la théorie du niveau de calcul, comme les axiomes de Peano, au niveau de moelle 3 ...

Chomsky: mécanismes ...

... mécanismes et implémentations ...

Chomsky: Oui. Et ...

... sans algorithme, au moins.

Chomsky:Je pense que ce n'est pas vrai. Peut-être que les informations sur la façon dont le système est utilisé vous diront quelque chose sur les mécanismes. Mais un esprit supérieur - peut-être plus élevé que le nôtre - verra qu'il existe un système interne, et qu'il a une base physiologique, et il sera possible de l'étudier, cette base physiologique. Sans même regarder le processus dans lequel ce système est utilisé. L'observation du processus vous donnera peut-être des informations utiles pour savoir où aller. Mais conceptuellement, c'est une tâche différente. La question est de savoir quelle est la meilleure façon de faire de la recherche. Alors peut-être que la meilleure façon d'étudier le lien entre les axiomes de Peano et les neurones est d'observer comment les mathématiciens prouvent les théorèmes. Mais c'est uniquement parce que je vous fournirai des informations complémentaires. Le résultat final réel sera une compréhension du système cérébral, de sa base physiologique,sans référence à aucun algorithme. Les algorithmes concernent tous les processus qui les utilisent et ils peuvent vous aider à obtenir des réponses. Il est possible que les surfaces inclinées vous disent quelque chose sur le taux de chute, mais si vous regardez les lois de Newton, elles ne disent rien sur les plans inclinés.

Bon. La logique de l'étude des systèmes cognitifs et linguistiques en utilisant l'approche Marr est compréhensible, mais comme vous ne reconnaissez pas la compétence linguistique comme une caractéristique génétique, vous pouvez appliquer cette logique à d'autres systèmes biologiques - le système immunitaire, le système cardiovasculaire ...

Chomsky: Exactement, je le pense très similaire. Vous pouvez dire la même chose du système immunitaire.

Et il peut même être plus facile de le faire avec ces systèmes qu'avec la pensée.

Chomsky:Mais vous vous attendez à d'autres réponses. Vous pouvez le faire avec le système digestif. Supposons que quelqu'un étudie le système digestif. Il est peu probable qu'il étudie ce qui se passe lorsque vous avez la grippe intestinale, ou lorsque vous avez mangé du bigmack, ou autre chose. Revenons à photographier ce qui se passe à l'extérieur de la fenêtre. Une façon d'étudier le système digestif est de collecter toutes sortes de données sur ce que fait le système digestif dans diverses circonstances, d'entrer des données dans un ordinateur, d'effectuer une analyse statistique - vous obtenez quelque chose. Mais ce ne sera pas ce que fait le biologiste. Il veut dès le départ s'abstraire de ce qui est considéré - peut-être faux, car vous pouvez toujours vous tromper - avec des variables non pertinentes, telles que si vous avez la grippe intestinale.

Mais c'est exactement ce que font les biologistes: ils prennent des personnes malades avec un système digestif malade, les comparent à des personnes saines et mesurent les propriétés moléculaires.

Chomsky: Ils le font à un stade plus avancé. Ils en savent déjà beaucoup sur la structure du système digestif avant de comparer les patients. Sinon, ils ne sauront pas quoi comparer et pourquoi l'un est malade et l'autre non.

Ils s'appuient sur une analyse statistique pour identifier les caractéristiques distinctives. Il s'agit d'une approche très bien financée, car vous prétendez étudier les patients.

Chomsky:Cela pourrait bien être un moyen d'obtenir du financement. Voici comment obtenir du financement pour la linguistique en disant que cela pourrait aider à traiter l'autisme. C’est une autre question tout à fait [rires]. Mais la logique de la recherche est de commencer à étudier le système, en faisant abstraction de ce que vous considérez, avec un degré de probabilité élevé, le bruit non pertinent. Vous essayez de trouver l'essence de base, puis vous vous demandez ce qui se passe si nous apportons autre chose, la même grippe intestinale.

Il semble tout de même qu'il soit difficile d'appliquer les niveaux de Marr à des systèmes de ce type. Si vous demandez quel type de tâche de calcul le cerveau résout, alors il semble y avoir une réponse, cela fonctionne presque comme un ordinateur. Mais si vous vous demandez quel type de problème informatique le plus simple résout, il est encore difficile d'y penser - ce n'est évidemment pas une tâche de traitement de l'information.

Chomsky: C'est vrai, mais il n'y a aucune raison de croire que toute la biologie est informatique. Il peut y avoir des raisons de penser que la pensée est telle. Et en fait, Gallistel ne dit pas que tout ce qui est dans le corps doit être étudié par la recherche d'unités de lecture / écriture / adresse.

Cela semble simplement contre-intuitif en termes d'évolution. Ces systèmes ont évolué ensemble, réutilisant des pièces, des molécules et des trajectoires similaires. Les cellules sont des appareils informatiques.

Chomsky:Vous n'étudiez pas le poumon en posant des questions sur ce que les cellules calculent. Vous étudiez le système immunitaire et le système visuel, mais vous ne vous attendez pas à trouver la même réponse. Le corps est un système hautement modulaire, il comporte de nombreux sous-systèmes complexes qui sont plus ou moins intégrés en interne. Ils opèrent sous différentes lois. La biologie est également modulaire. Vous ne pouvez pas supposer que tout cela n'est qu'un énorme gâchis d'objets se comportant de la même manière.

Bien sûr que non, mais je veux dire qu'il serait possible d'appliquer la même approche pour étudier chacun des modules.

Chomsky: Pas nécessairement, car les modules sont différents. Certains modules peuvent être informatiques, d'autres non.

, , , … , — ?

:Bien sûr. Vous pouvez comprendre beaucoup de choses, par exemple, sur ce qui fait qu'un embryon se transforme en poulet et non, disons, en souris. Il s'agit d'un système très compliqué, comprenant toutes sortes d'interactions chimiques et d'autres choses. Même avec un nématode, le fait que tout soit déterminé simplement par un réseau de neurones est complètement non évident, et il existe des preuves de recherches sur ce sujet. Vous devez regarder les interactions chimiques complexes qui se produisent dans le cerveau, dans le système nerveux. Il est nécessaire de scruter séparément chaque système. Ces interactions chimiques peuvent ne pas être liées à vos capacités arithmétiques - très probablement. Mais ils peuvent très facilement être liés au fait que vous décidiez de lever la main ou de la baisser.

Bien que, si vous commencez à étudier les interactions chimiques, cela vous mènera à ce que vous avez appelé une description répétée du phénomène, en d'autres termes seulement.

Chomsky: Ou une explication. Parce que c'est possible, ils sont très importants, en relation critique.

Mais si vous expliquez «la substance X doit être activée» ou «le gène X doit être présent», vous n'expliquez pas vraiment comment fonctionne le corps. Vous venez de trouver le levier et cliquez dessus.

Chomsky: Mais alors vous regardez plus loin et découvrez ce qui fait que ce gène fonctionne de cette façon dans de telles conditions, ou fonctionne différemment dans d'autres conditions.

Mais si les gènes sont au mauvais niveau d'abstraction, alors vous êtes en vol.

Chomsky: Alors vous n'obtenez pas la bonne réponse. Ou peut-être pas.Par exemple, il est bien connu qu'il est difficile de calculer comment un organisme se développe à partir du génome. Il existe différents types de processus se déroulant dans une cellule. Si vous regardez simplement l'action d'un gène, vous êtes peut-être au mauvais niveau d'abstraction. Il n'est jamais clair, par conséquent, il est nécessaire d'étudier cela. Je ne pense pas qu'il existe un algorithme pour répondre à ces questions.

Je voudrais déplacer la conversation vers l'évolution. Vous avez critiqué un point de vue très intéressant, que vous avez appelé «empirisme phylogénétique». Vous avez critiqué cette position par manque de pouvoir explicatif. Elle déclare simplement ce qui suit: ainsi, la pensée est ce qu'elle est, parce que de telles adaptations à l'environnement ont été choisies. Sélectionné par sélection naturelle. Vous avez fait valoir que cela n'explique rien, car vous pouvez toujours faire appel à ces deux principes - la mutation et la sélection.

Chomsky: Eh bien, vous pouvez les abandonner, mais ils ont peut-être raison. Il peut arriver que le développement de vos capacités arithmétiques résulte de mutations aléatoires et d'une sélection. S'il s'avère que c'est le cas, eh bien, très bien.

Cela ressemble à du truisme ( vérité bien connue - environ la traduction ).

Chomsky: Mais je ne dis pas que ce n'est pas vrai. Les truismes sont la vérité [rires].

Mais ils n'expliquent rien.

Chomsky:C'est peut-être le plus haut niveau d'explication que vous pouvez obtenir. Vous pouvez inventer le monde - je ne pense pas que ce sera notre monde - mais vous pouvez inventer un monde dans lequel rien ne se passe, sauf pour des changements aléatoires dans les objets et une sélection basée sur des forces externes. Je ne pense pas que notre monde soit ainsi organisé, et je ne pense pas qu’au moins un biologiste le pense. Il existe de nombreuses façons dont les forces naturelles déterminent les canaux dans lesquels la sélection peut avoir lieu, certaines choses se produisent, d'autres non. Tant de choses dans le corps ne fonctionnent pas de cette façon. Faites au moins la première étape, la méiose: pourquoi les cellules se divisent-elles en sphères plutôt qu'en cubes? Ce ne sont pas des mutations aléatoires ou une sélection naturelle: ce sont les lois de la physique. Il n'y a aucune raison de penser que les lois de la physique s'arrêtent là, elles fonctionnent partout.

Oui, bien sûr, ils limitent la biologie.

Chomsky: D'accord, c'est-à-dire qu'il ne s'agit pas seulement de mutations aléatoires et de sélection. Ce sont: les mutations aléatoires, la sélection et tout ce qui compte, par exemple, les lois de la physique.

Y a-t-il une place pour ces approches, qui sont maintenant appelées «génomique comparative»? Le Broads Institute ici [au MIT / Harvard] crée de grandes quantités de données à partir de différents génomes d'animaux différents, de cellules différentes dans des circonstances différentes et séquence toutes les molécules possibles. Y a-t-il quelque chose à apprendre sur les tâches cognitives de haut niveau de ces expériences évolutives comparatives, ou s'agit-il d'une approche immature?

Chomsky: Je ne dis pas que ce n'est pas la bonne approche, mais je ne sais pas ce que l'on peut en tirer. Comme toi.

, - ? , Foxp2? [ . : , , , . , . , .]

:Foxp2 est intéressant, mais cela n'a rien à voir avec la langue. Il est associé à la motricité fine et à des choses similaires. Cela a à voir avec l'utilisation de la langue, par exemple, lorsque vous dites - vous contrôlez vos lèvres et ainsi de suite, mais c'est très périphérique à la langue, et cela est déjà connu. Ainsi, par exemple, si vous utilisez des organes ou des signes articulatoires, eh bien, par exemple, un geste de la main est le même langage. En fait, il est même analysé et produit dans la même partie du cerveau, bien que dans un cas les mains bougent, dans les autres lèvres. Quelle que soit l'externalisation, tout est à la périphérie. Je pense qu'il est assez difficile d'en parler, mais si vous regardez la structure de la langue, vous en recevrez des preuves. Il existe des exemples intéressants dans l'apprentissage des langues, où il existe un conflit entre l'efficacité informatique et l'efficacité de la communication.

Prenons cet exemple, que j'ai déjà mentionné, avec un ordre linéaire. Si vous voulez savoir à quel verbe un adverbe est attaché, l'enfant utilise par réflexe la distance structurelle minimale plutôt que la distance linéaire minimale. Oui, il est plus facile d'utiliser la distance linéaire minimale d'un point de vue informatique, mais pour cela il faut qu'il y ait un concept d'ordre linéaire. Et si l'ordre linéaire n'est qu'un réflexe du système sensorimoteur, ce qui semble raisonnable, il ne le sera pas. Voici la preuve que la projection du système interne sur le système sensorimoteur est périphérique au fonctionnement du système informatique.

Mais peut-être que le système informatique introduit ses limites, comment la physique limite-t-elle la méiose?

Chomsky:Peut-être, mais il n'y a aucune preuve. Par exemple, l'extrémité gauche - celle de gauche dans le sens d'une précédente - les phrases ont d'autres caractéristiques que la droite. Si vous voulez poser une question, par exemple: "Qui voyez-vous?" Vous mettez le mot «qui» au début, pas à la fin. En fait, dans n'importe quelle langue dans laquelle le groupe de questions - qui a un livre qui se déplace ailleurs - se déplace vers la gauche, pas vers la droite. Il s'agit très probablement d'une limitation du traitement de l'information. La phrase commence par ce que l'auditeur vous dit: voici à quoi je ressemble. Si c'était à la fin, alors vous auriez une proposition complètement déclarative, et ce n'est qu'à la fin que vous sauriez quelles informations je vous demande. Si vous dites cela, c'est une limitation du traitement de l'information. Si tel est le cas, l'externalisation affecte la nature informatique de la syntaxe et de la sémantique.

Il y a des cas où vous trouvez des conflits évidents entre l'efficacité computationnelle et l'efficacité communicative. Prenons un exemple simple: si je dis: «Visiter des parents peut être un fardeau» - c'est ambigu. Des proches vous rendent-ils visite? Ou allez-vous rendre visite à des parents? Il s'avère que dans tous les cas connus, l'ambiguïté vient simplement du fait que nous permettons aux règles de fonctionner librement, sans restrictions. Il est donc efficace en termes de calcul, mais inefficace pour la communication, car il conduit à une ambiguïté insoluble.

Ou prenez un exemple de suggestions avec l'effet d'un chemin de jardin menant dans la mauvaise direction. Des suggestions comme: "Le cheval a couru devant la grange est tombé." (le cheval envoyé pour la grange est tombé - env.) Les gens, lorsqu'ils voient une telle offre, ne la comprennent pas, car elle est construite de manière à vous emmener le long du chemin du jardin. «Le cheval a couru devant la grange» sonne comme une phrase, puis vous êtes perplexe: que fait le mot «tombé» à la fin? D'un autre côté, si vous y réfléchissez, il s'agit d'une proposition absolument correctement formée. Cela signifie qu'un cheval qui a été pointé devant quelqu'un par une grange est tombé. Mais les règles du langage, lorsqu'elles fonctionnent simplement, peuvent vous donner des phrases incompréhensibles à cause du phénomène de chemin de jardin.

Et il existe de nombreux exemples de ce type. Il y a des choses que vous ne pouvez tout simplement pas dire pour une raison quelconque. Si je dis: les mécaniciens ont réparé les voitures. Et vous dites: "Ils se demandaient si les mécaniciens de la voiture l'avaient réparé." Vous pouvez poser des questions sur les voitures: "Combien de voitures qui les intéressaient, les mécaniciens les ont réparées?" Plus ou moins possible. Supposons que vous souhaitiez poser une question sur la mécanique. "Combien de mécaniciens ont-ils demandé s'ils avaient réparé les voitures?" Pour une raison quelconque, cela ne fonctionne plus comme ça. C'est une idée claire, mais vous ne pouvez pas la dire. Si vous étudiez ce cas en détail, les règles de calcul les plus efficaces ne vous permettent pas de le dire. Mais pour l'expression de la pensée, pour la communication, ce serait mieux si vous pouviez dire cela - d'où le conflit.
Et en fait, dans tous les cas d'un tel conflit, l'efficacité du calcul l'emporte. L'externalisation est dans tous les cas inférieure aux ambiguïtés, mais pour des raisons de calcul, le système ne se soucie apparemment pas de l'externalisation. Je ne l'ai peut-être pas montré de manière suffisamment plausible, mais simplement si vous le dites à voix haute, ce sera un argument suffisamment convaincant.

Cela nous dit quelque chose sur l'évolution. Ce qui s'affirme par ce fait: au cours de l'évolution du langage, un système informatique s'est développé, et alors seulement il a été externalisé. Et si vous pensez à la façon dont le langage pourrait se développer, vous avez presque atteint cette position. À un moment donné de l'évolution humaine, et cela est évident, tout récemment, si vous regardez les données archéologiques - peut-être au cours des cent mille dernières années, et ce n'est rien - à un moment donné, un système informatique avec de nouvelles propriétés qui n'existaient pas d'autres organismes ont de telles propriétés de type arithmétique ...

Autrement dit, cela vous a-t-il permis de mieux réfléchir avant l'externalisation?

Chomsky:Elle vous fait réfléchir. Un petit éclat du cerveau, qui se produit chez un individu, n'est pas dans un groupe. Cette personne avait la capacité de penser, pas le groupe. Il n'y a donc aucun intérêt à extérioriser. Ensuite, si ce changement génétique se propage, et par exemple, beaucoup de gens l'ont, alors il est logique de chercher un moyen de le projeter sur le système sensorimoteur, et c'est l'externalisation, mais c'est un processus secondaire.

Seulement si l'externalisation et le système de pensée interne ne sont pas liés de manière imprévisible.

Chomsky:Nous ne prédisons pas, et cela n'a guère de sens. Pourquoi serait-elle connectée à un système externe? Par exemple, vos capacités arithmétiques n'y sont pas connectées. Et il y a beaucoup d'autres animaux, comme les oiseaux chanteurs, qui ont un système informatique interne, un chant d'oiseau. Ce n'est pas le même système, mais c'est un système informatique interne. Et elle est extériorisée, mais parfois non. Dans certaines formes, le poussin maîtrise un chant de cette espèce, mais ne le reproduit qu'à maturité. Dans cette première période, il a une chanson, mais pas de système d'externalisation. Cela est également vrai pour les gens: l'enfant humain comprend beaucoup plus qu'il ne peut reproduire - beaucoup de preuves expérimentales - ce qui suggère que l'enfant a un système interne, mais il ne peut pas l'externaliser. Peut-être qu'il n'a pas assez de mémoire,ou d'autres raisons.

. , , , . , MIT, , , , , , , . , -, , ? , ? , — , .

:La philosophie des sciences est une discipline très intéressante, mais je ne pense pas qu'elle apporte vraiment une contribution à la science - elle apprend de la science. Elle essaie de comprendre ce que font les sciences, pourquoi les réalisations s'y produisent, quelles voies sont erronées, si elles peuvent être codifiées et comprises. Ce que je considère important dans l'histoire des sciences. Je pense que nous apprenons beaucoup de l'histoire des sciences sur ce qui peut être très important pour le développement des sciences. Surtout quand on comprend que dans les sciences cognitives nous sommes encore au stade pré-galiléen. Nous ne savons pas que nous recherchons quelque chose que Galileo a déjà trouvé, et il y a quelque chose à apprendre. Par exemple, un fait frappant des premières sciences, pas nécessairement de Galileo, mais globalement depuis l'époque des découvertes galiléennes, est que les choses simples peuvent être très déroutantes. Je tiens donc cette tasse, et si l'eau bout, alors la vapeur va monter, mais si je prends ma main, la tasse va tomber.Pourquoi la tasse tombe et la vapeur monte? Pendant mille ans d'affilée, ce fut une réponse tout à fait satisfaisante: ils luttent pour leur état naturel.

?

:C'est la physique aristotélicienne. Les meilleurs et les plus grands scientifiques pensaient que c'était la réponse. Galilée se permit de douter. Dès que vous vous permettez de douter, vous découvrez immédiatement que votre intuition est fausse. Comme une goutte de petite masse et de grande masse, etc. Toutes vos intuitions vous trompent - les énigmes sont partout où vous regardez. Dans l'histoire des sciences, il y a quelque chose à étudier. Prenons le même exemple que je vous ai donné, "les aigles volants instinctivement nagent". Personne n'a jamais pensé que c'était un mystère. Mais si vous y réfléchissez, c'est très mystérieux; vous utilisez des calculs complexes au lieu de simples. Si vous vous laissez surprendre, comme une tasse qui tombe, vous posez la question «Pourquoi?» Et puis vous vous retrouvez sur la voie de réponses assez intéressantes. Comme, par exemple: l'ordre linéaire ne fait pas partie d'un système informatique,qui est une hypothèse importante sur l'architecture de la pensée - elle dit que l'ordre linéaire n'est qu'une partie du système d'externalisation, c'est-à-dire le système secondaire. Et cela ouvre un grand nombre d'autres façons.

Ou prenez un autre exemple: la différence entre la réduction et l'unification. L'histoire des sciences donne des illustrations très intéressantes en chimie et en physique, et je pense qu'elles sont tout à fait pertinentes pour l'état des sciences cognitives et neurophysiologiques de notre temps.

Postface du traducteur: pendant le temps qui s'est écoulé depuis la publication de l'interview, Chomsky a publié d'autres documents intéressants - vous pouvez suggérer de lire une conversation de 2,5 heures avec le physicien américain Lawrence Krauss, ou avec le nouveau livre de Chomsky et Berwick, "Talking Man", si vous êtes intéressé par des questions évolution et langage.

Traduit par Tatyana Volkova.

Source: https://habr.com/ru/post/fr432846/


All Articles