Les ordinateurs écrivent de la prose, mais restent inférieurs aux gens. Pourquoi?



Il y a deux ans, dans un concours littéraire japonais, j'ai presque gagné une histoire écrite par l'intelligence artificielle. Il s'appelle «Le jour où l'ordinateur a écrit un roman». Même si cela ressemble à une incarnation stupide de la blague "la meilleure façon de faire un million est d'écrire un livre, comment faire un million", l'histoire est allée à la finale, en contournant environ quinze cents textes écrits par des gens. Mais la percée n'a pas eu lieu. Les textes de fiction sont toujours écrits par des personnes, des textes de non-fiction - surtout aussi.

Il y a quelques mois, Meanotek a essayé de faire un assistant IA pour écrire et écrire une histoire avec lui en collaboration. Spoiler - il n'a pas réussi. Les créateurs du projet nous ont dit quelle était l'idée et comment elle a été mise en œuvre. Et nous avons essayé de comprendre pourquoi les poètes sortent mieux des voitures que les écrivains en prose.

Je comprends que tu ne comprends pas, que nous ne comprenons rien


À l'été de cette année, la Fondation Sistema a organisé un concours de nouvelles de science-fiction «Future Time». Le sujet a été posé aux participants - «Immortalité», et le gagnant s'est vu promettre un gros jackpot solide d'un demi-million de roubles. Des milliers d'histoires ont été envoyées aux organisateurs, dont une a été écrite en utilisant l'intelligence artificielle.


L'IA fonctionne mieux dans le genre court - poèmes, citations sages, motivateurs et mèmes. Mais tout ne se passe pas toujours comme prévu. Par exemple, InspiroBot , créant des affiches de motivation, met des mots dans des choses étranges et parfois effrayantes.

L'histoire s'appelle "La grenouille déploie ses ailes" . Il s'agit d'une histoire de la jeune ingénieure Fotino, propriétaire d'un ensemble gentleman de qualités caractéristiques des héros du cyberpunk noir: la toxicomanie, un passé sombre, les déviations mentales, les tendances suicidaires et une réflexion sans fin sur la nature illusoire du monde. Entre les voyages hallucinogènes, Fotino tente de réparer l'IA qui gère la ville.
Il s'agit d'une histoire écrite non pas entièrement par AI, mais uniquement avec sa participation. L'expérience a été qu'un programme spécial n'a pas été utilisé pour créer le texte, mais plusieurs blocs de code ont été vissés ensemble, qui étaient à l'origine destinés à résoudre d'autres problèmes.

Le système a utilisé une bibliothèque de sa propre conception, qui, à son tour, utilise Pytorch. Les dialogues ont été composés par un chatbot développé précédemment, pour les en-têtes et les descriptions - un très grand réseau récurrent, formé sur les textes téléchargés depuis lib.ru.

  • Denis Tarasov ( Durham ), PDG de Meanotek.

Les aspects les plus importants de l'écriture - l'idée et l'intrigue - étaient encore assumés par l'homme. Selon Denis, ils ont essayé de créer un outil qui n'aide que l'écrivain et ne fonctionne pas pour lui.
Les dialogues avec l'IA sont entièrement générés par le système et conservés sous la forme dans laquelle ils ont été reçus. Les dialogues entre les personnages sont partiellement générés et la rugosité y est lissée. Suppression des rediffusions de phrases telles que "Je comprends que vous ne comprenez pas, que nous ne comprenons rien". Bien qu'une certaine proportion de ces expressions soit restée. Des sous-titres sont également tous générés. Nous avons essayé de corriger l'orthographe et la grammaire, mais il est possible que davantage d'erreurs aient été ajoutées que corrigées.

  • Denis Tarasov ( Durham ), PDG de Meanotek.

Dans le texte final, il est difficile de déterminer la quantité de texte machine et humain. Selon Denis, il y a des paragraphes où une phrase a été composée par une personne, et la seconde - un algorithme. «Une série d'épisodes n'aurait tout simplement pas été dans l'histoire sans les titres et les« semences »de l'IA. En général, la stylistique des fragments d'IA a influencé le style dans lequel les gens écrivaient. »

L'œuvre rappelle, si l'on peut l'appeler ainsi, une certaine expansion de la conscience. Après avoir écrit une phrase ou un paragraphe, une personne se tourne non seulement vers son imagination, mais regarde également que, sur la base de ses mots, un ordinateur a été généré. «L'homme a essayé de s'adapter à ce qui a été généré et, si possible, de tout rassembler dans un scénario significatif», explique Denis.



Cependant, le succès des collègues japonais a échoué. L'histoire n'a même pas atteint la longue liste. Le membre du jury Nikolai V. Kononov a écrit à propos de la "grenouille" comme ceci:
La main de l'éditeur est trop visible - et en général, la main humaine. Les développeurs du bot, en collaboration avec l'algorithme, ont écrit une histoire qui ne provoquera probablement pas le rejet des lecteurs de fiction. En ce sens, l'expérience a été un succès.

"Ce que la plupart des gens aiment aujourd'hui n'est pas nécessairement une histoire de qualité", explique Denis. "La qualité du texte peut encore être resserrée, mais le principal problème est le manque d'intrigue. Il s'avère que les différentes parties du texte peuvent même contenir du sens, mais elles n'ont ni début ni fin, aucune idée commune. C'est juste que quelque chose se passe, quelqu'un fait quelque chose, parle, et cela ne se termine par rien. "

Mais vous ne pouvez pas comprendre que vous allez résoudre un problème qui vous permettra de trouver quelque chose


Lorsque le mot "Robot" a été inventé pour la première fois, il était déjà utilisé dans le contexte de la question philosophique "Est-il juste de considérer les personnes artificielles comme des personnes". Il s'agit d'une pièce de Karel apek RUR Tout mot est aussi une pensée, un sens et le contexte qui le sous-tend. Dans le bon sens, l'écrivain trouve d'abord des idées et des significations, puis sélectionne des lettres pour eux.

Pourtant, les mots eux-mêmes ne sont rien d'autre que des gribouillis d'encre ou de pixels sur un fond blanc.



Le gros problème avec les textes de machine est que le processus va dans l'autre sens. Le système sélectionne un certain petit ensemble de mots dans un ensemble plus grand, et une personne - en train de lire - essaie de trouver le sens en eux, et itère sur ces ensembles jusqu'à ce que le sens à son avis soit trouvé.
Jusqu'à présent, les ordinateurs ont assez bien appris à écrire de la poésie. Cela se voit sur le site botpoet.com , où il y a un test qui montre clairement qu'il est difficile de distinguer un poète "humain" d'un ordinateur. Mais dans les versets, de nombreuses connexions logiques sont imaginées par le lecteur. En prose (surtout dans l'intrigue), elle est généralement plus prononcée, et l'ordinateur s'en sort toujours mal. Les réseaux de neurones sont souvent formés sur un éventail d'œuvres d'un auteur ou d'un autre, mais ils ne peuvent produire qu'un texte extérieurement similaire, c'est-à-dire qu'ils imitent le style, mais ne créent pas une nouvelle histoire.



Les employés de Yandex ont créé un réseau de neurones, qui a été formé à un éventail de poèmes russes, puis a alimenté les textes de la défense civile et publié des poèmes à la manière de Yegor Letov. Ils ont également enregistré l'album de musique "404" et ont appelé le groupe "Neural Defense"

L'organisation officielle des parcelles est un sujet de recherche de longue date. Avant l'âge d'or de l'informatique, les chercheurs triaient manuellement des milliers de textes à la recherche de modèles communs. L'un des exemples les plus célèbres est le livre de Joseph Campbell, A Hero with a Thousand Faces. Il s'agit d'une tentative de déduire une structure générale, une séquence de situations, qui est plus ou moins similaire dans les mythes de la plupart des peuples. Vladimir Propp a travaillé sur une tâche similaire. Dans le livre «La morphologie d'un conte de fées», il a essayé de décrire les composants généraux des histoires folkloriques.

Selon cette connaissance, les gens apprennent aux gens à faire des histoires. Les études sur la forme des intrigues relèvent de livres d'écriture et de scénarisation, où elles se transforment en instructions spécifiques. Par exemple, le scénariste Blake Snyder dans le livre "Save the Cat" a décrit la structure claire d'un bon film à son avis, où il a distribué les fonctions de l'intrigue nécessaires jusqu'à l'endroit dans le timing et le nombre de pages.

Mais les instructions aux gens ne se sont pas encore transformées en instructions pour les voitures.
Il est plus difficile de comprendre la structure de l'intrigue du texte et les torsions de l'intrigue, car pour commencer, il serait bien de s'entendre sur la façon dont nous les présentons formellement et de penser déjà comment les extraire du texte. Les instructions des manuels pour les écrivains peuvent probablement être mises dans la voiture sous la forme de règles avec des variables remplies au hasard (par exemple, pour qu'il sélectionne la ville d'action dans la liste des capitales européennes), mais cela ne nous rapproche guère de la création d'histoires originales. Je pense que jusqu'à présent, il est possible d'enseigner à un ordinateur à analyser si un nouveau texte particulier est plus proche des anciens réussis ou non, et de donner à l'auteur quelques recommandations, mais rien de plus.


"Pour l'instant, l'IA n'est pas en mesure d'évaluer la qualité d'une histoire, car en principe les critères de qualité ne sont pas clairs", explique Denis Tarasov. Mais s'il est très grossier d'assimiler qualité et succès, l'IA peut faire le travail.

L'année dernière, Bestseller Code est sorti, où les scénaristes Jodi Archer et Matthew Jokers ont tenté de décrire les similitudes entre les livres à succès. Ils ont alimenté les textes des livres à un système informatique basé sur l'apprentissage automatique (que l'on n'a pas décrit, cependant), les ont comparés avec le succès commercial et les modèles nommés qui pourraient contribuer à ce succès - thèmes, paramètres, caractéristiques des héros et séquences dans le changement de leur état .
Il n'est pas difficile de dériver un sujet: pour cela, il existe des algorithmes d'extraction de mots clés qui construisent un dictionnaire de fréquence et regardent quels mots se trouvent plus souvent qu'en moyenne dans la langue. Certes, pour apprendre à convertir des mots clés en sujets, nous devons encore essayer: par exemple, si nous savons que les mots "baiser", "tendre", "nuit" et "lilas" se trouvent dans le texte avec une fréquence inhabituellement élevée, un algorithme qui réduira ces mots au thème de «l'amour». Ou vous pouvez pré-diviser les textes en classes par thèmes ("amour", "aventures") puis résoudre le problème de la classification d'un nouveau texte - comme cela se fait, par exemple, dans les agrégateurs de nouvelles, où vous devez comprendre si le texte fait référence à l'économie, la politique, etc. n. En général, cette tâche semble tout à fait résoluble.

Les caractéristiques des héros sont également bien analysées. Les humanités numériques font beaucoup de cela, ce qui se tourne souvent vers la recherche sur la littérature numérique. Par exemple, le classique de cette zone, Franco Moretti, a automatiquement construit, puis analysé le réseau de connexions entre les personnages de Hamlet . Sur le matériel russe, par exemple, le groupe de Frank Fischer à la Higher School of Economics, qui constituait le corpus du drame russe RusDraCor, s'en occupe .



Faire un générateur de telles histoires n'est pas un gros problème scientifique. Sur Internet, il existe des générateurs d'histoires sur ce principe et même des générateurs d'histoires où vous pouvez sélectionner des paramètres et obtenir du texte de qualité différente. C'est toute la tâche à résoudre, il suffit de consacrer du temps et des efforts.

Tout d'abord, une séquence d'événements de niveau supérieur sera générée, puis chaque événement se déroulera jusqu'à ce qu'il atteigne le niveau des phrases et des lettres. Ou, en général, vous pouvez «réécrire» une histoire populaire, y changer les détails et maintenant la nouvelle histoire populaire est prête.

  • Denis Tarasov ( Durham ), PDG de Meanotek.

Devez-vous faire ce que vous ne savez pas?


Une autre question est de savoir si cela a du sens. Lorsque les gens essaient d'automatiser la production lourde robotisée, l'objectif est clair - dans de nombreuses industries, les capacités physiques des gens ont longtemps atteint le plafond. Il n'y a pas de tels problèmes par écrit - ces problèmes sont loin de la gravité physique du travail.

Au contraire, les lecteurs se plaignent plus souvent de toute tentative d'automatisation de l'écriture, pour l'amener à des modèles et des modèles communs. En regardant, par exemple, un film, les gens sont plus susceptibles d'être déçus si chaque fois, à une minute bien définie, une torsion de l'intrigue connue se produit. Dans un cinéma commercial cher, cela se produit de plus en plus souvent, mais il ne semble pas que nous l'appellerions une percée incroyable dans l'art dramatique.


À mon avis, un tel système dans la littérature fera beaucoup de mal, car il propagera diverses ordures littéraires, l’optimisant pour les demandes du lecteur. Ces déchets sont parfaitement produits sans générateur, et avec un générateur, il n'y aura rien à respirer du tout. Pour écrire une bonne histoire, vous devez comprendre la complexité des relations humaines, comprendre la biologie, la physique et bien plus encore, à un bon niveau - et pas seulement être capable d'ajouter des chaînes de mots qui provoquent une réponse émotionnelle donnée du lecteur.

Ce problème n'est résolu par aucun algorithme simple. Nous avons besoin d'un niveau d'intelligence et de connaissance d'une personne et d'une personne exceptionnelle. L'IA devrait être en mesure de construire elle-même les modèles du monde et la capacité de prédire les résultats de divers événements, et c'est un problème qui n'est pas résolu maintenant, et la science commence tout juste à s'en approcher.

Par conséquent, notre direction dans l'expérience est une tentative de combiner l'IA et l'homme.

  • Denis Tarasov ( Durham ), PDG de Meanotek.

D'une part, l'automatisation peut vraiment ruiner la littérature. D'un autre côté, si l'IA devient juste un expanseur d'imagination, si elle fournit quelque chose que l'auteur lui-même n'aurait jamais inventé, alors un ordinateur peut vraiment devenir un moyen de sortir des crises créatives, personnelles et mondiales.

Source: https://habr.com/ru/post/fr430116/


All Articles