Computer schreiben Prosa, sind aber den Menschen immer noch unterlegen. Warum?



Vor zwei Jahren hätte ich bei einem japanischen Literaturwettbewerb fast eine Geschichte gewonnen, die von künstlicher Intelligenz geschrieben wurde. Es heißt "Der Tag, an dem der Computer einen Roman schrieb". Auch wenn dies wie eine dumme Verkörperung des Witzes klingt: "Der beste Weg, eine Million zu verdienen, besteht darin, ein Buch zu schreiben, wie man eine Million macht", ging die Geschichte bis zum Finale und umging ungefähr anderthalb tausend Texte, die von Menschen geschrieben wurden. Aber der Durchbruch ist nicht geschehen. Fiktionstexte werden immer noch von Menschen geschrieben, Sachtexte - meistens auch.

Vor ein paar Monaten versuchte Meanotek, einen KI-Assistenten zum Schreiben zu machen und in Zusammenarbeit mit ihm eine Geschichte zu schreiben. Spoiler - es gelang ihm nicht. Die Macher des Projekts erzählten uns, was die Idee war und wie sie umgesetzt wurde. Und wir haben versucht herauszufinden, warum Dichter besser aus Autos steigen als Prosaschreiber.

Ich verstehe, dass Sie nicht verstehen, dass wir nichts verstehen


Im Sommer dieses Jahres veranstaltete die Sistema Foundation einen Science-Fiction-Kurzgeschichtenwettbewerb „The Future Time“. Den Teilnehmern wurde das Thema „Unsterblichkeit“ gestellt, und dem Gewinner wurde ein solider Jackpot von einer halben Million Rubel versprochen. Tausende von Geschichten wurden an die Organisatoren geschickt, darunter eine mit künstlicher Intelligenz.


KI funktioniert am besten im kurzen Genre - Gedichte, weise Zitate, Motivatoren und Meme. Aber nicht immer läuft alles wie vorgesehen. Zum Beispiel setzt InspiroBot , der Motivationsplakate erstellt, Wörter in seltsame und manchmal gruselige Dinge.

Die Geschichte heißt "Der Frosch breitet seine Flügel aus . " Dies ist eine Geschichte über das Ingenieur-Mädchen Fotino, die Besitzerin einer Reihe von Eigenschaften, die für die Helden des Cyberpunk Noir charakteristisch sind: Drogenabhängigkeit, dunkle Vergangenheit, mentale Abweichungen, Selbstmordtendenzen und endlose Reflexion über die Illusion der Welt. Zwischen halluzinogenen Reisen versucht Fotino, die KI zu reparieren, die die Stadt regiert.
Dies ist eine Geschichte, die nicht nur von AI geschrieben wurde, sondern nur unter seiner Teilnahme. Das Experiment bestand darin, dass kein spezielles Programm zum Erstellen des Textes verwendet wurde, sondern mehrere Codeblöcke zusammengeschraubt wurden, die ursprünglich zur Lösung anderer Probleme gedacht waren.

Das System verwendete eine eigene Bibliothek, die wiederum Pytorch verwendet. Die Dialoge wurden von einem zuvor entwickelten Chatbot für Überschriften und Beschreibungen zusammengestellt - ein sehr großes wiederkehrendes Netzwerk, das auf Texten basiert, die von lib.ru heruntergeladen wurden.

  • Denis Tarasov ( Durham ), CEO von Meanotek.

Die wichtigsten Aspekte des Schreibens - die Idee und die Handlung - wurden noch vom Menschen übernommen. Laut Denis haben sie versucht, ein Werkzeug zu entwickeln, das nur dem Schriftsteller hilft und für ihn nicht funktioniert.
Dialoge mit KI werden vollständig vom System generiert und in der Form belassen, in der sie empfangen wurden. Dialoge zwischen Zeichen werden teilweise erzeugt und die Rauheit wird dort geglättet. Wiederholungen aus Sätzen wie "Ich verstehe, dass Sie nicht verstehen, dass wir nichts verstehen" wurden entfernt. Obwohl ein gewisser Anteil solcher Ausdrücke erhalten blieb. Es werden auch alle Unterüberschriften generiert. Wir haben versucht, Rechtschreibung und Grammatik zu korrigieren, aber es ist möglich, dass mehr Fehler hinzugefügt als korrigiert wurden.

  • Denis Tarasov ( Durham ), CEO von Meanotek.

Im endgültigen Text ist es schwierig, die Menge an maschinellem und menschlichem Text zu bestimmen. Laut Denis gibt es Absätze, in denen ein Satz von einer Person verfasst wurde und der zweite - ein Algorithmus. „Eine Reihe von Episoden wäre ohne KI-Überschriften und„ Samen “einfach nicht in der Geschichte gewesen. Im Allgemeinen beeinflusste die Stilistik von KI-Fragmenten den Stil, in dem Menschen geschrieben haben. “

Die Arbeit erinnert, wenn man es so nennen darf, an eine gewisse Bewusstseinserweiterung. Nachdem eine Person einen Satz oder Absatz geschrieben hat, wendet sie sich nicht nur ihrer Vorstellungskraft zu, sondern sieht auch so aus, als ob basierend auf ihren Worten ein Computer generiert wurde. "Der Mann hat versucht, sich an das anzupassen, was erzeugt wurde, und wenn möglich alles in einer sinnvollen Handlung zusammenzufassen", sagt Denis.



Der Erfolg der japanischen Kollegen scheiterte jedoch. Die Geschichte traf nicht einmal die lange Liste. Das Jurymitglied Nikolai V. Kononov schrieb über den „Frosch“ folgendermaßen:
Die Hand des Herausgebers ist zu auffällig - und im Allgemeinen die menschliche Hand. Die Bot-Entwickler haben in Zusammenarbeit mit dem Algorithmus eine Geschichte geschrieben, die bei den Lesern der Belletristik wahrscheinlich keine Ablehnung hervorruft. In diesem Sinne war das Experiment ein Erfolg.

„Was die meisten Menschen heute mögen, ist nicht unbedingt eine Qualitätsgeschichte“, sagt Denis. „Die Qualität des Textes kann immer noch verbessert werden, aber das Hauptproblem ist das Fehlen einer Handlung. Es stellt sich heraus, dass die einzelnen Teile des Textes vielleicht sogar Bedeutung enthalten, aber sie haben keinen Anfang und kein Ende, keine gemeinsame Idee. Es ist nur so, dass etwas passiert, jemand etwas tut, redet und es mit nichts endet. "

Aber Sie können nicht verstehen, dass Sie ein Problem lösen werden, das es Ihnen ermöglicht, sich etwas auszudenken


Als das Wort "Roboter" zum ersten Mal geprägt wurde, wurde es bereits im Zusammenhang mit der philosophischen Frage "Ist es fair, künstliche Menschen als Menschen zu betrachten?" Verwendet. Dies ist ein Stück von Karel apek RUR. Jedes Wort ist auch ein Gedanke und eine Bedeutung und der Kontext dahinter. Auf eine gute Weise findet der Autor zuerst Ideen und Bedeutungen und wählt dann Buchstaben für sie aus.

Dennoch sind die Wörter selbst nichts anderes als Tinte oder Pixelkringel auf einem weißen Hintergrund.



Das große Problem bei Maschinentexten ist, dass der Prozess umgekehrt verläuft. Das System wählt eine bestimmte kleine Menge von Wörtern aus einer größeren Menge aus, und eine Person, die liest, versucht, die Bedeutung in ihnen zu finden, und durchläuft diese Mengen, bis die Bedeutung ihrer Meinung nach gefunden ist.
Bisher haben Computer ziemlich gut gelernt, Gedichte zu schreiben. Dies ist auf der Website botpoet.com zu sehen, wo es einen Test gibt, der deutlich zeigt, dass es schwierig ist, einen "menschlichen" Dichter von einem Computer zu unterscheiden. Aber in Versen werden viele logische Zusammenhänge vom Leser ausgedacht. In der Prosa (besonders in der Handlung) ist sie normalerweise ausgeprägter, und der Computer macht das immer noch schlecht. Neuronale Netze werden oft von dem einen oder anderen Autor auf einer Reihe von Werken trainiert, aber sie können nur äußerlich ähnlichen Text produzieren, das heißt, sie ahmen den Stil nach, schaffen aber keine neue Geschichte.

  • Alexander Piperski ( Apiperski ), Sprachwissenschaftler.


Die Mitarbeiter von Yandex schufen ein neuronales Netzwerk, das auf einer Reihe russischer Gedichte trainiert wurde, und fütterten dann die Texte des Zivilschutzes und gaben Gedichte im Stil von Jegor Letov heraus. Sie nahmen auch das Musikalbum „404“ auf und nannten die Gruppe „Neural Defense“.

Wie die Handlungen formal angeordnet sind, ist ein langjähriges Forschungsthema. Vor der Blütezeit der IT sortierten die Forscher Tausende von Texten manuell nach gemeinsamen Mustern. Eines der bekanntesten Beispiele ist Joseph Campbells Buch A Hero with a Thousand Faces. Dies ist ein Versuch, eine allgemeine Struktur abzuleiten, eine Abfolge von Situationen, die in den Mythen der meisten Völker mehr oder weniger ähnlich ist. Vladimir Propp arbeitete an einer ähnlichen Aufgabe. In dem Buch „Die Morphologie eines Märchens“ versuchte er, die allgemeinen Bestandteile von Folkloregeschichten zu beschreiben.

Nach diesem Wissen wird den Menschen beigebracht, Geschichten zu schreiben. Studien über die Form von Handlungen fallen in Bücher über Schreiben und Drehbuchschreiben, wo sie in spezifische Anweisungen umgewandelt werden. Zum Beispiel beschrieb der Drehbuchautor Blake Snyder in dem Buch „Save the Cat“ seiner Meinung nach die klare Struktur eines guten Films, in dem er die notwendigen Handlungsfunktionen bis zu dem Zeitpunkt und der Anzahl der Seiten verteilte.

Aber Anweisungen für Menschen haben sich noch nicht in Anweisungen für Autos verwandelt.
Es ist schwieriger, die Handlungsstruktur des Textes und die Handlungsänderungen zu verstehen, da es zunächst schön wäre, sich darauf zu einigen, wie wir sie formal präsentieren, und dann bereits darüber nachzudenken, wie sie aus dem Text extrahiert werden können. Die Anweisungen aus den Lehrbüchern für Schriftsteller können wahrscheinlich in Form von Regeln mit zufällig gefüllten Variablen ins Auto gestellt werden (zum Beispiel, um die Aktionsstadt aus der Liste der europäischen Hauptstädte auszuwählen), aber dies bringt uns der Erstellung origineller Geschichten kaum näher. Ich denke, bis jetzt ist es möglich, einem Computer beizubringen, zu analysieren, ob ein bestimmter neuer Text näher an erfolgreichen oder erfolglosen alten liegt, und dem Autor einige Empfehlungen zu geben, aber nichts weiter.

  • Alexander Piperski ( Apiperski ), Sprachwissenschaftler.

„Derzeit kann AI die Qualität einer Geschichte nicht bewerten, da die Qualitätskriterien im Prinzip nicht klar sind“, sagt Denis Tarasov. Aber wenn es sehr unhöflich ist, Qualität und Erfolg gleichzusetzen, kann AI den Job machen.

Letztes Jahr erschien der Bestseller Code, in dem die Drehbuchautoren Jodi Archer und Matthew Jokers versuchten, die Ähnlichkeiten zwischen erfolgreichen Büchern zu beschreiben. Sie fütterten die Texte von Büchern einem Computersystem, das auf maschinellem Lernen basiert (das man jedoch nicht beschrieb), verglichen sie mit kommerziellem Erfolg und benannten Muster, die zu diesem Erfolg beitragen könnten - Themen, Einstellungen, Eigenschaften von Helden und Sequenzen bei der Änderung ihres Zustands .
Es ist nicht schwierig, ein Thema abzuleiten: Dafür gibt es Algorithmen zum Extrahieren von Schlüsselwörtern, die ein Frequenzwörterbuch erstellen und untersuchen, welche Wörter häufiger als im Durchschnitt in der Sprache gefunden werden. Um zu lernen, wie man Schlüsselwörter in Themen umwandelt, müssen wir noch Folgendes versuchen: Wenn wir beispielsweise wissen, dass die Wörter "Kuss", "Zart", "Nacht" und "Flieder" im Text ungewöhnlich häufig vorkommen, Ein Algorithmus, der diese Wörter auf das Thema "Liebe" reduziert. Oder Sie können die Texte nach Themen ("Liebe", "Abenteuer") in Klassen unterteilen und dann das Problem der Klassifizierung eines neuen Textes lösen - wie dies beispielsweise bei Nachrichtenaggregatoren der Fall ist, bei denen Sie verstehen müssen, ob sich der Text auf Wirtschaft, Politik usw. bezieht. n. Im Allgemeinen scheint diese Aufgabe ziemlich lösbar zu sein.

Die Eigenschaften der Helden werden ebenfalls gut analysiert. Die Digital Humanities tun viel davon, was sich häufig der digitalen Literaturforschung zuwendet. Zum Beispiel baute der Klassiker dieses Gebiets, Franco Moretti, automatisch das Netzwerk der Verbindungen zwischen den Charakteren von Hamlet und analysierte es dann. In Bezug auf russisches Material befasst sich beispielsweise Frank Fischers Gruppe an der Higher School of Economics, die das Korpus des russischen Dramas RusDraCor bildete, damit .

  • Alexander Piperski ( Apiperski ), Sprachwissenschaftler.


Aus solchen Geschichten einen Generator zu machen, ist kein großes wissenschaftliches Problem. Im Internet gibt es Story-Generatoren nach diesem Prinzip und sogar Story-Generatoren, bei denen Sie Parameter auswählen und Text unterschiedlicher Qualität abrufen können. Dies ist die ganze Aufgabe, die gelöst werden muss. Es ist nur notwendig, Zeit und Mühe zu investieren.

Zuerst wird eine Folge von Ereignissen der obersten Ebene generiert, und dann wird jedes Ereignis entfaltet, bis es die Ebene der Sätze und Buchstaben erreicht. Oder Sie können im Allgemeinen eine beliebte Geschichte „umschreiben“, die Details dort ändern und jetzt ist die neue beliebte Geschichte fertig.

  • Denis Tarasov ( Durham ), CEO von Meanotek.

Müssen Sie tun, was Sie nicht wissen werden?


Eine andere Frage ist, ob dies sinnvoll ist. Wenn Menschen versuchen, die schwere Produktion zu automatisieren und zu roboterisieren, ist das Ziel klar: In vielen Branchen haben die körperlichen Fähigkeiten der Menschen längst die Obergrenze erreicht. Es gibt keine derartigen schriftlichen Probleme - diese Probleme sind weit entfernt von der physischen Schwere der Arbeit.

Im Gegenteil, die Leser beschweren sich häufiger über Versuche, das Schreiben zu automatisieren, um es auf gemeinsame Muster und Muster zu bringen. Wenn Sie beispielsweise einen Film ansehen, sind die Leute eher enttäuscht, wenn jedes Mal zu einer genau definierten Minute eine bekannte Handlung auftritt. Im teuren kommerziellen Kino passiert dies immer häufiger, aber es scheint nicht, dass wir es einen unglaublichen Durchbruch in der Dramatik nennen würden.


Meiner Meinung nach wird ein solches System in der Literatur großen Schaden anrichten, da es verschiedene literarische Abfälle verbreitet und sie für die Wünsche des Lesers optimiert. Solch ein Müll wird perfekt ohne Generator produziert, und mit einem Generator gibt es überhaupt nichts zu atmen. Um eine gute Geschichte zu schreiben, müssen Sie die Komplexität menschlicher Beziehungen verstehen, Biologie, Physik und vieles mehr auf einem guten Niveau verstehen - und nicht nur Wortketten hinzufügen können, die eine bestimmte emotionale Reaktion des Lesers hervorrufen.

Dieses Problem wird durch keinen einfachen Algorithmus gelöst. Wir brauchen ein Maß an Intelligenz und Wissen über eine Person und eine herausragende Person. Die KI sollte in der Lage sein, die Modelle der Welt selbst zu erstellen und die Ergebnisse verschiedener Ereignisse vorherzusagen. Dies ist ein Problem, das derzeit nicht gelöst ist, und die Wissenschaft fängt gerade erst an, sich ihm zu nähern.

Daher ist unsere Richtung im Experiment ein Versuch, KI und Mensch zu kombinieren.

  • Denis Tarasov ( Durham ), CEO von Meanotek.

Einerseits kann Automatisierung die Literatur wirklich ruinieren. Auf der anderen Seite kann ein Computer wirklich ein Ausweg aus persönlichen und globalen kreativen Krisen werden, wenn KI nur ein Expansionserweiterer wird, wenn sie etwas liefert, das der Autor selbst niemals erfunden hätte.

Source: https://habr.com/ru/post/de430116/


All Articles