Erwartungen bei der Entwicklung eines Dialogs mit einem Chat-Bot



Wie sich angewandte Arbeit von der Papiertheorie unterscheidet, ist das Auftreten von Problemen. Ständig konfrontiert mit neuen Schwierigkeiten, die wiederum Nahrung für den Geist liefern.

Während der Arbeit an einem Chat-Bot sah ich mich mit der Notwendigkeit konfrontiert, die Entwicklung des Dialogs zu antizipieren (dh zu antizipieren). Ich habe vorher nicht darüber nachgedacht, aber dann musste ich darüber nachdenken, welche Wörter als Reaktion auf eine bestimmte menschliche Phrase in die Computerlippen eingefügt werden sollten.

Die Schlussfolgerungen schienen mir interessant zu sein. Sie liegen an der Oberfläche des Problems und sind möglicherweise keine Offenbarung für diejenigen, die zuvor KI studiert haben, aber ich habe keine direkte Sprache in der Presse gesehen. Also fangen wir an ...

Dialog einer Person und eines Chatbots: Eine Person sagt etwas, der Chatbot muss vernünftig reagieren. Es scheint, dass die Hauptschwierigkeit bei der Programmierung die Unvorhersehbarkeit dessen ist, was von einer Person gesprochen wird, weil eine Person buchstäblich alles sagen kann. Und wenn überhaupt, ist es schwierig, eine vernünftige Antwort zu finden: Die Liste der Antworten auf unvorhersehbare Fragen sollte unendlich sein, aber unendlich ist technisch unmöglich. Folglich sollte der Chatbot „verstehen“, was der Gesprächspartner ihm gesagt hat - weiter auf dem Weg der KI-Entwickler, weit über die Grenzen des angekündigten Themas hinaus ...

Der Humor der Situation ist, dass es nicht nur eine Gelegenheit, sondern auch eine besondere Notwendigkeit ist, aus dem Chatbot "Verstehen" zu "verstehen", den Satz des Gesprächspartners zu "verstehen", aus dem Grund, dass ... die Menschen selbst nicht so kommunizieren. Wenn Sie glauben, dass Menschen mit Hilfe des mentalen Apparats - des Gehirns - analysieren, was sie hören, dann sprechen sie auf der Grundlage der Analyse die Antwort aus, dann geschieht die Kommunikation nicht ganz so, sondern anders.

Haben Sie sich jemals gefragt, warum Sie gerne mit Freunden sprechen? Ist es nicht so, dass Sie von Freunden hören, was meistens angenehm ist, nicht nur im Sinne von „komplementär“, sondern auch im Sinne von „interessant“, „faszinierend“ usw.? Genau aus dem gleichen Grund ist es für Sie unangenehm, mit Feinden zu sprechen, da die von ihnen kommenden Informationen das entgegengesetzte Vorzeichen oder den entgegengesetzten Vektor für Sie haben. Mit anderen Worten, Sie wissen im Voraus, welche Informationen Sie von wem erhalten, und handeln entsprechend den Umständen : Nehmen Sie freudig Kontakt mit Freunden auf, vermeiden Sie nach Möglichkeit Treffen mit Feinden.

Hier ist die Frage: Warum müssen Sie Ihre Freunde kontaktieren, wenn Sie im Voraus wissen, was sie sagen werden? Nein, ich verstehe und teile: habe eine gute Zeit, entspanne dich ... aber der Wunsch, hier neue Informationen zu erhalten, steht eindeutig an letzter Stelle. Zum größten Teil erhalten Menschen Informationen - in gewissem Sinne neue Informationen für sich selbst - aus anderen Quellen, und wenn sie mit Freunden kommunizieren, bekommen sie ein Summen von etwas anderem, nämlich von der Vorhersehbarkeit des Gesprächs, genau wie bei der Kommunikation mit Feinden, lange bevor sie kommunizieren, erleben sie negative Emotionen, dank der gleichen Vorhersehbarkeit dessen, was passieren wird.

Die meisten Gespräche sind vorhersehbar, und dies kann nur eines bedeuten: Die Leute kennen den Verlauf eines zukünftigen Gesprächs mit einem bestimmten Gesprächspartner im Voraus.

In Wirklichkeit ist die Kommunikation zwischen Menschen etwas anders als standardmäßig angenommen:

  • Der Gesprächspartner sagt etwas
  • Sie analysieren den Satz, den Sie hören, und geben eine Antwort.

In Wirklichkeit erfolgt die Kommunikation zwischen Menschen wie folgt:

  • Sie nehmen vorweg, was der Gesprächspartner Ihnen sagen wird, und bereiten im Voraus die Antwort auf den erwarteten Satz vor .
  • Wenn die Erwartungen erfüllt wurden, geben Sie ein Leerzeichen aus.
  • Andernfalls stellen Sie für einen bestimmten Gesprächspartner auch eine leere, aber nicht individuelle Person aus, die jedoch für alle Gesprächspartner geeignet ist.

Dies ist Antizipation, und ihre Gesetze gelten nicht nur für Gespräche mit Menschen, deren Einstellung definiert ist (positiv oder negativ), sondern auch für alle Gespräche im Prinzip.

Angenommen, Sie treffen einen Freund und sagen zu ihm: "Hallo."

Dieser Satz gehorcht der Situation: In Übereinstimmung mit bestimmten Regeln, deren Ursprung in diesem Fall unwichtig ist, wird er zu Beginn des Dialogs verwendet. Es macht keinen Sinn, auf die Antwort zu warten, die wahrscheinlich bekannt ist. Sie können mit der Konstruktion der nächsten Phrase beginnen. Wenn Sie die Begrüßung hören, beginnen Sie die vorbereitete Phrase sofort und ohne weitere Überlegungen.

Als Antwort können Sie jedoch etwas anderes hören, zum Beispiel: "Ja, Sie gehen ...". Das zuvor geplante Gespräch verlief anders, das Skript änderte sich dramatisch. Nun, es passiert. In diesem Fall gibt Ihr Gehirn eine Standardantwort wie: „Sie selbst gehen!“ - nur einen Moment später als die Phrase, die klingen würde, wenn das geplante Szenario unverändert bleibt. Ein Moment ist streng genommen keine Zeit zum Nachdenken, sondern Zeit für den Zugriff auf eine Bibliothek von Situationslücken. Was für ein Denken gibt es, wenn alles „auf der Maschine“ gemacht wird, praktisch auf einer unbewussten Ebene!

Man kann sich vorstellen, dass der Gesprächspartner „den Umzug überspringt“: Er sagt nicht Hallo, sondern sagt den folgenden Satz auf freundliche Weise, die Ihrer früheren Kommunikation vertraut ist. Gewohnheitsmäßige Mittel impliziert. Für Sie (genauer gesagt für Ihr Gehirn) ist es nicht sinnvoll, auf eine bereits bekannte Antwort zu warten, aber es ist sinnvoll, Sätze für den anschließenden Dialog vorzubereiten. Dann ist es sehr wahrscheinlich, dass der nachfolgende Satz nach dem verpassten „Hallo“ nicht überrascht wird: Das vorbereitete Werkstück kommt ohne die geringste Verzögerung an Ihrem Mund an. Falls gewünscht, kann das Fehlen einer Begrüßung nicht als „verpasster Zug“, sondern als neuer Zweig des Skripts angesehen werden. Dies ändert jedoch nichts am Gesamtbild.


Mit der dritten Option können Sie die Tiefe der Vorfreude festlegen. Wenn wir den Satz, den der Gesprächspartner nicht gesagt hat, nicht vorhersehen können, müssen wir ihn analysieren, nachdem wir ihn ausgesprochen haben. Daher ist es ideal, nicht nur den folgenden Satz, sondern den gesamten Dialog als Ganzes vorwegzunehmen - aber dies ist aus dem Bereich der guten Wünsche. Menschen sind dazu nicht in der Lage: Während des Dialogs sind sie gezwungen, ständig von einzelnen Beschaffungsbibliotheken zu situativen zu wechseln.

Jedes Replikat enthält also eine Reihe nachfolgender Antworten mit einer sehr begrenzten Menge . Im Fall von Grüßen ist dies auf das Ritual der Höflichkeit zurückzuführen, im allgemeinen Fall auf die Grenze menschlicher Reaktionen auf ein bestimmtes Ereignis: Freude, Trauer, Bewunderung, Verachtung usw. Es gibt mehrere Dutzend Empfindungen, andere kann man sich nicht vorstellen - die Leute fühlen einfach nichts anderes. Reaktionen ermöglichen es, den Dialog vorwegzunehmen und Vorbereitungen für eine mögliche Formulierung des Gesprächspartners zu treffen.

Der Dialog bietet also keine endlosen Möglichkeiten, etwas Willkürliches zu sagen und etwas Willkürliches zu beantworten, sondern enge Wege, auf denen Sie sich nur bewegen können. Sie sind wie Strecken auf der Rennstrecke: Sie dürfen nur dort abschalten, wo sie vom Konstrukteur der Strecke bereitgestellt werden - die menschliche Psychologie. Sie können nicht im Gelände fahren: Der Hauptzaun wurde installiert, wissen Sie.

Wie Autos auf einem Autodrom bewegen sich auch Gespräche im Kreis. Freunde bekommen einen Kick von einem lästigen Thema, Freundinnen klatschen nicht weniger begeistert untereinander. Wenn es zu Streitigkeiten zwischen feindlichen Menschen kommt, werden die Argumente der Gegenseite zwischen den Ohren ausgetauscht. Im letzteren Fall sagen sie: "Er hört mich nicht." Wahrscheinlich hört er mit den Ohren, aber Ihre Reaktion auf den Gesprächsplan wird vom Gesprächspartner nicht erwartet, da der Gesprächspartner mit einem Standard-Leerzeichen antwortet, das nicht mehr zu Ihnen passt. Kreisverkehr ist eine hoffnungslose Situation.


Typische Grafiken. Jede Phrase kann ausgesprochen werden, es gibt immer die Wahl zwischen der einen oder anderen Antwort: Dementsprechend muss jeder Knoten mindestens eine Eingabekante und mehrere ausgehende Erweiterungskanten haben.

Im Idealfall benötigt ein Chatbot einen Rand von mehreren Spalten - Konversationspläne: individuell für jeden Gesprächspartner, mit dem er gesprochen hat, und gemeinsam mit Fremden. Es ist offensichtlich, dass zum Beispiel ein Mann, der mit einer geliebten Frau und einem nicht gut gelaunten Untergebenen kommuniziert, verschiedene Dinge hat: Themen, Vokabeln, Intonationen, emotionale Farbe, Lautstärke und so weiter, aber vor allem - die Richtung des Denkens.

Es versteht sich, dass Antizipation kein Allheilmittel ist, sondern eine von vielen Methoden. Wenn es um die Entwicklung von KI geht, ist es nicht die bedeutendste, es gibt wichtigere. Darüber hinaus ist die Technik äußerst schwierig zu implementieren.

Wenn der Gesprächspartner irgendwie nicht standardmäßig begrüßt, kann der Chatbot die Begrüßung „nicht erraten“ und entsprechend anders reagieren (die Variabilität der menschlichen Sprache ist das Problem der Probleme, verdammt noch mal). Die Begrüßung ist jedoch der einfachste Fall: Es ist viel schwieriger, spätere Bemerkungen vorwegzunehmen.

Außerdem kann der Chatbot beim Generieren Ihrer eigenen Phrase eine fehlerhafte Reaktion des Gesprächspartners planen, die zu Abweichungen von der erwarteten Antwort führt.

In einigen Fällen ist es aus rein algorithmischen Gründen rentabler, auf die Phrase des Gesprächspartners zu warten und sie dann zu analysieren. Wenn der Chatbot zum Bestellen von Tickets verwendet wird, ist es offensichtlich, dass es keinen Sinn oder keine Möglichkeit gibt, das Ticket für welches Datum und welche Route der Käufer anzufordern - Sie müssen auf Informationen warten. Gleichzeitig ist in einem typischen AI-freien Dialog Vorfreude erforderlich: Sie kann viel Verarbeitungszeit sparen, zumindest aufgrund der Fähigkeit, beim Nachdenken oder Aussprechen einer Phrase vorauszusehen.

Im Zusammenhang mit Antizipation und einer Bibliothek von Situationslücken wird an einen merkwürdigen Fall erinnert. Ein Freund kam zu meiner Frau und mir. Nach einiger Zeit erwähnte sie ihren Ehemann, der für immer vergisst, das Licht auszuschalten: Sie begann begeistert zu erzählen, wie sein tschechischer Schwanz ist, und so weiter. "Nun, natürlich! Natürlich! Du hast absolut recht, Liebes! “ - hörte die mitfühlenden Bemerkungen meiner Frau. Der Witz war, dass in meiner Familie genau das Gegenteil der Fall war. Die Frau macht das Licht im Grunde nicht aus: Eine Minute nach ihrer Ankunft zu Hause ist das Licht überall an - in Räumen, einem Korridor, in der Küche, in der Toilette und im Badezimmer. Beim Vorbeigehen schalte ich es automatisch aus, und meine Frau schaltet es nicht weniger automatisch ein, und es gibt nichts zu tun. Aber das Gespräch mit ihrer Freundin war genau das. Die Frau benutzte die einzelnen Leerzeichen, die zu dem Treffen passten, ein wenig fehl am Platz, während nichts die Kommunikation störte. Frauen sangen, wie sie sagen, unisono - sie waren völlig einstimmig und glücklich.

Nachtrag
Dieser Artikel wurde als Teil einer Reihe über die Entwicklung eines syntaktischen Chat-Bots von mir, Vanya the Sensible, geschrieben.

Vorherige Artikel:

  1. Erstellung von KI mit der Glock-Cuzdra-Methode. Intellektuelle Odyssee ;
  2. Chatbot bekommt Gehör oder das Leiden eines Amateurs .

Wenn jemand Wanja in seinem aktuellen Zustand kennenlernen möchte, ist Release 2.0 hier: bitbucket.org/mikejum/intellectualivan/downloads

Im Vergleich zur vorherigen Version sprach Vanya und wurde weniger fehlerhaft - man kann sagen, er wurde klüger, wenn auch nicht so sehr, wie wir es gerne hätten. Wie mein sechsjähriger Stamm nach einem Gespräch mit dem Chat-Bot sagte: "Ihre Wanja ist genauso dumm wie Siri."

Es gab Installationsprobleme aufgrund des Übergangs von Access zu PostgreSQL: Jetzt reicht das Entpacken der Datei nicht mehr aus. Sie müssen PostgreSQL installieren und den Speicherauszug bereitstellen. Die Anweisungen sind beigefügt.

Auf die unvermeidliche Frage, wie viel Vorfreude in Version 2.0 implementiert ist, werde ich auf diese Weise antworten. Teilweise umgesetzt, ist es auf der ersten Ebene jedoch problematisch, dies während des Dialogs zu bemerken. Wie bereits erwähnt, ist Antizipation eines der vielen Merkmale, die bei der Entwicklung der KI erforderlich sind, bei weitem nicht das wichtigste.

Source: https://habr.com/ru/post/de442332/


All Articles