Eine Palette erleichtert es Malern, Farben in verschiedenen Farben anzuordnen und zu mischen, wĂ€hrend sie Kunst auf der Leinwand vor sich schaffen. Ein Ă€hnliches Tool, mit dem KI gemeinsam aus verschiedenen Datenquellen wie Konversationen, ErzĂ€hlungen, Bildern und Wissen lernen kann, könnte Forschern und Wissenschaftlern TĂŒren öffnen, um KI-Systeme zu entwickeln, die allgemeinere Intelligenz ermöglichen.
Eine Palette ermöglicht es einem Maler, Farben in verschiedenen Farben anzuordnen und zu mischen. SpaceFusion möchte KI-Wissenschaftlern helfen, Ă€hnliche Dinge fĂŒr verschiedene Modelle zu tun, die auf verschiedenen DatensĂ€tzen trainiert wurden. FĂŒr Deep-Learning-Modelle werden DatensĂ€tze heutzutage normalerweise durch Vektoren in verschiedenen latenten RĂ€umen unter Verwendung verschiedener neuronaler Netze dargestellt. In dem Artikel "
Gemeinsame Optimierung von Vielfalt und Relevanz bei der Erzeugung neuronaler Reaktionen " schlagen meine Co-Autoren und ich SpaceFusion vor, ein Lernparadigma, um diese verschiedenen latenten RĂ€ume auszurichten - ordnen und mischen Sie sie reibungslos wie die Farbe auf einer Palette - damit die KI sie nutzen kann die Muster und das Wissen, die in jedem von ihnen eingebettet sind. Diese Arbeit, die wir auf der
Jahreskonferenz 2019 des Nordamerikanischen Kapitels der Vereinigung fĂŒr Computerlinguistik: Menschliche Sprachtechnologien (NAACL-HLT) vorstellen , ist Teil des
datengesteuerten Konversationsprojekts und wird umgesetzt verfĂŒgbar auf
GitHub .
Erfassen der Farbe menschlicher Konversation
In einem ersten Versuch haben wir diese Technik auf die neuronale Konversations-KI angewendet. In unserem Setup wird erwartet, dass ein neuronales Modell relevante und interessante Antworten in einem bestimmten GesprĂ€chsverlauf oder Kontext generiert. WĂ€hrend vielversprechende Fortschritte bei neuronalen Konversationsmodellen erzielt wurden, gehen diese Modelle eher auf Nummer sicher und fĂŒhren zu generischen und langweiligen Antworten. Es wurden AnsĂ€tze entwickelt, um diese Reaktionen zu diversifizieren und die Farbe menschlicher Konversation besser zu erfassen. Oft
gibt es jedoch einen Kompromiss, dessen Relevanz abnimmt .
Abbildung 1: Wie eine Palette die einfache Kombination von Farben ermöglicht, richtet SpaceFusion die latenten RÀume aus, die aus einem Sequenz-zu-Sequenz-Modell (S2S, rote Punkte) und einem Autoencoder (AE, blaue Punkte) gelernt wurden, oder mischt sie gemeinsam die beiden Modelle effizienter.SpaceFusion löst dieses Problem, indem die aus zwei Modellen gelernten latenten RÀume ausgerichtet werden (Abbildung 1):
- ein Sequenz-zu-Sequenz-Modell (S2S), das darauf abzielt, relevante Antworten zu liefern, dem jedoch möglicherweise die DiversitÀt fehlt; und
- Ein Autoencoder (AE) -Modell, das in der Lage ist, verschiedene Antworten darzustellen, deren Beziehung zur Konversation jedoch nicht erfasst.
Das gemeinsam erlernte Modell kann die StÀrken beider Modelle nutzen und Datenpunkte strukturierter anordnen.
Abbildung 2: Das Obige zeigt einen Kontext und seine Mehrfachantworten im latenten Raum, die durch SpaceFusion induziert werden. Entfernung und Richtung vom vorhergesagten Antwortvektor in Anbetracht des Kontexts stimmen ungefĂ€hr mit der Relevanz bzw. DiversitĂ€t ĂŒberein.Wie in Abbildung 2 dargestellt, sind beispielsweise in einem Kontext - in diesem Fall âMöchte jemand dieses Spiel starten?â - die positiven Antworten âIch wĂŒrde es gerne spielenâ und âJa, das tue ichâ entlang der Liste angeordnet gleiche Richtung. Die negativen - "Ich interessiere mich nicht fĂŒr das Spiel" und "Nein, ich nicht" - werden auf einer Linie in eine andere Richtung abgebildet. Die Vielfalt der Antworten wird erreicht, indem der latente Raum in verschiedene Richtungen untersucht wird. Weiterhin entspricht der Abstand im latenten Raum der Relevanz. Antworten, die weiter vom Kontext entfernt sind - "Ja, das tue ich" und "Nein, das tue ich nicht" - sind normalerweise allgemein gehalten, wĂ€hrend die Antworten, die nĂ€her am Kontext liegen, fĂŒr den jeweiligen Kontext relevanter sind: "Ich interessiere mich nicht fĂŒr das Spiel" und " Wann wirst du? "
SpaceFusion entwirrt die Kriterien Relevanz und Vielfalt und stellt sie in zwei unabhÀngigen Dimensionen dar - Richtung und Entfernung -, wodurch es einfacher wird, beide gemeinsam zu optimieren. Unsere empirischen Experimente und die Bewertung durch den Menschen haben gezeigt, dass SpaceFusion bei diesen beiden Kriterien im Vergleich zu Wettbewerbsgrundlagen eine bessere Leistung erbringt.
Einen gemeinsamen latenten Raum lernen
Wie genau richtet SpaceFusion verschiedene latente RĂ€ume aus?
Die Idee ist sehr intuitiv: FĂŒr jedes Punktpaar aus zwei verschiedenen latenten RĂ€umen minimieren wir zuerst deren Abstand im gemeinsamen latenten Raum und fördern dann einen reibungslosen Ăbergang zwischen ihnen. Dies erfolgt durch HinzufĂŒgen von zwei neuartigen Regularisierungstermen - Distanzterm und GlĂ€ttungsterm - zur Zielfunktion.
Am Beispiel der Konversation misst der Abstandsterm den euklidischen Abstand zwischen einem Punkt aus dem latenten Raum S2S, der aus dem Kontext abgebildet wird und die vorhergesagte Antwort darstellt, und den Punkten aus dem latenten Raum AE, die seinen Zielantworten entsprechen. Das Minimieren dieser Entfernung ermutigt das S2S-Modell, den Kontext auf einen Punkt abzubilden, der nahe an seinen Antworten im gemeinsamen latenten Raum liegt und von diesen umgeben ist, wie in Abbildung 2 dargestellt.
Der GlĂ€ttungsterm misst die Wahrscheinlichkeit, die Zielantwort aus einer zufĂ€lligen Interpolation zwischen dem aus dem Kontext abgebildeten Punkt und dem aus der Antwort abgebildeten Punkt zu erzeugen. Indem wir diese Wahrscheinlichkeit maximieren, fördern wir einen reibungslosen Ăbergang der Bedeutung der generierten Antworten, wenn wir uns vom Kontext entfernen. Dies ermöglicht es uns, die Nachbarschaft des vom S2S erstellten Vorhersagepunkts zu untersuchen und so verschiedene Antworten zu generieren, die fĂŒr den Kontext relevant sind.
Mit diesen beiden neuartigen Regularisierungen, die in der Zielfunktion hinzugefĂŒgt wurden, legen wir die Entfernungs- und GlĂ€ttungsbeschrĂ€nkungen fĂŒr das Lernen des latenten Raums fest, sodass sich das Training nicht nur auf die Leistung in jedem latenten Raum konzentriert, sondern auch versucht, sie durch HinzufĂŒgen dieser auszurichten gewĂŒnschte Strukturen. Unsere Arbeit konzentrierte sich auf Konversationsmodelle, aber wir erwarten, dass SpaceFusion die latenten RĂ€ume ausrichten kann, die von anderen Modellen gelernt wurden, die auf verschiedenen DatensĂ€tzen trainiert wurden. Dies ermöglicht die ĂberbrĂŒckung verschiedener FĂ€higkeiten und Wissensbereiche, die von jedem spezifischen KI-System gelernt wurden, und ist ein kleiner Schritt in Richtung einer allgemeineren Intelligenz.