Die Palette ermöglicht es KĂŒnstlern, Farben in verschiedenen Farben zu organisieren und zu mischen und GemĂ€lde auf LeinwĂ€nden vor ihnen zu erstellen. Die Existenz eines Ă€hnlichen Tools, mit dem KI gemeinsam aus verschiedenen Datenquellen wie GesprĂ€chen, Geschichten, Bildern und Wissen lernen kann, könnte Forschern und Wissenschaftlern die TĂŒr öffnen, um umfassendere KI-Systeme zu entwickeln.
Die Palette ermöglicht es dem KĂŒnstler, Farben in verschiedenen Farben zu verschmieren und zu mischen. SpaceFusion hat sich zum Ziel gesetzt, KI-Wissenschaftlern dabei zu helfen, Ă€hnliche Dinge fĂŒr verschiedene Modelle zu tun, die auf verschiedenen DatensĂ€tzen trainiert wurden.Bei modernen Deep-Learning-Modellen werden DatensĂ€tze normalerweise durch Vektoren in verschiedenen verborgenen RĂ€umen unter Verwendung verschiedener neuronaler Netze dargestellt. In dem Artikel â
Gemeinsame Optimierung von Vielfalt und Relevanz bei der Erzeugung neuronaler Reaktionen â stellen meine Co-Autoren und ich SpaceFusion vor, ein Trainingsparadigma, das verschiedene verborgene RĂ€ume - wie Farben auf einer Palette - âmischenâ kann, damit die KI die in jedem von ihnen eingebetteten Muster und Kenntnisse nutzen kann sie. Die Implementierung dieser Arbeit ist auf
GitHub verfĂŒgbar.
Erfassen Sie die Farbe menschlicher Konversation
Als ersten Versuch haben wir diese Technik auf neuronale interaktive KI angewendet. In unserem Setup wird erwartet, dass das neuronale Modell relevante und interessante Antworten basierend auf dem GesprÀchsverlauf oder -kontext generiert. Trotz der Tatsache, dass vielversprechende Erfolge in Modellen der neuronalen Kommunikation erzielt wurden, versuchen diese Modelle in der Regel, kein Risiko einzugehen und allgemeine und langweilige Antworten zu reproduzieren. Es wurden AnsÀtze entwickelt, um diese Reaktionen zu diversifizieren und die Farbe menschlicher Konversation besser widerzuspiegeln.
Ein Kompromiss entsteht jedoch hÀufig
mit einer Abnahme der Relevanz. .
Abbildung 1: Wie eine Palette, die das Kombinieren von Farben vereinfacht, richtet SpaceFusion verborgene Bereiche aus den Modellen seq2seq (S2S, rote Punkte) und Autoencoder (AE, blaue Punkte) aus oder mischt sie, um die beiden Modelle effizienter zu nutzen.SpaceFusion löst dieses Problem, indem verborgene RĂ€ume aus zwei Modellen verknĂŒpft werden (Abbildung 1):
- das Sequenz-zu-Sequenz-Modell (S2S), das darauf abzielt, relevante Antworten zu erhalten, aber möglicherweise nur wenige Unterschiede aufweist; und auch
- Ein Autoencoder (AE) -Modell, das in der Lage ist, unterschiedliche Antworten zu prÀsentieren, jedoch nicht deren Beziehung zur Konversation widerspiegelt.
Ein gemeinsam trainiertes Modell kann die StÀrken beider Modelle nutzen und Datenpunkte strukturierter organisieren.
Abbildung 2: Das Obige zeigt einen Kontext und seine vielen Antworten im verborgenen Raum, die durch SpaceFusion verursacht werden. Die Entfernung und Richtung vom vorhergesagten Antwortvektor unter BerĂŒcksichtigung des Kontexts entsprechen ungefĂ€hr der Signifikanz bzw. DiversitĂ€t.Beispiel: Wie in Abbildung 2 dargestellt, unter BerĂŒcksichtigung des Kontexts - in diesem Fall: "Möchte jemand dieses Spiel starten?" - Die positiven Antworten âIch wĂŒrde es gerne spielenâ und âJa, ich spieleâ befinden sich in einer Richtung. Die negativen - "Ich interessiere mich nicht fĂŒr das Spiel" und "Nein, ich interessiere mich nicht" - werden in eine andere Richtung abgebildet. Die Vielfalt der Antworten wird durch das Studium des verborgenen Raums in verschiedene Richtungen erreicht. AuĂerdem ist der Abstand im verborgenen Raum relevant. Antworten, die weiter vom Kontext entfernt sind - âJa, ich spieleâ und âNein, ich spiele nichtâ - sind normalerweise allgemeiner Natur, wĂ€hrend diejenigen, die nĂ€her sind, fĂŒr den spezifischen Kontext relevanter sind: âIch interessiere mich nicht fĂŒr das Spielâ und âWann Wirst du spielen? "
SpaceFusion trennt Relevanz- und DiversitÀtskriterien und prÀsentiert sie in zwei unabhÀngigen Dimensionen - Richtung und Entfernung -, was die gemeinsame Optimierung beider Kriterien erleichtert. Unsere empirischen Experimente und Bewertungen am Menschen haben gezeigt, dass SpaceFusion bei diesen beiden Kriterien im Vergleich zu Wettbewerbsgrundlagen eine bessere Leistung erbringt.
Gemeinsamen verborgenen Raum lernen
Wie genau ordnet SpaceFusion verschiedene verborgene RĂ€ume zu?
Die Idee ist sehr intuitiv: FĂŒr jedes Punktpaar aus zwei verschiedenen verborgenen RĂ€umen minimieren wir zuerst deren Abstand im gemeinsamen verborgenen Raum und behalten dann einen reibungslosen Ăbergang zwischen ihnen bei. Dies erfolgt durch HinzufĂŒgen von zwei neuen Regularisierungsterms - Distanzterm und GlĂ€ttungsterm - zur Zielfunktion.
Am Beispiel der Konversation misst der Abstandsterm den euklidischen Abstand zwischen dem Punkt aus dem verborgenen Raum S2S, der basierend auf dem Kontext angezeigt wird und die vorhergesagte Antwort darstellt, und den Punkten aus dem verborgenen Raum AE, die seinen Zielantworten entsprechen. Durch das Minimieren dieses Abstands wird das S2S-Modell dazu ermutigt, den Kontext als einen Punkt nahe und umgeben von seinen Antworten in einem gemeinsamen verborgenen Raum anzuzeigen, wie in Abbildung 2 dargestellt.
Der GlĂ€ttungsterm misst die Wahrscheinlichkeit, eine Zielantwort aus einer zufĂ€lligen Interpolation zwischen einem aus einem Kontext abgebildeten Punkt und einem aus einer Antwort abgebildeten Punkt zu erzeugen. Durch Maximieren dieser Wahrscheinlichkeit fördern wir einen reibungslosen Ăbergang des Werts der generierten Antworten, wenn Sie sich vom Kontext entfernen. Dies ermöglicht es uns, die Nachbarschaft des von S2S erstellten Prognosepunkts zu erkunden und so eine Vielzahl von Antworten zu generieren, die fĂŒr den Kontext relevant sind.
Mit diesen beiden neuen Regularisierungen, die der Zielfunktion hinzugefĂŒgt wurden, legen wir dem Lernen verborgener RĂ€ume Entfernungs- und GleichmĂ€ĂigkeitsbeschrĂ€nkungen auf, sodass sich das Training nicht nur auf die Leistung in jedem verborgenen Raum konzentriert, sondern auch versucht, sie durch HinzufĂŒgen dieser gewĂŒnschten Strukturen miteinander in Einklang zu bringen. Unsere Arbeit konzentrierte sich auf interaktive Modelle, aber wir erwarten, dass SpaceFusion verborgene RĂ€ume ausrichtet, die von anderen Modellen auf verschiedenen DatensĂ€tzen trainiert wurden. Dies verbindet die verschiedenen FĂ€higkeiten und Wissensbereiche, die von jedem einzelnen KI-System gelernt wurden, und ist der erste Schritt zu einer umfassenderen KI.
Siehe auch: 7 kostenlose Kurse fĂŒr Entwickler