Sarkasmuserkennung mit Faltungs-Neuronalen Netzen

Hallo Habr! Ich präsentiere Ihnen die Übersetzung des Artikels " Erkennen von Sarkasmus mit tiefen Faltungs-Neuronalen Netzen " von Elvis Saravia.


Eines der Hauptprobleme bei der Verarbeitung natürlicher Sprache ist die Erkennung von Sarkasmus. Das Erkennen von Sarkasmus ist in anderen Bereichen wichtig, z. B. beim emotionalen Rechnen und bei der Stimmungsanalyse, da dies die Polarität des Satzes widerspiegeln kann.

Dieser Artikel zeigt, wie Sarkasmus erkannt wird, und bietet auch eine Verknüpfung zu einem Sarkasmusdetektor für neuronale Netze .

Sarkasmus kann als Ausdruck von stechendem Spott oder Ironie gesehen werden. Beispiele für Sarkasmus: „Ich arbeite 40 Stunden pro Woche, um arm zu bleiben“ oder „Wenn der Patient wirklich leben will, sind Ärzte machtlos.“

Um Sarkasmus zu verstehen und zu erkennen, ist es wichtig, die mit dem Ereignis verbundenen Fakten zu verstehen. Dies zeigt einen Widerspruch zwischen objektiver Polarität (normalerweise negativ) und sarkastischen Eigenschaften, die vom Autor vermittelt werden (normalerweise positiv).

Betrachten Sie das Beispiel: "Ich mag den Schmerz des Abschieds."
Es ist schwierig, die Bedeutung zu verstehen, wenn diese Aussage Sarkasmus enthält. In diesem Beispiel gibt „Ich mag Schmerz“ Wissen über die vom Autor zum Ausdruck gebrachten Gefühle (in diesem Fall positiv), und „Abschied“ beschreibt das widersprüchliche Gefühl (negativ).

Andere Probleme, die beim Verständnis sarkastischer Aussagen bestehen, sind die Bezugnahme auf mehrere Ereignisse und die Notwendigkeit, eine große Anzahl von Fakten, gesundem Menschenverstand und logischem Denken zu extrahieren.

Modell


In der Kommunikation, in der Sarkasmus herrscht, ist häufig eine „Stimmungsverschiebung“ vorhanden. Daher wird vorgeschlagen, zunächst ein Stimmungsmodell (basierend auf CNN) zu erstellen, um die Stimmungszeichen zu extrahieren. Das Modell wählt lokale Features in den ersten Ebenen aus, die dann auf höheren Ebenen in globale Features umgewandelt werden. Sarkastische Ausdrücke sind benutzerspezifisch - einige Benutzer verwenden mehr Sarkasmus als andere.

In dem vorgeschlagenen Modell zur Erkennung von Sarkasmus werden Persönlichkeitsmerkmale, Stimmungszeichen und Zeichen basierend auf Emotionen verwendet. Eine Reihe von Detektoren ist ein Framework zur Erkennung von Sarkasmus. Jeder Satz von Attributen wird durch separate vorab trainierte Modelle untersucht.

CNN Framework


CNNs modellieren effektiv die Hierarchie lokaler Features, um globale Features hervorzuheben, die zur Untersuchung des Kontexts erforderlich sind. Eingabedaten werden als Wortvektoren dargestellt. Für die anfängliche Verarbeitung von Eingabedaten wird word2vec von Google verwendet. Die Parameter der Vektoren werden in der Trainingsphase erhalten. Die maximale Vereinigung wird dann auf Funktionszuordnungen angewendet, um Funktionen zu erstellen. Nach der vollständig gebundenen Schicht befindet sich eine Softmax-Schicht, um die endgültige Vorhersage zu erhalten.

Die Architektur ist in der folgenden Abbildung dargestellt.



Um andere Merkmale zu erhalten - Stimmung (S), Emotion (E) und Persönlichkeit (P) - werden CNN-Modelle vorab trainiert und zum Extrahieren von Merkmalen aus Sarkasmusdatensätzen verwendet. Für das Training jedes Modells wurden unterschiedliche Trainingsdatensätze verwendet. (Weitere Details finden Sie im Dokument)

Es werden zwei Klassifikatoren getestet - reine CNN-Klassifikatoren (CNN) und CNN-extrahierte Eigenschaften, die an den SVM-Klassifikator (CNN-SVM) übergeben werden.

Es wird auch ein separater Basisklassifikator (B) trainiert, der nur aus dem CNN-Modell ohne Einbeziehung anderer Modelle (z. B. Emotionen und Stimmungen) besteht.

Die Experimente


Daten. Ausgeglichene und unausgeglichene Datensätze wurden von (Ptacek et al., 2014) und einem Sarkasmusdetektor erhalten . Benutzernamen, URLs und Hash-Tags werden entfernt, und der NLTK-Twitter-Tokenizer wird angewendet.

Die Metriken sowohl des CNN- als auch des CNN-SVM-Klassifikators, die auf alle Datensätze angewendet werden, sind in der folgenden Tabelle aufgeführt. Möglicherweise stellen Sie fest, dass ein Modell (insbesondere CNN-SVM), das Anzeichen von Sarkasmus, Anzeichen von Emotionen, Gefühlen und Charaktereigenschaften kombiniert, alle anderen Modelle mit Ausnahme des Basismodells (B) übertrifft.



Die Möglichkeiten der Generalisierbarkeit der Modelle wurden getestet, und die Hauptschlussfolgerung war, dass die unterschiedlichen Datensätze das Ergebnis erheblich beeinflussten, was in der folgenden Abbildung dargestellt ist. Beispielsweise wurde das Training an Datensatz 1 durchgeführt und an Datensatz 2 getestet. Der F1-Score des Modells betrug 33,05%.

Source: https://habr.com/ru/post/de419857/


All Articles