Neuronales Netzwerk trainiert, um Depressionen durch willkürliche Sprache einer Person ohne Kontext zu erkennen


Das neuronale Netzwerk bewertet die emotionale Färbung des 30-Sekunden-Fragments der Sprecherrede. Illustration aus früheren wissenschaftlichen Arbeiten der Autoren

In den letzten Jahren wurde maschinelles Lernen zunehmend als nützliches Diagnosewerkzeug eingesetzt. Bestehende Modelle sind in der Lage, Wörter und Intonationen der Sprache zu identifizieren, die auf eine Depression hinweisen können. Diese Modelle funktionieren jedoch normalerweise nur, wenn der Patient bestimmte Fragen des Arztes beantwortet: zum Beispiel über seine Stimmung, seinen Lebensstil, seine Krankengeschichte usw. Das heißt, die Arbeit des neuronalen Netzwerks unterscheidet sich in diesem Fall nicht von der Arbeit eines gewöhnlichen Psychotherapeuten, der mit dem Patienten spricht.

Für eine neue Generation der Medizin ist ein System, das Depressionen anhand eines beliebigen Satzes von Wörtern ohne einen bestimmten Satz von Fragen bestimmt, viel effektiver. Theoretisch können Sie in diesem Fall die psychische Gesundheit der gesamten Bevölkerung automatisch in Echtzeit überwachen (der gesamte Sprachverkehr) - und Patienten schnell ins Krankenhaus bringen. Das automatische Depressionserkennungsmodul kann in mobilen Anwendungen und Spielen implementiert werden.

Dieses Modell wurde von Wissenschaftlern des Massachusetts Institute of Technology entwickelt, schreibt die Veröffentlichung MIT News . Der wissenschaftliche Artikel wird auf der Interspeech 2018- Konferenz vorgestellt, die vom 2. bis 6. September in Indien stattfindet.

„Wenn Sie Modelle zur [Erkennung von Depressionen] skalierbar bereitstellen möchten, müssen Sie die Anzahl der Einschränkungen für die verwendeten Daten minimieren. Ein Modell sollte Daten aus gewöhnlichen Gesprächen und natürlichen Interaktionen zwischen Menschen extrahieren “, sagte Tuka Alhanai, Forscherin am Labor für Informatik und künstliche Intelligenz (CSAIL) des Massachusetts Institute of Technology, einem führenden Autor wissenschaftlicher Arbeiten.

Die Forscher hoffen, dass die neue Methode verwendet wird, um Anzeichen von Depressionen in natürlichen Gesprächen zu erkennen. Basierend auf dem Modell können beispielsweise mobile Anwendungen entwickelt werden, die den Text und die Stimme des Benutzers auf psychische Störungen verfolgen und Warnungen senden. Dies ist besonders nützlich für diejenigen, die aufgrund der Abwesenheit eines Arztes, der hohen Kosten einer Konsultation oder einfach weil sie nicht wissen, dass er ein psychisches Problem hat, nicht zum Arzt für eine Erstdiagnose gelangen können.

Depressionen sind eine sehr gefährliche psychische Erkrankung, die mit einer Abnahme des Selbstwertgefühls, einem Verlust des Lebensinteresses und gewohnheitsmäßigen Aktivitäten einhergeht. In einigen Fällen kann eine Person, die darunter leidet, anfangen, Alkohol oder andere Substanzen zu missbrauchen.

Die Schlüsselinnovation der neuen Technologie liegt in ihrer Fähigkeit, Muster zu erkennen, die auf Depressionen hinweisen, und diese Muster dann ohne zusätzliche Informationen, dh ohne vorherige Schulung einer bestimmten Person, mit neuen Menschen zu vergleichen. „Wir nennen es Arbeit„ ohne Kontext “, weil Sie die Art der gesuchten Fragen und die Art der Antworten auf diese Fragen nicht einschränken“, erklärt Alkhanay.

Um das neuronale Netzwerk zu trainieren, wurde eine Technik namens "Sequenzmodellierung" verwendet, die häufig für die Sprachverarbeitung verwendet wird. Das Modell lernt aus Textsequenzen und Klangdaten aus Fragen und Antworten von Menschen mit und ohne Depression. Allmählich enthüllt sie allgemeine Muster, da einige Wörter bei gesunden und kranken Menschen mit unterschiedlichen Geräuschen verbunden sind. Darüber hinaus können Menschen mit Depressionen langsamer sprechen und längere Pausen zwischen den Wörtern einlegen. Diese Text- und Tonkennungen für psychische Störungen wurden in früheren Studien untersucht. Letztendlich bestimmt das Modell selbst, ob es Anzeichen einer Depression in der Sprache gibt oder nicht.

Das Modell wurde an einem Datensatz von 142 Sprachfragmenten aus dem Corpus Corpus des Distress Analysis Interview (Ton, Text, Video) getestet. Die Genauigkeit der Diagnose betrug 71% (d. H. 29% der falsch positiven Ergebnisse), und die Vollständigkeit des Nachweises der Krankheit betrug 83% aller Patienten in der Probe. In den meisten Tests übertraf die Genauigkeit die Leistung aller Vorgängermodelle zur Diagnose von Depressionen. Forscher finden die vorläufigen Ergebnisse sehr ermutigend.

In einem früheren wissenschaftlichen Artikel aus dem Jahr 2017 haben die Autoren ein neuronales Netzwerk beschrieben, das die Stimmung des Sprechers an folgenden Zeichen erkennt:

  • Stimmmerkmale;
  • Satz von Wörtern;
  • der Puls.


Die Abbildung zeigt die Verteilung des emotionalen Inhalts über Intervalle von fünf Sekunden. Negative Segmente sind solche, die Anzeichen von Traurigkeit, Ekel, Wut, Angst oder Langeweile zeigen. Positive Segmente enthalten Zeichen von Glück, Interesse oder Begeisterung.

Neben Depressionen wollen Wissenschaftler das neuronale Netzwerk trainieren, um andere mentale Zustände wie Demenz zu erkennen.

Source: https://habr.com/ru/post/de421775/


All Articles