Computer lehrte, Demenz mit einer Genauigkeit von 93% zu erkennen



Die Angst vor dem Wahnsinn ist eine der stärksten Phobien des Homo sapiens. Vor zweihundert Jahren schrieb Alexander Puschkin darüber sein berühmtes "Gott bewahre, ich verliere den Verstand". Jetzt, im fortschreitenden 21. Jahrhundert, hat sich wenig geändert, und wir haben immer noch Angst vor erworbenen psychischen Störungen. In Russland beispielsweise macht Demenz den Menschen mehr Angst als Krebs und Schlaganfall: 45% der Befragten nannten sie die schrecklichste Alterskrankheit ( Umfragedaten auf dem Health Mail.ru-Portal).

Glücklicherweise kämpft die Medizin heute viel erfolgreicher mit Demenz als in der Puschkin-Ära. Mit einer frühzeitigen Diagnose kann der Verfall der Persönlichkeit verhindert und die kognitiven Fähigkeiten erhalten werden. Kürzlich wurde an der Universität von Osaka ein Programm zur Früherkennung von Demenz auf der Grundlage künstlicher Intelligenz entwickelt. Das Projekt verwendete Algorithmen und Daten für maschinelles Lernen, die bei der Arbeit mit kranken und gesunden Menschen gewonnen wurden. Die diagnostische Genauigkeit betrug 93%.

Was ist Demenz und wie wird sie erkannt?


Beginnen wir mit der Definition. Demenz - erworbene Demenz, ein anhaltender Rückgang der kognitiven Aktivität mit dem Verlust von Wissen und praktischen Fähigkeiten und der Schwierigkeit oder Unmöglichkeit, neue zu erwerben. Es tritt als Folge einer Hirnschädigung auf, meistens im Alter. Demenz wird von Alzheimer-Krankheit (sie macht bis zu 60% der Fälle aus), normotensivem Hydrozephalus, intrakraniellen Tumoren und Abszessen begleitet.

Demenz „mit dem Auge“ zu erkennen ist nicht einfach: Selbst nahe Menschen bemerken möglicherweise jahrelang nicht, dass mit einer Person etwas nicht stimmt. Und wenn sie feststellen, dass ihr Verwandter ihren Namen vergisst oder sich auf dem Weg zum Laden verirrt, gehen Gehirnveränderungen bereits zu weit.

Eine solche "Blindheit" wird hauptsächlich durch die Tatsache verursacht, dass Demenz in unserer Gesellschaft stigmatisiert ist und die Menschen wenig darüber wissen. Ein Merkmal der Störung spielt ebenfalls eine Rolle: Veränderungen treten allmählich auf.

Ärzte sind jedoch in der Lage, Demenz frühzeitig zu erkennen. Zu diesem Zweck werden mit dem Patienten psychologische Tests durchgeführt (einer der bekanntesten ist der Wexler-Test). Um die Diagnose zu bestätigen, führen sie Tests der Liquor cerebrospinalis durch und führen eine MRT durch.

„Der Wexler-Test (oder die Wechsler-Skala) ist einer der bekanntesten Tests zur Messung des intellektuellen Entwicklungsniveaus. Entworfen von David Wexler im Jahr 1939. Der Test basiert auf dem hierarchischen Intelligenzmodell von D. Wexler und diagnostiziert die allgemeine Intelligenz und ihre Komponenten - verbale und nonverbale Intelligenz. " Wikipedia

Das vorhandene System ist umständlich und nicht sehr praktisch, da der Patient sich mit einem Neurologen treffen und sich Zeit nehmen muss, um die Tests zu bestehen. Wenn alle älteren Menschen jährlich auf Demenzsymptome untersucht werden, erhöht sich die Belastung der Ärzte um ein Vielfaches.


Die WHO prognostiziert einen dreifachen Anstieg der Demenzfälle bis 2050

KI zu helfen


An der Universität von Osaka wurde eine Lösung für das Problem vorgeschlagen: In Zusammenarbeit mit dem Nara-Institut für Wissenschaft und Technologie entwickelten sie ein Programm, das Interviews mit Menschen durchführt und seine Sprache und Mimik analysiert. Das Programm basiert auf künstlicher Intelligenz; Er studierte auf der Grundlage von Interviews mit gesunden Menschen und solchen mit einer bestätigten Diagnose von Demenz. Das Programm kategorisiert Menschen mit einer Genauigkeit von 93% als „mit Demenzsymptomen“ oder „ohne Demenzsymptome“. Dies entspricht der effektivsten der „analogen“ Methoden.

Wie funktioniert es?

Ältere Menschen bestehen einen Computertest auf Demenz und kommunizieren mit dem Avatar des Programms - einem animierten Mädchen. Sie stellt Fragen, die in Untertiteln dupliziert sind, und „hört“ auf die Antworten. Danach analysiert das Programm die Sprache und den Gesichtsausdruck des Testteilnehmers anhand mehrerer Parameter und zeigt das Ergebnis an.

Wie Wissenschaftler aus Nara und Osaka in einer Veröffentlichung erklären, in der sie ihre Arbeit beschreiben, haben sie einen Avatar erstellt, der für ältere Menschen „eingesperrt“ war: Das gemalte Mädchen spricht nur langsam und macht nach dem Satz eine Pause. Wörter werden in großen Untertiteln dupliziert. Wenn der Testteilnehmer antwortete, erkennt das System die Aussage, woraufhin der Avatar mit dem Kopf nickt. Die Entwickler haben diese Technik aus dem beliebten Animationsprogramm in Japan - MikuMikuDance - ausgeliehen: Laut den Benutzern wird der Charakter dadurch lebendiger.


Der entwickelte Test umfasst mehrere Dialoge und Szenarien: a) Der Patient spricht über sich selbst; b) seine Fähigkeit, seine Augen zu konzentrieren, wird getestet; c) Lesen; f) Geschichtenerzählen - der Patient wird gebeten, sich an eine Geschichte zu erinnern; e) zufällige Fragen (zum Beispiel „Wie ist Ihr Appetit?“).

Der Test besteht aus sechs Blöcken, die auf verschiedenen Methoden basieren. Die erste ist eine Einführung (einfache Fragen „Wie heißt du?“ Und „Wie alt bist du?“). Es führt den Benutzer in das System ein und gibt ihm Zeit, sich an das Management zu gewöhnen. Die folgenden Blöcke basieren auf zwei maßgeblichen Methoden zur Bewertung der kognitiven Fähigkeiten: dem Wexler-Test und der kurzen Skala zur Beurteilung des mentalen Status (MMSE). Der Test enthält auch einen Block mit zufälligen Fragen und Antworten („Welches Jahr ist es?“, „Schläfst du gut?“, „Wer ist der japanische Premierminister?“). In den Antworten analysiert das Programm weniger Informationen als Sprachparameter.

In der Arbeit stützten sich Wissenschaftler auf Studien zur Sprache von Menschen mit Demenz: Sie haben Schwierigkeiten, Phrasen zu verstehen, nehmen lange Wörter und ihr aktiver Wortschatz wird reduziert. Um die Sprache in allen ausgewählten Parametern zu analysieren, benötigte das Programm viele Wochen maschinelles Lernen.

Werkzeuge und Methodik

Um Materialien zu sammeln, wurden 29 Teilnehmer ausgewählt: 14 - Patienten am Osaka University Hospital mit einer bestätigten Diagnose von Demenz; 15 - ältere Menschen ohne diese Diagnose. Jeder von ihnen hörte sich die Testfragen an und beantwortete sie.

Danach trennten die Entwickler die Audiodateien vom Video und transkribierten die Daten manuell mit der Audacity-Anwendung, wobei die Sprache in separate Anweisungen aufgeteilt wurde. Anschließend wurden die Materialien auf verschiedene Faktoren analysiert.

1) Sprachmerkmale: Sprachkraft, Artikulationsgeschwindigkeit und Heiserkeit. Die Parameter wurden basierend auf dem Spektrogramm geschätzt. Die Lücke zwischen den Fragen des Avatars und den Antworten des Befragten wurde ebenfalls analysiert.

2) Merkmale der Sprache. Mit dem Mecab-Programm haben wir die Anzahl der signifikanten Wörter und „Geräusche der Unsicherheit“ analysiert - „mmmm“, „ehhh“. Die Häufigkeit der Verwendung derselben Wörter und ihre Beziehung zu den „Geräuschen der Unsicherheit“ geben eine ungefähre Einschätzung des Wortschatzes.

3) Bild. Die Entwickler identifizierten aus den Videos, in denen weibliche Models dargestellt waren, 31 Beispiele für glückliche und 30 neutrale Gesichter. In jedem der Gesichter wurden 68 Merkmale analysiert (Höhe der Augenbrauen, Lippenwinkel, Augenbreite und andere). Anhand dieser Daten lernte die KI festzustellen, ob ein Lächeln im Gesicht ist.

Während des Interviews mit dem Befragten bestimmte das Programm für jeden Frame, ob der Befragte lächelt oder nicht. Die gesammelten Statistiken wurden als "Smile Index" bezeichnet. Menschen mit Alzheimer neigen dazu, häufiger zu lächeln, daher wird dieser Index überschätzt. Und mit anderen psychischen Störungen, die mit Demenz verbunden sind, nimmt die Emotionalität im Gegenteil ab.

Die Blickrichtung wurde ebenfalls überwacht: Studien zeigen, dass einige Patienten mit Demenz keinen Augenkontakt mehr mit dem Gesprächspartner haben.

Um die Ergebnisse zu verarbeiten, verwendeten wir den Support Vector Machines-Algorithmus (SVM oder die Support Vector-Methode) mit einem linearen Kernel und einer logischen Regression. Dies ist ein binärer Klassifikator, der die Aufgabe effektiv löst: Ordnen Sie den Befragten der Gruppe "mit Demenzsymptomen" oder "ohne Demenzsymptome" zu.

Perspektiven

Die Entwickler planen, das Programm für andere Sprachen und andere nationale Personengruppen anzupassen (sie studierte Japanisch). Es ist auch geplant, die Module zu verbessern. Nehmen Sie zunächst einen neuen Datensatz zur Analyse von Gesichtsausdrücken, der auf den Gesichtern nicht junger Models, sondern älterer Menschen basiert. Dies erhöht die Genauigkeit der Erkennung von Ausdrücken. Zweitens erweitern Sie die Kontrollgruppe, um mehr Daten von Menschen mit verschiedenen Arten von psychischen Störungen zu erhalten. Es ist geplant, dass das Programm nicht nur lernt, das Vorhandensein von Demenzsymptomen zu bestätigen, sondern auch seinen Typ durch äußere Anzeichen zu bestimmen: Dies ist wichtig, wenn ein Arzt eine Diagnose stellt.

PS Im November wird die Smile-Expo zwei Konferenzen zum Thema künstliche Intelligenz abhalten: in Kiew (14. November) und in Moskau (22. November).

In Moskau werden Konferenzredner über künstliche Intelligenz, Big Data, maschinelles Lernen, Chat-Bots und Informationssicherheit sprechen. vergleicht künstliche Intelligenz und Robotic Process Automation (simuliert Benutzeraktionen mit Programmen). Die Konferenz wird ein Diskussionspanel zum Thema „Künstliche Intelligenz und das Internet der Dinge: Erwartung und Realität“ veranstalten.

In Kiew wird das Hauptziel der Konferenz die Strukturierung des Wissens über die Automatisierung von Geschäftsprozessen mithilfe künstlicher Intelligenz sein. Der Schwerpunkt wird auf der Implementierung von KI in Geschäftsprozessen liegen: profitable Implementierungsbereiche, Berechnung der Effizienz, Projektmanagement.

Source: https://habr.com/ru/post/de424233/


All Articles