Warum brauchen wir die Verarbeitung natürlicher Sprache in der Medizin: moderne Herausforderungen und Herausforderungen

Laut The Huffington Post werden 80% der elektronischen Patientenakten in unstrukturierter Form gespeichert - der sogenannten „Textblase“. In Textform werden nicht nur EMV-Daten gespeichert, sondern auch eine Vielzahl anderer medizinischer Informationen - dies sind wissenschaftliche Artikel, klinische Empfehlungen, eine Beschreibung von Krankheiten und Beschwerden. Und selbst wenn die darin enthaltenen Daten teilweise strukturiert sind, gibt es keine allgemein akzeptierten Formate für ihre Speicherung.

Es ist problematisch, nützliches Wissen aus einer „Textblase“ zu extrahieren - die einfachsten Algorithmen können ein Dokument auf das Auftreten bestimmter Wörter oder Sätze überprüfen, aber dies reicht nicht aus: Der Arzt benötigt immer Details. Er muss nicht nur wissen, dass der Patient eine Temperatur hat, sondern auch die Dynamik verstehen: Zum Beispiel „steigt die Temperatur abends auf 39 und dauert den vierten Tag“.

Mithilfe von NLP-Technologien ( Natural Language Processing ) können Sie wertvolle Informationen aus medizinischen Texten und elektronischen Patientenakten extrahieren. Als nächstes werden wir zeigen, wie NLP-Technologien die Arbeit von Ärzten vereinfachen: Wir werden über Spracherkennung und Texte mit medizinischen Begriffen sprechen und bei klinischen Entscheidungen helfen.


"DOC + Ärzte werden höflich mit Ihren Wunden umgehen"

Was ist NLP?


Tatsächlich begann die Geschichte der NLP in den frühen Tagen der modernen Wissenschaft der künstlichen Intelligenz. Alan Turing nennt in seiner Arbeit „ Computer und Verstand “ als Kriterium für die „Vernünftigkeit“ einer Maschine ihre Fähigkeit, mit Menschen zu kommunizieren - dies ist eine wichtige, aber nicht die einzige Aufgabe, die Entwickler von NLP-Systemen lösen.

NLP kombiniert eine Reihe von Technologien (einschließlich mathematisch sehr weit voneinander entfernter Technologien), mit denen algorithmische Probleme im Zusammenhang mit der Verarbeitung natürlicher menschlicher Sprache gelöst werden können:

  • Extrahieren Sie Fakten aus dem Text (von einer einfachen Suche nach Stoppwörtern bis zu einer vollständigen Analyse der Literatur).
  • Spracherkennung und Konvertierung von Sprache in Text;
  • Klassifizierung von Texten;
  • Text- oder Sprachgenerierung;
  • Maschinelle Übersetzung
  • Analyse der Tonalität des Textes (einschließlich Opinion Mining);
  • Usw.

In der Science-Fiction kann ein Supercomputer häufig alle oben genannten Aufgaben ausführen. In dem Kultfilm The Space Odyssey von 2001 erkannte der HAL 9000 menschliche Sprache und visuelle Bilder, die in einer gemeinsamen Sprache kommuniziert wurden. In der Praxis sind alle diese Aufgaben hochspezialisiert und werden von einzelnen Algorithmen gelöst.

Und diese Algorithmen (und die zugrunde liegenden Technologien) werden ständig weiterentwickelt. Beispielsweise basierte die NLP-Richtung, die der normalen Benutzer am nächsten kam - die Spracherkennung - vor einigen Jahren auf versteckten Markov-Modellen . Sie zerlegten das, was eine Person sagte, in kleine Komponenten, wählten Phoneme aus, führten statistische Analysen durch und lieferten das wahrscheinlichste Ergebnis dessen, was im Textformat gesagt wurde. Entwickler verwenden heute viel häufiger neuronale Netze - insbesondere wiederkehrende neuronale Netze und deren Varianten, beispielsweise das Langzeitkurzgedächtnis (LSTM).

Heutzutage werden NLP-Systeme immer häufiger verwendet - wir sprechen mit Siri, mit einem Google-Assistenten (LSTM mit CTC wird in Android-Betriebssystemen verwendet) und mit Infotainment-Systemen für Autos, intelligente Algorithmen schützen unsere E-Mails vor Spam, Nachrichtenaggregatoren wählen Artikel aus, die dies tun Wir sind interessiert und Suchmaschinen ermöglichen es uns, die Informationen zu finden, die wir auf Anfrage benötigen.

Welche Aufgaben löst NLP in der Medizin?


NLP-Systeme sind jedoch nicht nur für den Betrieb moderner Geräte und Online-Anwendungen nützlich. Sie wurden seit Anfang der 90er Jahre in einzelnen Krankenhäusern und medizinischen Universitäten eingeführt .

Die erste NLP-Anwendung, die zu dieser Zeit an der Universität von Utah entwickelt wurde, war das Special Purpose Radiology Understanding System (SPRUS) für die Salt Lake City Clinic. Dieses Tool verwendete Informationen aus einem Expertensystem , das Symptome mit geeigneten Diagnosen vergleicht, und analysierte radiologische Textberichte (medizinische Protokolle, die Röntgenstrahlen interpretieren).

Das Programm verwendete die semantische Parsing-Technik, die auf der Suche nach Wörtern im Thesaurus basiert . Der Thesaurus wurde automatisch aus der Wissensdatenbank zur Lösung diagnostischer Probleme mit einem speziell entwickelten Compiler ergänzt.

Seitdem haben sich die Möglichkeiten von NLP und maschinellem Lernen in der Medizin erweitert: Heute vereinfacht die Technologie die Arbeit mit elektronischen Patientenakten für Ärzte und reduziert die Häufigkeit klinischer Fehler, wodurch medizinische Entscheidungen „unterstützt“ werden.

Vereinfachung der Arbeit mit elektronischen Karten (EMV)


Elektronische Patientenakten oder EMCs sind Analoga von Papierkarten, die uns bekannt sind. Die Aufgabe der elektronischen Karte besteht darin, den Arbeitsablauf zu vereinfachen und den Papieraufwand zu reduzieren. Wir haben ausführlicher darüber gesprochen, was EMV ist und wie sie dazu beitragen, die Qualität der medizinischen Versorgung in einem unserer früheren Materialien zu kontrollieren.

Trotz der Tatsache, dass es mit der Einführung von EMC für Ärzte einfacher geworden ist, mit Dokumenten zu arbeiten, dauert das Ausfüllen der Karten einige Zeit. Laut einer 2012 in Computers Informatics Nursing veröffentlichten Studie verbringen Krankenschwestern in US-Krankenhäusern immer noch etwa 19% ihrer Arbeitszeit damit, elektronische Karten auszufüllen.

Ja, dies ist nur ein Fünftel des Arbeitstages, aber selbst diese Zahl kann reduziert werden, und die freigegebenen Ressourcen können zur Patientenversorgung verwendet werden. Laut Joe Petro, Präsident von Nuance Communications, wird die NLP-Technologie dies ermöglichen.

Im Jahr 2009 erfuhr Nuance die Meinung Tausender US-amerikanischer Therapeuten zu Technologien zur Verarbeitung natürlicher Sprache. Laut den Ergebnissen der Studie gaben 94% der befragten Ärzte an, dass die Implementierung von EMC mit NLP ein wichtiger Treiber für die Qualität der medizinischen Versorgung sei.

Ein Beispiel für diesen Ansatz ist ein Dienst, der das medizinische Personal des Hudson Valley Heart Center in Paukipzi nutzt. Mithilfe einer Lösung von Nuance Communications diktieren Krankenschwestern im Krankenhaus Auszüge aus der Krankengeschichte des Patienten, erstellen die Ergebnisse einer körperlichen Untersuchung und zeichnen Daten zum Krankheitsverlauf auf. Die Anwendung aktualisiert automatisch die Aufzeichnungen im im Krankenhaus implementierten EMV-System.

Ähnliche Lösungen werden in Russland implementiert. Beispielsweise begann das Zentrum für Sprachtechnologien im Jahr 2016 mit der Entwicklung des Voice2Med-Systems zur Erkennung von medizinischer Sprache und zur Verkürzung der Zeit , die zum Ausfüllen von Berichten und medizinischen Aufzeichnungen erforderlich ist. Wie im Ministerium für Arbeit und Sozialschutz der Russischen Föderation angegeben, dauert es jetzt die Hälfte der Arbeitszeit des Arztes.

Unsere NLP-Lösungen


Das Hauptziel von NLP in der Medizin ist es, Daten aus Text zu extrahieren. Wir bei DOC + konzentrieren uns darauf. Unser Entwicklungsteam für maschinelles Lernen besteht aus sechs Personen. Davon arbeiten zwei ausschließlich mit NLP-Technologie. In DOC + wird die NLP-Technologie verwendet, um Karten zu markieren, auf denen das EMV-Qualitätskontrollsystem trainiert ist (darüber haben wir im vorherigen Artikel geschrieben ).

Basierend auf demselben System funktioniert auch unser Anamnese-Bot und optimiert die Arbeit von Online-Konsultationen. Der Bot arbeitet online und fordert den Patienten auf, Beschwerden in freier Form zu beschreiben. Anschließend werden die Symptome aus dem Text isoliert und dem Arzt gemeldet. Dank dessen beginnt der Spezialist eine telemedizinische Konsultation mit einem bereits vorbereiteten Patienten (mehr über die Arbeit unseres Anamnese-Bots erfahren Sie in den folgenden Beiträgen).

Merkmale der Entwicklung von NLP-Systemen

Es gibt verschiedene Schwierigkeiten bei der Entwicklung solcher Systeme. Die erste davon ist, dass es bei der Arbeit mit Texten nicht ausreicht, einfache, weit verbreitete Algorithmen und Ansätze zu verwenden. Dienste, die den Text auf das Vorhandensein bestimmter Wörter scannen und die Häufigkeit ihres Auftretens berücksichtigen, um die „Bedeutung“ in der Medizin zu bewerten, liefern ein sehr begrenztes Ergebnis.

Bei der Diagnose ist es wichtig, dass der Arzt nicht nur weiß, dass die Person ein bestimmtes Symptom hatte, sondern auch die Dynamik und Parameter dieses Symptoms versteht - Lokalisation, Art des Schmerzes, genaue Werte digitalisierter Indikatoren usw. Daher sind komplexere Algorithmen erforderlich, um mit medizinischen Texten zu arbeiten. Hervorheben nicht nur von Wörtern, sondern auch von komplexen Fakten über verschiedene Beschwerden und Symptome.
Aus dem Text: „Am 18. Februar schmerzte mein Kopf auf der linken Seite, am Abend stieg die Temperatur auf 39. Am nächsten Tag nahm der Kopfschmerzbereich zu, es gab keinen Schwindel“, sollte das System strukturierte Informationen über drei Symptome hervorheben:

  1. Kopfschmerzen - erschienen am 18.02.; Lokalisierung: links; Dynamik: 02.19 - eine Vergrößerung der Fläche.
  2. Temperatur - 18,02; Wert: 39 Grad.
  3. Schwindel - kein Symptom.
Das zweite Merkmal ist, dass Textverarbeitungswerkzeuge weiter angepasst werden müssen, um mit hochspezialisierten Materialien arbeiten zu können. Zum Beispiel mussten wir die Rechtschreibprüfung zusätzlich „optimieren“, da keine der Lösungen auf dem Markt unseren Anforderungen entsprach.
Rechtschreibprüfer korrigierten das Wort „Husten“ zu „Tropfen“, da sie Texte ohne medizinische Terminologie studierten. Deshalb haben wir das System am Körper von medizinischen Artikeln umgeschult. Und solche kleinen Verbesserungen an klassischen Algorithmen müssen ständig vorgenommen werden.
Was unser NLP-System kann

Jetzt erkennt die von uns entwickelte Lösung 400 Begriffe - Symptome, Diagnosen, Namen von Arzneimitteln usw. Darüber hinaus kann das System für die meisten Symptome zusätzliche Eigenschaften isolieren: Lokalisation (Bauchschmerzen rechts vom Nabel ), Typ ( feuchter Husten), Farbe ( klarer Auswurf) ), das Vorhandensein von Komplikationen und die Werte messbarer Parameter (Temperatur, Druck).

Darüber hinaus weiß sie, wie man Zeitparameter isoliert und mit Symptomen vergleicht, Tippfehler korrigiert und mit verschiedenen Optionen arbeitet, um dieselben Fakten zu beschreiben.

Klinische Entscheidungshilfe (CDS)


CDS-Unterstützungssysteme (Clinical Decision Support) bieten Ärzten automatisierte Hilfe bei der Diagnose, der Verschreibung von Behandlungen, der Bestimmung der Dosierung von Arzneimitteln usw. Mit den NLP-Systemen können Sie die dafür erforderlichen medizinischen Informationen abrufen - sie beziehen sie aus wissenschaftlichen Arbeiten, Testergebnissen, medizinischen Leitfäden und sogar aus den Worten des Patienten.

Eine dieser Lösungen wurde bei IBM entwickelt. Wir sprechen über das Frage-Antwort-System DeepQA, mit dem der IBM Watson-Supercomputer arbeitet . In diesem Fall fungiert Watson als „NLP-Suchmaschine“ für große Datenbanken: Er verarbeitet die Fragen von Ärzten, gibt ihnen eine spezifische Antwort und zeigt nicht nur Suchergebnisse im Internet an. Die Technologie bei Watson ermöglichte es ihm, bei Jeopardy zu gewinnen ! (Amerikanischer Vorläufer von "His Game").

Ein weiteres Beispiel für die Anwendung solcher Technologien ist das NLP-System, das von einem Wissenschaftlerteam unter der Leitung von Dr. Harvey J. Murff vom medizinischen Zentrum der Vanderbilt University entwickelt wurde. Die Entwickler lehrten den Algorithmus, elektronische Patientenakten zu analysieren und Krankheiten zu identifizieren, die nach der Operation zu Komplikationen führen können.

Der NLP-Prozessor indizierte Aufzeichnungen in medizinischen Aufzeichnungen unter Verwendung eines Schemas, das auf der systematisierten maschinenverarbeiteten medizinischen Nomenklatur von SNOMED-CT basiert. Bei der Ausgabe generierte das System eine XML-Datei mit einer „markierten“ Patientenkarte. Die Experimente zeigten, dass das Programm die meisten Komplikationen korrekt kategorisierte, beispielsweise wurde Nierenversagen in 82% der Fälle korrekt beobachtet und postoperativer Myokardinfarkt in 91% der Fälle.

DOC + hat auch ein eigenes Analogon zu CDS - jede Handlung eines Arztes in der Anwendung wird von Hinweisen begleitet, aber bisher werden sie durch klassische regelbasierte Algorithmen ohne den Einsatz von maschinellem Lernen und NLP gebildet. Wir arbeiten jedoch an einer neuen Generation von CDS, die die gesamte Krankengeschichte des Patienten in natürlicher Sprache liest und als Hinweis für den Arzt verwendet.

Weiterentwicklung von NLP-Systemen


Mit NLP-Systemen können Sie nicht nur mit medizinischen Unterlagen, sondern auch mit wissenschaftlichen Artikeln und medizinischen Standards arbeiten. Auf dem Gebiet der Medizin wurden umfangreiche Erfahrungen gesammelt, die in klinischen Empfehlungen, wissenschaftlichen Arbeiten und anderen Textquellen zusammengefasst sind. Es ist logisch, diese Daten zu verwenden, um künstliche Intelligenzsysteme auf dem Niveau der Karten realer Patienten zu trainieren und gleichzeitig eine strukturierte Datenbank mit Medikamenten zu erstellen, die nicht von Menschen, sondern von Algorithmen verwendet werden kann.

Der Vorteil solcher NLP-Systeme besteht darin, dass die Ergebnisse ihrer Arbeit oft leichter zu interpretieren sind, dh an bestimmte Quellen gebunden sind. Im Allgemeinen ist die Frage nach der Interpretierbarkeit der Ergebnisse von Algorithmen für maschinelles Lernen alles andere als trivial und sowohl für die gesamte wissenschaftliche Gemeinschaft (auf der führenden internationalen Konferenz über maschinelles Lernen ICML wird regelmäßig ein separater Workshop durchgeführt) als auch für Entwickler wichtig, insbesondere bei Projekten auf dem Gebiet der evidenzbasierte Medizin. Für uns macht das Erfordernis der Interpretierbarkeit die Aufgabe, unser NLP-System zu verbessern, noch schwieriger (und interessanter).

NLP ist ein vielversprechender Bereich, der die Qualität der medizinischen Versorgung auf ein neues Niveau heben wird. Wir planen, diese Technologien aktiv weiterzuentwickeln und in unserem Blog weiter über unsere Entwicklungen zu sprechen.



Zusätzliche Lektüre: nützliche Artikel aus unserem Blog " Just ask ":



Source: https://habr.com/ru/post/de411123/


All Articles