¿Por qué necesitamos el procesamiento del lenguaje natural en medicina? Desafíos y desafíos modernos

Según The Huffington Post, el 80% de los registros médicos electrónicos se almacenan de forma no estructurada, la llamada "burbuja de texto". En forma de texto, no solo se almacenan los datos de EMC, sino también una gran cantidad de otra información médica: estos son artículos científicos, recomendaciones clínicas, una descripción de enfermedades y quejas. E incluso si los datos en ellos están parcialmente estructurados, no hay formatos generalmente aceptados para su almacenamiento.

Resulta problemático extraer conocimiento útil de una "burbuja de texto": los algoritmos más simples son capaces de verificar en un documento la presencia de ciertas palabras o frases, pero esto no es suficiente: el médico siempre necesita detalles. Necesita no solo saber que el paciente tiene temperatura, sino también comprender la dinámica: por ejemplo, "la temperatura aumenta por las tardes a 39 y dura el cuarto día".

Las tecnologías de procesamiento del lenguaje natural (PNL) pueden ayudarlo a extraer información valiosa de textos médicos y registros médicos electrónicos. A continuación, mostraremos cómo las tecnologías de PNL simplifican el trabajo de los médicos: hablaremos sobre el reconocimiento del habla y los textos llenos de términos médicos, y ayudaremos a tomar decisiones clínicas.


"Los doctores DOC + tratarán cortésmente su dolor"

¿Qué es la PNL?


De hecho, la historia de la PNL comenzó en los primeros días de la ciencia moderna de la inteligencia artificial. Alan Turing, en su trabajo " Computadoras y mente " como criterio para la "razonabilidad" de una máquina, llama a su capacidad de comunicarse con las personas; ahora es una tarea importante, pero no la única, que los desarrolladores de sistemas de PNL resuelven.

La PNL combina una serie de tecnologías (incluidas aquellas muy alejadas entre sí en términos de matemáticas) que permiten resolver problemas algorítmicos relacionados con el procesamiento del lenguaje humano natural:

  • Extraer hechos del texto (desde una simple búsqueda de palabras vacías hasta un análisis completo de la literatura);
  • Reconocimiento de voz y conversión de voz a texto;
  • Clasificación de textos;
  • Generación de texto o discurso;
  • Traducción automática
  • Análisis de tonalidad del texto (incluida la minería de opinión);
  • Y otros

En ciencia ficción, una supercomputadora a menudo puede hacer todo lo anterior. En la película de culto The Space Odyssey de 2001 , el HAL 9000 reconoció el habla humana y las imágenes visuales, comunicadas en un lenguaje común. En la práctica, todas estas tareas son altamente especializadas, y los algoritmos individuales las resuelven.

Y estos algoritmos (y las tecnologías subyacentes) están progresando constantemente. Por ejemplo, la dirección de PNL más "más cercana" a los usuarios comunes, el reconocimiento de voz, hace unos años se basó en modelos ocultos de Markov . Dividieron lo que una persona dijo en componentes pequeños, destacaron fonemas, realizaron análisis estadísticos y produjeron el resultado más probable de lo que se dijo en formato de texto. Ahora, es mucho más probable que los desarrolladores usen redes neuronales, en particular redes neuronales recurrentes y sus variantes, por ejemplo, memoria a largo plazo (LSTM).

Hoy en día, los sistemas de PNL se usan cada vez más a menudo: hablamos con Siri, hablamos con un asistente de Google (LSTM con CTC se usa en el sistema operativo Android) y sistemas de información y entretenimiento para automóviles, los algoritmos inteligentes protegen nuestro correo del correo no deseado, los agregadores de noticias seleccionan artículos que estamos interesados ​​y los motores de búsqueda nos permiten encontrar la información que necesitamos en cualquier solicitud.

¿Qué tareas resuelve la PNL en medicina?


Sin embargo, los sistemas de PNL son útiles no solo en la operación de dispositivos modernos y aplicaciones en línea. Han sido introducidos en hospitales individuales y universidades médicas desde principios de los 90.

La primera aplicación de PNL desarrollada en la Universidad de Utah en ese momento fue el Sistema de Comprensión de Radiología de Propósito Especial (SPRUS) para la Clínica de Salt Lake City. Esta herramienta usó información de un sistema experto que compara los síntomas con diagnósticos apropiados y reportes radiológicos textuales (protocolos médicos que interpretan los rayos X).

El programa utilizó la técnica de análisis semántico basada en la búsqueda de palabras en el diccionario de sinónimos. El tesauro se reponía automáticamente de la base de conocimiento para resolver problemas de diagnóstico utilizando un compilador especialmente desarrollado.

Desde entonces, las posibilidades de PNL y aprendizaje automático en medicina han avanzado: hoy, la tecnología simplifica el trabajo con registros médicos electrónicos para los médicos y reduce la frecuencia de errores clínicos, "ayudando" a tomar decisiones médicas.

Simplificación del trabajo con tarjetas electrónicas (EMC)


Los registros médicos electrónicos, o EMC, son análogos de tarjetas de papel que nos son familiares. La tarea de la tarjeta electrónica es simplificar el flujo de trabajo y reducir la cantidad de papeleo. Hablamos con más detalle sobre qué es EMC y cómo ayudan a controlar la calidad de la atención médica en uno de nuestros materiales anteriores.

A pesar del hecho de que con la introducción de EMC, se ha vuelto más fácil para los médicos trabajar con documentos, lleva un tiempo completar las tarjetas. Según un estudio publicado en Computers Informatics Nursing en 2012, las enfermeras de los hospitales de EE. UU. Todavía pasan alrededor del 19% de su tiempo de trabajo completando tarjetas electrónicas.

Sí, esto es solo una quinta parte de la jornada laboral, pero incluso esta cifra puede reducirse y los recursos liberados pueden usarse para cuidar a los enfermos. Según el presidente de Nuance Communications, Joe Petro, la tecnología de PNL lo permitirá.

En 2009, Nuance aprendió las opiniones de miles de terapeutas estadounidenses sobre las tecnologías de procesamiento del lenguaje natural. Según los resultados del estudio, el 94% de los médicos encuestados dijeron que la implementación de EMC con PNL fue un importante impulsor de la calidad de la atención médica.

Un ejemplo de este enfoque es un servicio que utiliza el personal médico del Hudson Valley Heart Center en Paukipzi. Con la ayuda de una solución de Nuance Communications, las enfermeras del hospital dictan extractos del historial médico del paciente, elaboran los resultados de un examen físico y registran datos sobre el curso de la enfermedad. La aplicación actualiza automáticamente los registros en el sistema EMC implementado en el hospital.

Se están implementando soluciones similares en Rusia. Por ejemplo, en 2016, el Center for Speech Technologies comenzó a desarrollar el sistema Voice2Med para reconocer el habla médica y reducir el tiempo que lleva completar informes y registros médicos. Como se indicó en el Ministerio de Trabajo y Protección Social de la Federación de Rusia, ahora se necesita la mitad del tiempo de trabajo del médico.

Nuestras soluciones de PNL


El objetivo clave de la PNL en medicina es extraer datos del texto. En DOC + nos centramos en ello. Hay seis personas en nuestro equipo de desarrollo de aprendizaje automático. De estos, dos trabajan exclusivamente en tecnología PNL. En DOC +, la tecnología NLP se usa para marcar tarjetas en las que se capacita el sistema de control de calidad EMC (escribimos sobre esto en el artículo anterior ).

Basado en el mismo sistema, nuestro bot de anamnesis también funciona, optimizando el trabajo de las consultas en línea. El bot funciona en línea y le pide al paciente que describa las quejas de forma gratuita, luego aísla los síntomas del texto y los informa al médico. Gracias a esto, el especialista comienza una consulta de telemedicina con un paciente ya preparado (en las siguientes publicaciones le informaremos más sobre el trabajo de nuestro bot de anamnesis).

Características del desarrollo de sistemas PNL.

Existen varias dificultades para desarrollar tales sistemas. El primero de ellos es que cuando se trabaja con textos no es suficiente usar algoritmos y enfoques simples y generalizados. Los servicios que escanean el texto en busca de ciertas palabras y consideran la frecuencia de su aparición para evaluar la "importancia" en medicina dan un resultado muy limitado.

Al hacer un diagnóstico, es importante que el médico no solo sepa que una persona tenía un síntoma en particular, sino que también comprenda la dinámica y los parámetros de este síntoma: localización, tipo de dolor, valores exactos de indicadores digitalizados, etc. Por lo tanto, se necesitan algoritmos más complejos para trabajar con textos médicos, destacando no solo palabras, sino hechos complejos sobre diversas quejas y síntomas.
Del texto: "El 18 de febrero, me dolía la cabeza en el lado izquierdo, por la noche la temperatura subió a 39. Al día siguiente, el área de dolor de cabeza aumentó, no hubo mareos", el sistema debe resaltar información estructurada sobre tres síntomas:

  1. Dolor de cabeza - apareció el 18/02/18; localización: a la izquierda; Dinámica: 02.19 - un aumento en el área.
  2. Temperatura - 18.02; Valor: 39 grados.
  3. Mareos: sin síntomas.
La segunda característica es que las herramientas de procesamiento de texto deben personalizarse aún más para trabajar con materiales altamente especializados. Por ejemplo, tuvimos que "ajustar" el corrector ortográfico adicionalmente, ya que ninguna de las soluciones en el mercado cumplió con nuestros requisitos.
Los correctores ortográficos corrigieron la palabra "tos" a "gotas", ya que estudiaron textos sin terminología médica. Por lo tanto, volvimos a entrenar el sistema en el cuerpo a partir de artículos médicos. Y tales pequeñas mejoras a los algoritmos clásicos tienen que hacerse constantemente.
Lo que nuestro sistema de PNL puede hacer

Ahora la solución que desarrollamos reconoce 400 términos: síntomas, diagnósticos, nombres de medicamentos, etc. Además, para la mayoría de los síntomas, el sistema puede aislar propiedades adicionales: localización (dolor abdominal a la derecha del ombligo ), tipo (tos húmeda ), color (esputo claro) ), la presencia de complicaciones y los valores de parámetros medibles (temperatura, presión).

Además, ella sabe cómo aislar parámetros de tiempo y compararlos con síntomas, corregir errores tipográficos y trabajar con diferentes opciones para describir los mismos hechos.

Asistencia para la toma de decisiones clínicas (CDS)


Los sistemas de soporte de decisión clínica (CDS) brindan ayuda automatizada a los médicos cuando hacen un diagnóstico, prescriben tratamiento, determinan la dosis de medicamentos, etc. Los sistemas de PNL le permiten obtener la información médica necesaria para esto: la extraen de documentos científicos, resultados de exámenes, guías médicas e incluso las palabras del paciente.

Una de estas soluciones fue desarrollada en IBM. Estamos hablando del sistema de preguntas y respuestas DeepQA, con el que funciona la supercomputadora IBM Watson. En este caso, Watson actúa como un "motor de búsqueda de PNL" para grandes bases de datos: procesa las preguntas de los médicos y les da una respuesta específica, y no solo muestra los resultados de búsqueda en Internet. ¡La tecnología en Watson le permitió ganar en Jeopardy! (Progenitor estadounidense de "Su juego").

Otro ejemplo de la aplicación de tales tecnologías es el sistema PNL, creado por un equipo de científicos dirigido por el Dr. Harvey J. Murff del centro médico de la Universidad de Vanderbilt. Los desarrolladores enseñaron el algoritmo para analizar registros electrónicos de pacientes e identificar enfermedades que podrían causar complicaciones después de la cirugía.

El procesador de PNL indexó registros en registros médicos utilizando un esquema basado en la nomenclatura médica sistematizada SNOMED-CT . En la salida, el sistema generó un archivo XML con una tarjeta de paciente "marcada". Los experimentos mostraron que el programa clasificó correctamente la mayoría de las complicaciones, por ejemplo, la insuficiencia renal se observó correctamente en el 82% de los casos y el infarto de miocardio postoperatorio en el 91% de los casos.

DOC + también tiene su propio análogo a CDS: cualquier acción del médico en la aplicación va acompañada de sugerencias, pero hasta ahora están formadas por algoritmos clásicos basados ​​en reglas, sin el uso de aprendizaje automático y PNL. Pero estamos trabajando en una nueva generación de CDS que leerá todo el historial médico del paciente en lenguaje natural y lo usará como una pista para el médico.

Desarrollo adicional de sistemas de PNL


Los sistemas de PNL le permitirán trabajar no solo con registros médicos, sino también con artículos científicos y estándares médicos. En el campo de la medicina, se ha acumulado una vasta experiencia, que se resume en recomendaciones clínicas, artículos científicos y otras fuentes textuales. Es lógico utilizar estos datos para entrenar sistemas de inteligencia artificial a la par con los mapas de pacientes reales, al tiempo que se crea una base de datos estructurada de medicina que no puede ser utilizada por personas, sino por algoritmos.

La ventaja de tales sistemas de PNL es que los resultados de su trabajo son a menudo más fáciles de interpretar, es decir, vinculados a fuentes específicas. En general, la cuestión de la interpretabilidad de los resultados de los algoritmos de aprendizaje automático está lejos de ser trivial, y es importante tanto para la comunidad científica en su conjunto (en la conferencia internacional líder sobre ICML de aprendizaje automático, se dedica regularmente un taller separado) como para los desarrolladores, especialmente cuando se trata de proyectos en el campo de medicina basada en evidencia. Para nosotros, el requisito de interpretabilidad hace que la tarea de mejorar nuestro sistema de PNL sea aún más difícil (y más interesante).

La PNL es un área prometedora que llevará la calidad de la atención médica a un nuevo nivel. Planeamos desarrollar activamente estas tecnologías y seguir hablando sobre nuestros desarrollos en nuestro blog.



Lectura adicional: artículos útiles de nuestro blog " Just ask ":



Source: https://habr.com/ru/post/es411123/


All Articles