لماذا نحتاج إلى معالجة اللغة الطبيعية في الطب: التحديات والتحديات الحديثة

وفقًا لـ Huffington Post ، يتم تخزين 80 ٪ من السجلات الطبية الإلكترونية في شكل غير منظم - ما يسمى ب "فقاعة النص". في شكل نصي ، لا يتم تخزين بيانات EMC فحسب ، بل أيضًا كمية كبيرة من المعلومات الطبية الأخرى - هذه هي المقالات العلمية والتوصيات السريرية ووصف الأمراض والشكاوى. وحتى إذا كانت البيانات الموجودة بها منظمة جزئيًا ، فلا توجد تنسيقات مقبولة بشكل عام لتخزينها.

من الصعب استخلاص المعرفة المفيدة من "فقاعة نصية" - أبسط الخوارزميات قادرة على التحقق من المستند بحثًا عن وجود كلمات أو عبارات معينة ، لكن هذا لا يكفي: يحتاج الطبيب دائمًا إلى التفاصيل. لا يحتاج فقط إلى معرفة أن المريض لديه درجة حرارة ، ولكن أيضًا لفهم الديناميكيات: على سبيل المثال ، "ترتفع درجة الحرارة في المساء إلى 39 وتستمر لليوم الرابع".

يمكن أن تساعدك تقنيات معالجة اللغات الطبيعية (NLP) في استخراج معلومات قيمة من النصوص الطبية والسجلات الطبية الإلكترونية. بعد ذلك ، سنوضح كيف تبسط تقنيات البرمجة اللغوية العصبية عمل الأطباء: سنتحدث عن التعرف على الكلام والنصوص المليئة بالمصطلحات الطبية ، والمساعدة في اتخاذ القرارات السريرية.


" سوف يتعامل أطباء DOC + بأدب مع قرحة الخاص بك"

ما هو NLP؟


في الواقع ، بدأ تاريخ البرمجة اللغوية العصبية في الأيام الأولى لعلم الذكاء الاصطناعي الحديث. آلان تورينج في عمله " أجهزة الكمبيوتر والعقل " كمعيار لـ "معقولية" الماكينة يدعو قدرتها على التواصل مع الناس - هذه مهمة الآن ، ولكنها ليست المهمة الوحيدة التي يحلها مطورو أنظمة البرمجة اللغوية العصبية.

تجمع البرمجة اللغوية العصبية (NLP) بين عدد من التقنيات (بما في ذلك التقنيات البعيدة جدًا عن بعضها البعض من حيث الرياضيات) التي تسمح بحل مشاكل الخوارزميات المتعلقة بمعالجة اللغة البشرية الطبيعية:

  • استخلاص الحقائق من النص (من بحث بسيط عن كلمات التوقف إلى تحليل كامل للأدبيات) ؛
  • التعرف على الصوت وتحويل الصوت إلى نص ؛
  • تصنيف النصوص ؛
  • توليد النص أو الكلام ؛
  • الترجمة الآلية
  • تحليل نغمة النص (بما في ذلك تعدين الرأي) ؛
  • وآخرون

في الخيال العلمي ، غالبًا ما يكون الكمبيوتر العملاق قادرًا على القيام بكل ما سبق. في فيلم العبادة The Space Odyssey لعام 2001 ، تعرف HAL ​​9000 على الكلام البشري والصور المرئية ، التي تم توصيلها بلغة مشتركة. عمليًا ، كل هذه المهام متخصصة للغاية ، وتقوم الخوارزميات الفردية بحلها.

وهذه الخوارزميات (والتقنيات الأساسية) تتقدم باستمرار. على سبيل المثال ، كان "أقرب" للمستخدمين العاديين اتجاه البرمجة اللغوية العصبية - التعرف على الصوت - قبل بضع سنوات على أساس نماذج ماركوف المخفية . قاموا بتكسير ما قاله الشخص إلى مكونات صغيرة ، وخص بالذكر الصوتيات ، وأجروا تحليلًا إحصائيًا وأنتجوا النتيجة الأكثر ترجيحًا لما قيل في شكل نص. الآن ، من المرجح أن يستخدم المطورون الشبكات العصبية - على وجه الخصوص ، الشبكات العصبية المتكررة ومتغيراتها ، على سبيل المثال ، الذاكرة طويلة المدى (LSTM).

اليوم ، يتم استخدام أنظمة البرمجة اللغوية العصبية بشكل أكثر تكرارًا - نتحدث مع Siri ، ونتحدث مع مساعد Google ( يتم استخدام LSTM مع CTC في نظام التشغيل Android) وأنظمة المعلومات والترفيه في السيارة ، والخوارزميات الذكية تحمي بريدنا من الرسائل غير المرغوب فيها ، ويقوم مجمعو الأخبار بتحديد المقالات التي نحن مهتمون ، ومحركات البحث تسمح لنا بالعثور على المعلومات التي نحتاجها في أي طلب.

ما هي المهام التي يحلها البرمجة اللغوية العصبية في الطب؟


ومع ذلك ، تعد أنظمة البرمجة اللغوية العصبية مفيدة ليس فقط في تشغيل الأدوات الحديثة والتطبيقات عبر الإنترنت. تم إدخالهم في المستشفيات الفردية والجامعات الطبية منذ بداية التسعينات.

كان أول تطبيق NLP تم تطويره في جامعة يوتا في ذلك الوقت هو نظام فهم الأشعة للأغراض الخاصة (SPRUS) لعيادة سولت ليك سيتي. استخدمت هذه الأداة معلومات من نظام خبير يقارن الأعراض بالتشخيصات المناسبة وتقارير الأشعة الشعاعية النصية (البروتوكولات الطبية التي تفسر الأشعة السينية).

استخدم البرنامج تقنية التحليل الدلالي بناء على البحث عن الكلمات في قاموس المرادفات. تم تجديد المكنز تلقائيًا من قاعدة المعرفة لحل المشكلات التشخيصية باستخدام مترجم تم تطويره خصيصًا.

منذ ذلك الحين ، تقدمت إمكانيات البرمجة اللغوية العصبية والتعلم الآلي في الطب: اليوم ، تبسط التكنولوجيا العمل مع السجلات الطبية الإلكترونية للأطباء وتقلل من تكرار الأخطاء السريرية ، و "المساعدة" في اتخاذ القرارات الطبية.

تبسيط العمل باستخدام البطاقات الإلكترونية (EMC)


السجلات الطبية الإلكترونية ، أو EMCs ، هي نظائرها على البطاقات الورقية المألوفة لنا. تتمثل مهمة البطاقة الإلكترونية في تبسيط سير العمل وتقليل كمية العمل الورقي. تحدثنا بمزيد من التفاصيل حول ماهية EMC وكيف تساعد في التحكم في جودة الرعاية الطبية في واحدة من موادنا السابقة.

على الرغم من حقيقة أنه مع إدخال EMC ، أصبح من الأسهل على الأطباء العمل مع المستندات ، يستغرق الأمر بعض الوقت لملء البطاقات. وفقًا لدراسة نشرت في تمريض المعلوماتية الحاسوبية في عام 2012 ، لا يزال الممرضون في المستشفيات الأمريكية يقضون حوالي 19 ٪ من وقت عملهم في ملء البطاقات الإلكترونية.

نعم ، هذا فقط خمس يوم العمل ، ولكن حتى هذا الرقم يمكن تقليله ويمكن استخدام الموارد المفرج عنها لرعاية المرضى. وفقًا لرئيس شركة Nuance Communications Joe Petro ، فإن تقنية البرمجة اللغوية العصبية ستمكن هذا.

في عام 2009 ، علمت Nuance آراء الآلاف من المعالجين الأمريكيين حول تقنيات معالجة اللغات الطبيعية. وفقًا لنتائج الدراسة ، قال 94٪ من الأطباء الذين شملهم الاستطلاع أن تنفيذ EMC مع البرمجة اللغوية العصبية كان محركًا مهمًا لجودة الرعاية الطبية.

مثال على هذا النهج هو خدمة تستخدم الطاقم الطبي لمركز هدسون فالي للقلب في بوكيبزي. بمساعدة حل من Nuance Communications ، تملي ممرضات المستشفى مقتطفات من التاريخ الطبي للمريض ، وتضع نتائج الفحص البدني وتسجيل البيانات عن مسار المرض. يقوم التطبيق تلقائيًا بتحديث السجلات في نظام EMC المطبق في المستشفى.

يتم تنفيذ حلول مماثلة في روسيا. على سبيل المثال ، في عام 2016 ، بدأ مركز تقنيات الكلام في تطوير نظام Voice2Med للتعرف على الكلام الطبي وتقليل الوقت الذي يستغرقه إكمال التقارير والسجلات الطبية. كما جاء في وزارة العمل والحماية الاجتماعية في الاتحاد الروسي ، يستغرق الأمر الآن نصف وقت عمل الطبيب.

حلول البرمجة اللغوية العصبية لدينا


الهدف الرئيسي من البرمجة اللغوية العصبية في الطب هو استخراج البيانات من النص. نحن في DOC + نركز على ذلك. يضم فريق تطوير التعلم الآلي لدينا ستة أشخاص. من بين هؤلاء ، يعمل اثنان حصريًا على تقنية البرمجة اللغوية العصبية. في DOC + ، يتم استخدام تقنية NLP لتمييز البطاقات التي تم تدريب نظام التحكم في جودة EMC عليها (كتبنا عنها في المقالة السابقة ).

استنادًا إلى نفس النظام ، يعمل برنامج الروبوت الخاص بنا أيضًا ، مما يعمل على تحسين عمل الاستشارات عبر الإنترنت. يعمل البوت على الإنترنت ويطلب من المريض وصف الشكاوى في شكل حر ، ثم يعزل الأعراض عن النص ويبلغ الطبيب بها. بفضل هذا ، يبدأ الأخصائي استشارة طبية عن بعد مع مريض تم إعداده بالفعل (سنخبرك بالمزيد حول عمل تاريخنا الطبي في الوظائف التالية).

ملامح تطوير أنظمة البرمجة اللغوية العصبية

هناك العديد من الصعوبات في تطوير مثل هذه الأنظمة. أولها أنه عند العمل مع النصوص ، لا يكفي استخدام خوارزميات وأساليب بسيطة واسعة الانتشار. الخدمات التي تقوم بمسح النص بحثًا عن وجود كلمات معينة والنظر في تكرار ظهورها لتقييم "الأهمية" في الطب تعطي نتيجة محدودة للغاية.

عند إجراء التشخيص ، من المهم بالنسبة للطبيب ليس فقط أن يعرف أن الشخص لديه أعراض معينة ، ولكن أيضًا لفهم ديناميكيات ومعلمات هذا العرض - التوطين ، ونوع الألم ، والقيم الدقيقة للمؤشرات الرقمية ، وما إلى ذلك. لذلك ، هناك حاجة إلى خوارزميات أكثر تعقيدًا للعمل مع النصوص الطبية ، تسليط الضوء ليس فقط على الكلمات ، ولكن الحقائق المعقدة حول مختلف الشكاوى والأعراض.
من النص: "في 18 فبراير ، وجع رأسي على الجانب الأيسر ، في المساء ارتفعت درجة الحرارة إلى 39. في اليوم التالي زادت منطقة الصداع ، لم يكن هناك دوار" ، يجب على النظام تسليط الضوء على معلومات منظمة حول ثلاثة أعراض:

  1. الصداع - ظهر في 02/18 ؛ توطين: على اليسار. ديناميات: 02.19 - زيادة في المساحة.
  2. درجة الحرارة - 18.02 ؛ القيمة: 39 درجة.
  3. دوار - بدون أعراض.
الميزة الثانية هي أن أدوات معالجة النصوص تحتاج إلى مزيد من التخصيص للعمل مع المواد المتخصصة للغاية. على سبيل المثال ، كان علينا "تعديل" المدقق الإملائي بالإضافة إلى ذلك ، حيث لم يلبي أي من الحلول في السوق متطلباتنا.
قام المدقق الإملائي بتصحيح كلمة "السعال" إلى "قطرات" ، حيث درسوا على النصوص دون مصطلحات طبية. لذلك ، قمنا بإعادة تدريب النظام على الجسم من المواد الطبية. ويجب إجراء مثل هذه التحسينات الصغيرة للخوارزميات الكلاسيكية باستمرار.
ما يمكن أن يفعله نظام البرمجة اللغوية العصبية لدينا

الآن الحل الذي طورناه يتعرف على 400 مصطلح - الأعراض والتشخيص وأسماء الأدوية ، وما إلى ذلك ) ، ووجود مضاعفات وقيم المعلمات القابلة للقياس (درجة الحرارة والضغط).

بالإضافة إلى ذلك ، فهي تعرف كيفية عزل معلمات الوقت ومقارنتها بالأعراض وتصحيح الأخطاء المطبعية والعمل مع خيارات مختلفة لوصف الحقائق نفسها.

المساعدة في اتخاذ القرار السريري (CDS)


توفر أنظمة دعم اتخاذ القرار السريري (CDS) مساعدة تلقائية للأطباء عند إجراء التشخيص ووصف العلاج وتحديد جرعة الأدوية وما إلى ذلك. تتيح لك أنظمة البرمجة اللغوية العصبية (NLP) الحصول على المعلومات الطبية اللازمة لذلك - فهي تستمدها من الأوراق العلمية ونتائج الاختبارات والأدلة الطبية وحتى كلمات المريض.

تم تطوير أحد هذه الحلول في IBM. نحن نتحدث عن نظام الإجابة على الأسئلة DeepQA ، والذي يعمل به الكمبيوتر العملاق IBM Watson. في هذه الحالة ، يعمل Watson كـ "محرك بحث NLP" لقواعد البيانات الكبيرة: فهو يعالج أسئلة الأطباء ويعطيهم إجابة محددة ، ولا يعرض نتائج البحث على الإنترنت فقط. مكنته التكنولوجيا في Watson من الفوز في Jeopardy! (السلف الأمريكي لـ "لعبته").

مثال آخر على تطبيق هذه التقنيات هو نظام البرمجة اللغوية العصبية ، الذي أنشأه فريق من العلماء بقيادة الدكتور هارفي ج. مورف من المركز الطبي بجامعة فاندربيلت. قام المطورون بتعليم الخوارزمية لتحليل سجلات المرضى الإلكترونية وتحديد الأمراض التي يمكن أن تسبب مضاعفات بعد الجراحة.

قام المعالج NLP بفهرسة السجلات في السجلات الطبية باستخدام مخطط يعتمد على التسميات الطبية المجهزة آليًا والمعالجة آليًا. عند الإخراج ، أنشأ النظام ملف XML مع بطاقة المريض "مرمزة". أظهرت التجارب أن البرنامج صنف معظم المضاعفات بشكل صحيح ، على سبيل المثال ، لوحظ الفشل الكلوي بشكل صحيح في 82 ٪ من الحالات ، واحتشاء عضلة القلب بعد الجراحة في 91 ٪ من الحالات.

DOC + لديها أيضًا نظيرتها الخاصة لـ CDS - أي عمل من الطبيب في التطبيق مصحوب بتلميحات ، ولكن حتى الآن يتم تشكيلها بواسطة خوارزميات كلاسيكية قائمة على القواعد ، دون استخدام التعلم الآلي و NLP. لكننا نعمل على جيل جديد من CDS من شأنه أن يقرأ التاريخ الطبي الكامل للمريض بلغة طبيعية ويستخدمه بمثابة تلميح للطبيب.

مزيد من تطوير أنظمة البرمجة اللغوية العصبية


تتيح لك أنظمة البرمجة اللغوية العصبية (NLP) العمل ليس فقط مع السجلات الطبية ، ولكن أيضًا مع المقالات العلمية والمعايير الطبية. في مجال الطب ، تراكمت خبرة واسعة ، تم تلخيصها في التوصيات السريرية والأوراق العلمية والمصادر النصية الأخرى. من المنطقي استخدام هذه البيانات لتدريب أنظمة الذكاء الاصطناعي على قدم المساواة مع خرائط المرضى الحقيقيين ، أثناء إنشاء قاعدة بيانات منظمة للأدوية التي لا يمكن استخدامها من قبل الناس ، ولكن بواسطة الخوارزميات.

وتتمثل ميزة أنظمة البرمجة اللغوية العصبية هذه في أن نتائج عملها غالبًا ما تكون أسهل في التفسير ، أي أنها مرتبطة بمصادر محددة. بشكل عام ، فإن مسألة قابلية تفسير نتائج خوارزميات التعلم الآلي أبعد ما تكون عن التافهة ، وهي مهمة لكل من المجتمع العلمي ككل (في المؤتمر الدولي الرائد حول التعلم الآلي ICML ، يتم تخصيص ورشة عمل منفصلة لها بانتظام) وللمطورين ، خاصة عندما يتعلق الأمر بالمشاريع في مجال الطب المبني على البراهين. بالنسبة لنا ، فإن متطلبات قابلية التفسير تجعل مهمة تحسين نظام البرمجة اللغوية العصبية لدينا أكثر صعوبة (وأكثر إثارة للاهتمام).

تعد البرمجة اللغوية العصبية مجالًا واعدًا سينقل جودة الرعاية الطبية إلى مستوى جديد. نخطط لتطوير هذه التقنيات بنشاط أكبر ومواصلة الحديث عن تطوراتنا في مدونتنا.



قراءة إضافية: مقالات مفيدة من مدونتنا " اسأل فقط ":



Source: https://habr.com/ru/post/ar411123/


All Articles