Menurut The Huffington Post, 80% dari catatan medis elektronik
disimpan dalam bentuk yang tidak terstruktur - yang disebut "gelembung teks". Dalam bentuk teks, tidak hanya data EMC yang disimpan, tetapi juga sejumlah besar informasi medis lainnya - ini adalah artikel ilmiah, rekomendasi klinis, deskripsi penyakit dan keluhan. Dan bahkan jika data di dalamnya sebagian terstruktur, tidak ada format yang diterima secara umum untuk penyimpanannya.
Sangatlah sulit untuk mengekstraksi pengetahuan yang berguna dari "gelembung teks" - algoritma paling sederhana dapat memeriksa dokumen untuk terjadinya kata atau frasa tertentu, tetapi ini tidak cukup: dokter selalu membutuhkan detail. Dia tidak hanya perlu tahu bahwa pasien memiliki suhu, tetapi juga untuk memahami dinamika: misalnya, "suhu naik di malam hari menjadi 39 dan berlangsung selama hari keempat".
Teknologi Natural Language Processing (NLP)
dapat membantu Anda mengekstrak informasi berharga dari teks medis dan catatan medis elektronik. Selanjutnya, kami akan menunjukkan bagaimana teknologi NLP menyederhanakan pekerjaan dokter: kami akan berbicara tentang pengenalan suara dan teks yang diisi dengan istilah medis, dan membantu dalam membuat keputusan klinis.
“Dokter DOC + akan dengan sopan menangani luka Anda”Apa itu NLP?
Bahkan, sejarah NLP dimulai pada hari-hari awal ilmu pengetahuan modern tentang kecerdasan buatan. Alan Turing dalam karyanya "
Computers and Mind " sebagai kriteria untuk "kewajaran" dari sebuah mesin menyebut kemampuannya untuk berkomunikasi dengan orang-orang - sekarang ini adalah tugas yang penting, tetapi bukan satu-satunya tugas yang dipecahkan oleh para pengembang sistem NLP.
NLP menggabungkan sejumlah teknologi (termasuk yang sangat jauh satu sama lain dalam hal matematika) yang memungkinkan pemecahan masalah algoritmik terkait dengan pemrosesan bahasa manusia alami:
- Ekstrak fakta dari teks (dari pencarian sederhana untuk kata-kata berhenti hingga penguraian literatur yang lengkap);
- Pengenalan suara dan konversi suara ke teks;
- Klasifikasi teks;
- Generasi teks atau ucapan;
- Terjemahan mesin
- Analisis nada suara teks (termasuk penambangan Opini);
- Dan lainnya
Dalam fiksi ilmiah, superkomputer sering mampu melakukan semua hal di atas. Dalam film kultus The
Space Odyssey tahun 2001 , HAL 9000
mengenali ucapan manusia dan gambar visual, dikomunikasikan dalam bahasa yang sama. Dalam praktiknya, semua tugas ini sangat terspesialisasi, dan masing-masing algoritma menyelesaikannya.
Dan algoritma ini (dan teknologi yang mendasarinya) terus berkembang. Misalnya, yang paling "paling dekat" dengan pengguna biasa arah NLP - pengenalan suara - beberapa tahun yang lalu didasarkan pada
model Markov yang tersembunyi . Mereka memecah apa yang dikatakan seseorang menjadi komponen-komponen kecil, memilih fonem, melakukan analisis statistik dan menghasilkan hasil yang paling mungkin dari apa yang dikatakan dalam format teks. Sekarang, pengembang jauh lebih mungkin menggunakan jaringan saraf - khususnya,
jaringan saraf berulang dan variannya, misalnya,
memori jangka pendek jangka panjang (LSTM).
Saat ini, sistem NLP semakin sering digunakan - kami berbicara dengan Siri, berbicara dengan asisten Google (LSTM dengan CTC
digunakan di Android OS) dan sistem infotainment mobil, algoritme pintar melindungi email kami dari spam, agregator berita memilih artikel yang akan kami tertarik, dan mesin pencari memungkinkan kami menemukan informasi yang kami butuhkan atas permintaan apa pun.
Tugas apa yang dipecahkan NLP dalam kedokteran?
Namun, sistem NLP bermanfaat tidak hanya dalam pengoperasian gadget modern dan aplikasi online. Mereka telah
diperkenalkan di masing-masing rumah sakit dan universitas medis sejak awal tahun 90-an.
Aplikasi NLP pertama yang dikembangkan di Universitas Utah pada waktu itu adalah Sistem Pemahaman Radiologi Tujuan Khusus (SPRUS) untuk Klinik Salt Lake City. Alat ini menggunakan informasi dari
sistem pakar yang membandingkan gejala dengan diagnosis yang sesuai, dan laporan radiologis tekstual
parsil (protokol medis yang menginterpretasikan sinar-x).
Program ini
menggunakan teknik penguraian semantik
berdasarkan pencarian kata-kata dalam tesaurus. Tesaurus secara otomatis diisi ulang dari basis pengetahuan untuk memecahkan masalah diagnostik menggunakan kompiler yang dikembangkan secara khusus.
Sejak itu, kemungkinan NLP dan pembelajaran mesin dalam kedokteran telah melangkah maju: hari ini, teknologi menyederhanakan pekerjaan dengan catatan medis elektronik untuk dokter dan mengurangi frekuensi kesalahan klinis, "membantu" dalam membuat keputusan medis.
Penyederhanaan pekerjaan dengan kartu elektronik (EMC)
Rekam medis elektronik, atau EMC, adalah analog dari kartu kertas yang akrab bagi kita. Tugas kartu elektronik adalah menyederhanakan alur kerja dan mengurangi jumlah kertas kerja. Kami berbicara lebih rinci tentang apa itu EMC dan bagaimana mereka membantu mengontrol kualitas perawatan medis di salah satu
materi kami sebelumnya.
Terlepas dari kenyataan bahwa dengan diperkenalkannya EMC, menjadi lebih mudah bagi dokter untuk bekerja dengan dokumen, perlu waktu untuk mengisi kartu. Menurut sebuah
penelitian yang diterbitkan dalam Computers Informatics Nursing pada 2012, perawat di rumah sakit AS masih menghabiskan sekitar 19% dari waktu kerja mereka mengisi kartu elektronik.
Ya, ini hanya seperlima dari hari kerja, tetapi bahkan angka ini dapat dikurangi dan sumber daya yang dikeluarkan dapat digunakan untuk merawat orang sakit.
Menurut Presiden Nuance Communications Joe Petro, teknologi NLP akan memungkinkan ini.
Pada 2009, Nuance
mempelajari pendapat ribuan terapis AS tentang teknologi pemrosesan bahasa alami. Menurut hasil penelitian, 94% dari dokter yang disurvei mengatakan implementasi EMC dengan NLP adalah pendorong penting dari kualitas perawatan medis.
Contoh dari pendekatan ini adalah layanan yang
menggunakan staf medis Pusat Jantung Lembah Hudson di Paukipzi. Dengan bantuan solusi dari Nuance Communications, perawat rumah sakit mendiktekan ekstrak dari riwayat medis pasien, menyusun hasil pemeriksaan fisik dan mencatat data tentang perjalanan penyakit. Aplikasi secara otomatis
memperbarui catatan dalam sistem EMC yang diterapkan di rumah sakit.
Solusi serupa sedang diterapkan di Rusia. Misalnya, pada tahun 2016, Pusat Teknologi Pidato mulai
mengembangkan sistem Voice2Med untuk mengenali pembicaraan medis dan mengurangi waktu yang dibutuhkan untuk menyelesaikan laporan dan catatan medis. Sebagaimana dinyatakan dalam Kementerian Tenaga Kerja dan Perlindungan Sosial Federasi Rusia, sekarang
dibutuhkan separuh waktu kerja dokter.
Solusi NLP Kami
Tujuan utama NLP dalam kedokteran adalah untuk mengekstraksi data dari teks. Kami di DOC + fokus pada hal itu. Ada enam orang di tim pengembangan pembelajaran mesin kami. Dari jumlah tersebut, dua bekerja secara eksklusif pada teknologi NLP. Dalam DOC +, teknologi NLP digunakan untuk menandai kartu yang digunakan sistem kontrol kualitas EMC (kami menulis tentang hal itu dalam
artikel sebelumnya ).
Berdasarkan sistem yang sama, bot anamnesis kami juga berfungsi, mengoptimalkan pekerjaan konsultasi online. Bot bekerja secara online dan meminta pasien untuk menggambarkan keluhan dalam bentuk bebas, kemudian mengisolasi gejala dari teks dan melaporkannya ke dokter. Berkat ini, spesialis memulai konsultasi telemedicine dengan pasien yang sudah disiapkan (kami akan memberi tahu Anda lebih banyak tentang pekerjaan bot anamnesis kami di posting berikut).
Fitur pengembangan sistem NLP
Ada beberapa kesulitan dalam mengembangkan sistem seperti itu. Yang pertama adalah ketika bekerja dengan teks, tidak cukup hanya menggunakan algoritma dan pendekatan sederhana yang tersebar luas. Layanan yang memindai teks untuk kehadiran kata-kata tertentu dan mempertimbangkan frekuensi kemunculannya untuk menilai “pentingnya” dalam kedokteran memberikan hasil yang sangat terbatas.
Ketika membuat diagnosis, penting bagi dokter tidak hanya untuk mengetahui bahwa seseorang memiliki gejala tertentu, tetapi juga untuk memahami dinamika dan parameter gejala ini - lokalisasi, jenis rasa sakit, nilai tepat dari indikator digital, dll. Oleh karena itu, algoritma yang lebih kompleks diperlukan untuk bekerja dengan teks medis, menyoroti tidak hanya kata-kata, tetapi fakta kompleks tentang berbagai keluhan dan gejala.
Dari teks: "Pada tanggal 18 Februari, kepalaku terasa sakit di sisi kiri, pada malam hari suhu naik menjadi 39. Hari berikutnya daerah sakit kepala meningkat, tidak ada pusing", sistem harus menyoroti informasi terstruktur tentang tiga gejala:
- Sakit kepala - muncul pada 02/18; lokalisasi: di sebelah kiri; Dinamika: 02,19 - peningkatan area.
- Suhu - 18,02; nilai: 39 derajat.
- Pusing - tanpa gejala.
Fitur kedua adalah bahwa alat pengolah teks perlu disesuaikan lebih lanjut untuk bekerja dengan bahan yang sangat khusus. Sebagai contoh, kami harus "mengubah" pemeriksa ejaan sebagai tambahan, karena tidak ada solusi di pasar yang memenuhi persyaratan kami.
Pemeriksa ejaan mengoreksi kata "batuk" menjadi "tetes", karena mereka belajar pada teks tanpa terminologi medis. Karena itu, kami melatih kembali sistem pada tubuh dari artikel medis. Dan perbaikan kecil seperti itu untuk algoritma klasik harus dilakukan terus-menerus.
Apa yang bisa dilakukan sistem NLP kami
Sekarang solusi yang kami kembangkan mengenali 400 istilah - gejala, diagnosa, nama obat, dll. Selain itu, untuk sebagian besar gejala, sistem ini dapat mengisolasi sifat tambahan: lokalisasi (nyeri perut di
sebelah kanan pusar ), jenis (batuk
basah ), warna (batuk
basah ), warna (sputum
bening ), adanya komplikasi dan nilai-nilai parameter yang dapat diukur (suhu, tekanan).
Selain itu, dia tahu cara mengisolasi parameter waktu dan membandingkannya dengan gejala, memperbaiki kesalahan ketik dan bekerja dengan opsi berbeda untuk menggambarkan fakta yang sama.
Bantuan Pengambilan Keputusan Klinis (CDS)
Sistem pendukung pengambilan keputusan klinis (CDS)
memberikan bantuan otomatis kepada dokter ketika membuat diagnosis, menentukan pengobatan, menentukan dosis obat, dan sebagainya. Sistem NLP memungkinkan Anda untuk mendapatkan informasi medis yang diperlukan untuk ini - mereka
mengambilnya dari makalah ilmiah, hasil tes, panduan medis, dan bahkan kata-kata pasien.
Salah satu solusi ini dikembangkan di IBM. Kita berbicara tentang sistem tanya jawab DeepQA, yang digunakan superkomputer IBM Watson. Dalam hal ini, Watson bertindak sebagai "mesin pencari NLP" untuk database besar: ia memproses pertanyaan dokter dan memberi mereka jawaban spesifik, dan tidak hanya menampilkan hasil pencarian di Internet. Teknologi di Watson memungkinkannya untuk menang di
Jeopardy! (Nenek moyang Amerika dari "permainan-Nya").
Contoh lain dari penerapan teknologi tersebut adalah sistem NLP,
dibuat oleh tim ilmuwan yang dipimpin oleh Dr. Harvey J. Murff dari pusat medis Universitas Vanderbilt. Para pengembang mengajarkan algoritma untuk menganalisis catatan pasien elektronik dan mengidentifikasi penyakit yang dapat menyebabkan komplikasi setelah operasi.
Prosesor NLP mengindeks catatan dalam catatan medis menggunakan skema berdasarkan pada
SNOMED-CT sistemat nomenklatur medis yang diproses mesin. Pada output, sistem menghasilkan file XML dengan kartu pasien yang "ditandai". Percobaan menunjukkan bahwa program dengan benar mengkategorikan sebagian besar komplikasi, misalnya, gagal ginjal diamati dengan benar pada 82% kasus, dan infark miokard pasca operasi pada 91% kasus.
DOC + juga memiliki analognya sendiri dengan CDS - setiap tindakan dokter dalam aplikasi disertai dengan petunjuk, tetapi sejauh ini mereka dibentuk oleh algoritma berbasis aturan klasik, tanpa menggunakan pembelajaran mesin dan NLP. Tetapi kami sedang mengerjakan generasi baru CDS yang akan membaca seluruh riwayat medis pasien dalam bahasa alami dan menggunakannya sebagai petunjuk kepada dokter.
Pengembangan lebih lanjut dari sistem NLP
Sistem NLP akan memungkinkan Anda untuk bekerja tidak hanya dengan catatan medis, tetapi juga dengan artikel ilmiah dan standar medis. Di bidang kedokteran, pengalaman luas telah terakumulasi, yang dirangkum dalam rekomendasi klinis, karya ilmiah, dan sumber tekstual lainnya. Adalah logis untuk menggunakan data ini untuk melatih sistem kecerdasan buatan yang setara dengan peta pasien sungguhan, sambil membuat basis data obat yang terstruktur yang dapat digunakan bukan oleh orang-orang, tetapi oleh algoritma.
Keuntungan dari sistem NLP tersebut adalah bahwa hasil pekerjaan mereka seringkali lebih mudah diinterpretasikan, yaitu, terkait dengan sumber spesifik. Secara umum, pertanyaan tentang interpretabilitas hasil algoritma pembelajaran mesin jauh dari sepele, dan penting baik bagi komunitas ilmiah secara keseluruhan (pada konferensi internasional terkemuka tentang pembelajaran mesin ICML, bengkel terpisah secara teratur
dikhususkan untuk itu ) dan untuk pengembang, terutama ketika datang ke proyek-proyek di bidang obat berbasis bukti. Bagi kami, persyaratan interpretabilitas membuat tugas meningkatkan sistem NLP kami semakin sulit (dan lebih menarik).
NLP adalah area yang menjanjikan yang akan membawa kualitas perawatan medis ke tingkat yang baru. Kami berencana untuk secara aktif mengembangkan teknologi ini lebih lanjut dan terus berbicara tentang perkembangan kami di blog kami.
Bacaan tambahan: artikel bermanfaat dari blog kami "
Tanya saja ":