
Baru-baru ini, penggunaan AI dalam pengobatan telah semakin dibahas. Dan, tentu saja, bidang kedokteran yang secara langsung meminta aplikasi semacam itu adalah bidang diagnosis.
Tampaknya sebelumnya mungkin untuk menerapkan sistem pakar dan algoritma klasifikasi untuk masalah diagnosis. Namun, ada satu area AI yang paling sukses dalam beberapa tahun terakhir, yaitu area pengenalan gambar dan jaringan saraf convolutional. Pada beberapa tes, algoritma AI dalam pengenalan gambar telah melampaui manusia. Berikut adalah dua contoh:
Tantangan Pengakuan Visual Skala Besar dan
Tolok Ukur Tanda Lalu Lintas Jerman .
Oleh karena itu, muncul ide untuk menerapkan AI di bidang pengenalan gambar di mana dokter terlibat dalam pengenalan gambar, yaitu untuk analisis gambar dan, untuk permulaan, sinar-x.
Radioscopy digunakan untuk mendiagnosis berbagai penyakit dan cedera: kerusakan paru-paru (radang paru-paru, kanker), patah tulang dan cedera tulang lainnya, bagian dari diagnosis sistem pencernaan, dan banyak lagi.
Adalah penting bahwa dalam diagnosis beberapa penyakit ini, gambar rontgen dan interpretasinya adalah alat yang berlaku dalam diagnosis.
Interpretasi gambar, pada gilirannya, dilakukan oleh ahli radiologi berdasarkan analisis gambar visual. Timbul pertanyaan: bagaimana jika kita menerapkan kemajuan dalam analisis gambar menggunakan AI untuk analisis dan interpretasi x-ray. Apa yang akan terjadi
Apakah kita dapat mencapai kualitas yang sebanding dengan dokter? Atau mungkin akurasi klasifikasi akan melebihi akurasi dokter, seperti yang terlampaui dalam pengakuan gambar dalam
Skala Besar Pengenalan Visual ?
Ada beberapa kompetisi analisis sinar-X di Kaggle untuk diagnosis pneumonia. Misalnya,
salah satunya.
Di sini 5.863 gambar ditandai oleh dokter, masing-masing gambar ditandai oleh dua dokter, dan hanya jika mereka bertepatan dalam diagnosis, gambar ditambahkan ke set data. Pasien untuk gambar tidak dipilih secara khusus (semua gambar diambil sebagai bagian dari pekerjaan biasa dengan pasien). Himpunan kelas seimbang dalam arah pneumonia, yang mungkin dekat dengan kehidupan nyata, karena pasien sudah mengambil gambar dengan dugaan pneumonia.
Solusi terbaik mencapai presisi = 0,84 dan recall = 0,96. Kemudian muncul pertanyaan: apakah banyak atau sedikit ... Ini adalah pertanyaan yang bagus.
Untuk jaga-jaga, kami ingat bahwa presisi adalah berapa persen dari pasien yang model didefinisikan sebagai pasien dengan pneumonia benar-benar sakit dengan pneumonia (dan, dengan demikian, berapa persen dokter tidak mengobati penyakit ini secara tidak sengaja). Ingatlah berapa persen dari semua pasien dengan pneumonia yang akan dideteksi oleh model (kebalikan dari persentase ini adalah berapa banyak pasien dengan pneumonia yang akan ditandai oleh model yang sehat).
Jadi banyak atau sedikit? Nah, Anda dapat melihat pertanyaan ini seperti ini: bagaimana dengan dokter? Mereka memiliki presisi dan daya ingat apa.
Untuk melakukan ini, perlu menanam sekelompok dokter, memberi mereka gambar untuk diberi tanda, dan kemudian membandingkan kualitas tanda mereka dengan kualitas tanda menggunakan algoritma yang mirip dengan
Tolok Ukur Tanda Lalu Lintas Jerman , di mana kualitas pengakuan tanda-tanda jalan dibandingkan. Sejauh yang saya tahu, belum ada yang melakukan ini dengan dokter.
Tapi misalkan kita melakukan ini dan ternyata kualitas markup menggunakan algoritme sebanding dengan kualitas markup oleh dokter. Jika sekarang ini masih belum terjadi (yang bukan fakta), maka saya yakin itu akan terjadi dalam waktu dekat. Apa selanjutnya
Ganti ahli radiologi dengan kecerdasan buatan? Ini sudah lama menjadi impian di Amerika Serikat, di mana ahli radiologi dibayar sangat tinggi, dan mungkin sepatutnya, mengingat pentingnya mereka dalam membuat jenis diagnosis tertentu.
Mari kita lihat bagaimana proses penggunaan algoritma dalam kasus ini dalam praktiknya?
- Pertama, akan perlu untuk membakukan format dan kualitas output gambar pada berbagai peralatan x-ray. Mungkin sekarang standar (saya bukan ahli), tetapi untuk beberapa alasan menurut saya tidak. Jika standardisasi ini tidak ada, maka tidak mungkin untuk menjamin stabilitas model selama transisi dari satu instalasi ke instalasi lainnya.
- Kedua, kontrol kualitas model yang teratur perlu ditambahkan. Artinya, model harus secara teratur dimasukkan ke input sampel uji yang ditandai oleh dokter dan kualitas pekerjaannya harus terus divalidasi. Pada semua model yang digunakan di semua klinik. Ini berarti bahwa harus ada satu model terpusat (atau jumlah yang sangat kecil), karena jika tidak terlalu banyak sumber daya yang diperlukan untuk semua model untuk divalidasi. Logikanya, produsen peralatan x-ray mungkin akan sampai pada kesimpulan bahwa model akan dikirimkan bersama dengan unit x-ray.
- Ketiga, ambang batas kepercayaan harus dibangun ke dalam model, di luar gambar yang masih diteruskan ke dokter untuk klasifikasi.
Seperti yang Anda pahami, meskipun modelnya sekarang sebanding atau lebih unggul dari dokter dalam hal kualitas klasifikasi, serangkaian langkah proses diperlukan untuk penggantian (dokter) mereka atau, lebih tepatnya, pengurangan staf. Belum lagi serangkaian langkah peraturan dan sertifikasi yang umumnya diperlukan untuk mempraktikkan solusi semacam itu.
Secara umum, kita masih jauh dari skenario di atas, menurut saya.
Apakah skenario yang berbeda mungkin? Saya kira begitu. Ingat
Teorema Juri Condorcet , yang mengatakan bahwa probabilitas membuat keputusan yang tepat oleh sekelompok orang lebih tinggi daripada masing-masing dari mereka secara individual. Dengan demikian, kualitas klasifikasi dokter dan model bersama lebih tinggi daripada kualitas klasifikasi salah satu dari mereka.
Dengan demikian, dokter dapat menggunakan model sebagai penasihat. Mengapa Karena dokter sendiri memiliki ketelitian dan daya ingatnya sendiri. Misalkan dokter tidak menyebutnya begitu, tetapi ada kesalahan. Beberapa kesalahan mengarah pada fakta bahwa beberapa penyakit terlewatkan. Kesalahan seperti itu, saya pikir, lebih sedikit, karena dokter hanya berusaha meminimalkan kesalahan jenis pertama. Kesalahan lain mengarah pada fakta bahwa orang dirawat karena pneumonia, yang tidak mereka miliki, dan beberapa tempat di rumah sakit diambil secara tidak perlu. Berapa banyak kesalahan total yang tidak diketahui, tetapi sebenarnya ada.
Karenanya, bayangkan kita menggunakan dua model yang berbeda dan pendapat dokter tentang foto. Nilai tambah dari teorema Condorcet adalah bahwa ia tidak hanya mengklaim bahwa dua head lebih baik dari satu, tetapi juga memungkinkan Anda untuk menghitung berapa.
Biarkan masing-masing dari mereka (untuk masing-masing model dan dokter) memiliki akurasi 0,84 (tentu saja, kita tidak tahu keakuratan dokter, tetapi anggaplah itu tidak lebih rendah dari keakuratan model). Kemudian, dengan teorema Condorcet, akurasi total sama dengan 0,84 ^ 3 + 3 * 0,84 ^ 2 * (1 - 0,84) = 0,93, yang memberikan peningkatan yang jelas dibandingkan dengan akurasi awal 0,84. Dengan demikian, menerapkan model, dokter menjadi lebih akurat dalam prediksi.
Perhatikan bahwa dalam paradigma ini, kita menyelamatkan yang kudus, kita menyerahkan keputusan terakhir kepada dokter, tanpa mengalihkannya ke mesin. Ini, menurut saya, akan memfasilitasi pengenalan solusi semacam itu dan membuka jalan bagi penasihat AI dalam bidang kedokteran.
Apa yang kamu pikirkan
Seperti biasa, jika Anda ingin menguasai aplikasi jaringan saraf convolutional dan visi komputer dalam praktiknya - datanglah ke
kursus kami
untuk analis , mulai 28 Januari. Ada juga
kursus pengantar jika Anda perlu memperketat dasar-dasarnya.