Jaringan saraf dilatih untuk mengenali depresi dengan cara bicara sewenang-wenang seseorang tanpa konteks


Jaringan saraf mengevaluasi pewarnaan emosional dari fragmen pidato pembicara selama 30 detik. Ilustrasi dari karya ilmiah penulis sebelumnya

Dalam beberapa tahun terakhir, pembelajaran mesin semakin banyak digunakan sebagai alat diagnostik yang berguna. Model yang ada mampu mengidentifikasi kata-kata dan intonasi ucapan yang dapat mengindikasikan depresi. Tetapi model ini biasanya bekerja hanya jika pasien menjawab pertanyaan spesifik dokter: misalnya, tentang suasana hatinya, gaya hidup, riwayat medis, dll. Artinya, pekerjaan jaringan saraf dalam kasus ini tidak berbeda dengan pekerjaan seorang psikoterapis biasa yang berbicara dengan pasien.

Tetapi untuk generasi kedokteran baru, sistem yang menentukan depresi pada serangkaian kata-kata yang sewenang-wenang , tanpa serangkaian pertanyaan spesifik, jauh lebih efektif. Secara teoritis, dalam hal ini, Anda dapat secara otomatis memantau kesehatan mental seluruh populasi secara real time (semua lalu lintas suara) - dan dengan cepat merawat pasien. Modul deteksi depresi otomatis dapat diimplementasikan dalam aplikasi dan game seluler.

Model ini dikembangkan oleh para ilmuwan dari Massachusetts Institute of Technology, menulis publikasi MIT News . Artikel ilmiah akan dipresentasikan pada konferensi Interspeech 2018 , yang akan diselenggarakan pada 2-6 September di India.

โ€œJika Anda ingin menggunakan model [mendeteksi depresi] dengan cara yang dapat diskalakan ... maka Anda perlu meminimalkan jumlah pembatasan pada data yang digunakan. Sebuah model harus mengekstraksi data dari setiap percakapan biasa dan interaksi alami antara orang-orang, โ€kata Tuka Alhanai, seorang peneliti di Institut Ilmu Komputer dan Laboratorium Inteligensi Buatan Teknologi Massachusetts (CSAIL), seorang penulis terkemuka karya ilmiah.

Para peneliti berharap metode baru ini akan digunakan untuk mendeteksi tanda-tanda depresi dalam percakapan alami. Misalnya, berdasarkan model, aplikasi seluler dapat dikembangkan yang melacak teks dan suara pengguna untuk gangguan mental dan mengirim peringatan. Ini sangat berguna bagi mereka yang tidak dapat pergi ke dokter untuk diagnosa awal karena tidak adanya dokter, tingginya biaya konsultasi, atau hanya karena mereka tidak tahu bahwa ia memiliki masalah mental.

Depresi adalah penyakit mental yang sangat berbahaya, yang disertai dengan penurunan harga diri, kehilangan minat dalam hidup dan aktivitas kebiasaan. Dalam beberapa kasus, seseorang yang menderita itu dapat mulai menyalahgunakan alkohol atau zat lain.

Inovasi kunci dari teknologi baru terletak pada kemampuannya untuk mendeteksi pola yang mengindikasikan depresi, dan kemudian membandingkan pola-pola ini dengan orang-orang baru tanpa informasi tambahan, yaitu, tanpa pelatihan sebelumnya tentang orang tertentu. "Kami menyebutnya berfungsi" tanpa konteks "karena Anda tidak memaksakan batasan pada jenis pertanyaan yang Anda cari dan jenis jawaban untuk pertanyaan ini," jelas Alkhanay.

Untuk melatih jaringan saraf, teknik yang disebut "pemodelan urutan", yang sering digunakan untuk pemrosesan ucapan, digunakan. Model belajar dari urutan data teks dan suara dari pertanyaan dan jawaban dari orang dengan dan tanpa depresi. Secara bertahap, ia mengungkapkan pola umum, karena beberapa kata dikaitkan dengan suara yang berbeda pada orang sehat dan sakit. Selain itu, penderita depresi dapat berbicara lebih lambat dan menggunakan jeda yang lebih lama di antara kata-kata. Pengidentifikasi teks dan suara untuk gangguan mental ini telah dipelajari dalam penelitian sebelumnya. Pada akhirnya, model itu sendiri menentukan apakah ada tanda-tanda depresi dalam pidato atau tidak.

Model ini diuji pada kumpulan data dari 142 fragmen ucapan dari Distress Analysis Interview Corpus corpus (suara, teks, video). Keakuratan diagnosis adalah 71% (mis. 29% dari hasil positif palsu), dan kelengkapan deteksi penyakit adalah 83% dari semua pasien dalam sampel. Dalam kebanyakan tes, akurasi melebihi kinerja semua model sebelumnya untuk mendiagnosis depresi. Peneliti menemukan hasil awal sangat menggembirakan.

Dalam artikel ilmiah sebelumnya dari 2017, penulis menggambarkan jaringan saraf yang mengenali suasana hati pembicara dengan tanda-tanda berikut:

  • karakteristik suara;
  • mengatur kata-kata;
  • denyut nadi.


Ilustrasi menunjukkan distribusi konten emosional selama interval lima detik. Segmen negatif adalah mereka yang menunjukkan tanda-tanda sedih, jijik, marah, takut, atau bosan. Segmen positif mengandung tanda-tanda kebahagiaan, minat, atau antusiasme.

Selain depresi, para ilmuwan bermaksud untuk melatih jaringan saraf untuk mengenali kondisi mental lainnya, seperti demensia.

Source: https://habr.com/ru/post/id421775/


All Articles