Lokalisasi suara: bagaimana otak mengenali sumber suara



Dunia di sekitar kita dipenuhi dengan semua jenis informasi yang terus diproses otak kita. Dia menerima informasi ini melalui indera, yang masing-masing bertanggung jawab untuk bagian sinyal: mata (penglihatan), lidah (rasa), hidung (bau), kulit (sentuhan), alat vestibular (keseimbangan, posisi spasial dan rasa berat) dan telinga (suara). Dengan menyatukan sinyal dari semua organ ini, otak kita dapat membangun gambaran lingkungan yang akurat. Namun tidak semua aspek pemrosesan sinyal eksternal diketahui oleh kami. Salah satu rahasia ini adalah mekanisme lokalisasi sumber suara.

Para ilmuwan dari Laboratorium Neuroengineering untuk Pidato dan Pendengaran (New Jersey Institute of Technology) telah mengusulkan model baru dari proses saraf lokalisasi suara. Apa sebenarnya proses yang terjadi di otak selama persepsi suara, bagaimana otak kita memahami posisi sumber suara dan bagaimana penelitian ini dapat membantu dalam memerangi cacat pendengaran. Kami belajar tentang ini dari laporan kelompok penelitian. Ayo pergi.

Dasar studi


Informasi yang diterima otak kita dari indera berbeda satu sama lain baik dalam hal sumber maupun dalam hal pemrosesan. Beberapa sinyal segera muncul di depan otak kita dalam bentuk informasi yang akurat, sementara yang lain memerlukan proses komputasi tambahan. Secara kasar, kami merasakan sentuhannya segera, tetapi ketika kami mendengar suaranya, kami masih harus menemukan dari mana asalnya.

Dasar untuk melokalisasi suara di bidang horizontal adalah perbedaan waktu antar * (ITD dari perbedaan waktu antar ) suara mencapai telinga pendengar.
Basis interaural * - jarak antara telinga.
Ada area tertentu di otak (medial superior olive atau MBO) yang bertanggung jawab untuk proses ini. Pada saat menerima sinyal suara dalam MBO, perbedaan antar waktu diubah menjadi laju reaksi neuron. Bentuk kurva kecepatan keluaran MBO sebagai fungsi ITD menyerupai bentuk fungsi korelasi silang dari sinyal input untuk masing-masing telinga.

Cara informasi diproses dan ditafsirkan dalam MBO tetap tidak sepenuhnya jelas, itulah sebabnya ada beberapa teori yang sangat bertentangan. Teori klasik lokalisasi suara yang paling terkenal dan faktanya adalah model Jeffress ( Lloyd A. Jeffress ). Ini didasarkan pada garis yang ditandai * dari detektor neuron yang sensitif terhadap sinkronisasi binaural dari sinyal input saraf dari setiap telinga, dan masing-masing neuron paling sensitif terhadap nilai ITD tertentu ( 1A ).
Prinsip garis bertanda * adalah hipotesis yang menjelaskan bagaimana saraf yang berbeda, yang semuanya menggunakan prinsip fisiologis yang sama untuk mengirimkan impuls sepanjang aksonnya, mampu menghasilkan sensasi yang berbeda. Saraf yang serupa secara struktural dapat menghasilkan persepsi sensorik yang berbeda jika mereka dikaitkan dengan neuron unik dalam sistem saraf pusat yang mampu men-decode sinyal saraf yang sama dalam berbagai cara.


Gambar No. 1

Model ini secara komputasi mirip dengan pengkodean saraf berdasarkan korelasi silang suara yang tidak terbatas yang mencapai kedua telinga.

Ada juga model di mana diasumsikan bahwa lokalisasi suara dapat dimodelkan atas dasar perbedaan dalam laju reaksi populasi neuron tertentu dari belahan otak yang berbeda, yaitu. model asimetri interhemispheric ( 1B ).

Sampai sekarang, sulit untuk secara tegas menyatakan mana dari dua teori (model) yang benar, mengingat masing-masing dari mereka memprediksi ketergantungan yang berbeda dari lokalisasi suara pada intensitas suara.

Dalam studi yang kami pertimbangkan saat ini, para ilmuwan memutuskan untuk menggabungkan kedua model untuk memahami apakah persepsi suara didasarkan pada kode saraf atau pada perbedaan dalam respon populasi saraf individu. Beberapa percobaan dilakukan di mana orang berusia 18 hingga 27 tahun (5 wanita dan 7 pria) mengambil bagian. Audiometri (pengukuran ketajaman pendengaran) peserta adalah 25 dB atau lebih tinggi pada frekuensi 250 hingga 8000 Hz. Peserta percobaan ditempatkan di ruang kedap suara di mana peralatan khusus dikalibrasi dengan akurasi tinggi. Peserta harus, setelah mendengar sinyal suara, menunjukkan arah dari mana ia berasal.

Hasil penelitian


Untuk menilai ketergantungan lateralisasi aktivitas otak pada intensitas suara sebagai respons terhadap neuron yang ditandai, kami menggunakan data tentang laju reaksi neuron dalam inti laminar otak burung hantu gudang.
Lateralitas * - asimetri bagian kiri dan kanan tubuh.
Untuk menilai ketergantungan lateralisasi aktivitas otak pada laju reaksi populasi neuron tertentu, kami menggunakan data aktivitas dua otak monyet rhesus yang lebih rendah, setelah itu perbedaan kecepatan neuron dari belahan otak yang berbeda juga dihitung.

Model garis yang ditandai dari detektor neuron menunjukkan bahwa, dengan penurunan intensitas suara, lateralitas dari sumber yang dirasakan akan menyatu dalam nilai rata-rata yang serupa dengan rasio suara tenang dan keras ( 1C ).

Model asimetri interhemispheric, pada gilirannya, menunjukkan bahwa dengan penurunan intensitas suara ke hampir ambang batas, lateralitas yang dirasakan akan bergeser ke garis tengah ( 1D ).

Pada intensitas suara keseluruhan yang lebih tinggi, diasumsikan bahwa lateralisasi akan invarian dalam intensitas (menyisipkan 1C dan 1D ).

Oleh karena itu, analisis tentang bagaimana intensitas suara mempengaruhi arah suara yang dirasakan memungkinkan Anda untuk secara akurat menentukan sifat dari proses yang terjadi pada saat itu - neuron dari satu area umum atau neuron dari belahan yang berbeda.

Jelas, kemampuan seseorang untuk membedakan antara ITD dapat bervariasi dengan intensitas suara. Namun, para ilmuwan mengatakan bahwa sulit untuk menafsirkan temuan sebelumnya yang berkaitan dengan sensitivitas terhadap ITD dan penilaian pendengar tentang arah sumber suara sebagai fungsi dari intensitas suara. Beberapa studi mengatakan bahwa ketika intensitas suara mencapai ambang batas, lateralitas yang dirasakan dari sumber berkurang. Studi lain menunjukkan bahwa tidak ada pengaruh intensitas pada persepsi sama sekali.

Dengan kata lain, para ilmuwan "dengan lembut" mengisyaratkan bahwa tidak ada informasi yang cukup dalam literatur mengenai hubungan ITD, intensitas suara, dan menentukan arah sumbernya. Ada teori yang ada sebagai semacam aksioma yang secara umum diterima oleh komunitas ilmiah. Oleh karena itu, diputuskan untuk menguji secara rinci semua teori, model, dan kemungkinan mekanisme persepsi pendengaran dalam praktik.

Eksperimen pertama dilakukan dengan menggunakan paradigma psikofisik, yang memungkinkan kami untuk mempelajari lateralisasi berbasis ITD sebagai fungsi dari intensitas bunyi dalam kelompok yang terdiri dari sepuluh peserta yang biasanya mendengar dalam percobaan.


Gambar No. 2

Sumber suara disetel secara khusus untuk mencakup sebagian besar rentang frekuensi di mana orang dapat mengenali ITD, yaitu. 300 hingga 1200 Hz ( 2A ).

Dalam setiap tes, pendengar harus menunjukkan lateralitas yang diharapkan, diukur sebagai fungsi dari tingkat sensasi, dalam kisaran nilai ITD dari 375 hingga 375 ms. Untuk menentukan efek intensitas suara, model efek campuran nonlinier (NMLE) digunakan, yang mencakup intensitas suara tetap dan acak.

Grafik 2B menunjukkan perkiraan lateralisasi dengan noise datar spektral pada dua intensitas suara untuk pendengar yang representatif. Grafik 2C menunjukkan data mentah (lingkaran) dan disesuaikan dengan model NMLE (garis) dari semua pendengar.


Tabel nomor 1

Tabel di atas menunjukkan semua parameter NLME. Dapat dilihat bahwa persepsi lateralitas meningkat dengan meningkatnya ITD, seperti yang diperkirakan para ilmuwan. Dengan penurunan intensitas suara, persepsi semakin bergeser ke garis tengah (masukkan pada grafik 2C ).

Tren ini diperkuat oleh model NLME, yang menunjukkan pengaruh signifikan dari ITD dan intensitas suara pada tingkat lateralitas maksimum, mengkonfirmasikan model perbedaan antar sel.

Selain itu, ambang batas audiometri rata-rata dari nada murni memiliki efek yang dapat diabaikan pada persepsi lateralitas. Tetapi intensitas suara tidak secara signifikan mempengaruhi kinerja fungsi psikometrik.

Tujuan utama percobaan kedua adalah untuk menentukan bagaimana hasil yang diperoleh dalam percobaan sebelumnya berubah ketika fitur spektral rangsangan (suara) diperhitungkan. Kebutuhan untuk menguji noise datar spektral pada intensitas suara rendah adalah bahwa bagian-bagian dari spektrum mungkin tidak terdengar, dan ini dapat mempengaruhi penentuan arah suara. Oleh karena itu, fakta bahwa lebar bagian yang dapat didengar dari spektrum dapat berkurang dengan menurunnya intensitas suara dapat disalahartikan sebagai hasil dari percobaan pertama.

Oleh karena itu, diputuskan untuk melakukan percobaan lain, tetapi sudah menggunakan kembali * A-weighted noise.
A-weighting * diterapkan pada level suara untuk memperhitungkan kenyaringan relatif yang dirasakan oleh telinga manusia, karena telinga kurang sensitif terhadap frekuensi suara rendah. A-weighting diimplementasikan dengan aritmatika menambahkan tabel nilai yang terdaftar dalam pita oktaf ke tingkat tekanan suara yang diukur dalam dB.
Grafik 2D menunjukkan data mentah (lingkaran) dan data (garis) yang disesuaikan dengan model NMLE untuk semua peserta dalam percobaan.

Analisis data menunjukkan bahwa ketika semua bagian suara kira-kira sama-sama terdengar (dalam percobaan pertama dan kedua), lateralitas yang dirasakan dan kemiringan pada grafik menjelaskan perubahan lateralitas dengan ITD berkurang dengan penurunan intensitas suara.

Dengan demikian, hasil percobaan kedua mengkonfirmasi hasil yang pertama. Artinya, dalam praktiknya ditunjukkan bahwa model yang diusulkan kembali pada tahun 1948 oleh Jeffress tidak benar.

Ternyata lokalisasi suara memburuk dengan penurunan intensitas suara, dan Jeffress percaya bahwa suara dirasakan dan diproses oleh seseorang secara setara tanpa memandang intensitasnya.

Untuk pengenalan yang lebih rinci dengan nuansa penelitian ini, saya sarankan Anda melihat laporan para ilmuwan .

Epilog


Asumsi teoritis dan percobaan praktis yang mengkonfirmasikannya menunjukkan bahwa neuron otak mamalia diaktifkan pada kecepatan yang berbeda tergantung pada arah sinyal suara. Setelah ini, otak membandingkan kecepatan ini antara semua neuron yang terlibat dalam proses untuk memetakan lingkungan suara secara dinamis.

Model Jeffresson sebenarnya tidak 100% keliru, karena dapat digunakan untuk menggambarkan dengan sempurna lokasi sumber suara dalam burung hantu gudang. Ya, untuk burung hantu gudang, intensitas suara tidak masalah, mereka akan menentukan posisi sumbernya. Namun, model ini tidak bekerja dengan monyet rhesus, seperti yang ditunjukkan oleh percobaan sebelumnya. Oleh karena itu, model Jeffresson ini tidak dapat menggambarkan lokalisasi suara untuk semua makhluk hidup.

Eksperimen dengan orang-orang sekali lagi menegaskan bahwa lokalisasi suara terjadi pada organisme yang berbeda dengan cara yang berbeda. Banyak peserta tidak dapat menentukan posisi sumber sinyal suara dengan benar karena intensitas suara yang rendah.

Para ilmuwan percaya bahwa karya mereka menunjukkan kesamaan tertentu antara cara kita melihat dan bagaimana kita mendengar. Kedua proses berhubungan dengan kecepatan neuron di berbagai bagian otak, serta penilaian perbedaan ini untuk menentukan posisi objek yang kita lihat di ruang angkasa dan posisi sumber suara yang kita dengar.

Di masa depan, para peneliti akan melakukan serangkaian percobaan untuk lebih meneliti hubungan antara pendengaran manusia dan penglihatan, yang akan membantu kita lebih memahami bagaimana otak kita secara dinamis membangun peta dunia di sekitar kita.

Terima kasih atas perhatian Anda, tetap ingin tahu dan selamat bekerja, kawan! :)

Terima kasih telah tinggal bersama kami. Apakah Anda suka artikel kami? Ingin melihat materi yang lebih menarik? Dukung kami dengan melakukan pemesanan atau merekomendasikan kepada teman Anda, cloud VPS untuk pengembang mulai dari $ 4,99 , diskon 30% untuk pengguna Habr pada analog unik dari server entry-level yang kami ciptakan untuk Anda: Seluruh kebenaran tentang VPS (KVM) E5-2650 v4 (6 Core) 10GB DDR4 240GB SSD 1Gbps dari $ 20 atau bagaimana cara berbagi server? (opsi tersedia dengan RAID1 dan RAID10, hingga 24 core dan hingga 40GB DDR4).

Dell R730xd 2 kali lebih murah? Hanya kami yang memiliki 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV dari $ 199 di Belanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - mulai dari $ 99! Baca tentang Cara Membangun Infrastruktur Bldg. kelas menggunakan server Dell R730xd E5-2650 v4 seharga 9.000 euro untuk satu sen?

Source: https://habr.com/ru/post/id476396/


All Articles