👨🏼‍🚒 🚴 👎 MIT telah mengembangkan jenis antarmuka baru yang memungkinkan Anda mengubah "pikiran" menjadi suara 🤚🏿 👊🏼 💒

Arnav Kapoor, salah satu pengembang jenis antarmuka baru, mendemonstrasikan pengoperasian perangkat

Insinyur MIT telah menciptakan sistem yang menyalin kata dan kalimat yang diucapkan sendiri ke dalam teks. Agar sistem berfungsi dengan baik, operatornya perlu mengucapkan kata dan frasa dengan jelas untuk diri mereka sendiri. Dalam hal ini, otot-otot wajah, tenggorokan, dan lidah yang bertanggung jawab untuk berbicara mulai bekerja. Mereka tidak bekerja dengan kekuatan penuh, tetapi hanya mengaktifkan, yang cukup untuk sistem baru untuk "membaca".

Dari luar, terlihat seperti ini - seseorang hanya diam, dan sistem "berbicara", atau lebih tepatnya mencetak. Pengembangan ini terdiri dari dua bagian: gadget yang harus dikenakan di wajah dan jaringan saraf yang "terlatih" khusus, yang menganalisis informasi yang diterima dan menghubungkannya dengan huruf dan kata-kata. Selain itu, antarmuka memungkinkan Anda untuk mengontrol gadget - beralih saluran di TV, melacak biaya dan menjaga aktivitas yang cukup normal.

Gadget yang akan dikenakan di telinga termasuk "earphone tulang", yaitu earphone yang mengalirkan suara sepanjang tulang ke telinga bagian dalam. Saluran eksternal tetap terbuka dan seseorang mendengar segala sesuatu yang terjadi di sekitarnya.

Sistem seperti ini sangat portabel dan cocok untuk dipakai baik di jalan maupun di rumah. Beberapa cara untuk menggunakannya tidak biasa. Misalnya, Anda dapat bermain catur, berbicara sendiri tentang pergerakan musuh dan mendapatkan bantuan dari komputer.

Anda dapat menggunakan pengembangan tidak hanya untuk orang dengan masalah fisik, tetapi juga untuk pengguna biasa dalam berbagai situasi. Tugas pengembang adalah menciptakan sistem yang dapat meningkatkan kemampuan seseorang, melengkapi kecerdasannya dan, dalam beberapa hal, indranya.

“Kami tidak lagi dapat hidup tanpa smartphone dan perangkat digital lainnya,” kata Petty Maes, salah satu peserta proyek. “Tetapi penggunaan gadget ini mencegah kita, kita perlu menyela untuk bekerja dengannya. Misalnya, ada percakapan, dan tiba-tiba ada kebutuhan untuk menggunakan telepon. Anda harus menemukannya, mengambilnya, memasukkan kata sandi dan membuka aplikasi. Oleh karena itu, saya dan siswa saya bereksperimen dengan jenis sistem baru dan faktor bentuk mereka untuk waktu yang lama, yang memungkinkan orang untuk mengambil keuntungan dari teknologi dan layanan modern tanpa terganggu oleh gadget, sebenarnya. ”

Hasilnya dilaporkan pada konferensi ACM Intelligent User Interface conference dari Association for Computing Machinery.

Pada prinsipnya, gagasan yang diajukan oleh para ilmuwan bukanlah hal baru. Itu muncul di suatu tempat di abad ke-19, dan dengan munculnya teknologi baru, mereka mulai bekerja dengan serius pada implementasinya. Pada tahun 60-an, berbicara frasa dan kata-kata kepada diri sendiri saat membaca mulai dianggap sebagai faktor eksternal yang menghambat membaca cepat (pada kenyataannya, itu adalah). Tetapi berbicara memiliki kelebihan, dapat digunakan dalam pengembangan antarmuka komputer. Salah satu contoh diberikan di atas.

Dalam proses menciptakan sistem, para ilmuwan pertama-tama perlu memahami otot-otot pada wajah orang yang paling aktif terlibat dalam proses berbicara. Setelah itu, pengembangan perangkat prototipe untuk mengubah "pikiran menjadi teks" dimulai. Elemen sensor sinyal utama sistem adalah 16 elektroda.

Mereka mengambil kesaksian dan mengecek apa yang dikatakan orang itu pada dirinya sendiri. Kemudian, berdasarkan array data yang diterima, para pengembang mulai melatih jaringan saraf. Ngomong-ngomong, awalnya perangkat menutupi kedua sisi wajah. Tapi kemudian ternyata jaringan saraf mengubah sinyal menjadi teks tanpa masalah bahkan jika elektroda hanya di satu sisi wajah. Oleh karena itu, untuk mengurangi ukuran sistem, itu dibelah dua.

Pelatihan jaringan saraf mulai kecil - hanya dengan 20 kata. Seiring waktu, kamus meningkat, dan jaringan saraf menjadi lebih "pintar". Menurut para ilmuwan, itu dapat dipersonalisasi untuk siapa saja, meningkatkan akurasi pengakuan "pikiran". Semakin banyak pelatihan yang Anda miliki, semakin baik sistem akan bekerja.

Para pengembang tidak punya rencana untuk menyempurnakannya, ini hanya pembuktian konsep. Teknologi ini dapat digunakan di banyak bidang, termasuk manufaktur. Anda dapat membayangkan sebuah perusahaan industri, tingkat kebisingan di mana mengganggu komunikasi normal karyawan tentang masalah pekerjaan. Dalam hal ini, Anda dapat menggunakan sistem seperti itu. Situasi serupa terjadi pada petugas pemadam kebakaran atau penyelam. Mereka tidak perlu bicara, sistem akan menyuarakan "pikiran".

Sejauh ini, kita tidak berbicara tentang komersialisasi teknologi, tetapi perkembangan seperti itu juga tidak dikecualikan.

MIT telah mengembangkan jenis antarmuka baru yang memungkinkan Anda mengubah "pikiran" menjadi suara

More articles: