Robot MIT Mempelajari Jenga Mengandalkan Visi dan Sentuhan



Pendekatan khusus untuk pembelajaran mesin dapat membantu robot mempelajari cara merakit ponsel dan bekerja dengan bagian-bagian kecil lainnya di jalur perakitan.

Di ruang bawah tanah gedung MIT ke-3, robot dengan hati-hati merenungkan langkah selanjutnya. Dia dengan lembut menusuk menara dari balok, mencari balok yang paling cocok untuk peregangan, agar tidak menghancurkan seluruh menara. Demikianlah permainan Jenga yang soliter, lambat, namun mengejutkan, dinamis.

Robot, yang dikembangkan oleh para insinyur dari MIT, dilengkapi dengan pegangan dengan pin lembut, gelang dengan sensor tekanan dan kamera eksternal - dan mereka menggunakan semua ini untuk melihat dan merasakan seluruh menara dan blok individualnya.

Sementara robot dengan lembut menekan unit, komputer menerima umpan balik visual dan sentuhan dari kamera dan gelang, membandingkan pengukuran dengan gerakan sebelumnya. Dia juga menghitung kemungkinan konsekuensi dari gerakan ini - khususnya, apakah mungkin untuk berhasil mengekstraksi blok tertentu, mengingat konfigurasi spesifik menara dan dengan penerapan kekuatan dengan ukuran tertentu. Kemudian, secara real time, robot “belajar” apakah perlu untuk terus memberi tekanan pada blok, atau apakah perlu untuk beralih ke yang baru untuk mencegah menara jatuh.

Penjelasan rinci tentang robot yang bermain "Jenga" diterbitkan pada bulan Januari di jurnal Science Robotics. Alberto Rodriguez, Associate Professor, Career Center Walter Henry Gale dari Departemen Teknik MIT mengatakan robot menunjukkan sesuatu yang sulit dicapai ketika mengembangkan sistem sebelumnya: kemampuan untuk dengan cepat mempelajari cara terbaik untuk menyelesaikan tugas, tidak hanya dari data visual, yang pendekatannya sering digunakan dalam robot, tetapi juga dari sentuhan, fisik interaksi.

“Tidak seperti tugas atau permainan yang lebih diisi secara logis, misalnya, catur atau pergi, untuk bermain Dzhenga Anda harus memiliki keterampilan fisik yang baik - untuk menyelidiki, menarik, menempatkan, dan meluruskan blok. Ini membutuhkan persepsi dan manipulasi interaktif, Anda perlu menyentuh menara untuk memahami bagaimana dan kapan harus memindahkan balok, kata Rodriguez. - Sangat sulit untuk mensimulasikan tugas seperti itu, sehingga robot harus belajar di dunia nyata, berinteraksi dengan menara Jenga yang asli. Kesulitan utama adalah kebutuhan untuk belajar dari sejumlah kecil percobaan, menggunakan akal sehat ketika diterapkan pada benda dan fisika. "

Dia mengatakan bahwa sistem pembelajaran sentuhan yang mereka kembangkan dapat digunakan untuk tugas-tugas selain Jenga, terutama yang membutuhkan interaksi fisik yang hati-hati, seperti memilah sampah yang dapat didaur ulang atau mengumpulkan produk konsumen.

“Pada jalur perakitan untuk telepon, pada hampir setiap langkah Anda memerlukan perasaan bahwa bagian itu ada di tempatnya, atau bahwa sekrup dikencangkan - semua ini berasal dari sensasi sentuhan dan kekuatan, bukan yang visual,” kata Rodriguez. "Model pendidikan dari tindakan seperti itu adalah segmen paling lezat dari teknologi ini saat ini."

Penulis utama karya ini adalah mahasiswa pascasarjana MIT Nima Faseli. Tim ini juga termasuk: Mikel Oller, Jiajun Wu, Zheng Wu dan Joshua Tenenbaum, profesor ilmu kognitif dan penelitian otak di MIT.


Dorong dorong


Dalam permainan "Jenga", yang dalam bahasa Swahili berarti "membangun", 54 blok persegi panjang ditempatkan dalam 18 lapisan masing-masing 3 blok, sehingga pada lapisan yang berdekatan blok-blok tersebut terletak saling tegak lurus. Tujuan permainan ini adalah untuk menghapus blok dengan hati-hati dan meletakkannya di atas menara, membangun level baru sehingga menara tidak jatuh.

Untuk memprogram robot untuk bermain Jenga, skema pembelajaran mesin tradisional (MO) perlu menjelaskan secara umum segala sesuatu yang dapat terjadi ketika sebuah blok, robot dan menara berinteraksi - ini adalah perhitungan yang cukup mahal yang memerlukan pemrosesan data dari ribuan atau bahkan puluhan ribu upaya untuk mendapatkan blokir

Sebagai gantinya, Rodriguez dan rekan-rekannya mulai mencari cara, lebih efisien dari sudut pandang menggunakan data, agar robot mempelajari cara memainkan game "Jenga", yang terinspirasi oleh kemampuan kognitif manusia dan bagaimana kita sendiri dapat mendekati game ini.

Tim mengadaptasi standar pegangan robot ABB IRB 120 untuk industri untuk tugas tersebut, dan kemudian memasang menara Jenga di tempat yang mudah dijangkau untuk penangkapan, dan periode pelatihan dimulai. Pada awalnya, robot memilih blok acak dan tempat di blok mana perlu ditekan. Kemudian dia berusaha sedikit, mencoba memeras blok keluar dari menara.

Selama setiap upaya, komputer merekam pengukuran visual dan sentuhan yang terkait dengannya, dan mencatat apakah itu berhasil.

Alih-alih melakukan puluhan ribu upaya seperti itu (maka menara harus dipulihkan berkali-kali), robot hanya dilatih oleh 300 orang. Upaya untuk pengukuran dan hasil yang serupa dikelompokkan, menunjukkan aspek-aspek tertentu dari perilaku balok. Misalnya, satu kelompok data dapat menunjukkan upaya untuk memindahkan blok yang menahan gerakan, yang lain - bekerja dengan blok yang bergerak dengan mudah, dan yang ketiga - upaya yang menyebabkan jatuhnya menara. Untuk setiap kelompok data, robot mengembangkan model sederhana yang memprediksi perilaku blok berdasarkan pada pengukuran visual dan sentuhan saat ini.

Faseli mengatakan bahwa teknologi pengelompokan seperti itu secara serius meningkatkan efisiensi robot dalam mempelajari permainan ini, dan terinspirasi oleh cara alami orang mengelompokkan perilaku benda yang serupa. "Robot membangun cluster data dan kemudian mempelajari model untuk masing-masing cluster ini, alih-alih mempelajari modelnya, menjelaskan semua yang dapat terjadi pada prinsipnya."

Mengumpulkan tumpukan


Para peneliti menguji pendekatan mereka dengan membandingkannya dengan algoritma MO canggih dalam simulasi komputer dari sebuah game menggunakan simulator MuJoCo. Data yang diperoleh dalam simulator memungkinkan para ilmuwan untuk memahami bagaimana robot akan belajar di dunia nyata.

"Kami menyediakan algoritma ini dengan data yang sama dengan yang diterima sistem kami untuk melihat bagaimana mereka bisa belajar bermain Jenga pada level yang sama," kata Oller. "Dibandingkan dengan pendekatan kami, algoritma ini untuk menguasai permainan harus bermain dengan jumlah menara, beberapa urutan besarnya lebih tinggi dari yang kami miliki."

Tim menjadi tertarik pada apakah pendekatan mereka ke Wilayah Moskow dapat bersaing dengan pemain manusia, dan mengadakan beberapa kompetisi informal dengan sukarelawan.

"Kami melihat berapa banyak balok yang bisa keluar dari menara sebelum jatuh, dan perbedaannya tidak sebesar itu," kata Oller.

Namun, ada cara untuk benar-benar mengadu robot dan manusia, jika peneliti mau. Selain interaksi fisik, untuk memainkan "Jenga" Anda memerlukan strategi, mengekstraksi blok yang cocok sehingga lawan Anda lebih sulit untuk menarik blok berikutnya tanpa menjatuhkan menara.

Sejauh ini, tim tidak begitu tertarik untuk menciptakan robot yang memenangkan "Jenga", lebih sibuk menggunakan keterampilan baru di bidang lain.

"Ada banyak tugas yang kami lakukan dengan tangan kami, di mana perasaan" melakukannya dengan benar "dapat diekspresikan dalam bahasa kekuatan dan dorongan sentuhan," kata Rodriguez. "Suatu pendekatan yang mirip dengan kita mungkin berguna untuk tugas-tugas seperti itu."

Source: https://habr.com/ru/post/id441422/


All Articles