Google mengajarkan robot untuk melakukan tugas baru di "taman kanak-kanak"


Di taman kanak-kanak, robot belajar membuka pintu.Kemampuan

belajar adalah salah satu yang paling penting bagi robot. Jika mereka mulai belajar, mengumpulkan informasi yang mereka butuhkan dari waktu ke waktu, maka mereka dapat digunakan untuk melakukan tugas-tugas kompleks yang tidak diprogram sebelumnya. Tugas bisa sangat berbeda - dari merawat orang tua dan pasien di rumah sakit hingga membersihkan tempat. Benar, jika Anda harus melatih masing-masing robot secara terpisah, itu akan membutuhkan banyak waktu. Tetapi bagaimana jika robot mengajar robot? Dan bagaimana jika kelompok robot mulai belajar bersama?

Masalah ini jauh dari baru, telah dijelaskan lebih dari satu kali oleh penulis fiksi ilmiah. Spesialis robotika dan kecerdasan buatan juga mencoba menyelesaikan masalah ini. Google lebih dari yang lainDia tertarik belajar dari robot. Mungkin salah satu cara termudah untuk mencapai apa yang Anda inginkan adalah membuat database pengetahuan umum tentang robot, di mana informasi yang dikumpulkan oleh masing-masing mesin akan dikumpulkan.

Semua robot harus terhubung ke pangkalan ini. Jika satu robot mempelajari sesuatu, semua orang segera mendapatkan pengetahuan dan pengalaman. Karyawan Google menguji ide ini (juga bukan baru) dalam praktiknya, dan mendapatkan hasil yang baik. Secara khusus, tindakan yang dilakukan oleh salah satu robot segera menjadi milik "rekan-rekan" nya.

Robot dapat melakukan tindakan yang sama dengan cara yang sangat berbeda. Terkadang lebih baik, kadang lebih buruk. Setiap informasi tentang tindakan ini ditangkap dan dikirim ke server, di mana ia diproses menggunakan jaringan saraf. Sistem kognitif mengevaluasi tindakan masing-masing mesin, dan hanya memilih informasi tentang pengalaman positif, membuang data tentang upaya gagal untuk menyelesaikan satu atau tugas lain. Robot memuat data yang diproses oleh jaringan saraf dengan frekuensi tertentu. Dan dengan setiap unduhan baru, mereka menjadi lebih efektif. Dalam video di bawah ini, robot mempelajari proses membuka pintu.


Setelah beberapa jam pelatihan, mesin mentransmisikan informasi tentang tindakannya ke jaringan bersama. Dalam proses menguasai pembukaan pintu, robot mempelajari detail prosedur ini, secara bertahap "memahami" peran yang dimainkan oleh pegangan pintu dan apa yang perlu dilakukan untuk membuka pintu secepat mungkin.


Proses belajar coba-coba itu bagus, tetapi tidak sempurna. Orang dan hewan, misalnya, juga dapat menganalisis unsur-unsur lingkungan, mengevaluasi kemungkinan dampaknya pada tindakan mereka. Ketika manusia dan hewan tumbuh, gambaran dunia tertentu terbentuk. Jelas bahwa pada manusia itu jauh lebih rumit daripada pada kebanyakan hewan, tetapi ada elemen serupa dalam kedua kasus.

Karena itu, insinyur Google memutuskan untuk menunjukkan kepada robot bagaimana hukum fisika memengaruhi tindakan mereka. Dalam satu percobaan, robot diinstruksikan untuk mempelajari berbagai benda yang umum untuk setiap rumah atau kantor. Ini adalah pensil, pena, buku, dan barang-barang lainnya. Robot dengan cepat mempelajari dan memberikan informasi itu kepada "kolega" mereka. Seluruh tim robot dalam waktu singkat menerima konsep konsekuensi dari tindakan mereka.



Dalam percobaan baru, insinyur memerintahkan robot untuk memindahkan objek tertentu ke titik tertentu. Namun, sistem tidak menerima instruksi apa pun tentang sifat objek. Objek terus berubah. Ini bisa berupa botol air, sekaleng bir, pena atau buku. Ternyata, robot menyelesaikan tugas ini menggunakan data dari pengalaman sebelumnya tentang interaksi dengan dunia nyata. Mereka mampu menghitung konsekuensi dari memindahkan objek di permukaan ke titik yang diinginkan.

Tapi bagaimana dengan pria?


Dua percobaan sebelumnya dilakukan dengan partisipasi robot saja, tanpa bantuan manusia. Menurut Google, pelatihan sistem robot bisa berjalan lebih cepat jika seseorang membantu mesin. Bagaimanapun, seseorang dapat dengan cepat menghitung apa yang akan dihasilkan dari kinerja beberapa tindakan. Misalnya, dalam satu percobaan, seseorang membantu robot yang berbeda membuka berbagai jenis pintu. Setiap sistem menerima pintu dan kunci yang unik.

Akibatnya, strategi bersama dikembangkan untuk semua robot, yang disebut "politik." Semua aksi robot diproses menggunakan jaringan saraf yang dalam. Dia memproses gambar dari kamera yang merekam aksi robot, dan mentransfer informasi yang sudah diproses ke server pusat sudah dalam bentuk kebijakan.


Robot secara konsisten meningkatkan "kebijakan" mereka menggunakan coba-coba. Setiap robot berusaha membuka pintu menggunakan kebijakan terbaru saat ini. Tindakan robot masih diproses oleh jaringan saraf dan diunggah ke server. Seiring waktu, robot mulai bekerja jauh lebih efisien daripada yang pertama kali.


Setelah robot mulai bertindak dengan sukses, masing-masing instruktur yang bekerja dengan robot agak mengubah kondisi tugas. Perubahannya kuat (posisi pintu, sudut bukaan, dll.), Tetapi cukup sehingga kebijakan yang dikembangkan sebelumnya tidak sepenuhnya cocok untuk menyelesaikan masalah baru. Robot secara bertahap belajar untuk mengatasi kondisi baru untuk diri mereka sendiri, dan kemudian belajar untuk melakukan tugas yang paling sulit yaitu membuka pintu dan kunci yang berbeda. Eksperimen terakhir menunjukkan keefektifan jenis pelatihan ini: robot mampu membuka pintu dan kunci, yang belum mereka temui.


Para penulis proyek mengklaim bahwa interaksi robot satu sama lain dan gudang data pusat membantu mereka belajar lebih cepat dan lebih efisien. Dan penggunaan jaringan saraf secara signifikan meningkatkan hasil awal.

Sayangnya, sejauh ini daftar tugas yang dapat dilakukan robot sangat terbatas. Mereka hampir tidak diberi bahkan gerakan dan tugas yang paling sederhana, seperti membuka pintu atau mengangkat berbagai benda. Manusia masih dipaksa untuk memberi tahu robot apa yang harus dilakukan dan bagaimana harus bertindak. Tetapi algoritma secara bertahap membaik, dan jaringan saraf telah berhenti menjadi sesuatu yang mengejutkan. Karena itu, ada harapan bahwa dalam waktu dekat robot masih dapat melakukan tugas yang kompleks. Mungkin masa depan sudah ada di sini.

Source: https://habr.com/ru/post/id398013/


All Articles