AI sendiri belajar cara membangun Rubik's Cube



Program komputer telah lama dapat bermain catur, dan platform yang relatif baru khusus dari Deep Mind bahkan telah dilatih untuk bermain go secara profesional. Begitu profesional sehingga tidak ada pemain di antara orang yang setara dengan komputer, dan kemungkinan besar tidak akan.

Beberapa hari yang lalu diketahui bahwa mesin itu secara mandiri belajar memecahkan teka-teki rumit lainnya - Rubik's Cube. Selain itu, selama pelatihan, mereka tidak menunjukkan kepadanya cara merakit kubus dengan benar, platform perangkat lunak yang dibuat oleh para ilmuwan dari AS mempelajari semuanya secara mandiri. Beberapa ahli percaya bahwa "benteng yang lain, yang dianggap milik manusia", jatuh di depan mesin.

Kubus Rubik, atau lebih tepatnya, algoritma rakitannya , rumit karena setiap aksi rakitan memiliki konsekuensi tertentu, tetapi agak sulit untuk memperkirakan efeknya pada keseluruhan proses perakitan. Bahkan untuk mobil. Orang biasanya belajar cara merakit kubus sesuai dengan algoritma yang dikembangkan sebelumnya yang memungkinkan memecahkan teka-teki dalam waktu sesingkat mungkin.

Beberapa siswa membuat kesuksesan luar biasa di bidang ini. Jadi, pada bulan Mei tahun ini , rekor lain ditetapkan untuk merakit kubus Rubik dengan dua tangan. Sang juara, pemain Australia berusia 22 tahun bernama Felix Zemdegs, mampu mengumpulkan kubus hanya dalam 4,22 detik. Dia mulai berlatih sejak usia 12 tahun, menonton rekaman kebaktian di YouTube.


Sedangkan untuk mobil, robot mengumpulkan kubus lebih cepat. Tahun ini rekornya ditetapkan dalam 0,38 detik. Itu bisa saja lebih cepat, tetapi mekanisme kubus itu sendiri tidak tahan. Dalam upaya untuk membuat rekor, para pengembang harus memperkuat desain kubus, jika tidak maka akan jatuh terpisah dari manipulasi mesin yang terlalu cepat.


Dalam kasus platform yang dijelaskan di atas, pekerjaan dilakukan sesuai dengan algoritma yang sebelumnya dimasukkan ke dalam memori sistem. Tetapi para ilmuwan dari MIT mampu melatih sistem mereka sendiri untuk merakit Cube sendiri.



Saat membuat kubus itu sendiri, penemunya tugas yang paling menarik adalah mengembangkan cara memecahkan teka-teki dari posisi mana pun. Insinyur Rubik berhasil melakukan ini dalam sebulan. Di masa depan, algoritma perakitan telah berulang kali diperbaiki.

Baru-baru ini, para ahli AI telah mulai mencari cara untuk mengajarkan mesin bagaimana membuat mati. Pembelajaran dengan mesin dalam digunakan. Sistem diberi tugas dan aturan dijelaskan. Selanjutnya, robot harus bertindak sendiri. Dalam hal kemajuan, mesin menerima hadiah - sesuatu seperti itu dan mengajarkan bentuk-bentuk AI yang lemah. Lagi pula, komputer harus tahu apa yang bergerak ke arah yang benar. Dan mereka membiarkan dia tahu ini melalui sistem imbalan. Semua ini membantu mesin untuk belajar.

Dalam kasus Rubik's Cube, ini agak lebih rumit daripada dalam kasus yang biasa. Faktanya adalah bahwa sampai saat tertentu tidak mungkin untuk memahami apakah sistem berfungsi dengan benar atau tidak. Dan tidak ada gunanya memberi hadiah untuk pergantian wajah yang tidak disengaja yang tidak membuahkan hasil. Dalam catur, semuanya lebih sederhana - sudah ada dari langkah kedua atau ketiga Anda dapat memahami ke arah mana permainan bergerak dan apakah mesin bekerja dengan baik atau tidak. Oleh karena itu, ada sesuatu yang bermanfaat.

Untuk mengajari komputer cara membuat kubus Rubik, digunakan teknologi pembelajaran khusus, yang disebut "iterasi autodidactic". Teknologi ini memungkinkan Anda untuk "memutar" kubus yang sudah terpasang untuk mencapai konfigurasi yang mirip dengan yang sekarang. Ternyata seperti reverse engineering, jika istilah ini berlaku untuk pembelajaran mesin. "Pohon keputusan" khusus dibuat, yang digunakan mesin untuk menghitung langkah-langkah untuk setiap konfigurasi.

Hasilnya sangat mengesankan. Menurut pengembang sendiri, algoritme dapat memecahkan teka-teki dalam sekitar 30 gerakan. Selain itu, mesin mengumpulkan kubus di 100% kasus, tidak peduli apa versi puzzle yang dibongkar itu datang. Secara umum, untuk menyusun puzzle yang terfragmentasi dengan baik, Anda membutuhkan 19 hingga 23 langkah. Beberapa solusi mengarah pada hasil yang diinginkan lebih cepat daripada yang lain. Algoritma build tercepat terdiri dari 21 langkah.

Platform, yang dikembangkan oleh para insinyur MIT, disebut DeepCube. β€œPlatform kami mampu belajar sendiri di lingkungan yang kompleks, hanya menerima satu penghargaan untuk seluruh proses kerja,” kata laporan itu.

Sekarang tim ilmuwan yang sama sedang mengerjakan implementasi metode pengajarannya untuk menyelesaikan masalah kombinatorial kompleks lainnya. Antara lain, prediksi struktur protein tersier .

Source: https://habr.com/ru/post/id414463/


All Articles