Jaringan Jerapah Jerapah Belajar Bermain Catur di Tingkat Master FIDE Internasional dalam 72 Jam
Siswa di Imperial College London Matthew Lai mengembangkan program komputer Giraffe , yang bermain catur selama tiga hari dengan sendirinya - dan mampu mengekstraksi semua pengetahuan khusus domain yang diperlukan untuk bermain di tingkat master FIDE internasional. Untuk ini, sumber daya komputasi komputer normal sudah cukup baginya. Pelatihan jaringan saraf mengambil 72 jam dalam 20 utas pada mesin dengan dua prosesor 10-core Xeon E5-2660.Dalam karya ilmiah, penulis menulis bahwa setelah pelatihan selama 72 jam, program memilih langkah terbaik dalam 46% kasus, dan salah satu dari tiga gerakan terbaik dalam 70% kasus. Ini adalah hasil yang sangat baik bahkan untuk program catur reguler.Semua orang tahu fakta bahwa komputer bermain catur lebih baik daripada orang, tetapi tidak semua orang mengerti mengapa mereka mencapai kemenangan, karena kekuatan kasar yang sederhana tidak cukup untuk memilah-milah semua 10 123 kemungkinan gerakan dan jawaban lawan.Pertama, program catur membatasi kedalaman maksimum perhitungan cabang. Kedua, mulai dari Deep Blue dan berakhir dengan juara saat ini di antara catur komputer Komodo, mereka tidak mungkin mengalahkan seseorang jika grandmaster tidak mengkonfigurasi modul evaluasi posisiatau orang-orang yang sangat berpengetahuan luas dalam catur, seperti tim pengembangan Deep Blue dari IBM. Program ini awalnya meletakkan dasar bukaan dan trik khas permainan, seperti membela raja dengan bidak atau menyerang raja dalam posisi terbuka dengan gajah berwarna-warni.Penilaian posisi yang kompeten memungkinkan program untuk memilih cabang yang paling disukai untuk pengembangan partai.Dalam hal ini, menjadi jelas mengapa program Jerapah baru sangat berbeda dari yang lain. Tidak ada yang menyetemnya, dia sendiri belajar bermain. Selain itu, alih-alih kekuatan kasar cabang dengan batas kedalaman, program ini menggunakan pendekatan "probabilistik". Dia mempelajari lebih dalam cabang-cabang yang kemungkinan kelanjutannya lebih lama.Ilustrasi menunjukkan pohon keputusan. Node pohon terlihat berwarna kuning, yang terlihat oleh algoritma standar dengan batasan panjang cabang. Hijau - node hanya terlihat oleh algoritma probabilitas-terbatas (Jerapah). Warna merah menunjukkan node terlihat untuk kedua algoritma.
Algoritma semacam itu didasarkan pada premis bahwa lawan juga akan merespons dengan gerakan terbaik di antara yang mungkin - dan permainan akan ditunda untuk jumlah gerakan maksimum. Ini adalah cabang yang dipilih Giraffe untuk analisis lebih dalam. Dalam arti tertentu, logika program ini mirip dengan logika pemain catur berpengalaman yang "secara intuitif" merasakan cara paling menguntungkan untuk mengembangkan permainan.Ternyata sampai saat ini, kemajuan dalam pengembangan jaringan saraf telah mencapai tingkat sedemikian sehingga satu siswa dapat menulis sebuah program yang dapat belajar bermain catur pada tingkat yang sangat tinggi secara mandiri dalam tiga hari. Diagram berikut menunjukkan arsitektur jaringan saraf yang awalnya diletakkan penulis. Dia juga menyusun seperangkat posisi awal untuk program pelatihan.
Beginilah posisi disajikan dalam program.
Profesor ilmu komputer PS Sebastian Thrun adalah salah satu yang pertama di dunia yang menggunakan jaringan saraf dalam program catur. Pada pertengahan 90-an, ia mengembangkan program NeuroChess . Namun, seperti program Giraffe saat ini, pengembangan itu juga tidak bisa mengalahkan perwakilan terbaik dari "sekolah klasik".Source: https://habr.com/ru/post/id384253/
All Articles