
Meskipun usianya cukup besar, permainan
Pac-Man , berbagai versi, masih sangat populer. Penggemar permainan secara teratur bersaing satu sama lain dalam siapa yang akan mencetak poin terbanyak selama bagian ini. Pengembang AI juga mempelajarinya, meningkatkan keterampilan sistem mereka dalam melewati game.
Tim pengembangan dari startup Kanada Maluuba, yang sebelumnya diakuisisi oleh Microsoft,
mampu membuat platform perangkat lunak yang menunjukkan hasil yang sangat baik ketika melewati Ms. Pac-Man, versi game ini untuk Atari 2600. Program ini memecahkan semua rekor yang ditetapkan sebelumnya, mendapatkan 999.990 poin.
Omong-omong, game
ini dibuat pada tahun 1982. Kemudian Atari Inc. Dirilis port game arcade arcade Pac-Man Namco. Seperti dalam versi aslinya, Anda harus mengontrol protagonis dengan joystick. Protagonis harus bergerak melalui labirin, mendapatkan poin, sambil menghindari hantu. Pencipta permainan porting adalah Tod Fry.
Menurut beberapa ahli, fakta bahwa platform perangkat lunak mencetak jumlah poin maksimum dalam permainan adalah pencapaian yang signifikan di bidang kecerdasan buatan (bentuknya yang lemah). Faktanya adalah bahwa platform perangkat lunak lain menunjukkan hasil yang kurang berhasil - permainan ternyata cukup rumit untuk AI. Tentu saja, tidak semua pengembang membuat proyek berdasarkan catatan pada Ms. Pac-Man, tetapi mereka yang mengerjakannya, berbicara tentang sejumlah besar masalah teknis ketika mencoba menunjukkan hasil yang berarti.
Untuk mencapai kesuksesan, tim Maluuba memutuskan untuk membagi permainan menjadi sekelompok elemen kecil, dengan mencari solusi untuk berinteraksi dengan masing-masing elemen tersebut. Selanjutnya, unsur-unsur ini didistribusikan di antara agen AI, yang masing-masing menyelesaikan tugas spesifiknya. Doina Prekap, seorang profesor di Universitas McGill di Montreal, menyatakan bahwa gagasan yang diajukan oleh para pengembang patut mendapat perhatian. Menurutnya, inilah cara otak manusia bekerja dalam beberapa kasus - memecah masalah menjadi beberapa komponen dan berturut-turut memecahkan setiap elemen.
Para pengembang menyebut metode mereka, Hybrid Reward Architecture, menggunakan lebih dari 150 agen AI, yang masing-masing bekerja secara paralel dengan yang lain dalam proses melewati permainan. Selain itu, masing-masing agen menerima "hadiah" setelah berhasilnya bagian dari permainan sendiri.
Selain agen "kecil", ada agen tingkat atas lain yang terlibat dalam menyatukan semua data yang diterima dari semua "bawahan". Dia juga memutuskan di mana sosok pahlawan harus bergerak. Dalam hal ini, sejumlah besar data dianalisis. Faktor utama adalah arah gerakan yang dipilih oleh jumlah maksimum agen dasar. Di sisi lain, jika 100 agen ingin pergi ke kanan untuk mendapatkan trofi, tetapi 3 agen berencana untuk belok kiri, karena mereka melihat hantu, maka agen utama "mendengarkan" tiga ini.
Menurut kepala pengembang, sistem mulai menunjukkan hasil yang lebih baik setelah agen diprogram untuk perilaku egois. Yaitu, masing-masing dari mereka membuat keputusan tanpa melihat yang lain. Tetapi keputusan umum tentang arah gerakan pahlawan dibuat oleh agen utama. Dia mengevaluasi berbagai faktor dan perintah ke mana harus pergi.
"Ini adalah keseimbangan antara, di satu sisi, kebutuhan untuk interaksi, dan di sisi lain, kebutuhan untuk membuat keputusan individu," kata Harm van Seijen, kepala tim peneliti Microsoft.
Tetapi mengapa pada umumnya diputuskan untuk memilih Ms. Pac-Man? Memilih game ini mungkin terlihat aneh bagi kebanyakan orang. Tetapi para ahli mengatakan bahwa tidak ada yang aneh di sini, karena kelas permainan ini cukup rumit untuk kecerdasan mesin, karena ada banyak situasi "darurat" dalam satu unit waktu, yang masing-masing membutuhkan versi pengembangan peristiwa sendiri. Dan untuk menemukan solusi Anda perlu "berpikir" hampir seperti orang, seperti yang disebutkan di atas.
βBanyak perusahaan sedang mengerjakan AI untuk permainan, mengembangkan proyek mereka sendiri, karena passing membutuhkan banyak kualitas manusia,β kata Raul Mehrotra, salah satu programmer Maluuba.
Platform perangkat lunak yang dikembangkan di Microsoft
beroperasi menurut metode pembelajaran mesin yang disebut pembelajaran penguatan. Selama bekerja, sistem pengujian (agen atau agen) belajar dengan berinteraksi dengan lingkungan. Ini, menurut definisi, adalah jenis percobaan cybernetic. Metode pembelajaran yang diperkuat adalah salah satu jenis pengajaran dengan guru, tetapi media atau modelnya adalah guru. Agen bertindak terhadap lingkungan, dan pada gilirannya mempengaruhi agen. Umpan balik muncul.
Proyek itu sendiri bukan teori murni. Menurut pengembang, platform perangkat lunak yang dibuat dapat digunakan di banyak daerah. Misalnya, Anda dapat menariknya untuk bekerja di dalam perusahaan yang menjual untuk memprediksi dinamika masuknya pelanggan, popularitas barang dan hal-hal penting lainnya. Sistem ini dapat bekerja dengan tren umum dan dengan faktor individu, termasuk pembeli individu.