
Ilmuwan dari Microsoft Research (MSR) Asia
telah menciptakan sistem kecerdasan buatan (AI) yang telah mempelajari seluk-beluk mahjong. Mahjong dianggap sebagai salah satu game paling sulit dalam hal penguasaan algoritma, seperti ada faktor acak di dalamnya.
Super Phoenix (Suphx) adalah sistem AI pertama yang menerima peringkat 10 dan (peringkat) di
Tenhou , platform kompetisi
riichi mahjong online dengan lebih dari 300.000 peserta dari seluruh dunia. Hanya 180 orang yang memiliki kualifikasi seperti itu. Ini adalah debit maksimum untuk algoritma saat ini, hanya beberapa profesional yang dikenal bermain di level yang lebih tinggi.
Untuk membuat sistem, pembelajaran penguatan digunakan - prinsip komprehensif algoritma pembelajaran berdasarkan kombinasi pembelajaran mendalam dan pembelajaran penguatan. Suphx menguasai seluk-beluk mahjong dengan berpartisipasi dalam 5.000 pertandingan dalam 4 bulan. Sistem ini secara bertahap meningkatkan kualitas dan kecepatan permainan. Sekarang algoritma memiliki strategi sendiri, yang mencakup gerakan sengaja lemah, yang memungkinkan pada akhirnya untuk mendapatkan keuntungan yang lebih besar.
Tidak seperti catur dan pergi, di mana AI telah membuat kemajuan yang signifikan, mahjong adalah permainan dengan informasi yang tidak lengkap. Tidak semua faktor diketahui oleh peserta, misalnya, tidak mungkin untuk melihat gambar pada buku-buku jari lawan. Proses permainan menyerupai poker - peserta membutuhkan ingatan yang baik, pengamatan, pemikiran strategis dan kemampuan untuk menggertak.
Menurut para ilmuwan dari MSR, keberadaan faktor acak dalam mahjong adalah tantangan unik untuk sistem AI, dan pengalaman yang diperoleh dalam pengajaran algoritma untuk masalah non-linear dapat menemukan penerapannya dalam situasi kehidupan nyata yang melibatkan serangkaian faktor yang tidak diketahui.
Microsoft Research dan Maluuba sebelumnya
melatih kecerdasan buatan pada Ms. Pac-Man, yang dirilis untuk salah satu konsol rumah Atari 2600 pertama. Algoritma memecahkan rekor dunia dengan 999.990 poin, sedangkan hasil terbaik untuk seseorang adalah 266.360 poin.