Bot poker strategis Libratus disesuaikan untuk simulasi militer

Pada tahun 2017, bot poker Libratus menjadi berita utama ketika mengalahkan empat profesional dalam kepemilikan tidak terbatas pada jarak 120.000 tangan. Sekarang teknologinya telah disesuaikan untuk penggunaan militer .

Pengembang sistem AI yang lemah sering membandingkan efektivitas program mereka dalam konfrontasi permainan melawan manusia. Dalam gim dengan informasi lengkap kapan saja selama gim, semua pemain memiliki informasi lengkap tentang keadaan gim, yaitu tentang posisi dan semua kemungkinan pergerakan pemain. Berbeda dengan situasi deterministik seperti itu, dalam permainan dengan informasi yang tidak lengkap, bagian dari informasi tentang keadaan permainan disembunyikan dari pemain - misalnya, kartu lawan. Tidak ada batasan hold'em hanyalah salah satu dari game ini. Selain kartu lawan, elemen ketidakpastian ditambahkan di sini karena ukuran arbitrer dari setiap taruhan. Dengan pemikiran ini, jumlah hasil yang mungkin diperkirakan mencapai 10 161 . Pengembangan strategi optimal dalam menghadapi ketidakpastian, dengan mempertimbangkan taktik lawan, adalah persis apa yang dibutuhkan militer.

Libratus ("seimbang" dari bahasa Latin) diciptakan oleh para peneliti dari Universitas Carnegie Mellon untuk menguji ide-ide pengambilan keputusan otomatis berdasarkan teori permainan. Pada awal tahun lalu, setelah kemenangan besar atas para profesional, penulis utama program ini, Profesor Tuomas Sandholm, mendirikan sebuah startup yang disebut Strategy Robot untuk mengadaptasi teknologi game untuk digunakan oleh pemerintah. Misalnya, dalam permainan perang dan simulasi untuk mempelajari strategi dan perencanaan militer. Pada akhir Agustus, menurut catatan publik, perusahaan menandatangani kontrak dua tahun dengan Angkatan Darat AS hingga $ 10 juta. Pendanaan diberikan oleh Unit Inovasi Pertahanan, yang dibentuk Pentagon pada 2015 untuk meningkatkan kontak dengan perusahaan-perusahaan Lembah Silikon dan lebih aktif memperkenalkan perusahaan baru. teknologi.


Strategi Libratus pada berbagai tahap distribusi. Berdasarkan hasil distribusi, model permainan melawan lawan tertentu ditentukan

Libratus dibangun di atas teori permainan algoritmik (komputasi). Dalam head-up dengan para profesional, bot memenangkan lebih dari 1,8 juta dolar konvensional: selama turnamen ia mengembangkan strategi taruhan yang kuat dan bahkan menunjukkan kemungkinan menggertak.

Sandholm yakin bahwa pendekatan ini berlaku untuk banyak game lain, serta simulasi militer. Saat ini, latihan permainan militer biasanya hanya menguji sejumlah kecil strategi untuk lawan imajiner: "Ini membuka banyak peluang untuk eksploitasi, karena lawan nyata mungkin tidak bermain sesuai dengan asumsi Anda, " kata profesor.

Sandholm menolak untuk membahas spesifik proyek Robot Strategi, meskipun perusahaan telah menandatangani setidaknya satu kontrak pemerintah lainnya. Dia mengatakan bahwa program ini membantu dalam tugas simulasi, yang termasuk membuat keputusan dalam ruang fisik simulasi, misalnya, di mana menempatkan unit militer.

Teknik poker Libratus menunjukkan bahwa bot strategis mungkin memberi militer beberapa rekomendasi mengejutkan. Pemain profesional yang menentang bot, selama turnamen, terkejut menemukan bahwa ia tiba-tiba beralih dari taktik ketat ke taktik yang sangat agresif, sehingga tindakannya hampir tidak mungkin untuk diprediksi - tetapi semua tindakan bot secara ketat bertujuan untuk menang. "Ini aneh karena tidak ada kesan bahwa dia bermain lebih baik dari Anda, tetapi kemudian Anda melihat skor dan memahami apa yang terjadi," kata Sandholm.

Menurut para ahli, teknologi seperti itu dapat membuat permainan perang dan simulasi lebih bermanfaat, meskipun hasilnya masih akan tetap menjadi salah satu komponen perencanaan strategis. Dunia nyata jauh lebih rumit dan membingungkan daripada skenario yang mampu menguasai bahkan teknologi AI terbaik.

Bot strategis Libratus bukan satu-satunya upaya Pentagon untuk menerapkan teori permainan modern dan AI yang lemah dalam urusan militer. Badan penelitian DARPA telah meluncurkan program khusus yang disebut "Interaksi yang konsisten dalam permainan dengan informasi yang tidak lengkap mengenai adopsi keputusan militer yang kompleks (SI3-CMD)" . Michael Wellman, seorang profesor di University of Michigan, mengatakan contoh Libratus menunjukkan: teknologi ini hampir matang untuk penggunaan dunia nyata: “Terobosan dalam poker sangat mengejutkan, dan segalanya berjalan cepat dengan permainan lain. Ini saatnya untuk mencobanya di area kehidupan nyata, ”katanya.

Selain Robot Strategi, Profesor Sandholm mendirikan startup mesin strategis lainnya, di mana ia mengadaptasi bot strategis untuk tugas komersial seperti pasar listrik, olahraga, dan permainan komputer.

Teknologi AI menarik minat militer tidak hanya di Amerika Serikat, tetapi juga di Rusia dan Cina , tulis Wired . Profesor Sandholm tidak berbagi kekhawatiran tentang ini. Dia percaya AI akan "membuat dunia jauh lebih aman."

Source: https://habr.com/ru/post/id436958/


All Articles