DeepMind Can't Stop: AI Can Play Quake III Arena Sekarang



DeepMind, yang dulu merupakan divisi dari Google Corporation, sedang mengembangkan AI (bentuknya yang lemah) untuk berbagai keperluan. Sekarang tim DeepMind secara aktif terlibat dalam penciptaan berbagai bentuk AI, dipertajam untuk permainan, baik logis, desktop, dan penembak. Ada banyak permainan - ini sudah, dan StarCraft, dan sekarang - dan Quake III Arena.

Para pengembang mengatakan di blog mereka bahwa mereka melatih sistem AI untuk memainkan Quake III Arena dengan cara yang sama seperti yang dilakukan seseorang. Artinya, sistem komputer telah belajar untuk beradaptasi dengan kondisi game yang berubah dengan cepat, termasuk level switching dan elemen-elemennya. Secara tradisional, sistem yang diperkuat digunakan dalam pelatihan.

Selama jenis pelatihan ini, komputer menerima hadiah atau denda, tergantung pada apakah bagian itu berhasil atau tidak. Biasanya, masalah komputer adalah ia tidak dapat beradaptasi dengan kondisi yang berubah dengan sangat cepat - seperti halnya seseorang. Terlepas dari kenyataan bahwa jaringan saraf telah lama dapat belajar dari kesalahan mereka sendiri, permainan komputer sulit bagi mereka jika sistem tidak mengetahui kondisi awal.

Sistem dilatih untuk bermain dalam mode Capture The Flag. Dalam hal ini, pemain harus mencoba untuk menangkap bendera lawan, tetapi dalam keadaan apa pun ia tidak boleh membiarkan bendera miliknya ditangkap. Jika tim mana pun dapat menangkap dan menahan bendera lawan untuk jumlah waktu maksimum dalam lima menit, maka tim tersebut akan menjadi pemenang.

Untuk mencegah AI hanya mempelajari fitur-fitur level, termasuk lokasi kamar, bangunan, dll., Setiap kali jaringan saraf dipaksa untuk bermain di level baru. Dalam hal ini, AI mengembangkan strategi gimnya sendiri tanpa menjejalkan. Komputer menyaksikan aksi pemain lain, mempelajari "geografi" tingkat dan bertindak sesuai dengan situasi.

Selain itu, pengembang dari Deepmind melatih AI untuk memainkan seluruh tim, yang terdiri dari agen yang berbeda. Seluruh sistem disebut For The Win (FTW).

Jadi, For The Win (FTW) belajar mengatur timnya, mengoordinasi dan mengarahkan tindakan masing-masing agen. Tugas, seperti disebutkan di atas, adalah untuk mempertahankan bendera sendiri dan menangkap bendera orang lain. Setelah komputer mencapai tingkat keterampilan tertentu, DeepMind ditawari untuk bermain dengan pemain biasa di turnamen khusus.


Semua 40 orang ambil bagian di dalamnya. Tim-tim dalam turnamen itu beragam - yaitu, dalam satu tim mungkin ada orang dan agen AI. Menurut hasil permainan, menjadi jelas bahwa AI dalam bentuk murni memenangkan lebih banyak kemenangan daripada tim orang. Dalam tim campuran, AI menunjukkan tingkat kerjasama yang lebih tinggi daripada yang biasanya orang tunjukkan. Jadi, komputer, jika perlu, berfungsi sebagai budak atau terlibat langsung dalam serangan di pangkalan musuh.

Menurut pengembang, prinsip kerja yang digunakan untuk membuat For The Win (FTW) dapat digunakan untuk memainkan judul lain, misalnya, StarCraft II atau Dota 2.

Pada awal bulan ini, DeepMind mendemonstrasikan proses belajar AI untuk melewati game jadul - di Atari. Prinsip pelatihan penguatan juga digunakan di sini, dan cukup sulit untuk mengajarkan AI untuk lulus game-game lama, karena banyak aksi protagonis sangat implisit.

Dasarnya diambil game Montezuma's Revenge. Tidak ada tugas yang jelas, tidak ada arah ke mana harus pergi, atau pemahaman tentang apa yang perlu dikumpulkan atau terhadap siapa yang berbicara. Dua metode yang digunakan untuk mengajar contoh: TDC (klasifikasi jarak temporal) dan CDC (cross-modal temporal distance distance).

Komputer dilatih untuk memainkan game menggunakan video walkthrough dari YouTube - ada banyak dari mereka di layanan. Selama bagian ini, frame dari rekaman video yang melewati level AI dan "guru-gurunya" dari YouTube dibandingkan. Jika perbandingan menunjukkan tingkat kesamaan yang tinggi, AI akan menerima hadiah. Ternyata, setelah beberapa waktu, AI melakukan urutan tindakan yang sama dengan orang tersebut.

Adapun StarCraft, yang disebutkan di atas, pada tahun 2017, seseorang masih mengalahkan mobil , dan kering, dengan skor 4: 0. Profesional StarCraft Song Byung-gu kemudian bertarung dengan empat bot StarCraft yang berbeda.

Source: https://habr.com/ru/post/id416209/


All Articles