Cho Chikun dan Deep Zen Go: upaya lain untuk melampaui manusia di th



Pada 27 Januari 2016, Google DeepMind untuk pertama kalinya secara publik mengumumkan keberhasilan pengembangan barunya. Perusahaan intelijen buatan buatan Inggris, yang dibeli Google pada 2014, mencoba menaklukkan permainan go Asia kuno. Pada awal tahun ini, status go sebagai game independen komputer masih tak tergoyahkan. Sistem go komputer ada, tetapi dimainkan di tingkat amatir. Profesional hilang hanya dengan cacat yang signifikan.

DeepMind membangun AlphaGo pada kombinasi dari Monte Carlo dan jaringan saraf tiruan. Setelah membuat sistem, menyesuaikan parameternya dan melatih jaringan saraf, itu diuji terhadap program komputer lainnya dan manusia. AlphaGo mengalahkan juara Eropa 2013, 2014 dan 2015 Fan Hui.

Go secara tradisional lebih rendah di Eropa daripada di rumah di Asia. Kekuatan AlphaGo memiliki keraguan yang kuat . Namun Google segera mengumumkan bahwa pertarungan AlphaGo berikutnya akan diadakan dengan pemilik profesional ke-9 dan Lee Sedoll, salah satu pemain terbaik dalam dekade terakhir. Pada bulan Maret, serangkaian lima pertandingan terjadi ... dan pria itu kalah lagi dengan skor 4: 1 . Kejutan dari komunitas kecerdasan buatan dan pemain go diikuti oleh keheningan total tentang pertandingan di masa depan. Tidak ada pertandingan baru yang dijadwalkan melawan AlphaGo .

Upaya untuk mengalahkan AlphaGo akan dilakukan oleh tim proyek Jepang Deep Zen Go, yang sejauh ini mengajarkan sistemnya untuk bermain melawan orang. Pada tanggal 19, 20 dan 23 November, tiga pertandingan direncanakan melawan Cho Tikun, master ke-9 dari Jepang. Perkiraan yang menarik adalah oleh Aya Huang, seorang karyawan DeepMind yang, pada bulan Maret, sebagai bagian dari pertandingan bersejarah, duduk di seberang Lee Sedol dan meletakkan batu di papan untuk AlphaGo. Huan percaya bahwa versi baru Zen akan menang dengan skor 3: 0 atau 2: 1.

DeepMind telah menyelesaikan tugas yang sangat sulit. Menurut aturan permainan, dua lawan menempatkan batu hitam dan putih di papan ukuran tertentu (dalam game profesional - 19 × 19). Batu dapat ditangkap, beberapa tindakan dilarang, ada beberapa aturan lagi yang berbeda dari versi permainan. Tapi tujuannya selalu satu: orang yang menangkis wilayah yang lebih besar menang.

Untuk sistem komputer, kesenangan di atas meja yang sederhana sangat sulit: posisi yang memungkinkan dari batu pada papan 19 × 19 adalah seratus urutan lebih besar daripada bidak catur di papan 8 × 8. Batu tidak berkurang, ada lebih banyak - Anda tidak dapat membuat basis untuk akhir pesta. Dari gerakan awal Anda dapat dengan cepat menyimpulkan situasi baru yang tidak mungkin diramalkan. Semua ini mempersulit penciptaan sistem komputer yang kuat.

Program pertama yang diputar dibuat pada tahun 70-an. Sejak awal 80-an, kejuaraan dunia telah diadakan di antara program komputer. Untuk waktu yang lama, mobil hilang untuk orang-orang dengan cacat 9 batu atau lebih. Hingga awal tahun ini, pencapaian pada 4 batu handicap dianggap sebagai prestasi .

Teknologi terbaru adalah pencarian kayu atau metode Monte Carlo, sistem pakar dengan basis data pergerakan yang baik. Di DeepMind, jaringan saraf politik dan nilai-nilai telah ditambahkan ke metode Monte Carlo. Mereka dilatih dengan bantuan 160 ribu game dari server pemain KGS dari keenam dan kesembilan. Kemudian sistem belajar banyak melawan dirinya sendiri. Hasilnya adalah kekalahan juara Eropa pertama dari Dan 2 profesional, kemudian kekalahan juara Korea dari Dan 9 profesional.

Bagi Google, makna pengembangan bukan hanya solusi untuk masalah teoretis. Ini alasan bagus untuk bangga. Pertandingan dihadiri oleh salah satu pendiri pencarian Sergey Brin dan karyawan terkenal lainnya. Mereka semua ingin melihat momen kemenangan perusahaan.

Baru-baru ini, sistem kecerdasan buatan mendapatkan momentum pada jaringan saraf yang sama. Saat ini, hampir semua orang di saku mereka memiliki asisten suara cerdas yang dapat menjawab pertanyaan dalam bahasa manusia: Siri, Google Assistant atau Google Now, Cortana. Perusahaan ingin mengingatkan Anda bahwa ini hanyalah puncak gunung es dari pencapaian AI mereka. Sebagai contoh, kemenangan AlphaGo melawan orang-orang terbaik, CEO Google Sundar Pichai disebutkan dalam pidato pembukaan selama presentasi smartphone Google Pixel bulan lalu. Sebuah pengingat nya wormeddi suatu tempat antara arah sistem terjemahan mesin yang baru Bahasa Inggris ← → Bahasa Cina dan algoritme pengenalan gambar dan pengenalan suara canggih.

Kemenangan Google "berdering" jauh. Pertandingan itu diadakan di ibu kota Korea Selatan dan menjadi alasan untuk membuat dana sebesar triliun won ($ 860 juta) untuk pengembangan sistem kecerdasan buatan. Pengembang sistem komputer lain berkenalan dengan laporan dari penelitian DeepMind dan AlphaGo dan meningkatkan sistem mereka. Hanya sedikit orang yang ingin menanggung pendatang baru yang tajam ke program acara go yang sudah mapan.

Pergi zen dalam


Pada 1 Maret, bahkan sebelum dimulainya pertandingan AlphaGo, Li Sedol, pencipta Zen Yoji Ojima dan perusahaan Jepang Dwango mengumumkan kolaborasi untuk membuat versi terdistribusi Deep Zen Go. Bagi Ojima, Zen adalah proyek amatir yang tidak bisa dibelanjakan dengan serius. Perusahaan siap menyediakan peralatan dan spesialis pembelajaran mesin. Tim pengembangan juga dibantu oleh tim pembelajaran mendalam dari Universitas Tokyo dan pengembang program Ponanza, sistem shogi komputer paling sukses di dunia yang mengungguli orang-orang profesional.



 — AlphaGo,  — . , AlphaGo 500 . Zen , 400 200 . , , .

. 1 . . 12.2 . 12.4 . , AlphaGo, Nature .

Kinerja Zen yang sebenarnya bukan hanya laporan dari tim pengembang. Sistem ini dapat "disentuh" ​​pada server KGS untuk game online, di mana berbagai versi Zen telah memainkan blitz selama 15 detik selama beberapa tahun. Sejak Maret, ada peningkatan bertahap dalam peringkat bot Zen. Pertama, Zen19 muncul di antara ratusan yang terbaik , versi berikutnya Zen19X masuk 50 pemain teratas karena jaringan sarafnya , Zen19A memecahkan dua puluh.

Zen19K dan menerima Dan ke-8 di server KGS - versi ini memiliki nilai jaringan saraf. Secara fisik, pemain ini terlihat seperti server Kurisu dengan dua prosesor Intel Xeon quad-core E5-2623 v3dan empat akselerator video Nvidia GTX Titan X (Maxwell). Versi ini sudah bersaing dengan para profesional. Sebagai contoh, pada tanggal 30 Agustus, go-professional Rusia dan beberapa juara Eropa Ilya Shikshin kalah dari bot, dan 31 menang .

Versi terbaru dari bot Zen19K2 untuk pertama kalinya mencapai Dan ke-9 di server dan mencapai baris pertama dari peringkat. Perlu dicatat bahwa server ini lebih populer di Eropa dan Amerika, profesional Asia jarang melakukannya.


Grafik pertumbuhan peringkat Zen19K2 dari 8 September hingga 15 November 2016.

Duel dengan pria


Zen menunjukkan kemajuan dalam pertandingan resmi melawan orang-orang. Pada akhir Maret 2016, Zen menjadi pemenang piala komputer kesembilan yang diselenggarakan oleh Universitas Komunikasi Elektro Jepang. Kompetisi ini dianggap sebagai kejuaraan dunia di antara program komputer untuk game go. Mereka memainkan semua program terkuat kecuali AlphaGo - mungkin, Google memutuskan bahwa tidak ada yang bisa dibuktikan di sini. Sebagai pemenang turnamen, program Zen berkompetisi dengan 3 batu handicap dengan Kobayashi Koichi Jepang (Dan 9 profesional) dan menang.

27 Juli sebagai bagian dari Kejuaraan Eropadiselenggarakan tahun ini di St. Petersburg, sistem Zen dengan 2 batu handicap dimainkan melawan Cho Heyang (9 profesional Dan), salah satu pro wanita terkuat. Zen ternyata menjadi lebih kuat lagi. Program ini secara bertahap mencapai permainan dengan pijakan yang sama dengan orang-orang.

Untuk memberi tahu dunia tentang AlphaGo, DeepMind mengadakan pertandingan dengan orang yang paling berpengalaman dan profesional dari mereka yang tersedia secara geografis. Di sinilah momen yang sama: menurut pengembang , sistem telah mencapai tingkat pertandingan AlphaGo dengan Fan Hui. Beberapa hari yang lalu , saingan baru dipilih untuk Deep Zen Go .


Dari kiri ke kanan: salah satu pengembang Zen adalah Kato Hideki dan Cho Chikun.

Cho Tikun - Master berusia 9 tahun dari profesional ke-9 diberikan dari Jepang, salah satu yang terkuat di dunia tahun 80-an dan 90-an. Selama karirnya, ia telah memenangkan lebih dari seratus turnamen besar. Tiga pertandingan melawannya akan diadakan pada 19, 20 dan 23 November. Ini akan menjadi tiga pertandingan dengan poin kompensasi 6,5 Komi Jepang untuk permainan putih, dengan standar untuk pesta besar yang berlangsung dua jam dan mengalahkan 3 × 60 detik.

Server yang kuat dengan pembuangan panas dalam beberapa daya kuda akan bertindak melawan seseorang: dua prosesor Intel Xeon E5-2699v4 22-core , 4 Nvidia Titan X  (kali ini Pascal terbaru), 128 GB RAM, 128 GB solid-state drive (sistem) dan dua pada 480 GB.

Yang menarik, Lee Sedola mengalahkan AlphaGo, yang berjalan di Google Cloud Platform pada core prosesor 1920 dan 280 akselerator video. Menurut sebuah artikel di Nature, versi yang tidak terisi kehilangan versi terdistribusi dalam 77% kasus. Tetapi menurut laporan DeepMind, versi reguler dari AlphaGo yang tidak terisi juga tidak begitu lemah. Grafik di sebelah kanan membandingkan kinerja AlphaGo pada satu mesin dan dalam bentuk yang didistribusikan di sekelompok server ganda.



Permainan akan disiarkan secara online dengan komentar dalam bahasa Jepang. Tidak jelas apakah komentar resmi akan dalam bahasa Inggris.

Sabtu, 19 November. Mulai siaran: 06:30 Waktu Moskow (12:30 di zona waktu Jepang). Mulai dari permainan: 07:00 waktu Moskow (13:00 JST). Game pertama .
Minggu, 20 November, bersamaan.Game kedua .
23 November, Rabu, bersamaan. Game ketiga .

Seperti yang Anda lihat, ketiga pertandingan berlangsung di akhir pekan resmi. 23 November di Jepang, kaya akan liburan, tetapi miskin dalam liburan dan liburan, Jepang - Hari Thanksgiving .



Dalam beberapa hari, hasil pertandingan dengan Tikun akan ditentukan. Kekuatan pemain manusia dapat diprediksi dan diprediksi. Tetapi sedikit yang diketahui tentang AlphaGo: kami belum melihat satu pun pertandingan publik sejak Maret. Tidak diketahui seberapa dalam pengembangan DeepMind mulai dimainkan selama waktu ini. Deep Zen Go terus membaik: pengembang berharap program mereka akan segera mencapai level AlphaGo pada Maret 2016.

Untuk raksasa teknologi yang komprehensif, memberikan kemenangan AI keunggulan bahkan dalam satu arah simbolis tidak diperbolehkan. Namun, Google memiliki lebih banyak sumber daya. Tetapi jangan kehilangan harapan bahwa perkembangan Asia yang baru akan dapat mengalahkan AlphaGo dalam pertandingan resmi jika para pihak menjadwalkan duel. Namun, untuk memulainya, program perlu belajar bagaimana mengalahkan orang.

Penulis berterima kasih kepada grup go_secrets untuk bantuan dalam menulis artikel ini .

Source: https://habr.com/ru/post/id399127/


All Articles