Cho Chikun et Deep Zen Go: une autre tentative de dépasser l'homme en th



Le 27 janvier 2016, Google DeepMind a pour la première fois annoncé publiquement le succès de son nouveau développement. La société britannique d'intelligence artificielle, que Google a achetée en 2014, a tenté de conquérir l'ancien jeu asiatique du go. Au début de cette année, le statut de go en tant que jeu indépendant de l'ordinateur était toujours inébranlable. Les systèmes de go ordinateur existaient, mais jouaient au niveau amateur. Les professionnels n'ont perdu contre eux qu'avec un handicap important.

DeepMind construit AlphaGo sur une combinaison de Monte Carlo et de réseaux de neurones artificiels. Après avoir créé le système, ajusté ses paramètres et formé les réseaux de neurones, il a été testé contre d'autres programmes informatiques et le champion humain. AlphaGo a battu le champion d'Europe 2013, 2014 et 2015 Fan Hui.

Le go est traditionnellement plus faible en Europe que chez soi en Asie. La force de l'AlphaGo a des doutes fondés . Mais Google a immédiatement annoncé que le prochain combat AlphaGo aura lieu avec le propriétaire du 9ème professionnel dan Lee Sedoll, l'un des meilleurs joueurs de la dernière décennie. En mars, une série de cinq matchs a eu lieu ... et l' homme a de nouveau perdu avec un score de 4: 1 . Le choc des communautés d'intelligence artificielle et des joueurs de go a été suivi d'un silence complet sur les futurs matchs. Aucun nouveau match n'est prévu contre AlphaGo .

Une tentative de vaincre AlphaGo sera menée par l'équipe du projet japonais Deep Zen Go, qui enseigne jusqu'à présent son système à jouer contre les gens. Les 19, 20 et 23 novembre, trois matchs sont prévus contre Cho Tikun, le 9e dan du Japon. Une prévision intéressante est celle d'Aya Huang, un employé de DeepMind qui, en mars, dans le cadre d'un match historique, s'est assis en face de Lee Sedol et a placé des pierres sur le plateau pour AlphaGo. Huan croit que la nouvelle version de Zen gagnera avec un score de 3: 0 ou 2: 1.

DeepMind a résolu une tâche vraiment difficile. Selon les règles du jeu, deux adversaires placent des pierres noires et blanches sur un plateau d'une certaine taille (dans les jeux professionnels - 19 × 19). Les pierres peuvent être capturées, certaines actions sont interdites, il existe plusieurs autres règles qui varient selon la version du jeu. Mais l'objectif est toujours un: celui qui repousse un territoire plus grand gagne.

Pour un système informatique, un amusement de table simple à l'extérieur est très difficile: les positions possibles des pierres sur le plateau 19 × 19 sont de cent ordres de grandeur de plus que les pièces d'échecs sur le plateau 8 × 8. Les pierres ne diminuent pas, il y en a plus - vous ne pouvez pas créer une base pour les fins des fêtes. Des premiers mouvements, vous pouvez rapidement déduire une nouvelle situation impossible à prévoir. Tout cela complique la création de puissants systèmes informatiques.

Les premiers programmes à jouer go ont été créés dans les années 70. Depuis le début des années 80, des championnats du monde se déroulent parmi les programmes informatiques. Pendant longtemps, les voitures ont été perdues au profit de personnes ayant un handicap de 9 pierres ou plus. Jusqu'au début de cette année, la réussite sur 4 pierres du handicap était considérée comme une réussite .

La dernière technologie est la recherche de bois ou la méthode Monte Carlo, des systèmes experts avec une base de données de bons mouvements. Chez DeepMind, des réseaux neuronaux de politique et de valeurs ont été ajoutés à la méthode Monte Carlo. Ils ont été entraînés à l'aide de 160 000 jeux du serveur de joueurs KGS du sixième au neuvième dan. Ensuite, le système a étudié par lots contre lui-même. Le résultat est la défaite du premier champion d'Europe du 2e dan professionnel, puis la défaite du champion coréen du 9e dan professionnel.

Pour Google, le sens du développement n'est pas seulement une solution à un problème théorique. C'est une bonne raison d'être fier. Le co-fondateur de Search, Sergey Brin, et d'autres employés notables ont assisté aux matchs. Ils voulaient tous voir le moment du triomphe de l'entreprise.

Récemment, les systèmes d'intelligence artificielle gagnent du terrain sur les mêmes réseaux de neurones. Aujourd'hui, presque tout le monde dans sa poche a un assistant vocal intelligent qui peut répondre aux questions en langage humain: Siri, Google Assistant ou Google Now, Cortana. Les entreprises aiment vous rappeler que ce n'est que la pointe de l'iceberg de leurs réalisations en matière d'IA. Par exemple, la victoire d'AlphaGo contre le meilleur des gens, le PDG de Google, Sundar Pichai, a mentionné dans son discours d'ouverture lors de la présentation des smartphones Google Pixel le mois dernier. Un rappel de son vermifugésquelque part entre les nouvelles directions du système de traduction automatique Français ← → Chinois et algorithmes avancés de reconnaissance d'image et de reconnaissance vocale.

La victoire de Google a "sonné" loin. Le match a eu lieu dans la capitale de la Corée du Sud et est devenu la raison de créer un fonds d' un billion de won (860 millions de dollars) pour le développement de systèmes d'intelligence artificielle. Les développeurs d'autres systèmes informatiques ont pris connaissance des rapports de recherche DeepMind et AlphaGo et ont amélioré leurs systèmes. Peu de gens veulent endurer un nouveau venu aussi pointu sur la scène établie des programmes de go.

Deep zen go


Le 1er mars, avant même le début du match AlphaGo, Lee Sedol, créateur de Zen Yoji Ojima et de la société japonaise Dwango a annoncé une collaboration pour créer une version distribuée de Deep Zen Go. Pour Ojima, Zen était un projet amateur sur lequel il ne pouvait pas sérieusement dépenser de l'argent. L'entreprise était prête à fournir du matériel et un spécialiste de l'apprentissage automatique. L'équipe de développement a également été assistée par une équipe d'apprentissage en profondeur de l'Université de Tokyo et le développeur du programme Ponanza, le système de shogi informatique le plus performant au monde qui surpasse les professionnels.



Le but ultime est de vaincre AlphaGo, le terme pour sa réalisation est de six mois à un an. Selon les auteurs du programme, AlphaGo a un avantage de 500 points de notation Elo grâce à une meilleure reconnaissance des formes. Les créateurs de Zen pensaient pouvoir obtenir 400 points en améliorant la reconnaissance des formes et 200 grâce à d'autres modifications. Cependant, ces estimations ont été données avant le match avec Li Sedol, uniquement selon les matchs avec Fan Hui.

Le travail a commencé. Le projet compte à partir du 1er mars de cette année de la branche de la onzième version du programme. Dans la douzième version, les premiers développements de l'apprentissage automatique apparaissent. Dans la version 12.2, un réseau neuronal de valeur a été intégré. En septembre, l'apprentissage automatique apparaît dans la version 12.4. Selon les développeurs, leur objectif n'était pas de faire une copie d'AlphaGo, mais les développements de l'article dans Nature ont été pris en compte.

La vraie performance de Zen n'est pas seulement les rapports de l'équipe de développement. Le système peut être "touché" sur le serveur KGS pour les jeux en ligne en cours, où différentes versions de Zen jouent au blitz depuis 15 secondes depuis quelques années maintenant. Depuis mars, il y a eu une augmentation progressive de la note des robots zen. Tout d'abord, Zen19 figurait parmi les centaines des meilleurs , la prochaine version de Zen19X a été incluse dans le top 50 des joueurs en raison de ses réseaux de neurones, Zen19A a cassé les vingt.

Zen19K et reçoit le 8ème dan sur le serveur KGS - cette version a un réseau de neurones de valeur. Physiquement, ce lecteur ressemble à un serveur Kurisu avec deux processeurs Intel Xeon quadricœur E5-2623 v3et quatre accélérateurs vidéo Nvidia GTX Titan X (Maxwell). Cette version rivalise déjà avec les professionnels. Par exemple, le 30 août, le professionnel russe et multiple champion d'Europe Ilya Shikshin a perdu contre le bot et 31 ont gagné .

La dernière version du bot Zen19K2 a pour la première fois atteint le 9ème dan sur le serveur et atteint la première ligne du classement. Il est à noter que ce serveur est plus populaire en Europe et en Amérique, les professionnels asiatiques y vont très rarement.


Graphique de croissance de la note du bot Zen19K2 du 8 septembre au 15 novembre 2016.

Duel avec l'homme


Zen montre des progrès dans les matchs officiels contre les gens. Fin mars 2016, Zen est devenu le vainqueur de la neuvième coupe informatique go organisée par l'Université japonaise des électrocommunications. Cette compétition est considérée comme le championnat du monde parmi les programmes informatiques pour le jeu de go. Ils ont joué tous les programmes les plus puissants à l'exception d'AlphaGo - probablement, Google a décidé qu'ils n'avaient rien à prouver ici. En tant que vainqueur du tournoi, le programme Zen a concouru sur 3 pierres à handicap avec le Japonais Kobayashi Koichi (9ème dan professionnel) et a gagné.

27 juillet dans le cadre du Championnat d'Europequi a eu lieu cette année à Saint-Pétersbourg, le système Zen avec 2 pierres de handicap a joué contre Cho Heyang (9 professionnels dan), l'une des plus fortes pros féminines. Le Zen s'est de nouveau révélé plus fort. Le programme est progressivement entré dans le jeu sur un pied d'égalité avec les gens.

Pour parler au monde d'AlphaGo, DeepMind a organisé un match avec le professionnel le plus expérimenté et le plus titré parmi ceux qui étaient disponibles géographiquement. Voici un moment similaire: selon les développeurs , le système a atteint le niveau AlphaGo d'un match avec Fan Hui. Il y a quelques jours , un nouveau rival a été choisi pour Deep Zen Go .


De gauche à droite: l'un des développeurs de Zen est Kato Hideki et Cho Chikun.

Cho Tikun - Le maître de 60 ans du 9e professionnel est originaire du Japon, l'un des plus forts du monde des années 80 et 90. Au cours de sa carrière, il a remporté plus d'une centaine de tournois majeurs. Trois matchs contre lui auront lieu les 19, 20 et 23 novembre. Il s'agira de trois matchs avec des points de compensation japonais de 6,5 Komi pour le jeu blanc, avec un standard pour une grande fête d'une durée de deux heures et battant 3 × 60 secondes.

Un serveur puissant avec dissipation de chaleur de quelques chevaux agira contre une personne: deux processeurs Intel Xeon E5-2699v4 à 22 cœurs , 4 Nvidia Titan X  (cette fois le dernier Pascal), 128 Go de RAM, 128 Go de disques SSD (système) et deux à 480 Go.

Fait intéressant, Lee Sedola a vaincu AlphaGo, qui fonctionnait dans la plate-forme Google Cloud sur 1920 cœurs de processeur et 280 accélérateurs vidéo. Selon un article de Nature, une version non allouée perd une version distribuée dans 77% des cas. Mais selon le rapport DeepMind, la version régulière et non allouée d'AlphaGo n'est pas non plus si faible. Le graphique de droite compare les performances d'AlphaGo sur une seule machine et sous une forme répartie sur un cluster de plusieurs serveurs.



Les jeux seront diffusés en ligne avec des commentaires en japonais. Il n'est pas clair si les commentaires officiels seront en anglais.

Samedi 19 novembre. Début de la diffusion: 06h30 heure de Moscou (12h30 dans le fuseau horaire japonais). Début du jeu: 07h00 heure de Moscou (13h00 JST). Le premier match .
Dimanche 20 novembre, même heure.Le deuxième match .
Mercredi 23 novembre, à la même heure. Le troisième match .

Comme vous pouvez le voir, les trois matchs ont lieu le week-end officiel. 23 novembre au Japon, riche en vacances, mais pauvre en vacances et jours fériés, Japon - Action de grâce .



Dans quelques jours, l'issue du match avec Tikun sera déterminée. La force d'un joueur humain peut être prédite et prédite. Mais on sait peu de choses sur AlphaGo: nous n'avons pas vu un seul match public depuis mars. On ne sait pas à quel point le développement de DeepMind a commencé à jouer pendant cette période. Deep Zen Go continue de s'améliorer: les développeurs espèrent que leur programme atteindra bientôt le niveau AlphaGo de mars 2016.

Pour un géant de la technologie globale, donner aux lauriers de l'IA la primauté dans une seule direction symbolique n'est pas autorisé. Cependant, Google a plus de ressources. Mais ne perdons pas espoir que le nouveau développement asiatique pourra battre AlphaGo en match officiel si les parties programment un duel. Cependant, pour commencer, le programme doit apprendre à vaincre les gens.

L'auteur remercie le groupe go_secrets pour l'aide à la rédaction de cet article .

Source: https://habr.com/ru/post/fr399127/


All Articles