AlphaGo remporte le troisième match décisif de Lee Sedol

La troisième victoire de l'intelligence artificielle dans une série historique de cinq matchs en e


Go est un jeu de logique d'Asie de l'Est avec une histoire ancienne et de riches traditions culturelles. Il existe plusieurs règles et variantes, mais l'objectif principal est le même: chacun des deux joueurs doit clôturer le territoire de la plus grande taille possible avec des pierres de leur propre couleur. Les chercheurs en intelligence artificielle de th sont attirés par la complexité. Il est trop tard pour vaincre les échecs - les ordinateurs jouent mieux que les humains depuis plusieurs années maintenant. Mais au go, le nombre de positions possibles est beaucoup plus élevé (10 100 ) qu'aux échecs. Les programmes modernes jouent bien, mais au niveau des amateurs de go. Avant de créer un système qui peut battre le meilleur des gens, au mieux une décennie.

Les experts ont donc déclaré avant l'avènement d'AlphaGo. Le développement de DeepMind (Google a racheté la société en 2014) utilise la méthode Monte Carlo. Le meilleur des systèmes informatiques modernes utilise cette technologie. Mais chez AlphaGo, les mouvements aident également à choisir des réseaux neuronaux de politique et de valeurs. On peut les appeler proches parents de réseaux de neurones qui reconnaissent les images et la parole. Le système a d'abord appris à jouer sur 160 000 jeux à partir du serveur KGS. Ensuite, AlphaGo s'est entraînée aux jeux contre elle-même.

Pour la première fois, cet échantillon d'IA a attiré l'attention en janvier. Ensuite, Google a publié un article scientifique sur AlphaGo, qui mentionnait le match d'octobre 2015. Le triple champion d'Europe Fan Hui a perdu le nouveau développement en cinq matchs sur cinq.

On pense que le niveau de go européen est plus bas que dans la patrie du jeu, en Asie. Les mouvements individuels et les erreurs de Hui ont soulevé des questions. Par conséquent, les joueurs de go et les amateurs d'IA attendaient avec impatience le match AlphaGo Seoul contre l'un des meilleurs représentants de l'équipe de personnes - le propriétaire du neuvième professionnel dan Lee Sedol .

Jusqu'en mars, la question était la suivante: AlphaGo a-t-il une chance contre Lee Sedola ? Mais Sedol a perdu le premier et le deuxièmefête. Si après le premier match le maître du neuvième dan fait preuve d'optimisme, alors après le deuxième match il part confus. Sedoll a déclaré qu'il n'a pas vu les moments où il a joué le match.

Aujourd'hui, c'était le troisième versement. L' ancien PDG de Google, Eric Schmidt, l'un des principaux ingénieurs de la société, Jeff Dean, et Sergey Brin, arrivés à Séoul l'autre jour, ont assisté au match . Évidemment, la conquête du go symbolise l'importance des technologies d'apprentissage automatique, qui sont au cœur de Google. De gauche à droite: le fondateur de DeepMind, Demis Hassabis, le neuvième propriétaire professionnel dan, Lee Sedol, le co-fondateur de Google, Sergey Brin.




Comme lors du premier match, Sedol est devenu noir, c'est-à-dire le premier. En outre, la connaissance du système pourrait être incluse parmi les bons points - les ingénieurs de DeepMind n'ont guère les ressources pour changer quelque chose les jours du match. Au moins, la rumeur prétend que Sedoll et une équipe d'experts en go ont passé la nuit à chercher des faiblesses d'AlphaGo. Les premiers mouvements de Black furent agressifs. Il semble que Sedol essayait de prendre le jeu dans une direction différente, essayant de mettre la pression sur les points faibles du système.


Diffusion vidéo du troisième volet du match AlphaGo - Lee Sedol.

Pendant le jeu, l'IA a démontré sa capacité à travailler avec des moments difficiles sous la forme de positions ko. On pense que les systèmes informatiques vont mal avec le ko. À la fin du troisième match, Black n'avait plus de temps, donc l'homme a dû réfléchir aux mouvements pendant une minute.

Après 176 coups, le jeu s'est terminé par la victoire du système AlphaGo. Il restait 8 minutes et 31 secondes à AI.



Il s'agit de la troisième victoire consécutive d'AlphaGo dans la série. Le résultat global de la série historique de cinq matchs est déterminé. Le sort de la récompense monétaire a été déterminé - il est évident que maintenant il ira à la charité et au développement du go, comme cela était prévu en cas de défaite d'une personne. Les deux derniers matchs dimanche et mardi détermineront la profondeur de la démonstration des avantages d'AlphaGo - malgré la conclusion claire de la série, elle sera toujours jouée.


En mars dernier, le système a battu le deuxième joueur dan professionnel, il contourne aujourd'hui le neuvième dan. Peut-être que cela a été aidé par le fait que le système AlphaGo s'est entraîné dans les jeux contre lui-même au cours des cinq derniers mois. Selon le chef de DeepMind Demis Hassabis, la configuration actuelle utilise à peu près la même quantité de ressources matérielles que l'option qui a battu Fan Hui. Hassabis affirme que les algorithmes sont plus importants que le matériel.

Le dernier, cinquième match aura lieu mardi. Ensuite, les résultats de la bataille de milliers d'années de jeu humain dans le développement de deux ans, lancée sur un cluster de plusieurs dizaines de processeurs serveurs d'accélérateurs graphiques disponibles dans le commerce, seront résumés.

Documents utiles sur le sujet:

Source: https://habr.com/ru/post/fr391513/


All Articles