AlphaGo vence o terceiro jogo decisivo de Lee Sedol
A terceira vitória da inteligência artificial em uma série histórica de cinco jogos no
Go é um jogo de lógica do leste asiático com história antiga e ricas tradições culturais. Existem várias regras e variações, mas o objetivo principal é o mesmo: cada um dos dois jogadores precisa cercar o território do maior tamanho possível com pedras de sua própria cor. Pesquisadores de inteligência artificial são atraídos pela complexidade. É tarde demais para conquistar o xadrez - os computadores estão jogando melhor que os humanos há vários anos. Mas, no jogo, o número de posições possíveis é muito maior (10 100 ) do que no xadrez. Os programas modernos funcionam bem, mas no nível dos amantes de goma. Antes de criar um sistema que possa vencer o melhor das pessoas, no máximo uma década.Então, disseram os especialistas antes do advento do AlphaGo. O desenvolvimento do DeepMind (o Google comprou a empresa em 2014) usa o método Monte Carlo. Os melhores sistemas de computadores modernos usam essa tecnologia. Mas na AlphaGo, os movimentos também ajudam a escolher redes neurais de política e valores. Eles podem ser chamados parentes próximos de redes neurais que reconhecem imagens e fala. O sistema foi ensinado pela primeira vez a jogar em 160 mil jogos no servidor da KGS. Então AlphaGo treinou em jogos contra si mesma.Pela primeira vez, essa amostra de IA atraiu atenção em janeiro. Em seguida, o Google publicou um artigo científico sobre o AlphaGo, que mencionou a partida de outubro de 2015. O tricampeão europeu Fan Hui perdeu o novo desenvolvimento em cinco dos cinco jogos.Acredita-se que o nível de go europeu seja menor do que na terra natal do jogo, na Ásia. Os movimentos individuais e os erros de Hui levantaram questões. Portanto, jogadores e entusiastas da IA estavam ansiosos pelo jogo AlphaGo Seoul contra um dos melhores representantes da equipe - o dono do nono profissional e dan Sedol .Até março, a pergunta era a seguinte: o AlphaGo tem chance contra Lee Sedola ? Mas Sedol perdeu o primeiro e o segundofesta. Se após o primeiro jogo o mestre do nono dan mostrou otimismo, depois do segundo jogo ele saiu confuso. Sedoll afirmou que não viu os momentos em que jogou o jogo.Hoje foi a terceira parcela. O jogo contou com a presença do ex-CEO do Google, Eric Schmidt, um dos engenheiros importantes da empresa, Jeff Dean, e Sergey Brin, que chegaram a Seul no outro dia. Obviamente, conquistar conquistar simboliza a importância das tecnologias de aprendizado de máquina, que são o coração do Google. Da esquerda para a direita: o fundador do DeepMind, Demis Hassabis, nono profissional e proprietário Lee Sedol, cofundador do Google, Sergey Brin.
Como no primeiro jogo, o Sedol ficou preto, ou seja, o primeiro. Além disso, o conhecimento do sistema pode ser incluído entre os pontos positivos - os engenheiros da DeepMind dificilmente têm recursos para mudar alguma coisa nos dias da partida. Pelo menos o boato afirma que Sedoll e uma equipe de especialistas em go passaram a noite procurando por pontos fracos do AlphaGo. Os primeiros movimentos de Black foram agressivos. Parece que Sedol estava tentando levar o jogo em uma direção diferente, tentando pressionar os pontos fracos do sistema.Transmissão de vídeo da terceira parcela da partida AlphaGo - Lee Sedol.Durante o jogo, a IA demonstrou a capacidade de trabalhar com momentos difíceis na forma de posições de ko. Acredita-se que os sistemas informáticos lidam mal com o ko. No final do terceiro jogo, as Black estavam sem tempo, então o homem teve que pensar nos movimentos por um minuto.Após 176 jogadas, o jogo terminou com a vitória do sistema AlphaGo. A AI tinha 8 minutos e 31 segundos restantes no relógio.
Esta é a terceira vitória consecutiva do AlphaGo na série. O resultado geral da série histórica de cinco jogos é determinado. O destino da recompensa monetária foi determinado - é óbvio que agora ele irá para a caridade e o desenvolvimento do go, como foi planejado no caso da derrota de uma pessoa. Os últimos dois jogos de domingo e terça-feira determinarão a profundidade da demonstração dos benefícios do AlphaGo - apesar da clara conclusão da série, ela ainda será disputada.Em março passado, o sistema venceu o segundo dan profissional, hoje ultrapassa o nono dan. Talvez isso tenha sido ajudado pelo fato de o sistema AlphaGo ter treinado contra si mesmo nos últimos cinco meses. De acordo com o chefe do DeepMind Demis Hassabis, a configuração atual usa aproximadamente a mesma quantidade de recursos de hardware da opção que venceu o Fan Hui. Hassabis diz que algoritmos são mais importantes que hardware.O último, quinto jogo será realizado na terça-feira. Em seguida, serão resumidos os resultados da batalha de milhares de anos de jogos humanos no desenvolvimento de dois e dois anos, lançados em um cluster de várias dezenas de processadores de servidor disponíveis comercialmente, de aceleradores gráficos.Materiais úteis sobre o tema:Source: https://habr.com/ru/post/pt391513/
All Articles