Cho Chikun e Deep Zen Go: outra tentativa de superar o homem no



Em 27 de janeiro de 2016, o Google DeepMind anunciou pela primeira vez publicamente o sucesso de seu novo desenvolvimento. A empresa britânica de inteligência artificial, que o Google comprou em 2014, tentou conquistar o antigo jogo asiático de go. No início deste ano, o status de ir como um jogo independente de computador ainda era inabalável. Os sistemas Computer Go existiam, mas jogavam no nível amador. Os profissionais perderam para eles apenas com uma desvantagem significativa.

DeepMind constrói AlphaGo em uma combinação de redes neurais artificiais e Monte Carlo. Após criar o sistema, ajustar seus parâmetros e treinar as redes neurais, ele foi testado contra outros programas de computador e o campeão humano. AlphaGo venceu o campeão europeu 2013, 2014 e 2015 Fan Hui.

O Go é tradicionalmente mais baixo na Europa do que em casa na Ásia. A força do AlphaGo tem dúvidas bem fundamentadas . Mas o Google anunciou imediatamente que a próxima luta do AlphaGo será realizada com o proprietário do 9º profissional dan Lee Sedoll, um dos melhores jogadores da última década. Em março, uma série de cinco jogos aconteceu ... e o homem perdeu novamente com uma pontuação de 4: 1 . O choque das comunidades de inteligência artificial e dos jogadores foi seguido por um completo silêncio sobre futuras partidas. Não há novas partidas agendadas contra o AlphaGo .

Uma tentativa de derrotar o AlphaGo será realizada pela equipe do projeto japonês Deep Zen Go, que até agora está ensinando seu sistema a jogar contra as pessoas. Nos dias 19, 20 e 23 de novembro, estão previstos três jogos contra Cho Tikun, o nono dan master do Japão. Uma previsão interessante é de Aya Huang, uma funcionária do DeepMind que, em março, como parte de uma partida histórica, sentou-se ao lado de Lee Sedol e colocou pedras no tabuleiro do AlphaGo. Huan acredita que a nova versão do Zen vencerá com uma pontuação de 3: 0 ou 2: 1.

O DeepMind resolveu uma tarefa verdadeiramente difícil. De acordo com as regras do jogo, dois oponentes colocam pedras preto e branco em um tabuleiro de um determinado tamanho (em jogos profissionais - 19 × 19). Pedras podem ser capturadas, algumas ações são proibidas, existem várias outras regras que variam de versão do jogo. Mas o objetivo é sempre um: quem vence um território maior vence.

Para um sistema de computador, uma diversão de mesa simples e externa é muito difícil: as possíveis posições de pedras em um tabuleiro 19 × 19 são cem ordens de magnitude a mais do que as peças de xadrez em um tabuleiro 8 × 8. As pedras não diminuem, existem mais - você não pode criar uma base para os finais das partes. Desde os movimentos iniciais, você pode deduzir rapidamente uma nova situação que é impossível prever. Tudo isso complica a criação de poderosos sistemas de computador.

Os primeiros programas que tocam foram criados nos anos 70. Desde o início dos anos 80, campeonatos mundiais são realizados entre programas de computador. Durante muito tempo, os carros foram perdidos para pessoas com uma deficiência de 9 pedras ou mais. Até o início deste ano, a conquista de 4 pedras do handicap era considerada uma conquista .

A tecnologia mais recente é a busca por madeira ou o método Monte Carlo, sistemas especializados com um banco de dados de boas jogadas. No DeepMind, redes neurais de política e valores foram adicionadas ao método Monte Carlo. Eles foram treinados com a ajuda de 160 mil jogos do servidor de jogadores do KGS do sexto ao nono dan. Então o sistema estudou em lotes contra si mesmo. O resultado é a derrota do primeiro campeão europeu do 2º dan profissional, depois a derrota do campeão coreano do 9º dan profissional.

Para o Google, o significado de desenvolvimento não é apenas uma solução para um problema teórico. Esta é uma boa razão para se orgulhar. As partidas foram acompanhadas pelo co-fundador da pesquisa, Sergey Brin, e outros funcionários notáveis. Todos eles queriam ver o momento do triunfo da empresa.

Recentemente, os sistemas de inteligência artificial estão ganhando impulso nas mesmas redes neurais. Hoje, quase todo mundo no bolso tem um assistente de voz inteligente que pode responder perguntas em linguagem humana: Siri, Google Assistant ou Google Now, Cortana. As empresas gostam de lembrá-lo de que essa é apenas a ponta do iceberg de suas realizações em IA. Por exemplo, a vitória da AlphaGo contra as melhores pessoas, Sundar Pichai, CEO do Google, mencionou em seu discurso de abertura durante a apresentação dos smartphones Google Pixel no mês passado. A lembrança de sua vermifugadosem algum lugar entre as novas direções do sistema de tradução automática Inglês ← → Chinês e algoritmos avançados de reconhecimento de imagem e reconhecimento de fala.

A vitória do Google "tocou" longe. A partida foi realizada na capital da Coréia do Sul e tornou-se o motivo para criar um fundo de um trilhão de won (860 milhões de dólares) para o desenvolvimento de sistemas de inteligência artificial. Os desenvolvedores de outros sistemas informáticos se familiarizaram com os relatórios das pesquisas DeepMind e AlphaGo e aprimoraram seus sistemas. Poucas pessoas querem suportar um novato tão acentuado no cenário estabelecido dos programas go.

Deep zen go


Em 1º de março, mesmo antes do início do jogo AlphaGo, Li Sedol, criador do Zen Yoji Ojima e da empresa japonesa Dwango, anunciou uma colaboração para criar uma versão distribuída do Deep Zen Go. Para Ojima, Zen era um projeto amador no qual ele não podia gastar seriamente dinheiro. A empresa estava pronta para fornecer equipamentos e um especialista em aprendizado de máquina. A equipe de desenvolvimento também foi assistida por uma equipe de aprendizado profundo da Universidade de Tóquio e pelo desenvolvedor do programa Ponanza, o sistema de shogi de computador mais bem-sucedido do mundo que supera as pessoas profissionais.



O objetivo final é derrotar o AlphaGo, o prazo para sua realização é de seis meses a um ano. Segundo os autores do programa, o AlphaGo tem uma vantagem de 500 pontos de classificação Elo devido ao melhor reconhecimento de padrões. Os criadores do Zen pensaram que poderiam obter 400 pontos melhorando o reconhecimento de padrões e 200 de outras modificações. No entanto, essas estimativas foram dadas antes da partida com Li Sedol, apenas de acordo com os jogos com Fan Hui.

O trabalho começou. O projeto conta desde 1º de março deste ano na filial da décima primeira versão do programa. Na décima segunda versão, aparecem os primeiros desenvolvimentos no aprendizado de máquina. Na versão 12.2, uma rede neural de valor foi integrada. Em setembro, o aprendizado de máquina aparece na versão 12.4. Segundo os desenvolvedores, seu objetivo não era fazer uma cópia do AlphaGo, mas os desenvolvimentos do artigo na Nature foram levados em consideração.

O desempenho real do Zen não são apenas relatórios da equipe de desenvolvimento. O sistema pode ser "tocado" no servidor KGS para jogos on-line, onde diferentes versões do Zen tocam blitz há 15 segundos há alguns anos. Desde março, houve um aumento gradual na classificação dos bots Zen. Primeiro, o Zen19 apareceu entre as centenas dos melhores , a próxima versão do Zen19X foi incluída entre os 50 melhores jogadores devido às suas redes neurais, o Zen19A quebrou os vinte.

Zen19K e recebe o 8º dan no servidor KGS - esta versão possui uma rede neural de valor. Fisicamente, este player se parece com um servidor Kurisu com dois processadores Intel Xeon quad-core E5-2623 v3e quatro aceleradores de vídeo Nvidia GTX Titan X (Maxwell). Esta versão já compete com profissionais. Por exemplo, em 30 de agosto, o russo profissional e múltiplo campeão europeu Ilya Shikshin perdeu para o bot e 31 venceu .

A versão mais recente do bot Zen19K2 pela primeira vez alcançou o 9º dan no servidor e atingiu a primeira linha da classificação. Vale a pena notar que este servidor é mais popular na Europa e na América; os profissionais asiáticos o fazem muito raramente.


Zen19K2 gráfico de crescimento de classificação de bot de 8 de setembro a 15 de novembro de 2016.

Duelo com homem


O Zen mostra progresso em partidas oficiais contra pessoas. No final de março de 2016, a Zen se tornou a vencedora da nona copa para computador , realizada pela Universidade Japonesa de Eletrocomunicações. Esta competição é considerada o campeonato mundial entre os programas de computador para o jogo de go. Eles jogaram todos os programas mais fortes, exceto o AlphaGo - provavelmente o Google decidiu que não tinha nada a provar aqui. Como vencedor do torneio, o programa Zen competiu em 3 pedras de handicap com o japonês Kobayashi Koichi (9º profissional) e venceu.

27 de julho como parte do Campeonato Europeurealizado neste ano em São Petersburgo, o sistema Zen com 2 pedras de handicap jogou contra Cho Heyang (9 profissionais), uma das profissionais mais fortes do sexo feminino. Zen acabou por ser mais forte novamente. O programa gradualmente chegou ao jogo em pé de igualdade com as pessoas.

Para contar ao mundo sobre o AlphaGo, a DeepMind realizou uma partida com o profissional mais experiente e com mais títulos dentre os que estavam disponíveis geograficamente. Aí chega um momento semelhante: de acordo com os desenvolvedores , o sistema atingiu o nível AlphaGo de uma partida com o Fan Hui. Alguns dias atrás , um novo rival foi escolhido para o Deep Zen Go .


Da esquerda para a direita: um dos desenvolvedores do Zen é Kato Hideki e Cho Chikun.

Cho Tikun - O mestre de 9 anos do profissional de 60 anos é do Japão, um dos mais fortes do mundo nos anos 80 e 90. Durante sua carreira, ele ganhou mais de cem grandes torneios. Três jogos contra ele serão realizados nos dias 19, 20 e 23 de novembro. Serão três jogos com pontos de compensação japoneses de 6,5 Komi para o jogo branco, com um padrão para uma grande festa com duração de duas horas e superação de 3 × 60 segundos.

Um servidor poderoso com dissipação de calor em alguns cavalos de potência agirá contra uma pessoa: dois processadores Intel Xeon E5-2699v4 de 22 núcleos , 4 Nvidia Titan X  (desta vez o mais recente Pascal), 128 GB de RAM, unidades de estado sólido de 128 GB (sistema) e dois a 480 GB.

Curiosamente, Lee Sedola venceu o AlphaGo, que rodava no Google Cloud Platform em 1920 núcleos de processador e 280 aceleradores de vídeo. Segundo um artigo da Nature, uma versão não alocada perde uma versão distribuída em 77% dos casos. Mas, de acordo com o relatório DeepMind, a versão regular e não alocada do AlphaGo também não é tão fraca. O gráfico à direita compara o desempenho do AlphaGo em uma única máquina e em um formulário distribuído em um cluster de vários servidores.



Os jogos serão transmitidos online com comentários em japonês. Não está claro se os comentários oficiais serão em inglês.

Sábado, 19 de novembro. Início da transmissão: 06:30, horário de Moscou (12:30 no fuso horário japonês). Início do jogo: 07:00, horário de Moscou (13:00 JST). O primeiro jogo .
Domingo, 20 de novembro, no mesmo horário.O segundo jogo .
23 de novembro, quarta-feira, no mesmo horário. O terceiro jogo .

Como você pode ver, todos os três jogos acontecem no fim de semana oficial. 23 de novembro no Japão, rico em feriados, mas ruim em feriados e feriados, Japão - Dia de Ação de Graças .



Em alguns dias, o resultado da partida com o Tikun será determinado. A força de um jogador humano pode ser prevista e prevista. Mas pouco se sabe sobre o AlphaGo: não vemos uma única partida pública desde março. Não se sabe até que ponto o desenvolvimento do DeepMind começou a ser reproduzido durante esse período. O Deep Zen Go continua melhorando: os desenvolvedores esperam que seu programa atinja o nível AlphaGo em março de 2016.

Para um gigante de tecnologia abrangente, dar louros da primazia da IA ​​em uma única direção simbólica não é permitido. No entanto, o Google tem mais recursos. Mas não perca a esperança de que o novo desenvolvimento asiático seja capaz de vencer o AlphaGo em uma partida oficial se as partes marcarem um duelo. No entanto, para começar, o programa precisa aprender a derrotar as pessoas.

O autor agradece ao grupo go_secrets pela ajuda na redação deste artigo .

Source: https://habr.com/ru/post/pt399127/


All Articles