O DeepMind oferece acesso gratuito a um ambiente de aprendizado de mĂĄquina virtual



Recentemente, representantes da divisĂŁo DeepMind (agora parte da holding Alphabet) anunciaram o fornecimento de acesso gratuito aos desenvolvedores ao cĂłdigo-fonte da plataforma DeepMind Lab. Este Ă© um serviço de aprendizado de mĂĄquina baseado no Quake III, projetado para treinamento em inteligĂȘncia artificial. A saber - para aprender a resolver problemas no espaço tridimensional sem intervenção humana. O nĂșcleo da plataforma Ă© o mecanismo de jogo Quake III Arena.

Dentro do mundo do jogo, a IA tem a forma de uma esfera e a capacidade de voar enquanto explora o espaço circundante. O objetivo definido pelos desenvolvedores Ă© ensinar a forma fraca da IA ​​a "entender" o que estĂĄ acontecendo e responder a vĂĄrias situaçÔes que ocorrem no mundo virtual. Um "personagem" pode executar uma sĂ©rie de açÔes, mover-se atravĂ©s de um labirinto e estudar o ambiente imediato.

"Estamos tentando desenvolver vĂĄrias formas de IA que podem executar uma sĂ©rie de tarefas, desde o estudo usual do mundo dos jogos atĂ© a realização de qualquer ação com uma anĂĄlise de suas consequĂȘncias", diz Shane Legge, pesquisador chefe da DeepMind.



Os especialistas esperam que a IA possa aprender por tentativa e erro. Jogos neste caso sĂŁo quase uma opção ideal. Por exemplo, anteriormente no DeepMind, eles usavam (e estĂŁo usando agora) o console do jogo Atari para ensinar a rede neural a executar as açÔes seqĂŒenciais necessĂĄrias para o jogo.

Mas um mundo tridimensional aberto que pode ser alterado representa um ambiente muito mais promissor para a aprendizagem da IA ​​do que o mundo plano de brinquedos graficamente simples para a Atari. A IA no mundo tridimensional possui atribuiçÔes claras que mudam sequencialmente de tal maneira que a experiĂȘncia adquirida na solução de cada tarefa anterior acaba sendo Ăștil para a IA na resolução da subsequente.

A vantagem de um ambiente tridimensional Ă© que ele pode ser usado para treinar sistemas de computadores para responder a vĂĄrios problemas que um robĂŽ pode esperar no mundo real. Usando este simulador, os robĂŽs industriais podem ser treinados sem problemas. E trabalhar com um ambiente virtual nĂŁo Ă© um exemplo mais fĂĄcil em alguns casos do que ensinar esses sistemas "manualmente".

Ao mesmo tempo, a maioria das redes neurais modernas Ă© desenvolvida para resolver um problema especĂ­fico (processamento de imagem, por exemplo). Os desenvolvedores da nova plataforma prometem ajudar a criar uma forma universal de IA que pode resolver um grande nĂșmero de tarefas. AlĂ©m disso, com a ajuda de pessoas, neste caso, o sistema de computador nĂŁo Ă© necessĂĄrio. A geração do ambiente para a rede neural ocorre sempre em uma ordem aleatĂłria.


De acordo com os desenvolvedores da plataforma, ajuda a aprender a IA da mesma maneira que as crianças aprendem. "Como vocĂȘ ou eu estudamos o mundo na infĂąncia", citou um exemplo de um dos funcionĂĄrios da DeepMind. “A comunidade de aprendizado de mĂĄquina sempre foi muito aberta. Publicamos cerca de 100 artigos por ano. AlĂ©m disso, abrimos o cĂłdigo fonte para muitos de nossos projetos. ”

Agora, o Google DeepMind abriu o cĂłdigo-fonte do DeepMind Lab, publicado no GitHub. Graças a isso, qualquer pessoa pode baixar o cĂłdigo da plataforma e modificĂĄ-lo para atender Ă s suas necessidades. Os representantes do projeto declaram que os especialistas conectados podem criar novos nĂ­veis de jogo carregando seus prĂłprios projetos no GitHub. Isso pode ajudar toda a comunidade a atingir seus objetivos com mais rapidez e eficiĂȘncia.

Este projeto nĂŁo Ă© o Ășnico para o DeepMind. No mĂȘs passado, seus representantes entraram em um acordo de cooperação com a Activision Blizzard Inc. O objetivo Ă© transformar o ambiente Starcraft 2 em um banco de testes para inteligĂȘncia artificial. Talvez no futuro prĂłximo outros desenvolvedores de jogos participem desse projeto. A propĂłsito, a IA no ambiente de jogos nĂŁo obtĂ©m vantagem sobre o inimigo, usando apenas informaçÔes visuais para promoçãocomo um homem.

Na prĂĄtica, isso significa que o Google AI precisarĂĄ prever o que o inimigo estĂĄ fazendo a qualquer momento para responder adequadamente Ă s açÔes do "inimigo". AlĂ©m disso, serĂĄ necessĂĄrio responder rapidamente ao que foi alĂ©m do plano. Tudo isso permitirĂĄ testar o prĂłximo nĂ­vel de capacidade da inteligĂȘncia artificial. "No final, queremos usar essas habilidades para resolver problemas globais", disse Demis Hassabis, fundador da Deepmind (foi comprada pelo Google em 2014 e a IA estĂĄ sendo desenvolvida com base nas conquistas da empresa adquirida).

Os especialistas em IA aprovam cautelosamente o projeto. "O bom Ă© que eles fornecem um grande nĂșmero de tipos de ambientes", disse Ilya Sutskevar, cofundadora da OpenAI. "Quanto mais tipos de ambiente um sistema encontra, mais rĂĄpido ele evolui", continuou ele. De fato, o ambiente de aprendizado de IA tridimensional contĂ©m mais de 1000 nĂ­veis e tipos de ambientes.

Zoubin Gahrahmani, professor de Cambridge, acredita que o DeepMind Lab e outras plataformas para aprimorar o desenvolvimento da inteligĂȘncia artificial contribuem para o progresso, permitindo que os pesquisadores acessem o ambiente desenvolvido. AlĂ©m disso, projetos como esse sĂŁo bastante transparentes. Ele tambĂ©m percebeuque uma pessoa atinja um determinado nĂ­vel do jogo leva muito menos tempo que um computador. Portanto, o professor duvida que a IA, sua forma fraca, seja difĂ­cil pelo menos elevar ao nĂ­vel de uma pessoa em termos de velocidade de aprendizado.

Source: https://habr.com/ru/post/pt399853/


All Articles