O DeepMind criou um computador que aprende a usar sua memória
O DeepMind desenvolveu um novo tipo de IA que pode aprender a usar sua própria memória. O projeto é chamado de " Computador Neural Diferencial " (Computador Neural Diferencial, ou DNC).Quais são as consequências de um projeto cujo objetivo é "ensinar" um computador a usar sua própria memória? O principal é que uma forma fraca de IA está se tornando mais eficaz do que nunca. Por exemplo, esse sistema pode ajudar uma pessoa a se mudar para uma cidade completamente desconhecida sem o menor inconveniente.
Ilustração de arquitetura DNC. O controlador de rede neural recebe informações de fora, usando os dados para trabalhar com a memória através de operações específicas de leitura / gravação. Para ajudar o controlador a trabalhar com memória, o DNC mantém links temporários para rastrear os dados gravados e também captura os níveis de uso atuais para cada local de memória.A principal conquista dos funcionários da DeepMind é que eles foram capazes de ensinar sua IA a executar cada tarefa subseqüente, sem esquecer como foram as anteriores. Em uma situação normal, o sistema pode usar a mesma área de memória para registrar informações sobre várias tarefas. Depois de concluir a primeira tarefa, a máquina começa a executar a segunda. E os dados sobre a implementação do primeiro para substituir os dados sobre a implementação do segundo.
DNC plays tagO DNC do DeepMind não. Os funcionários da empresa fornecem à rede neural um pedaço de memória em um meio externo e ensinam ao sistema como usá-la. O processo de aprendizagem neste caso é da natureza de tentativa e erro. Os representantes do projeto declararam em seu site o seguinte: “Quando o DNC gera uma resposta, comparamos com a resposta correta desejada. Com o tempo, o sistema aprende a dar respostas cada vez mais perto da direita. ”O coração de um DNC é uma rede neural chamada controlador. Os criadores do sistema fazem uma analogia aqui com o processador no computador. O controlador é responsável por receber dados, gravá-los na memória e ler na memória. Além disso, o controlador analisa os dados e gera uma resposta em resposta a uma pergunta feita pelo sistema.O controlador executa vários tipos de operações na memória. A cada momento, ele decide se deve escrever algo na memória ou não. Se a solução for sim, o controlador poderá escolher duas opções de gravação - em um setor não utilizado ou em um setor em que já exista informação que o controlador estava procurando anteriormente. Isso torna possível atualizar as informações registradas em algum setor fixo. Se todos os setores da memória forem usados, o controlador poderá decidir liberar a memória, semelhante à maneira como você pode sobrescrever um setor em um disco rígido comum que não é mais necessário.Como no caso da gravação, o controlador pode ler dados de vários setores. O sistema pode procurar as informações necessárias em cada setor ou ler imediatamente os dados armazenados no setor relacionados aos dados solicitados.Tudo isso permite que o sistema resolva efetivamente a questão do uso da memória, armazenamento e recuperação de dados.Depois que a rede neural recebeu um mapa do metrô de Londres, o computador imediatamente começou a dar respostas complexas a perguntas complexas sobre a movimentação no metrô. Essas respostas foram baseadas no princípio da dedução. Aqui está um exemplo de uma das perguntas que o DNC pode responder corretamente logo após carregar um mapa do metrô na memória do sistema: "Quando entramos no vagão do metrô e passamos uma parada na linha Central, existem mais quatro paradas na linha Koltsevaya e outra linha Dzhubili duas paradas, em qual parada sairemos? ” Para assistentes digitais como o Siri, essa pergunta é insuportável - eles simplesmente não conseguirão encontrar a resposta certa, apesar de todo o poder computacional dos data centers da Apple. Mas a IA do DeepMind é capaz de dar a resposta correta.
Fonte: Photofusion / GettyAlém disso, este sistema pode dar conselhos sobre como encurtar o caminho entre diferentes paradas. Ela dá a resposta certa em 9 casos em 10.Segundo os desenvolvedores, o sistema deles pode dar a resposta certa, porque o princípio de seu trabalho é semelhante aos princípios fundamentais do pensamento humano. Obviamente, o sistema do DeepMind ainda está longe de ser um análogo real da máquina da inteligência humana, mas a versão atual funciona bem. O cérebro humano ainda gerencia com mais habilidade os dados armazenados, incluindo o processo de publicação de novas informações.Os especialistas do DeepMind esperam que, no futuro, possam criar um sistema que, sem introduzir programas especializados em sua memória, possa usar as informações disponíveis para solucionar certos problemas. Nesse caso, já podemos falar sobre um sistema completo de autoaprendizagem que pode usar os dados disponíveis para resolver problemas complexos.Ainda não está claro quando o Alphabet poderá usar as vantagens do novo sistema em seus produtos e serviços comerciais. Até o momento, a equipe da unidade está realizando estudos aprofundados e não diz nada sobre quando o uso comercial do sistema desenvolvido começará.Especialistas dizem que a empresa fez grandes avanços na pesquisa de IA, Herbert Jaeger, da Jacobs University of Bremen, afirmou que a equipe DeepMind "superou um dos estágios mais importantes no desenvolvimento evolutivo dos sistemas neurais modernos". Esse cientista tem certeza de que, de fato, a empresa criou algo mais significativo do que o descrito por seus representantes em um artigo da revista Nature .Como todos os outros projetos DeepMind, este é baseado em aprendizado profundo. Quase a mesma tecnologia que ajudou o sistema AlphaGo a vencer 4 jogos do quinto campeão mundial Lee Sedol.Agora, o DeepMind, juntamente com o Instituto Futuro da Humanidade, está realizando outro trabalho interessante. Uma equipe integrada de especialistas cria um "botão vermelho" para uma forte forma de IA. Essa é uma ferramenta que desativará a inteligência artificial no caso de ficar fora de controle.O problema de criar um instrumento desse tipo está bem demonstrado na declaração de Nick Bostrom, diretor do Instituto para o Futuro da Humanidade: “Se uma explosão intelectual nos ameaça de extinção, precisamos entender se podemos controlar o processo de detonação. Hoje, seria mais razoável acelerar o trabalho de resolução do problema de controle, em vez de suspender a pesquisa no campo da inteligência artificial. Mas até agora, seis pessoas estão resolvendo o problema de controle, enquanto dezenas, se não centenas, milhares, estão trabalhando na criação da inteligência artificial. ”Source: https://habr.com/ru/post/pt398357/
All Articles