A própria IA aprendeu a construir um cubo de Rubik



Os programas de computador há muito tempo conseguem jogar xadrez, e uma plataforma recentemente especializada da Deep Mind foi treinada para jogar profissionalmente. Tão profissional que não há jogadores entre pessoas iguais a um computador, e provavelmente não.

Outro dia, ficou claro que a máquina aprendeu de forma independente a resolver outro quebra-cabeça complexo - o Cubo de Rubik. Além disso, durante o treinamento, eles não demonstraram a ela como montar corretamente o cubo, a plataforma de software criada por cientistas dos EUA aprendeu tudo de forma independente. Alguns especialistas acreditam que outro “bastião, que era considerado de posse do homem”, caiu na frente das máquinas.

O Cubo de Rubik, ou melhor, seu algoritmo de montagem , é complicado, pois cada ação de montagem tem certas consequências, mas é bastante difícil prever seus efeitos no processo geral de montagem. Mesmo para o carro. As pessoas geralmente aprendem a montar um cubo de acordo com algoritmos desenvolvidos anteriormente que permitem resolver o quebra-cabeça no menor tempo possível.

Alguns dos alunos estão obtendo sucessos surpreendentes neste campo. Então, em maio deste ano , outro recorde foi estabelecido para montar o cubo de Rubik com as duas mãos. O campeão, um australiano de 22 anos chamado Felix Zemdegs, conseguiu coletar o cubo em apenas 4,22 segundos. Ele começou a treinar a partir dos 12 anos, assistindo a registros de montagem no YouTube.


Quanto ao carro, os robôs coletam o cubo ainda mais rápido. Este ano, o recorde foi estabelecido em 0,38 segundos. Poderia ter sido mais rápido, mas a mecânica do cubo em si não suportava. Em uma tentativa de estabelecer um recorde, os desenvolvedores tiveram que fortalecer o design do cubo, caso contrário ele simplesmente se desfez de manipulações muito rápidas da máquina.


No caso da plataforma descrita acima, o trabalho é realizado de acordo com algoritmos previamente inseridos na memória do sistema. Mas os cientistas do MIT foram capazes de treinar seu próprio sistema para montar o Cubo por conta própria.



Ao criar o próprio cubo, seu inventor, a tarefa mais interessante, foi desenvolver uma maneira de resolver o quebra-cabeça de qualquer posição. O engenheiro Rubik conseguiu fazer isso em um mês. No futuro, o algoritmo de montagem foi aprimorado repetidamente.

Recentemente, especialistas em IA começaram a procurar uma maneira de ensinar à máquina como fazer um dado. Foi utilizado um profundo aprendizado de máquina. O sistema recebeu uma tarefa e as regras foram explicadas. Em seguida, o robô teve que agir por conta própria. No caso do progresso, a máquina recebeu uma recompensa - algo assim e ensina formas fracas de IA. Afinal, o computador deve saber o que está se movendo na direção certa. E eles o informaram através do sistema de recompensa. Tudo isso ajuda a máquina a aprender.

No caso do cubo de Rubik, isso é um pouco mais complicado do que no caso usual. O fato é que, até um determinado momento, é impossível entender se o sistema está funcionando corretamente ou não. E não há sentido em recompensar por uma virada acidental de um rosto que não traz resultados. No xadrez, tudo é mais simples - já no segundo ou terceiro lance você pode entender em que direção o jogo está se movendo e se a máquina funciona bem ou não. Consequentemente, há algo a recompensar.

Para ensinar um computador a criar um cubo de Rubik, foi utilizada uma tecnologia especializada de aprendizado profundo, chamada "iteração autodidática". Essa tecnologia permite que você gire o cubo já montado para obter uma configuração semelhante à atual. Acontece algo como engenharia reversa, se esse termo for aplicável ao aprendizado de máquina. É criada uma “árvore de decisão” especializada, usada pela máquina para calcular as etapas de cada configuração.

O resultado foi impressionante. Segundo os próprios desenvolvedores, o algoritmo pode resolver o quebra-cabeça em cerca de 30 movimentos. Além disso, a máquina coleta o cubo em 100% dos casos, independentemente da versão do quebra-cabeça desmontado. Em geral, para montar um quebra-cabeça bem fragmentado, você precisa de 19 a 23 etapas. Algumas soluções levam ao resultado desejado mais rapidamente do que outras. O algoritmo de compilação mais rápido consiste em 21 etapas.

A plataforma, desenvolvida pelos engenheiros do MIT, é chamada DeepCube. "Nossa plataforma é capaz de aprender sozinho em ambientes complexos, recebendo apenas um prêmio por todo o processo de trabalho", diz o relatório.

Agora, a mesma equipe de cientistas está trabalhando na implementação de seu método de ensino para resolver outros problemas combinatórios complexos. Entre outros, a previsão da estrutura terciária da proteína .

Source: https://habr.com/ru/post/pt414463/


All Articles