Rede neural determina recuperação de imagem

Esta foto que você vai esquecer em breve




Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do Instituto de Tecnologia de Massachusetts desenvolveram um algoritmo que determina a recuperação de imagens. Além disso, com base nesse algoritmo, foi criada uma aplicação para melhorar as fotos para que elas sejam bem impressas no cérebro.

Como você pode imaginar, o algoritmo foi desenvolvido treinando a rede neural. O treinamento ocorreu em público. Durante o treinamento, cada fotografia do álbum foi mostrada em 600 milissegundos, depois uma pausa de 800 milissegundos e, em seguida, dezenas de outras fotos. Após um tempo aleatório, a primeira foto foi repetida. Algumas outras fotografias também foram repetidas mais tarde. A qualquer momento, o usuário pode pressionar um botão e sinalizar que reconhece a foto. Assim, a rede neural recebeu informações sobre quais fotos são melhor lembradas.

Como resultado do treinamento, a rede neural aprendeu a prever literalmente a memória humana. Além disso, destaca áreas com alta e baixa memorização no quadro, devido às quais a foto pode ser otimizada.



Como resultado, os pesquisadores compilaram um grande banco de dados de 60.000 fotografias com um índice de recordabilidade - LaMem (Large-Memorability Dataset).

O algoritmo é chamado MemNet, existe uma página de demonstração online .

Um modelo de rede neural pré-preparado pode ser baixado e testado offline usando a estrutura Caffe .

"Compreender a memorização ajudará a criar sistemas que armazenam as informações mais importantes ou, inversamente, mantêm as informações que as pessoas provavelmente esquecem", diz Aditya Khosla, estudante de graduação do Laboratório de Ciência da Computação e Inteligência Artificial, principal autor do projeto de ciências. "É como ter um grupo focal instantaneamente acessível que fale da probabilidade de lembrar uma mensagem visual específica."

Esse sistema pode ser aplicado em vários campos: da melhoria da eficiência de anúncios e mensagens em uma rede social ao desenvolvimento de materiais de treinamento mais eficazes. Ou como um assistente pessoal que traz informações para você da maneira mais memorável.

Os desenvolvedores do projeto não apenas publicaram o design da rede neural, mas também estão prontos para fornecer a todos um banco de dados LaMem com 60.000 fotos anotadas ( mediante solicitação ).

Uma discussão mais detalhada do treinamento em rede neural convolucional e a operação do algoritmo MemNet é descrita em um artigo científico . Descreve como a base foi compilada, como o jogo foi jogado na memória visual durante o treinamento da rede neural e, no final, como os resultados do trabalho da rede neural foram verificados após o treinamento.

Source: https://habr.com/ru/post/pt388175/


All Articles