Vídeo: rede neural descreve uma caminhada em Amsterdã

O artista americano demonstrou os recursos da rede neural NeuroTalk, que descreve as cenas de vídeo em tempo real. O sistema cometeu erros, se corrigiu, mas às vezes dizia corretamente o que estava acontecendo. “Um homem segura uma linguiça em um coque com mostarda e ketchup”, “tesouras estão sentadas na mesa ao lado da carteira” e “vista do trem pela janela do trem” - no vídeo embaixo do gato.



Nos últimos anos, os computadores aprenderam muito sobre o reconhecimento de objetos em imagens, sejam eles rostos, animais ou móveis. As redes neurais capazes de aprender com o tempo podem descrever cenas complexas. A partir do vídeo do artista e programador americano Kyle MacDonald, fica claro que os sistemas estão longe de ter precisão absoluta. MacDonald modificou uma rede neural desenvolvida por pesquisadores de Stanford e Google para analisar o vídeo capturado em uma webcam nas ruas de Amsterdã. Software de código-fonte aberto NeuralTalk

usado pelo artista. É capaz de descrever cenas em tempo real. O programa comete erros, às vezes se corrige. Às vezes, esses sistemas são chamados de inteligência artificial, mas fazem isso com muita força: ao descrever imagens e vídeos, o software não entende o que está na imagem - apenas procura conexões entre objetos.



O Facebook está trabalhando em um sistema semelhante . A empresa está desenvolvendo um sistema que reconhece objetos e pessoas em fotografias, incluindo - para tornar a rede social mais acessível para pessoas com deficiência. A análise de vídeo do Facebook ainda não foi discutida, mas pode-se supor que a empresa esteja considerando essa idéia para a configuração intelectual do feed de notícias.


Usando essas fotos, os desenvolvedores do Facebook ensinam o sistema a reconhecer raças de cães.

Source: https://habr.com/ru/post/pt387227/


All Articles