Pesquisa reversa de imagens: Um guia da Agência de detetives Bellingcat


Foto de uma das investigações on-line de Bellingcat

A agência internacional Bellingcat publicou várias dicas para identificar pessoas e localizações geográficas em fotografias usando o recurso "Image Search" nos mecanismos de pesquisa.

Descobriu-se que nessa relação não há igual ao mecanismo de busca russo Yandex. Imagens " . De acordo com um exemplo, o mecanismo encontra fotografias desse rosto em uma configuração e iluminação completamente diferentes, o que indica um reconhecimento avançado de rosto. O Google e outras empresas não têm nada disso, admitem os especialistas. Assim, o Yandex pode ser chamado de líder indiscutível na pesquisa reversa de imagens.

O guia publicado explica os métodos básicos de investigações on-line, com foco na identificação de indivíduos e endereços.

Pesquise fotos semelhantes por modelo de rosto no Yandex, Google e Bing.



No primeiro exemplo, o Yandex encontrou inúmeras fotografias da pessoa desejada de várias fontes (entre os melhores resultados, apenas estranhos foram apresentados em apenas dois casos), e os resultados diferem da imagem original, mas mostram a mesma pessoa. O Google não encontrou nada e, nos resultados de pesquisa do Bing, havia apenas um resultado com a mesma pessoa (quinta imagem, segunda linha).

Os especialistas da Bellingcat usam constantemente o Yandex em investigações e não expressam paranóia em particular sobre sua origem russa. Esta é a primeira ferramenta que eles recorrem no trabalho. Em segundo lugar, está o Bing, onde na pesquisa existem várias funções exclusivas, como destacar uma área específica da imagem para pesquisa.

O Google é adequado para a pesquisa reversa mais simples. Por exemplo, identificando pessoas famosas em fotografias, pesquisando a fonte das imagens, determinando o autor de uma obra de arte e assim por diante. No entanto, se você quiser encontrar imagens semelhantes (não cópias exatas), ficará desapontado.

Por exemplo, ao procurar uma pessoa que tentou atacar um jornalista da BBC em um comício de Trump, o Google encontra a fonte da imagem cortada, mas não consegue encontrar imagens adicionais dele ou de alguém pelo menos um pouco semelhante.





Embora o Google não tenha realmente ajudado a encontrar outras instâncias do rosto dessa pessoa ou pessoas semelhantes a ele, ele ainda encontrou a versão original e sem cortes da foto da qual a captura de tela foi tirada.

Teste


Para testar vários métodos e mecanismos de busca de imagens reversas, os especialistas da Bellingcat capturaram várias imagens representando vários tipos de pesquisa, incluindo fotografias originais (anteriormente não enviadas para a Internet) e processadas. Eles observam que agora a pesquisa pode não funcionar como funcionava durante os testes, porque após a publicação do artigo, os mecanismos de pesquisa já indexaram essas fotos e as integraram aos resultados.

As fotos de teste incluem várias regiões geográficas diferentes com materiais de origem na Europa Ocidental, Europa Oriental, América do Sul, Sudeste Asiático e Estados Unidos. Em cada uma dessas fotos, os objetos individuais da imagem são destacados para verificar os pontos fortes e fracos de cada mecanismo de pesquisa.

Uma das fotos do teste: Palácio Olisov em Níjni Novgorod, Rússia (original, não foi carregado anteriormente na rede):



Separadamente: SUV branco em Nizhny Novgorod:



Separadamente: trailer em Nizhny Novgorod:



Em um edifício em Nizhny Novgorod, como em outras fotografias, os melhores resultados foram mostrados pelas imagens Yandex. Os repórteres de Bellingcat dizem que seus resultados são tão impressionantes que às vezes parecem algum tipo de magia negra, embora não sem erros.

Nesse caso, a Yandex reconheceu facilmente esse prédio. Ele encontrou fotografias tiradas do mesmo ângulo e também de outros ângulos, incluindo 90 ° no sentido anti-horário (veja as duas primeiras imagens na terceira linha) do ponto de vista da imagem original.



Yandex também reconheceu facilmente o SUV branco em primeiro plano da foto como o Nissan Juke.



Finalmente, na mais complexa busca isolada por essa imagem, Yandex não conseguiu identificar o discreto trailer cinza em frente ao prédio. Alguns resultados têm a mesma aparência da imagem original, mas nenhum deles é verdadeiro.



Comparado a esses resultados, a exibição do Google e do Bing parece ridícula, embora o Google tenha classificado corretamente o trailer como um trailer de viagem .

Se a pesquisa de imagens falhar, truques simples ajudam em alguns casos:

  • imagem no espelho da foto;
  • o uso de filtros de cores;
  • Remoção de elementos desnecessários do quadro que podem complicar a pesquisa.

Ferramentas auxiliares


Além da pesquisa de imagens padrão, a Bellingcat recomenda várias ferramentas de suporte para a realização de investigações online.

Em primeiro lugar, existem ferramentas especializadas para processar certos tipos de fotos. Por exemplo, o aplicativo Merlin Bird ID da Cornell Lab identifica com extrema precisão o tipo de pássaro em uma fotografia ou sugere opções.

Ou FlagID , onde você pode inserir manualmente informações sobre a bandeira e descobrir sua origem.



Se a fotografia contiver caracteres de um idioma desconhecido, você poderá repeti-los manualmente usando a ferramenta de escrita manual do Google Tradutor.







Pixelização e desfoque


Conforme descrito em detalhes neste tópico do Twitter , você pode pixelizar ou desfocar os elementos de uma foto para enganar um mecanismo de pesquisa - e focar apenas o fundo. Nesta foto da porta-voz Rudi Giuliani, a imagem exata não permite entender onde a foto foi tirada.



Mas se você desfocar / pixelizar uma mulher no meio da imagem, o Yandex poderá analisar outros elementos da imagem: cadeiras, pinturas, lustres, tapetes, padrões de parede e assim por diante.



Depois disso, Yandex sabe exatamente onde a imagem foi tirada: este é um hotel popular em Viena.





Os pesquisadores da Bellingcat concluem que os mecanismos de pesquisa de imagens reversas avançaram significativamente na última década, e o progresso continua em ritmo acelerado.

O progresso é facilitado por um grande aumento na base de pesquisa. Grandes empresas de Internet conseguiram convencer os usuários a colocar arquivos de fotos pessoais em sua hospedagem, nos quais a Inteligência Artificial é treinada:

Para isso, o Google Fotos e o Yandex.Disk oferecem armazenamento gratuito de fotos em quantidades ilimitadas. Essa é uma quantidade infinita de material para aprendizado de máquina.

Eles prevêem que em breve um programa público de reconhecimento de rosto começará a funcionar no Facebook ou Instagram, o que infligirá um sério golpe à privacidade na Internet, mas também aumentará a eficácia das investigações digitais.



Source: https://habr.com/ru/post/pt483736/


All Articles