Como ensinamos a IA a reconhecer aglomerados de galáxias

imagem

Recentemente, juntamente com uma equipe de amigos-astrofísicos, concluí um projeto cujo objetivo era procurar galáxias distantes e seus aglomerados ocultos pelo tecido do espaço sideral. Agora vou compartilhar com vocês o que fizemos como resultado desse trabalho difícil.

Análise de dados


Galáxias e seus aglomerados são objetos em larga escala da parte visível do Universo. Os resultados da pesquisa dedicada a eles fornecem informações valiosas para expandir o campo do conhecimento sobre várias estruturas em larga escala e permitem identificar as características da formação da forma moderna do Universo. Descreverei isso com mais detalhes nos seguintes artigos (se você estiver interessado).

Para analisar a quantidade gigantesca de informações provenientes dos telescópios, mesmo para a presença de galáxias, é necessário um mecanismo automático (ou mais astrônomos). Você pode escrever um programa que execute esta tarefa. Mas como ensiná-la a distinguir galáxias e seus aglomerados de outros objetos no espaço?

Tivemos sorte, no espaço havia um lugar para "magia", e especificamente para o efeito de Sunyaev-Zeldovich, descoberto no século passado.

O efeito é o seguinte: inicialmente, os fótons CMB não são energéticos como uma preguiça em um ramo de eucalipto, mas depois de interagir com elétrons que possuem uma grande quantidade de energia dentro do gás, sua energia aumenta devido à temperatura do gás no cluster, que é aquecido por compressão adiabática ou sob a ação de forças gravidade, ou na colisão de galáxias e nuvens de matéria intergaláctica.

imagem
Fig. 1. O efeito de Sunyaev - Zeldovich.

Ao aumentar a energia, o fóton aumenta sua frequência e se move da faixa milimétrica para a faixa submilimétrica. Neste momento, na direção dos aglomerados de galáxias, os fótons de CMB com uma dada temperatura na faixa de milímetros não são suficientes; portanto, na direção dos aglomerados de galáxias, há uma queda em relação ao fundo médio. Na faixa do submilímetro, pelo contrário, há um excesso de fótons e um pico local.

Isso se manifesta da seguinte forma: o efeito do fundo cósmico de micro-ondas (isto é, preenchendo uniformemente o Universo com radiação térmica, a seguir denominada CMB), observado ao longo da linha de aglomerados de galáxias, parece mais fraco em baixas frequências e mais brilhante em altas frequências.

Assim, sob a influência do efeito, o fundo é convertido em um sinal negativo para frequências abaixo do limiar (Fig. 2, imagem à esquerda) e um sinal positivo para frequências acima do limiar sem sinal na frequência zero 217 GHz (Fig. 2, imagem à direita). Essa característica do efeito permite que os astrônomos encontrem aglomerados de galáxias e superaglomerados na região de microondas do espectro.
O que não é mágico?

imagem
Fig. 2. O efeito do efeito Sunyaev-Zeldovich nas propriedades visíveis dos aglomerados de galáxias

Evidências experimentais para a existência do efeito foram obtidas recentemente quando astrofísicos estudaram o espectro eletromagnético usando o telescópio Planck e chamaram a atenção para o fato de que em algumas frequências a região observada do céu parece estar "vazia" e em outros aglomerados inteiros de galáxias estão emergindo nele.

imagem
Fig. 3. Este é o primeiro superaglomerado descoberto usando o efeito Sunyaev-Zeldovich. À esquerda está a imagem obtida por Planck. O painel direito mostra a imagem obtida usando o Observatório XMM-Newton.

Está tudo ótimo, mas o que fizemos?


Você sabe, as situações geralmente surgem quando você decide fazer algo simplesmente porque gosta, embora presuma que não será necessário no futuro. Foi a mesma situação.

Quando o texto da parte principal do trabalho foi escrito e havia muito pouco tempo para processar os resultados, e o prazo final era de menos de uma semana, sentei-me na frente do monitor e não sabia o que fazer. Às vezes até gosto de situações assim, porque somente nelas tenho que resolver o problema da estratégia ótima. Entendi que não conseguia reconhecer fisicamente uma grande quantidade de dados (cerca de 10.000 imagens) e, por trás dos meus ombros, apenas três cursos passaram, um dos quais me ajudou. O curso é dedicado ao trabalho com o Inception, a rede neural convolucional do Google, pela qual passei "pelo autodesenvolvimento" (link no final do artigo).

Para trabalhar com uma rede neural, foram utilizados o software Anaconda 2, a linguagem de programação Python 2.7, a biblioteca Keras para trabalhar com aprendizado de máquina e big data e Theano para trabalhar com dados numéricos.

Obviamente, sem o conselho de pessoas envolvidas no aprendizado de máquina por dois anos, isso não poderia acontecer. Portanto, após quatro dias, tínhamos um programa para trabalhar com redes neurais de aprendizado profundo.

Uma rede consiste em sequências de camadas convolucionais (CL) e camadas de união (PL). As camadas convolucionais permitem extrair vários cartões de recursos das imagens de entrada, e as camadas de união executam uma determinada subamostra nos cartões de funções.

Essas sequências de camadas correspondem à etapa de extração do recurso. Para classificar imagens, o nível de saída é uma camada totalmente conectada com o número de unidades igual ao número de classes. A rede é construída de acordo com a arquitetura básica, com dois estágios de convolução (um tipo especial de transformação integral) e subamostragem conectada ao classificador, conforme mostrado na figura.

imagem
Fig. 4. Arquitetura de rede neural

O treinamento em rede ocorreu com o professor. Catálogos de fotos para treinamento em rede e maior reconhecimento de aglomerados de galáxias são compilados usando o GLESP, um esquema de pixelização para mapas do fundo cósmico de microondas, que cria uma estrita decomposição ortogonal da tela. Para criar um catálogo de treinamento de redes neurais, foram utilizados dados da missão do telescópio Planck, cujo objetivo era procurar galáxias e seus aglomerados usando o efeito Sunyaev-Zel'dovich. Os dados da missão são apresentados na forma de 6.135 imagens capturadas em frequências de 100, 143, 217, 353 e 545 GHz.

Alguns dos resultados da rede são apresentados na Figura 5. Temos dois coeficientes (0,35 e 0,87). E se o coeficiente for maior que 0,5, o aglomerado de galáxias estará na imagem.
E eis que encontramos um aglomerado!

imagem
Fig. 5. Desempenho de rede

O programa foi aplicado a um catálogo de imagens de diferentes partes do céu e atualmente as analisa quanto à presença de galáxias e seus aglomerados.

No futuro, estudaremos mais detalhadamente o princípio da influência do efeito Sunyaev-Zeldovich nas propriedades visíveis de objetos de grande escala no Universo e criaremos um algoritmo analítico universal para um estudo mais detalhado dos objetos espaciais.

Eu realmente espero que este pequeno artigo leve você pelo menos um minuto ao maravilhoso mundo do espaço. Vejo você nos seguintes artigos!

Links úteis:

  1. Curso Inicial
  2. O.V. Verkhodanov, N.V. Verkhodanova, O.S. Ulakhovich et al., Astrophysical Bulletin, Volume 73, 1, 2018
  3. Ostriker, Jeremiah P., Ethan T., Nature, 322 (6082): 804, 1986
  4. Rio de Janeiro: Guanabara Koogan, 2001.
  5. Colaboração Planck, Astron. Astrophys. 571, A29, 2014

Source: https://habr.com/ru/post/pt419223/


All Articles