Cómo enseñamos a la IA a reconocer cúmulos de galaxias

imagen

Recientemente, junto con un equipo de amigos astrofísicos, completé un proyecto cuyo objetivo era buscar galaxias distantes y sus cúmulos ocultos por la estructura del espacio exterior. Ahora compartiré con ustedes lo que hicimos como resultado de este difícil trabajo.

Análisis de datos


Las galaxias y sus cúmulos son objetos a gran escala de la parte visible del Universo. Los resultados de la investigación dedicada a ellos proporcionan información valiosa para expandir el campo de conocimiento sobre varias estructuras a gran escala y nos permiten identificar las características de la formación de la forma moderna del Universo. Describiré esto con más detalle en los siguientes artículos (si está interesado).

Para analizar la cantidad gigantesca de información proveniente de los telescopios, incluso para la presencia de galaxias, se requiere un mecanismo automático (o más astrónomos). Puede escribir un programa que realice esta tarea. Pero, ¿cómo enseñarle a distinguir las galaxias y sus cúmulos de otros objetos en el espacio?

Tuvimos suerte, en el espacio había un lugar para la "magia", y específicamente para el efecto de Sunyaev-Zeldovich, descubierto en el siglo pasado.

El efecto es el siguiente: inicialmente, los fotones CMB no son energéticos como un perezoso en una rama de eucalipto, pero después de interactuar con electrones que tienen una gran cantidad de energía dentro del gas, su energía aumenta debido a la temperatura del gas en el grupo, que se calienta por compresión adiabática o bajo la acción de fuerzas gravedad, o en la colisión de galaxias y nubes de materia intergaláctica.

imagen
Fig. 1. El efecto de Sunyaev - Zeldovich.

Al aumentar la energía, el fotón aumenta su frecuencia y se mueve del rango milimétrico al rango submilimétrico. En este momento, en la dirección de los cúmulos de galaxias, los fotones de CMB con una temperatura dada en el rango milimétrico no son suficientes, por lo tanto, en la dirección de los cúmulos de galaxias hay una caída con respecto al fondo promedio. En el rango submilimétrico, por el contrario, hay un exceso de fotones y un pico local.

Esto se manifiesta de la siguiente manera: el efecto del fondo cósmico de microondas (es decir, llenar uniformemente el Universo con radiación térmica, en lo sucesivo denominado CMB), observado a lo largo de la línea de cúmulos de galaxias, se ve más débil a bajas frecuencias y más brillante a altas frecuencias.

Por lo tanto, bajo la influencia del efecto, el fondo se convierte en una señal negativa para frecuencias por debajo del umbral (Fig. 2, imagen a la izquierda) y una señal positiva para frecuencias por encima del umbral sin señal a frecuencia cero 217 GHz (Fig. 2, imagen a la derecha). Esta característica del efecto permite a los astrónomos encontrar grupos de galaxias y supercúmulos en la región de microondas del espectro.
¿Qué no es magia?

imagen
Fig. 2. El efecto del efecto Sunyaev-Zeldovich sobre las propiedades visibles de los cúmulos de galaxias

Recientemente se obtuvo evidencia experimental de la existencia del efecto cuando los astrofísicos estudiaron el espectro electromagnético utilizando el telescopio Planck y llamaron la atención sobre el hecho de que en algunas frecuencias la región observada del cielo parece estar "vacía", y en otros grupos completos de galaxias están emergiendo en él.

imagen
Fig. 3. Este es el primer supercúmulo descubierto usando el efecto Sunyaev-Zeldovich. A la izquierda está la imagen obtenida por Planck. El panel derecho muestra la imagen obtenida utilizando el Observatorio XMM-Newton.

Todo es genial, pero ¿qué hemos hecho?


Ya sabes, a menudo surgen situaciones cuando decides hacer algo simplemente porque te gusta, aunque asumes que no será necesario en el futuro. Era la misma situación.

Cuando se redactó el texto de la parte principal del trabajo y hubo muy poco tiempo para procesar los resultados, y la fecha límite fue un poco menos de una semana, me senté frente al monitor y no sabía qué hacer. A veces incluso me gustan tales situaciones, porque solo en ellas tengo que resolver el problema de la estrategia óptima. Comprendí que no podía reconocer físicamente una gran cantidad de datos (alrededor de 10,000 imágenes), y detrás de mis hombros solo pasaron tres cursos, uno de los cuales me ayudó. El curso está dedicado a trabajar con Inception, la red neuronal convolucional de Google, que una vez pasé "para el autodesarrollo" (enlace al final del artículo).

Para trabajar con una red neuronal, se utilizaron el software Anaconda 2, el lenguaje de programación Python 2.7, la biblioteca Keras para trabajar con aprendizaje automático y big data, y Theano para trabajar con datos numéricos.

Por supuesto, sin el consejo de personas que se han dedicado al aprendizaje automático durante dos años, no podría hacerlo. Por lo tanto, después de cuatro días, teníamos un programa para trabajar con redes neuronales de aprendizaje profundo.

Una red consta de secuencias de capas convolucionales (CL) y capas de unión (PL). Las capas convolucionales le permiten extraer múltiples tarjetas de características de las imágenes de entrada, y las capas de unión realizan una submuestra dada en las tarjetas de función.

Estas secuencias de capas corresponden al paso de extracción de características. Para clasificar imágenes, el nivel de salida es una capa totalmente conectada con el número de unidades igual al número de clases. La red se construye de acuerdo con la arquitectura básica con dos etapas de convolución (un tipo especial de transformación integral) y submuestreo conectado al clasificador, que se muestra en la figura.

imagen
Fig. 4. Arquitectura de red neuronal

La capacitación en red se llevó a cabo con el maestro. Los catálogos de fotos para la capacitación en red y el reconocimiento posterior de los cúmulos de galaxias se compilan utilizando GLESP, un esquema de pixelización para mapas del fondo cósmico de microondas, que crea una estricta descomposición ortogonal de la pantalla. Para crear un catálogo de entrenamiento de redes neuronales, se utilizaron datos de la misión del telescopio Planck, cuyo propósito era buscar galaxias y sus cúmulos utilizando el efecto Sunyaev-Zel'dovich. Los datos de la misión se presentan en forma de 6,135 imágenes tomadas en frecuencias de 100, 143, 217, 353 y 545 GHz.

Algunos de los resultados de la red se presentan en la Figura 5. Obtuvimos dos coeficientes (0.35 y 0.87). Y si el coeficiente es más de 0.5, entonces el cúmulo de galaxias está en la imagen.
Y, he aquí, ¡encontramos un grupo!

imagen
Fig. 5. Rendimiento de la red

El programa se aplicó a un catálogo de imágenes de diferentes partes del cielo y actualmente las analiza para detectar la presencia de galaxias y sus cúmulos.

En el futuro, estudiaremos con más detalle el principio de la influencia del efecto Sunyaev-Zeldovich en las propiedades visibles de los objetos a gran escala en el Universo y crearemos un algoritmo analítico universal para un estudio más detallado de los objetos espaciales.

Realmente espero que este breve artículo te lleve al menos un minuto al maravilloso mundo del espacio. ¡Nos vemos en los siguientes artículos!

Enlaces utiles:

  1. Curso de inicio
  2. O.V. Verkhodanov, N.V. Verkhodanova, O.S. Ulakhovich et al., Astrophysical Bulletin, Volumen 73, 1, 2018
  3. Ostriker, Jeremiah P., Ethan T., Nature, 322 (6082): 804, 1986
  4. Passmoor S., Cress C., MNRAS, 397 (1), 2009
  5. Colaboración Planck, Astron. Astrophys.571, A29, 2014

Source: https://habr.com/ru/post/es419223/


All Articles