Comment nous avons appris à l'IA à reconnaître les amas de galaxies

image

Récemment, avec une équipe d'amis-astrophysiciens, j'ai réalisé un projet dont le but était de rechercher des galaxies lointaines et leurs amas cachés par le tissu de l'espace. Je vais maintenant partager avec vous ce que nous avons fait à la suite de ce travail difficile.

Analyse des données


Les galaxies et leurs amas sont des objets à grande échelle de la partie visible de l'Univers. Les résultats des recherches qui leur sont consacrées fournissent des informations précieuses pour élargir le champ des connaissances sur diverses structures à grande échelle et nous permettent d'identifier les caractéristiques de la formation de la forme moderne de l'Univers. Je décrirai cela plus en détail dans les articles suivants (si vous êtes intéressé).

Pour analyser la quantité gigantesque d'informations provenant des télescopes, même pour la présence de galaxies, un mécanisme automatique (ou plusieurs astronomes) est nécessaire. Vous pouvez écrire un programme qui exécute cette tâche. Mais comment lui apprendre à distinguer les galaxies et leurs amas d'autres objets dans l'espace?

Nous avons eu de la chance, dans l'espace, il y avait une place pour la «magie», et en particulier pour l'effet de Sunyaev-Zeldovich, découvert au siècle dernier.

L'effet est le suivant: au départ, les photons CMB ne sont pas énergétiques comme un paresseux sur une branche d'eucalyptus, mais après avoir interagi avec des électrons qui ont une grande quantité d'énergie à l'intérieur du gaz, leur énergie augmente en raison de la température du gaz dans l'amas, qui est chauffé par compression adiabatique ou sous l'action des forces la gravité, ou dans la collision de galaxies et de nuages ​​de matière intergalactique.

image
Fig. 1. L'effet de Sunyaev - Zeldovich.

En augmentant l'énergie, le photon augmente sa fréquence et passe de la plage millimétrique à la plage submillimétrique. En ce moment, dans la direction des amas de galaxies, les photons de CMB avec une température donnée dans la gamme des millimètres ne suffisent pas, par conséquent, dans la direction des amas de galaxies, il y a une baisse par rapport au fond moyen. Dans la gamme submillimétrique, au contraire, il y a un excès de photons et un pic local.

Cela se manifeste comme suit: l'effet du fond cosmique des micro-ondes (c'est-à-dire remplissant uniformément l'Univers de rayonnement thermique, ci-après dénommé CMB), observé le long de la ligne des amas de galaxies, semble plus faible aux basses fréquences et plus brillant aux hautes fréquences.

Ainsi, sous l'influence de l'effet, le fond est converti en un signal négatif pour les fréquences inférieures au seuil (Fig.2, image à gauche) et un signal positif pour les fréquences supérieures au seuil sans signal à fréquence nulle 217 GHz (Fig.2, image à droite). Cette caractéristique de l'effet permet aux astronomes de trouver des amas de galaxies et de superamas dans la région micro-ondes du spectre.
Qu'est-ce qui n'est pas magique?

image
Fig. 2. L'effet de l'effet Sunyaev-Zeldovich sur les propriétés visibles des amas de galaxies

Des preuves expérimentales de l'existence de l'effet ont été obtenues récemment lorsque des astrophysiciens ont étudié le spectre électromagnétique à l'aide du télescope Planck et ont attiré l'attention sur le fait qu'à certaines fréquences, la région du ciel observée semble être "vide", et à d'autres, des amas entiers de galaxies émergent.

image
Fig. 3. Il s'agit du premier superamas découvert à l'aide de l'effet Sunyaev-Zeldovich. À gauche, l'image obtenue par Planck. Le panneau de droite montre l'image obtenue à l'aide de l'observatoire XMM-Newton.

C'est très bien, mais qu'avons-nous fait?


Vous savez, des situations surviennent souvent lorsque vous décidez de faire quelque chose simplement parce que vous l'aimez, bien que vous supposiez que cela ne sera plus nécessaire à l'avenir. C'était la même situation.

Lorsque le texte de la partie principale du travail a été écrit et qu'il y avait très peu de temps pour traiter les résultats, et que le délai était un peu moins d'une semaine, je me suis assis devant le moniteur et je ne savais pas quoi faire. J'apprécie même parfois de telles situations, car c'est seulement en elles que je dois résoudre le problème de la stratégie optimale. J'ai compris que je ne pouvais pas physiquement reconnaître une grande quantité de données (environ 10 000 images), et derrière mes épaules, seuls trois cours ont réussi, dont l'un m'a juste aidé. Le cours est dédié à travailler avec Inception, le réseau de neurones convolutionnels de Google, que j'ai déjà parcouru "pour l'auto-développement" (lien à la fin de l'article).

Pour travailler avec un réseau de neurones, le logiciel Anaconda 2, le langage de programmation Python 2.7, la bibliothèque Keras pour travailler avec l'apprentissage automatique et les mégadonnées, et Theano pour travailler avec les données numériques ont été utilisés.

Bien sûr, sans les conseils de personnes engagées dans le machine learning depuis deux ans, cela ne pourrait pas. Par conséquent, après quatre jours, nous avions un programme pour travailler avec les réseaux neuronaux d'apprentissage en profondeur.

Un réseau est constitué de séquences de couches convolutives (CL) et de couches d'union (PL). Les couches convolutives vous permettent d'extraire plusieurs cartes de fonction à partir d'images d'entrée, et les couches d'union effectuent un sous-échantillon donné sur les cartes de fonction.

Ces séquences de couches correspondent à l'étape d'extraction des entités. Pour classer les images, le niveau de sortie est une couche entièrement connectée avec un nombre d'unités égal au nombre de classes. Le réseau est construit selon l'architecture de base avec deux étapes de convolution (un type spécial de transformation intégrale) et de sous-échantillonnage connectés au classificateur, comme illustré sur la figure.

image
Fig. 4. Architecture du réseau neuronal

Une formation en réseau a eu lieu avec l'enseignant. Des catalogues de photos pour la formation des réseaux et la reconnaissance des amas de galaxies sont compilés à l'aide de GLESP, un schéma de pixelisation pour les cartes du fond micro-ondes cosmique, qui crée une décomposition orthogonale stricte de l'affichage. Pour créer un catalogue de formation de réseaux de neurones, des données de la mission du télescope Planck ont ​​été utilisées, dont le but était de rechercher des galaxies et leurs amas en utilisant l'effet Sunyaev-Zel'dovich. Les données de mission sont présentées sous la forme de 6 135 images prises à des fréquences de 100, 143, 217, 353 et 545 GHz.

Certains des résultats du réseau sont présentés dans la figure 5. Nous avons obtenu deux coefficients (0,35 et 0,87). Et si le coefficient est supérieur à 0,5, alors l'amas de galaxies est sur l'image.
Et voilà, nous avons trouvé un cluster!

image
Fig. 5. Performances du réseau

Le programme a été appliqué à un catalogue d'images de différentes parties du ciel et les analyse actuellement pour la présence de galaxies et de leurs amas.

À l'avenir, nous étudierons plus en détail le principe de l'influence de l'effet Sunyaev-Zeldovich sur les propriétés visibles des objets à grande échelle dans l'Univers et créerons un algorithme analytique universel pour une étude plus détaillée des objets spatiaux.

J'espère vraiment que ce court article vous emmènera au moins une minute dans le monde merveilleux de l'espace. Rendez-vous dans les articles suivants!

Liens utiles:

  1. Cours d'initiation
  2. O.V. Verkhodanov, N.V. Verkhodanova, O.S. Ulakhovich et al., Astrophysical Bulletin, Volume 73, 1, 2018
  3. Ostriker, Jeremiah P., Ethan T., Nature, 322 (6082): 804, 1986
  4. Passmoor S., Cress C., MNRAS, 397 (1), 2009
  5. Collaboration Planck, Astron. Astrophys.571, A29, 2014

Source: https://habr.com/ru/post/fr419223/


All Articles