Bagaimana kami mengajar AI untuk mengenali gugusan galaksi

gambar

Baru-baru ini, bersama dengan tim teman-astrofisikawan, saya menyelesaikan sebuah proyek yang tujuannya adalah untuk mencari galaksi yang jauh dan kelompok mereka yang disembunyikan oleh jalinan luar angkasa. Sekarang saya akan berbagi dengan Anda apa yang kami lakukan sebagai hasil dari pekerjaan yang sulit ini.

Analisis data


Galaksi dan gugusannya adalah objek berskala besar dari bagian Semesta yang terlihat. Hasil penelitian yang ditujukan kepada mereka memberikan informasi berharga untuk memperluas bidang pengetahuan tentang berbagai struktur skala besar dan memungkinkan kami untuk mengidentifikasi fitur-fitur pembentukan bentuk modern Semesta. Saya akan menjelaskan ini secara lebih rinci dalam artikel berikut (jika Anda tertarik).

Untuk menganalisis jumlah informasi raksasa yang datang dari teleskop, bahkan untuk keberadaan galaksi, diperlukan mekanisme otomatis (atau lebih banyak astronom). Anda dapat menulis program yang melakukan tugas ini. Tetapi bagaimana cara mengajarnya untuk membedakan galaksi dan kelompoknya dari benda-benda lain di luar angkasa?

Kami beruntung, di ruang angkasa ada tempat untuk "sihir", dan khususnya untuk efek Sunyaev-Zeldovich, ditemukan kembali pada abad terakhir.

Efeknya adalah sebagai berikut: pada awalnya, foton CMB tidak energik seperti sloth pada cabang eucalyptus, tetapi setelah berinteraksi dengan elektron yang memiliki sejumlah besar energi di dalam gas, energinya meningkat karena suhu gas dalam gugus, yang dipanaskan oleh kompresi adiabatik atau di bawah aksi gaya-gaya gravitasi, atau dalam tabrakan galaksi dan awan materi intergalaksi.

gambar
Fig. 1. Pengaruh Sunyaev - Zeldovich.

Dengan meningkatkan energi, foton meningkatkan frekuensi dan bergerak dari rentang milimeter ke kisaran submillimeter. Pada saat ini, ke arah kluster galaksi, foton CMB dengan suhu yang diberikan dalam kisaran milimeter tidak cukup, oleh karena itu, ke arah kluster galaksi ada penurunan sehubungan dengan latar belakang rata-rata. Dalam rentang submillimeter, sebaliknya, ada kelebihan foton dan puncak lokal.

Ini dimanifestasikan sebagai berikut: efek dari latar belakang gelombang mikro kosmik (mis., Secara seragam mengisi alam semesta dengan radiasi termal, selanjutnya disebut CMB), diamati di sepanjang garis gugusan galaksi, terlihat lebih lemah pada frekuensi rendah dan lebih terang pada frekuensi tinggi.

Dengan demikian, di bawah pengaruh efek, latar belakang diubah menjadi sinyal negatif untuk frekuensi di bawah ambang batas (Gbr. 2, gambar di sebelah kiri) dan sinyal positif untuk frekuensi di atas ambang batas tanpa sinyal pada frekuensi nol 217 GHz (Gbr. 2, gambar di sebelah kanan). Fitur efek ini memungkinkan para astronom untuk menemukan kelompok galaksi dan superkluster di wilayah gelombang mikro spektrum.
Apa itu bukan sihir?

gambar
Fig. 2. Efek efek Sunyaev-Zeldovich pada sifat-sifat kluster galaksi yang terlihat

Bukti eksperimental untuk keberadaan efek diperoleh baru-baru ini ketika astrofisikawan mempelajari spektrum elektromagnetik menggunakan teleskop Planck dan menarik perhatian pada fakta bahwa pada beberapa frekuensi wilayah yang diamati di langit tampak "kosong", dan pada kelompok lain seluruh gugusan galaksi muncul di atasnya.

gambar
Fig. 3. Ini adalah superkluster pertama yang ditemukan menggunakan efek Sunyaev-Zeldovich. Di sebelah kiri adalah gambar yang diperoleh Planck. Panel kanan menunjukkan gambar yang diperoleh menggunakan Observatorium XMM-Newton.

Semuanya hebat, tetapi apa yang telah kita lakukan?


Anda tahu, situasi sering muncul ketika Anda memutuskan untuk melakukan sesuatu hanya karena Anda menyukainya, meskipun Anda berasumsi bahwa itu tidak akan diperlukan di masa depan. Itu situasi yang sama.

Ketika teks untuk bagian utama dari karya itu ditulis dan ada sangat sedikit waktu untuk memproses hasilnya, dan tenggat waktunya kurang dari seminggu, saya duduk di depan monitor dan tidak tahu apa yang harus dilakukan. Saya kadang-kadang bahkan menyukai situasi seperti itu, karena hanya di dalamnya saya harus menyelesaikan masalah strategi yang optimal. Saya mengerti bahwa secara fisik saya tidak bisa mengenali sejumlah besar data (sekitar 10.000 gambar), dan di belakang bahu saya hanya tiga kursus yang terlewati, salah satunya hanya membantu saya. Kursus ini didedikasikan untuk bekerja dengan Inception, jaringan saraf convolutional Google, yang pernah saya lalui "untuk pengembangan diri" (tautan di akhir artikel).

Untuk bekerja dengan jaringan saraf, perangkat lunak Anaconda 2, bahasa pemrograman Python 2.7, perpustakaan Keras untuk bekerja dengan pembelajaran mesin dan data besar, dan Theano untuk bekerja dengan data numerik digunakan.

Tentu saja, tanpa saran orang yang telah terlibat dalam pembelajaran mesin selama dua tahun, itu tidak bisa dilakukan. Oleh karena itu, setelah empat hari, kami memiliki program untuk bekerja dengan jaringan saraf pembelajaran yang mendalam.

Jaringan terdiri dari urutan lapisan konvolusional (CL) dan lapisan union (PL). Lapisan konvolusional memungkinkan Anda untuk mengekstraksi banyak kartu fitur dari gambar input, dan lapisan gabungan melakukan subsampel tertentu pada kartu fungsi.

Urutan lapisan ini sesuai dengan langkah ekstraksi fitur. Untuk mengklasifikasikan gambar, level output adalah lapisan yang terhubung penuh dengan jumlah unit yang sama dengan jumlah kelas. Jaringan dibangun sesuai dengan arsitektur dasar dengan dua tahap konvolusi (tipe khusus transformasi integral) dan subsampling yang terhubung ke pengklasifikasi, yang ditunjukkan pada gambar.

gambar
Fig. 4. Arsitektur jaringan saraf

Pelatihan jaringan berlangsung dengan guru. Katalog foto untuk pelatihan jaringan dan pengakuan lebih lanjut dari kluster galaksi dikompilasi menggunakan GLESP, skema pixelisasi untuk peta latar belakang gelombang mikro kosmik, yang menciptakan dekomposisi ortogonal ketat dari tampilan. Untuk membuat katalog pelatihan jaringan saraf, data dari misi teleskop Planck digunakan, yang tujuannya adalah untuk mencari galaksi dan klusternya menggunakan efek Sunyaev-Zel'dovich. Data misi disajikan dalam bentuk 6.135 gambar yang diambil pada frekuensi 100, 143, 217, 353 dan 545 GHz.

Beberapa hasil jaringan disajikan pada Gambar 5. Kami mendapat dua koefisien (0,35 dan 0,87). Dan jika koefisien lebih dari 0,5, maka gugus galaksi ada pada gambar.
Dan, lihatlah, kami menemukan sebuah kluster!

gambar
Fig. 5. Kinerja jaringan

Program ini diterapkan pada katalog gambar dari berbagai bagian langit dan saat ini sedang menganalisis mereka untuk keberadaan galaksi dan klusternya.

Di masa depan, kita akan mempelajari secara lebih rinci prinsip pengaruh efek Sunyaev-Zeldovich pada sifat yang terlihat dari objek skala besar di Semesta dan membuat algoritma analitik universal untuk studi objek ruang angkasa yang lebih terperinci.

Saya benar-benar berharap artikel singkat ini membawa Anda setidaknya satu menit ke dunia luar angkasa yang indah. Sampai jumpa di artikel berikut!

Tautan yang bermanfaat:

  1. Kursus awal
  2. O.V. Verkhodanov, N.V. Verkhodanova, O. Ulakhovich et al., Buletin Astrofisika, Volume 73, 1, 2018
  3. Ostriker, Jeremiah P., Ethan T., Nature, 322 (6082): 804, 1986
  4. Passmoor S., Cress C., MNRAS, 397 (1), 2009
  5. Kolaborasi Planck, Astron. Astrophys. 571, A29, 2014

Source: https://habr.com/ru/post/id419223/


All Articles