Ketika berburu partikel fundamental baru, fisikawan selalu harus berspekulasi bagaimana partikel dapat berperilaku. Algoritma pembelajaran mesin baru tidak perlu ini.

Dalam tabrakan yang terjadi di Large Hadron Collider April ini, partikel bermuatan individu (garis oranye) dan jet partikel besar (kerucut kuning) ditemukan
Large Hadron Collider (LHC) menabrak miliaran pasang proton setiap detik. Terkadang mesin ini berhasil sedikit mengguncang realitas dan menciptakan sesuatu yang belum pernah terjadi sebelumnya dalam benturan ini. Tetapi karena kejadian seperti itu, menurut definisi, tidak terduga, fisikawan tidak tahu apa yang sebenarnya mereka butuhkan untuk dicari. Mereka khawatir bahwa dengan menyaring data miliaran tabrakan ini, dan dengan mengambil sampel sejumlah yang lebih layak, mereka mungkin secara tidak sengaja menghilangkan bukti beberapa fisika baru. "Kami selalu khawatir bahwa kami dapat mengeluarkan bayi dengan air," kata
Kyle Kranmer , spesialis fisika partikel di New York University yang bekerja sebagai bagian dari percobaan ATLAS LHC.
Dihadapkan dengan tugas untuk secara cerdas mengurangi jumlah data, beberapa fisikawan mencoba menggunakan teknologi pembelajaran mesin seperti "jaringan saraf yang dalam" untuk menyeret lautan peristiwa yang dikenalnya untuk mencari fenomena fisik baru.
Dalam kasus khas menggunakan teknologi ini, jaringan saraf yang dalam belajar untuk membedakan kucing dari anjing dengan mempelajari tumpukan foto berlabel "kucing" dan tumpukan lain yang berlabel "anjing". Tetapi pendekatan ini tidak akan berhasil dalam mencari partikel baru, karena fisikawan tidak dapat memberi makan gambar mesin dari sesuatu yang belum pernah mereka lihat. Oleh karena itu, mereka harus melakukan "belajar dengan sedikit pengawasan," ketika mesin mulai belajar dari partikel yang diketahui dan kemudian mencari peristiwa langka dengan informasi yang kurang rinci - misalnya, seberapa sering peristiwa seperti itu dapat terjadi secara umum.
Dalam sebuah makalah yang diterbitkan pada bulan Mei di arxiv.org preprints, tiga peneliti menyarankan menggunakan strategi yang sama untuk memperluas teknik berburu benjolan, teknik pencarian partikel klasik yang menemukan boson Higgs. Gagasan umum, sebagai salah satu penulis karya,
Ben Nachman , seorang peneliti di Lawrence Berkeley National Laboratory, menulis, untuk melatih mesin dalam mencari variasi langka dalam kumpulan data.
Pertimbangkan contoh paling sederhana, dalam semangat kucing dan anjing yang disebutkan, sebagai upaya untuk menemukan spesies hewan baru dalam set data yang dipenuhi dengan pengamatan hutan Amerika Utara. Jika kita mengasumsikan bahwa hewan baru akan dikelompokkan dalam wilayah geografis tertentu (ide ini sesuai dengan fakta bahwa partikel baru dikelompokkan di sekitar massa tertentu), algoritme harus dapat memilih mereka dengan perbandingan sistematis dari wilayah tetangga. Jika ada 113
karibu [rusa kutub di Amerika Utara] di British Columbia, dan 19 rusa di negara bagian Washington (meskipun ada jutaan tupai di sana-sini), program ini akan belajar membedakan karibu dari tupai tanpa secara langsung mempelajarinya. "Ini bukan sihir, tetapi sepertinya itu," kata
Tim Cohen , spesialis fisika partikel teoretis di University of Oregon yang juga mempelajari pengawasan lemah.
Untuk pencarian tradisional dalam fisika partikel, tidak seperti yang dijelaskan, para peneliti harus membuat asumsi tentang bagaimana sebuah fenomena baru mungkin terlihat. Mereka menciptakan model bagaimana partikel baru akan berperilaku - misalnya, sebuah partikel baru dapat bergerak menuju pembusukan ke dalam set partikel tertentu yang diketahui. Dan hanya setelah mereka menentukan apa yang mereka cari, mereka dapat membuat strategi pencarian khusus. Seorang mahasiswa pascasarjana biasanya membutuhkan satu tahun kerja untuk melakukan tugas ini, tetapi Nachman percaya bahwa itu bisa dilakukan lebih cepat dan lebih menyeluruh.
Algoritma CWoLa yang diusulkan, yang berarti “klasifikasi tanpa label” (MSC), dapat mencari data yang ada untuk partikel yang tidak diketahui yang membusuk menjadi dua partikel yang tidak diketahui yang lebih ringan dari jenis yang sama, atau menjadi dua partikel yang diketahui dari jenis yang sama atau berbeda. Dengan menggunakan metode pencarian biasa, dibutuhkan
setidaknya 20 tahun bagi tim yang bekerja pada LHC untuk menyaring semua kemungkinan yang bertepatan dengan opsi kedua, dan untuk opsi pertama hari ini tidak ada strategi pencarian sama sekali. Nachman, yang bekerja pada proyek ATLAS, mengatakan KBM mampu melakukan semua pencarian ini sekaligus.
Ahli lain dalam fisika partikel eksperimental setuju bahwa permainan mungkin bernilai lilin. "Kami telah mencari di berbagai tempat yang dapat diprediksi, sehingga sangat penting bagi kami untuk pergi ke arah lain dan mengisi kekosongan yang belum kami cari," kata
Kate Pachal , seorang ahli fisika yang mencari tabrakan partikel baru dalam proyek ATLAS. Dia dan rekan-rekannya bermain dengan ide mengembangkan perangkat lunak yang fleksibel yang dapat mengatasi berbagai massa partikel, tetapi tidak satu pun dari mereka yang memenuhi syarat dalam pembelajaran mesin. "Saya pikir sudah waktunya untuk mencobanya," katanya.
Diharapkan bahwa jaringan saraf akan dapat mendeteksi korelasi data yang mendasarinya yang tidak tersedia untuk model saat ini. Teknologi pembelajaran mesin lainnya telah berhasil mempercepat keefektifan tugas-tugas tertentu pada LHC, misalnya,
menentukan jet yang dikeluarkan oleh quark yang lebih rendah. Dalam pekerjaan itu, sangat jelas bahwa fisikawan kehilangan beberapa sinyal. "Mereka kehilangan beberapa informasi, dan jika Anda membayar $ 10 miliar untuk unit tersebut, maka tidak ada informasi yang boleh dilewatkan," kata
Daniel Whitson , spesialis fisika partikel di University of California, Irvine.
Namun, bidang pembelajaran mesin penuh dengan
cerita peringatan tentang program yang dicampur tangan dengan halter (atau
lebih buruk ). Beberapa di LHC khawatir bahwa semua jalur pendek ini akan mencerminkan kerja gremlin di dalam mesin itu sendiri, yang oleh para peneliti dengan hati-hati coba untuk tidak perhatikan. "Ketika Anda menemukan anomali, itu tidak segera jelas - apakah itu fisika baru, atau hanya ada yang salah dengan detektor?" Says
Till Eifert , seorang ahli fisika yang bekerja pada proyek ATLAS.