Bei der Suche nach neuen fundamentalen Teilchen mussten Physiker immer spekulieren, wie sich Teilchen verhalten können. Neue Algorithmen für maschinelles Lernen benötigen dies nicht.

Bei einer Kollision, die im April dieses Jahres beim Large Hadron Collider auftrat, wurden einzelne geladene Partikel (orange Linien) und große Partikelstrahlen (gelbe Kegel) gefunden
Der Large Hadron Collider (LHC) kollidiert jede Sekunde Milliarden von Protonenpaaren. Manchmal schafft es diese Maschine, die Realität ein wenig zu rocken und bei diesen Kollisionen etwas Beispielloses zu schaffen. Da solche Ereignisse per Definition unerwartet sind, wissen die Physiker nicht genau, wonach sie suchen müssen. Sie befürchten, dass sie durch Durchsuchen von Daten zu Milliarden dieser Kollisionen und durch Abtasten einer realisierbaren Menge versehentlich Beweise für eine neue Physik entfernen könnten. "Wir machen uns immer Sorgen, dass wir das Baby mit Wasser
bespritzen können", sagt
Kyle Kranmer , ein Spezialist für Teilchenphysik an der New York University, der im Rahmen des ATLAS LHC-Experiments arbeitet.
Angesichts der Aufgabe, die Datenmenge intelligent zu reduzieren, versuchen einige Physiker, solche Technologien des maschinellen Lernens wie „tiefe neuronale Netze“ zu verwenden, um das Meer vertrauter Ereignisse auf der Suche nach neuen physikalischen Phänomenen zu schleppen.
In einem typischen Fall der Verwendung dieser Technologie lernt das tiefe neuronale Netzwerk, Katzen von Hunden zu unterscheiden, indem es einen Stapel Fotos mit der Bezeichnung „Katze“ und einen weiteren Stapel mit der Bezeichnung „Hund“ untersucht. Dieser Ansatz funktioniert jedoch nicht bei der Suche nach neuen Partikeln, da Physiker die Maschinenbilder von etwas, das sie noch nie gesehen haben, nicht füttern können. Daher müssen sie „mit wenig Aufsicht lernen“, wenn Maschinen anfangen, aus bekannten Partikeln zu lernen, und dann nach seltenen Ereignissen mit weniger detaillierten Informationen suchen - zum Beispiel, wie oft solche Ereignisse im Allgemeinen auftreten können.
In einem im Mai auf arxiv.org veröffentlichten Artikel schlugen drei Forscher eine ähnliche Strategie vor, um die Bump-Jagd zu erweitern, eine klassische Partikelsuchtechnik, bei der das Higgs-Boson gefunden wurde. Die allgemeine Idee, als einer der Autoren der Arbeit,
Ben Nachman , ein Forscher am Lawrence Berkeley National Laboratory, zu schreiben, die Maschine auf der Suche nach seltenen Variationen im Datensatz zu trainieren.
Betrachten Sie das einfachste Beispiel im Geiste der genannten Katzen und Hunde als einen Versuch, eine neue Tierart in einem Datensatz zu finden, der mit Beobachtungen nordamerikanischer Wälder gefüllt ist. Wenn wir davon ausgehen, dass neue Tiere in bestimmten geografischen Gebieten gruppiert werden (diese Idee entspricht der Tatsache, dass neue Partikel um eine bestimmte Masse gruppiert werden), sollte der Algorithmus in der Lage sein, sie durch einen systematischen Vergleich benachbarter Regionen auszuwählen. Wenn es in British Columbia 113
Karibu [Rentiere in Nordamerika] und in Washington 19
Karibu gibt (trotz der Anwesenheit von Millionen von Eichhörnchen dort und dort), wird das Programm lernen, Karibu von Eichhörnchen zu unterscheiden, ohne sie direkt zu untersuchen. "Es ist keine Magie, aber es sieht so aus", sagte
Tim Cohen , ein Spezialist für theoretische Teilchenphysik an der University of Oregon, der auch schwache Überwachung studiert.
Für die traditionelle Suche in der Teilchenphysik müssen Forscher im Gegensatz zu der beschriebenen Annahmen treffen, wie ein neues Phänomen aussehen könnte. Sie erstellen ein Modell für das Verhalten neuer Partikel - beispielsweise kann ein neues Partikel zum Zerfall in einen bestimmten Satz bekannter Partikel tendieren. Und erst nachdem sie festgestellt haben, wonach sie suchen, können sie eine spezielle Suchstrategie erstellen. Ein Doktorand benötigt normalerweise ein Jahr Arbeit, um diese Aufgabe zu erledigen, aber Nachman glaubt, dass dies schneller und gründlicher erledigt werden könnte.
Der vorgeschlagene CWoLa-Algorithmus, der „Klassifizierung ohne Etiketten“ (KBM) bedeutet, kann in vorhandenen Daten nach unbekannten Partikeln suchen, die entweder in zwei leichtere unbekannte Partikel desselben Typs oder in zwei bekannte Partikel desselben oder unterschiedlichen Typs zerfallen. Mit den üblichen Suchmethoden hätte es
mindestens 20 Jahre gedauert, bis Teams, die am LHC arbeiteten, alle Möglichkeiten durchgesehen hätten, die mit der zweiten Option zusammenfielen, und für die erste Option gibt es heute überhaupt keine Suchstrategien. Nachman, der am ATLAS-Projekt arbeitet, sagt, dass KBM alle diese Suchvorgänge auf einmal durchführen kann.
Andere Experten der experimentellen Teilchenphysik sind sich einig, dass das Spiel die Kerze wert sein könnte. "Wir haben bereits an verschiedenen vorhersehbaren Orten gesucht, daher ist es für uns sehr wichtig, in die andere Richtung zu gehen und die
Lücken zu füllen, nach denen wir noch nicht gesucht haben", sagte
Kate Pachal , eine Physikerin, die im ATLAS-Projekt nach Kollisionen neuer Partikel sucht. Er und seine Kollegen spielten mit der Idee, flexible Software zu entwickeln, die eine Vielzahl von Partikelmassen bewältigen kann, aber keine von ihnen war für maschinelles Lernen qualifiziert. "Ich denke, es ist Zeit, es zu versuchen", sagte sie.
Es ist zu hoffen, dass neuronale Netze zugrunde liegende Datenkorrelationen erkennen können, die aktuellen Modellen nicht zur Verfügung stehen. Andere Technologien für maschinelles Lernen haben die Effektivität bestimmter Aufgaben auf dem LHC bereits erfolgreich beschleunigt, beispielsweise die
Bestimmung der von den unteren Quarks ausgegebenen
Jets . In dieser Arbeit war völlig klar, dass Physiker einige Signale übersehen. "Ihnen fehlten einige Informationen, und wenn Sie 10 Milliarden US-Dollar für das Gerät bezahlt haben, sollten Sie keine Informationen verpassen", sagte
Daniel Whitson , Spezialist für Teilchenphysik an der University of California in Irvine.
Und doch ist das Gebiet des maschinellen Lernens voller
warnender Geschichten über Programme, die gemischte Hände mit Hanteln (oder noch
schlimmer ) haben. Einige am LHC befürchten, dass all diese kurzen Wege die Arbeit der Gremlins in der Maschine selbst widerspiegeln, was die Experimentatoren so sorgfältig versuchen, nicht zu bemerken. "Als Sie die Anomalie gefunden haben, ist nicht sofort klar, ob es sich um eine neue Physik handelt oder ob nur etwas mit dem Detektor nicht stimmt." Sagt
Till Eifert , ein Physiker, der am ATLAS-Projekt arbeitet.