Lors de la recherche de nouvelles particules fondamentales, les physiciens ont toujours dû spéculer sur le comportement des particules. Les nouveaux algorithmes d'apprentissage automatique n'en ont pas besoin.

Lors d'une collision survenue au Grand collisionneur de hadrons en avril, des particules chargées individuelles (lignes orange) et de gros jets de particules (cônes jaunes) ont été trouvés.
Le Grand collisionneur de hadrons (LHC) heurte des milliards de paires de protons chaque seconde. Parfois, cette machine parvient à faire basculer un peu la réalité et à créer quelque chose sans précédent dans ces collisions. Mais comme de tels événements sont, par définition, inattendus, les physiciens ne savent pas exactement ce qu'ils doivent rechercher. Ils craignent qu'en passant au crible les données sur des milliards de ces collisions et en échantillonnant une quantité plus réalisable, ils pourraient par inadvertance éliminer les preuves d'une nouvelle physique. «Nous
craignons toujours de pouvoir éclabousser le bébé avec de l'eau», explique
Kyle Kranmer , spécialiste de la physique des particules à l'Université de New York qui travaille dans le cadre de l'expérience ATLAS LHC.
Confrontés à la tâche de réduire intelligemment la quantité de données, certains physiciens tentent d'utiliser des technologies d'apprentissage automatique comme les «réseaux de neurones profonds» pour entraîner la mer d'événements familiers à la recherche de nouveaux phénomènes physiques.
Dans un cas typique d'utilisation de cette technologie, le réseau neuronal profond apprend à distinguer les chats des chiens en étudiant une pile de photos étiquetées «chat» et une autre pile étiquetée «chien». Mais cette approche ne fonctionnera pas dans la recherche de nouvelles particules, car les physiciens ne peuvent pas nourrir la machine d'images de quelque chose qu'ils n'ont jamais vu. Par conséquent, ils doivent faire «l'apprentissage avec peu de supervision», lorsque les machines commencent à apprendre à partir de particules connues, puis recherchent des événements rares avec des informations moins détaillées - par exemple, la fréquence à laquelle de tels événements peuvent se produire en général.
Dans un article publié en mai sur les prépublications arxiv.org, trois chercheurs ont suggéré d'utiliser une stratégie similaire pour étendre la technique de la chasse aux bosses, une technique classique de recherche de particules qui a trouvé le boson de Higgs. L'idée générale, comme l'écrit l'un des auteurs de l'ouvrage,
Ben Nachman , chercheur au Lawrence Berkeley National Laboratory, est de former la machine à la recherche de variations rares dans l'ensemble de données.
Prenons l'exemple le plus simple, dans l'esprit des chats et des chiens mentionnés, comme une tentative de trouver une nouvelle espèce animale dans un ensemble de données rempli d'observations sur les forêts d'Amérique du Nord. Si l'on suppose que de nouveaux animaux seront regroupés dans certaines zones géographiques (cette idée correspond au fait que de nouvelles particules sont regroupées autour d'une certaine masse), l'algorithme devrait pouvoir les sélectionner par une comparaison systématique des régions voisines. S'il y a 113
caribous [rennes en Amérique du Nord] en Colombie-Britannique et 19 dans l'État de Washington (malgré la présence de millions d'écureuils ici et là), le programme apprendra à distinguer le caribou des écureuils sans les étudier directement. «Ce n'est pas magique, mais ça y ressemble», a déclaré
Tim Cohen , spécialiste théorique de la physique des particules à l'Université de l'Oregon, qui étudie également la surveillance faible.
Pour les recherches traditionnelles en physique des particules, contrairement à celle décrite, les chercheurs doivent faire des hypothèses sur l'apparence d'un nouveau phénomène. Ils créent un modèle de comportement des nouvelles particules - par exemple, une nouvelle particule peut graviter vers la désintégration en un certain ensemble de particules connues. Et seulement après avoir déterminé ce qu'ils recherchent, ils peuvent créer une stratégie de recherche spéciale. Un étudiant diplômé prend généralement un an de travail pour effectuer cette tâche, mais Nachman pense que cela pourrait être fait plus rapidement et de manière plus approfondie.
L'algorithme CWoLa proposé, qui signifie «classification sans étiquettes» (MSC), est capable de rechercher dans les données existantes toutes les particules inconnues qui se désintègrent soit en deux particules inconnues plus légères du même type, soit en deux particules connues du même type ou de types différents. En utilisant les méthodes de recherche habituelles, il aurait fallu
au moins 20 ans aux équipes travaillant sur le LHC pour passer en revue toutes les possibilités qui coïncidaient avec la deuxième option, et pour la première option aujourd'hui, il n'y a aucune stratégie de recherche. Nachman, qui travaille sur le projet ATLAS, affirme que KBM est capable de faire toutes ces recherches en une seule fois.
D'autres experts en physique expérimentale des particules conviennent que le jeu en vaut la chandelle. "Nous avons déjà cherché dans différents endroits prévisibles, il est donc très important pour nous d'aller dans l'autre sens et de combler les vides que nous n'avons pas encore recherchés", a déclaré
Kate Pachal , une physicienne à la recherche de collisions de nouvelles particules dans le projet ATLAS. Lui et ses collègues ont joué avec l'idée de développer un logiciel flexible qui pourrait faire face à un large éventail de masses de particules, mais aucun d'entre eux n'était qualifié en apprentissage automatique. «Je pense qu'il est temps de l'essayer», a-t-elle déclaré.
On espère que les réseaux de neurones seront capables de détecter des corrélations de données sous-jacentes qui ne sont pas disponibles pour les modèles actuels. D'autres technologies d'apprentissage automatique ont déjà réussi à accélérer l'efficacité de certaines tâches sur le LHC, par exemple la
détermination des jets émis par les quarks inférieurs. Dans ce travail, il était parfaitement clair que les physiciens manquaient certains signaux. "Il leur manquait des informations, et si vous avez payé 10 milliards de dollars pour l'unité, alors aucune information ne devrait être manquée", a déclaré
Daniel Whitson , spécialiste de la physique des particules à l'Université de Californie à Irvine.
Et pourtant, le domaine de l'apprentissage automatique regorge d'
histoires d'avertissement sur les programmes qui ont mélangé les mains avec des haltères (ou
pire ). Certains au LHC craignent que tous ces courts trajets reflètent le travail des gremlins dans la machine elle-même, que les expérimentateurs essayent si soigneusement de ne pas remarquer. "Quand vous avez trouvé l'anomalie, ce n'est pas immédiatement clair - est-ce une nouvelle physique, ou est-ce simplement quelque chose qui ne va pas avec le détecteur?" Dit
Till Eifert , un physicien travaillant sur le projet ATLAS.