
Les expĂ©riences au Grand collisionneur de hadrons produisent chaque seconde environ un million de gigaoctets de donnĂ©es. MĂȘme aprĂšs rĂ©duction et compression, les donnĂ©es obtenues sur le LHC en une heure, en volume, sont comparables aux donnĂ©es reçues par Facebook pour toute l'annĂ©e.
Heureusement, les experts en physique des particules n'ont pas à traiter ces données manuellement. Ils travaillent conjointement avec une sorte d'apprentissage de l'intelligence artificielle pour effectuer une analyse de données indépendante à l'aide de la technologie d'apprentissage automatique.
«Par rapport aux algorithmes informatiques traditionnels que nous développons pour effectuer un certain type d'analyse, nous créons l'algorithme d'apprentissage automatique afin qu'il décide du type d'analyse à effectuer, ce qui nous permet d'économiser un nombre incalculable d'heures-homme de développement et d'analyse», explique le physicien Alexander Radovich du CollÚge de William et Mary, travaillant dans l'expérience des neutrinos de Nova.
Radovic et un groupe de chercheurs ont décrit la portée de l'application actuelle et les perspectives futures de MO en physique des particules dans un résumé publié dans Nature en août 2018.
Tamiser les Big Data
Pour traiter l'énorme quantité de données obtenues dans des expériences modernes, telles que celles qui vont au LHC, les chercheurs utilisent des «déclencheurs» - un équipement spécial qui fonctionne avec le logiciel, en décidant en temps réel quelles données laisser pour analyse et lesquelles éliminer. .
En utilisant un détecteur
LHCb dans une expérience qui peut expliquer pourquoi il y a tellement plus de matiÚre que d'antimatiÚre dans l'Univers, les algorithmes MO prennent au moins 70% de ces décisions, explique Mike Williams du Massachusetts Institute of Technology, travaillant pour LHCb, l'un des auteurs résumé mentionné. "MO joue un rÎle dans presque tous les aspects du travail avec les données dans une expérience, des déclencheurs à l'analyse des données restantes", dit-il.
L'apprentissage automatique montre des avancĂ©es significatives dans l'analyse. Les Ă©normes dĂ©tecteurs ATLAS et CMS du LHC, grĂące auxquels la particule de Higgs a Ă©tĂ© dĂ©couverte, disposent de millions de capteurs dont les signaux doivent ĂȘtre rassemblĂ©s pour obtenir des rĂ©sultats significatifs.
«Ces signaux constituent un espace de donnĂ©es complexe», explique Michael Kagan du National Energy Accelerator Laboratory (SLAC) du dĂ©partement amĂ©ricain de l'Ănergie, un dĂ©tecteur ATLAS, qui a contribuĂ© au rapport. "Nous devons comprendre la relation entre eux afin de tirer des conclusions - par exemple, qu'une certaine trace d'une particule dans un dĂ©tecteur est laissĂ©e par un Ă©lectron, un photon ou autre chose."
MO est également bénéfique pour les expériences avec des neutrinos. NOva, qui dessert le
Fermilab , étudie comment les neutrinos se transfÚrent d'une espÚce à une autre lorsqu'ils voyagent à travers la Terre. Ces
oscillations de neutrinos sont potentiellement capables de rĂ©vĂ©ler l'existence de nouveaux types de neutrinos qui, selon certaines thĂ©ories, pourraient se rĂ©vĂ©ler ĂȘtre des particules de matiĂšre noire. Les dĂ©tecteurs NOva recherchent les particules chargĂ©es qui apparaissent lorsque les neutrinos entrent en collision avec le matĂ©riau dans le dĂ©tecteur, et les algorithmes MO les dĂ©terminent.
De l'apprentissage automatique au deep learning
Les progrÚs récents dans le domaine de la MO sont souvent appelés apprentissage en profondeur et promettent d'élargir encore la portée de la MO en physique des particules. Les GP signifient généralement l'utilisation de réseaux de neurones: des algorithmes informatiques avec une architecture inspirée d'un réseau dense et dense de neurones du cerveau humain.
Ces réseaux de neurones apprennent de maniÚre indépendante certaines tùches d'analyse par le biais de la formation, lorsqu'ils traitent des données de test, par exemple, à partir de simulations, et reçoivent un retour sur la qualité de leur travail.
Jusqu'à récemment, le succÚs des réseaux de neurones était limité car ils étaient trÚs difficiles à former, a déclaré le co-auteur Kazuhiro Terao, un chercheur du SLAC travaillant dans l'expérience des neutrinos MicroBooNE, qui étudie les oscillations des neutrinos dans le cadre du programme à court terme du Fermilab. L'expérience fera partie d'une future
expérience de neutrinos profonds souterrains . «Ces difficultés ont limité notre capacité à travailler avec des réseaux neuronaux simples à deux niveaux de profondeur», dit-il. «Grùce aux progrÚs des algorithmes et des équipements informatiques, nous en savons désormais beaucoup plus sur la façon de créer et de former des réseaux de neurones plus performants avec des centaines ou des milliers de couches.»
De nombreuses percĂ©es dans le domaine de la protection civile sont dues au dĂ©veloppement commercial des gĂ©ants de la technologie et Ă l'explosion des donnĂ©es qu'ils ont créées au cours des deux derniĂšres dĂ©cennies. «Par exemple, NOva utilise un rĂ©seau de neurones similaire Ă l'architecture de GoogleNet», explique Radovic. "Cela a amĂ©liorĂ© l'expĂ©rience dans la mesure oĂč cela n'aurait pu ĂȘtre rĂ©alisĂ© qu'en augmentant la collecte de donnĂ©es de 30%."
Un terreau fertile pour l'innovation
Les algorithmes MoD deviennent de plus en plus complexes et finement ajustĂ©s de jour en jour, ouvrant des opportunitĂ©s sans prĂ©cĂ©dent pour rĂ©soudre des problĂšmes dans le domaine de la physique des particules. Un grand nombre des nouvelles tĂąches pour lesquelles elles peuvent ĂȘtre appliquĂ©es sont liĂ©es Ă la vision par ordinateur, dit Kagan. "Ceci est similaire Ă la reconnaissance faciale, mais ce n'est qu'en physique des particules que les propriĂ©tĂ©s de l'image sont plus abstraites et complexes que les oreilles ou le nez."
Les donnĂ©es de certaines expĂ©riences, telles que NOvA et MicroBooNE, peuvent trĂšs facilement ĂȘtre transformĂ©es en images rĂ©elles, et l'IA peut immĂ©diatement ĂȘtre utilisĂ©e pour dĂ©terminer leurs caractĂ©ristiques. D'un autre cĂŽtĂ©, les images des rĂ©sultats des expĂ©riences sur le LHC doivent d'abord ĂȘtre reconstruites sur la base d'un ensemble complexe de donnĂ©es obtenues Ă partir de millions de capteurs.
«Mais mĂȘme si les donnĂ©es ne ressemblent pas Ă des images, nous pouvons toujours appliquer des mĂ©thodes de vision par ordinateur si nous traitons les donnĂ©es correctement», explique Radovic.
L'un des domaines dans lesquels cette approche peut ĂȘtre trĂšs utile est l'analyse des jets de particules se produisant en grande quantitĂ© sur le LHC. Les jets sont des jets de particules Ă©troits, dont les traces sont extrĂȘmement difficiles Ă sĂ©parer les unes des autres. La technologie de vision par ordinateur peut aider Ă comprendre ces jets.
Une autre nouvelle application de GO est la simulation de donnĂ©es sur la physique des particules, qui prĂ©dit, par exemple, ce qui se passera dans les collisions de particules sur le LHC, qui peut ĂȘtre comparĂ© Ă des donnĂ©es rĂ©elles. Ces types de simulations s'exĂ©cutent gĂ©nĂ©ralement lentement et nĂ©cessitent une puissance de traitement incroyablement Ă©levĂ©e. L'IA pourrait effectuer de telles simulations beaucoup plus rapidement, ce qui pourrait finalement devenir un complĂ©ment utile aux mĂ©thodes de recherche traditionnelles.
«Il y a quelques annĂ©es Ă peine, personne n'aurait pu penser que les rĂ©seaux de neurones profonds pouvaient ĂȘtre entraĂźnĂ©s à « voir »les donnĂ©es basĂ©es sur le bruit alĂ©atoire», explique Kagan. "Bien que ce travail en soit encore Ă ses dĂ©buts, il semble dĂ©jĂ trĂšs prometteur et devrait aider Ă rĂ©soudre les problĂšmes de donnĂ©es Ă l'avenir."
Les bienfaits d'un scepticisme sain
Malgré les percées évidentes, les amateurs de MO rencontrent souvent le scepticisme de leurs collÚgues, en particulier, car les algorithmes MO fonctionnent pour la plupart comme des «boßtes noires», ne donnant presque aucune information sur la façon dont ils sont arrivés à une certaine conclusion.
«Le scepticisme est trĂšs sain», explique William. «Si nous utilisons MO pour les dĂ©clencheurs qui suppriment certaines donnĂ©es, comme sur LHCb, alors nous devons ĂȘtre extrĂȘmement prudents dans ce problĂšme et Ă©lever la barre trĂšs haut.»
Par conséquent, afin de renforcer la position des OM dans la physique des particules, il est nécessaire de constamment essayer d'améliorer la compréhension du fonctionnement des algorithmes et, si possible, d'effectuer des comparaisons croisées avec des données réelles.
«Nous devons constamment essayer de comprendre ce que fait un algorithme informatique et d'évaluer ses résultats», explique Terao. - Cela est vrai pour tout algorithme, pas seulement pour MO. Par conséquent, le scepticisme ne doit pas entraver les progrÚs. "
L'avancĂ©e rapide permet dĂ©jĂ Ă certains chercheurs de rĂȘver de ce qui pourrait devenir possible dans un avenir proche. «Aujourd'hui, nous utilisons principalement des MO pour rechercher des fonctionnalitĂ©s dans nos donnĂ©es qui peuvent nous aider Ă rĂ©pondre Ă certaines questions», explique Terao. «Et dans une dizaine d'annĂ©es, les algorithmes MO pourraient ĂȘtre en mesure de poser indĂ©pendamment leurs propres questions et de comprendre qu'ils ont dĂ©couvert une nouvelle physique.»