TOPIC:

Des décisions plus intelligentes à la vitesse des collisions

L’apprentissage automatique transforme la manière dont ATLAS et CMS filtrent les collisions en temps réel

Par:

Piotr Traczyk

Vue d’artiste d’une collision de particules mêlée à un circuit électronique (Image : Daniel Dominguez/CERN)

Une prise de décision intelligente et rapide est essentielle pour faire face à l’avalanche de collisions produites au LHC. À l’ère du LHC à haute luminosité (HiLumi LHC), les expériences ATLAS et CMS devront traiter des débits de données acquises par leurs détecteurs qui équivaudront à environ un quart du trafic internet mondial de 2025. Tout cela en temps réel, aux premières étapes de la sélection d’événements.

Chaque seconde, des milliards de protons se percutent aux quatre points de collision du LHC, générant un volume de données si considérable qu’il est impossible de toutes les stocker. Les données doivent donc être filtrées en temps réel par ce qu’on appelle des « systèmes de déclenchement ». Des algorithmes spécifiques évaluent, d’après des caractéristiques prédéfinies, quelles collisions sont potentiellement intéressantes. Au final, environ un événement sur 20 000 est examiné et stocké à des fins d’analyse plus poussée.

Pour tenter de découvrir des failles dans le Modèle standard de la physique des particules, voire des phénomènes complètement nouveaux, les chercheurs des expériences CMS et ATLAS au LHC construisent à l’intérieur de leurs détecteurs des systèmes de déclenchement plus intelligents et d’une puissance de calcul supérieure, capables d’exploiter plus de données en temps réel. Récemment, ces expériences ont utilisé des solutions reposant sur l’IA et l’apprentissage automatique pour améliorer le potentiel pour la physique de leurs systèmes de déclenchement, ouvrant la voie à la détection d’événements potentiellement intéressants ou d’anomalies.  

Les physiciens des particules ont très tôt adopté les réseaux neuronaux et utilisent des algorithmes d’apprentissage automatique pour l’analyse de données depuis les années 1990. Jusqu’à présent, ces outils ont été principalement utilisés pour repérer les traces laissées par les particules dans les détecteurs et classer par catégories les processus de physique à l’œuvre. Ces méthodes ont déjà permis de rendre l’analyse de données plus performante, bien au-delà de ce qui était envisagé au début de l’exploitation du LHC. CMS et ATLAS ont ainsi pu mesurer des processus clés, en particulier ceux associés au boson de Higgs, beaucoup plus tôt que prévu. 

Cependant, l’apprentissage automatique fait plus qu’améliorer les performances : il ouvre la voie à des approches totalement nouvelles pour la découverte de phénomènes inconnus. La détection d’anomalies non supervisée en est un exemple : au lieu de cibler des particules ou des processus spécifiques prédits par le Modèle standard, cette technique recherche toutes sortes de contradictions entre les données et la théorie. Les algorithmes sont entraînés, sur des collisions du LHC sélectionnées aléatoirement, à encoder les événements « standard » enregistrés par les détecteurs, afin que les physiciens puissent sélectionner les événements potentiellement intéressants de manière objective.

« C’est un changement radical pour la physique des particules, parce qu’il nous permet de fouiller les données du LHC à la recherche de nouveaux phénomènes, sans préjuger de ce à quoi ces phénomènes pourraient ressembler, explique Maurizio Pierini de CMS. C’est essentiel, alors que nous nous dirigeons vers une ère de précision au LHC et que nous continuons d’explorer tous les recoins susceptibles de dissimuler des signes d’une nouvelle physique. »

Toutefois, pour exploiter pleinement cette technique, on ne peut se limiter à la petite fraction de données sélectionnées par les systèmes de déclenchement de CMS et d’ATLAS. Pour une détection des anomalies vraiment objective, l’algorithme doit être appliqué dès le niveau du déclenchement, afin d’éviter que les algorithmes des systèmes de déclenchement suppriment des événements potentiellement intéressants avant que l’analyse ait une chance de les trouver. Cette contrainte présente un défi important, car le système de déclenchement doit prendre une décision chaque fois qu’une collision se produit, soit 40 millions de fois par seconde ou toutes les 25 nanosecondes. À un tel rythme, il n’est pas possible d’appliquer des algorithmes d’apprentissage automatique nécessitant une grande puissance de calcul… ou peut-être que si ?

En 2018, les chercheurs de CMS ont mis au point un outil open source capable de traduire des algorithmes d’apprentissage automatique dans le langage (microgiciel) qui contrôle les dispositifs logiques programmables (FPGA). Il s’agit d’éléments électroniques programmables personnalisés utilisés pour prendre des décisions ultrarapides à la première étape de la sélection d’événements, qu’on appelle le déclenchement de niveau 1. L’équipe a ensuite élaboré des stratégies pour « compresser » les algorithmes et les adapter à l’électronique du déclenchement de niveau 1, sans trop réduire leur performance.

Les expériences ATLAS et CMS mettent déjà en œuvre cette approche au déclenchement de niveau 1 pendant la phase d’acquisition de données. Grâce à cela, pour la première fois, les chercheurs disposent d’un ensemble de données à analyser basé sur la nouvelle approche de déclenchement.

« Les systèmes de déclenchement permettant de détecter les anomalies sont très différents de ceux que l’on trouve habituellement au LHC, et leur utilisation à des fins de découvertes potentielles exige que nous développions des techniques d’analyse de données complètement nouvelles, explique Dylan Rankin d’ATLAS. Ces premiers ensembles de données que nous collectons à ATLAS et à CMS nous permettront de mieux comprendre comment nous devons nous y prendre. Nous en tirerons des enseignements essentiels afin d’améliorer nos modèles et nos techniques pour la mise au point des futurs systèmes de déclenchement. »

En attendant, des approches plus avancées sont en cours de développement, à la fois au sein des expériences proprement dites et dans le cadre du projet Next-Generation Triggers. Lancé en janvier 2024 sous la forme d’une collaboration entre les départements Physique expérimentale, Physique théorique et Technologie de l’information du CERN et les expériences ATLAS et CMS, ce projet sur cinq ans a monopolisé une grande partie du travail de R&D. Mené majoritairement par des chercheurs en début de carrière, il se concentre sur les défis du futur LHC à haute luminosité, dont l’exploitation devrait débuter en 2030. L’objectif principal est d’extraire plus d’informations de physique des volumes de données considérablement accrus en améliorant la sélection des événements de collision les plus pertinents tout en éliminant efficacement le bruit de fond. Ces avancées sont cruciales pour améliorer la sensibilité des expériences et, à terme, augmenter les chances de découvrir des phénomènes auparavant inconnus. Pour parvenir à cet objectif, les chercheurs combinent des techniques modernes d’IA et d’apprentissage automatique, et du matériel spécialisé, tels des dispositifs logiques programmables, basé sur des outils tels que hls4ml. Ainsi, ils peuvent déployer des modèles d’apprentissage automatique directement sur l’électronique de déclenchement, tout en affinant par ailleurs l’orientation théorique et les outils d’analyse pour l’étude des événements ultra-rares.

Ensemble, ces progrès devraient permettre, même aux débits de données extrêmes du HL-LHC, de détecter des signaux potentiellement révolutionnaires dans le flot des signaux générés lors des collisions.

Related Articles

No posts were found. Try to change the category or the date filters.