Traitement des données : que faut-il enregistrer ?

Des kilomètres de câbles relient les quatre détecteurs principaux du LHC aux serveurs du Centre de calcul du CERN (Photo : CERN)

Traiter le volume des données produites auprès du Grand collisionneur de hadrons (LHC) représente un véritable défi.

Les particules entrent en collision à de très hautes énergies à l’intérieur des détecteurs du CERN, produisant de nouvelles particules qui se désintègrent de façon très complexe en traversant les différentes couches de sous-détecteurs. Les sous-détecteurs enregistrent le passage de chaque particule et des microprocesseurs convertissent la trajectoire des particules et leur énergie en signaux électriques, regroupant les informations pour créer un résumé numérique de la collision (« événement »). Chaque événement produit environ un million d’octets (1 Mo) de données brutes, sachant qu’il se produit environ 600 millions événements par seconde.

Le flux de données attendu pour les quatre expériences pendant la deuxième période d’exploitation est d’environ 25 Go/s (gigaoctet par seconde).

  • ALICE: 4 Go/s (collisions Pb-Pb)
  • ATLAS: 800 Mo/s - 1 Go/s
  • CMS: 600 Mo/s
  • LHCb: 750 Mo/s

La Grille de calcul mondiale pour le LHC (WLCG) traite cette montagne de données en deux étapes. Tout d’abord, elle exécute des algorithmes spécifiques permettant d’éliminer certains événements, soit parce que les physiciens du CERN les connaissent déjà soit parce qu’ils les considèrent comme inintéressants. Les physiciens peuvent ainsi se concentrer sur les données les plus importantes, celles qui pourraient conduire à de nouvelles découvertes en physique.

(Vidéo: Département IT du CERN)

Lors de cette première étape de sélection, parmi les quelque 600 millions d’événements que les détecteurs enregistrent par seconde, seuls 100 000 sont envoyés au Centre de calcul du CERN pour être reconstitués numériquement. Lors de la deuxième étape, des algorithmes plus sophistiqués traitent à nouveau les données, ne retenant que 100 à 200 événements intéressants par seconde.  Ces données brutes sont enregistrées sur les serveurs du Centre de calcul du CERN à raison d’environ 1,5 CD par seconde (quelque 1050 mégaoctets par seconde). Les physiciens des collaborations internationales travaillent sans relâche à l’amélioration des méthodes d’étalonnage des détecteurs, et au perfectionnement des algorithmes de traitement afin de détecter des évènements toujours plus intéressants.

View in English

Dernières nouvelles : Informatique