La Grille de calcul mondiale pour le LHC


A global collaboration of computer centres distributes and stores LHC data, giving real-time access to physicists around the world

La Grille de calcul mondiale pour le LHC (WLCG) est une collaboration entre plusieurs centres de calcul répartis dans le monde entier. Lancée en 2002, elle a pour but de fournir les ressources nécessaires au stockage, à la distribution et à l’analyse des 15 pétaoctets (15 millions de gigaoctets) de données générées chaque année par le Grand collisionneur de hadrons (LHC).

En 1999, lorsqu’ont débuté les travaux de conception d’un système informatique pour l’analyse des données du LHC, il est vite apparu que la puissance informatique requise dépassait largement les ressources financières disponibles au CERN. Par ailleurs, la plupart des laboratoires et universités qui travaillaient ensemble sur le LHC avaient accès à des installations informatiques nationales ou régionales.

En 2002, celles-ci ont été rassemblées au sein d’une même infrastructure informatique pour le LHC – la Grille – qui relie désormais des milliers d’ordinateurs et de systèmes de stockage dans plus de 170 centres répartis dans 41 pays. Hiérarchisés en niveaux (« Tiers »), ces centres de calcul sont utilisés par une communauté de plus de 8 000 chercheurs qui ont ainsi accès aux données du LHC en temps quasi réel. Grâce à la Grille, ces données peuvent être traitées, analysées, et, dans certains cas, stockées par les utilisateurs.

La Grille de calcul mondiale pour le LHC est la plus grande grille de calcul du monde. Elle repose sur deux grilles principales, l’infrastructure de grille européenne (EGI), en Europe, et l’Open Science Grid (OSG), aux États-Unis, mais dispose de nombreuses grilles associées au niveau régional ou national, telles que TWGrid, à Taïwan, ou EU-IndiaGrid, qui soutient les infrastructures de grilles en Europe et en Asie.

Une telle infrastructure de grille est la solution la plus efficace au problème posé par l’analyse des données du LHC, présentant de nombreux avantages par rapport à un système centralisé : plusieurs copies des données peuvent être conservées dans des lieux différents, ce qui garantit leur accès à tous les scientifiques indépendamment de l'endroit où ils se trouvent ; la grille assure aussi la redistribution des tâches informatiques en cas de problème sur un site ; en outre, la présence de centres de calcul dans différents fuseaux horaires facilite la surveillance du système et permet de bénéficier de l’appui de spécialistes 24 heures sur 24 ; enfin, les ressources peuvent être réparties dans le monde entier, en fonction d’enjeux politiques et financiers.

La Grille et son utilisation

Avec plus de 8 000 chercheurs du LHC travaillant sur les quatre grandes expériences – ALICE, ATLAS, CMS et LHCb – qui sollicitent activement les données et les analysent en temps quasi-réel, le système informatique conçu pour exploiter ces données se doit d’être extrêmement flexible.

La Grille de calcul mondiale pour le LHC offre un accès fluide et sans faille à des ressources informatiques (capacité de stockage, puissance de traitement, capteurs, outils de visualisation, etc.). Les utilisateurs effectuent des demandes de calculs depuis l’un des nombreux points d’entrée du système. Une demande de calculs peut porter aussi bien sur le stockage, la capacité de traitement, ou encore la disponibilité de logiciels d’analyse des données, pour ne citer que ces éléments. La Grille de calcul vérifie l’identité de l’utilisateur et ses identifiants, puis recherche parmi les sites ceux en mesure de lui fournir les ressources demandées. Les utilisateurs n’ont pas à se soucier de la provenance des ressources informatiques : ils peuvent exploiter la puissance de la Grille et disposer de la capacité de stockage dont ils ont besoin sur simple demande.

Le niveau 0 de la Grille traite plus d’un million de calculs par jour. Les pics de distribution de données de 10 gigaoctets par seconde, soit l’équivalent de deux DVD de données par seconde, n’ont rien d’inhabituel.

Worldwide LHC Computing Grid