La fin d'une époque pour l'informatique

Il fut un temps où la vapeur faisait tourner le monde. Pour construire une usine ou un laboratoire scientifique, il fallait une machine à vapeur et une réserve de charbon. Aujourd'hui, pour la plupart d'entre nous, l'énergie vient d'une prise dans le mur, sous forme d'électricité.

On peut faire l’analogie avec ce qui se passe pour l'informatique : pour exploiter un grand laboratoire comme le CERN, actuellement, il faut un centre informatique. Cette époque, pourtant, sera bientôt révolue.

data centre,Computers and Control Rooms
Les ingénieurs informatiques du CERN(Image: Sophia Bennett/CERN)

Pour les physiciens du LHC, le changement a déjà eu lieu, avec la Grille de calcul mondiale pour le LHC, gérée par la communauté mondiale de la physique des particules. À l’heure où les physiciens se préparent au LHC haute luminosité (HL-LHC), nous avons besoin d'une nouvelle solution pour satisfaire les besoins croissants en calcul et en stockage de données. La solution pourrait être du type « nuage », terme général utilisé pour désigner les systèmes distribués d'informatique et de stockage de données.

Il existe des différences manifestes entre le nuage et la Grille. Lors de la création de la Grille de calcul mondiale pour le LHC, le CERN a pu tabler sur une technologie qui ne serait disponible que plusieurs années plus tard, en s'appuyant sur la loi de Moore, selon laquelle la capacité de traitement double environ tous les 18 mois. Après plus de 50 ans, toutefois, la loi de Moore se heurte à une limite de la technologie difficile à franchir. La technologie du nuage, en revanche, ne montre aucun signe de ralentissement : une plus grande largeur de bande signifie simplement plus de fibres, ou le recours au multiplexage fréquentiel sur une même fibre.

data centre,Computers and Control Rooms
(Image: Sophia Bennett/CERN)

L'informatique en nuage est déjà bien développée. Pendant que le CERN construisait la Grille, des entreprises telles que Google ou Amazon construisaient d'immenses entrepôts de données afin d’héberger des systèmes d’informatique en nuage commerciaux. Nous pourrions nous addresser à ces entreprises pour satisfaire nos besoins en calcul, mais il est peu probable qu’elles soient en mesure de garantir la conservation de nos données pour les dizaines d’années nécessaires. Nous avons donc besoin d'un « nuage scientifique » spécifique.

Le CERN a déjà commencé à réfléchir aux paramètres d'une installation de ce type. Zenodo, par exemple, est un système d'archivage de données à l'épreuve du temps et non propriétaire, qui a été adopté par d'autres communautés faisant face à un gros volume de données. La nature virtuelle de cette technologie permet à différentes disciplines scientifiques de coexister sur une même infrastructure, ce qui la rend très attractive. Pour passer à l'étape suivante, il faudra une coopération avec la puissance publique pour développer des entrepôts pour le calcul et les données, afin de créer un nuage scientifique.

Le CERN et la communauté de la physique des particules dans son ensemble ont beaucoup à apporter dans cette entreprise. Le CERN avait joué un rôle pionnier en développant les grilles de calcul pour répondre aux besoins du LHC ; de même, nous pouvons contribuer au développement du nuage scientifique pour répondre aux besoins du HL-LHC. Outre le fait que cette machine produira cinq fois plus de luminosité que le LHC, la tendance est de faire de plus en plus arriver les données directement des capteurs situés dans les détecteurs du LHC à nos centres informatiques, avec un minimum de traitement et de réduction intermédiaires. En ajoutant à cela la tradition d'ouverture du CERN, qui a commencé avec la publication en libre accès et se manifeste à présent par une évolution vers les « données ouvertes », on dispose de tous les éléments et les savoir-faire pertinents pour concevoir les futures installations pour le calcul et les données. La physique des particules peut par conséquent contribuer au développement de l'informatique en nuage, pour le bénéfice de la science dans son ensemble.

À l'avenir, l'informatique scientifique sera accessible un peu comme l'électricité aujourd'hui : nous puiserons dans les ressources par une simple connexion, sans nous préocupper de l'endroit où nos cycles de calcul et notre stockage de données sont situés physiquement. Au lieu de nous appuyer sur notre propre grand centre informatique, nous utiliserons un nuage scientifique composé de centres de calcul et de données au service de l'entreprise scientifique dans son ensemble, et garantissant la conservation des données pour une durée aussi longue que nécessaire. La localisation des centres devrait être choisie principalement en fonction de l'efficacité de l’exploitation.

Le CERN est à l'avant-garde de l'informatique scientifique depuis des décennies, avec d’abord le système de contrôle-commande informatisé du Supersynchrotron à protons dans les années 1970, puis avec CERNET, TPC/IP, le World Wide Web, et enfin la Grille de calcul mondiale pour le LHC. Nous devons rester à l'avant-garde afin de fournir la meilleure science possible. Il est temps que la physique des particules, de concert avec les pouvoirs publics et avec d'autres disciplines scientifiques utilisant de grands volumes de données, joue son rôle dans le développement d'un monde où la prise informatique a sa place à côté de la prise électrique. C'est le moment de dire adieu à une ère révolue de l'informatique.

 

Lis plus (en Anglais) dans le CERN courier.