Genève, le 11 décembre 2020. Les quatre grandes collaborations du LHC (ALICE, ATLAS, CMS et LHCb) ont approuvé à l'unanimité la nouvelle politique de données ouvertes pour les expériences scientifiques menées auprès du Grand collisionneur de hadrons (LHC), présentée au Conseil du CERN aujourd'hui. Cette politique consiste en un engagement de publier, parmi les données recueillies aux expériences du LHC, les données scientifiques dites de niveau 3, c'est-à-dire celles qui sont requises pour produire les études scientifiques. Les données commenceront à être publiées cinq ans environ après l'acquisition, le but étant que l'ensemble complet de données soit public au moment de la clôture de l'expérience concernée. Cette politique s'inscrit dans un mouvement de plus en plus soutenu de promotion de la science ouverte, dont le but est de rendre la recherche scientifique plus reproductible, plus accessible et plus collaborative.
Les données de niveau 3 publiées peuvent contribuer à la recherche scientifique en physique des particules, ainsi qu'à la recherche dans le domaine du calcul scientifique, par exemple pour améliorer les méthodes de reconstitution ou d'analyse fondées sur les techniques d'apprentissage automatique, approche qui requiert des ensembles de données volumineux pour l'entraînement et la validation.
« Cette politique de données ouvertes reflète l'engagement du CERN à l’égard de la science ouverte, déjà affirmée dans la Convention du CERN il y a plus de 60 ans, explique Eckhard Elsen, directeur de la recherche et de l'informatique au CERN. Elle définit les étapes concrètes sur la voie d'une mise en œuvre au CERN de cette approche, qui mettra les données à la disposition de la communauté scientifique élargie ainsi que du grand public. »
Les données scientifiques sont considérées comme relevant de différents niveaux de complexité. Les données scientifiques de niveau 3 sont celles qui sont utilisées pour la plupart des études de physique. Elles seront publiées conjointement avec les logiciels et la documentation permettant de les exploiter. Cette publication permettra une analyse de grande qualité par des groupes divers : scientifiques non liés au CERN, scientifiques d'autres disciplines, participants à des projets pédagogiques et de vulgarisation, grand public.
Cette politique prévoit également la publication d'ensembles de données de niveau 1 et de niveau 2, dont des échantillons sont déjà disponibles. Le niveau 1 correspond aux éléments à l'appui des résultats publiés dans des articles scientifiques, et le niveau 2 à des ensembles de données conçus à des fins pédagogiques et de vulgarisation.
En pratique, cette information scientifique sera publiée par le canal du Portail des données ouvertes du CERN, où se trouve déjà un ensemble de données étendu résultant des expériences du LHC et d'autres expériences. Les données seront mises à disposition conformément aux normes FAIR, ce qui garantira qu’elles seront facilement trouvables, accessibles, interopérables et réutilisables.
« Cette politique constitue un cadre évolutif qui doit permettre de conserver les données expérimentales et de préserver leur caractère ouvert », explique Jamie Boyd, coordinateur du groupe de travail ayant formulé la politique. Cette stratégie vient compléter la politique existante de libre accès du CERN, qui prévoit que tous les résultats de recherche du CERN sont publiés en libre accès. Elle est également conforme à la stratégie européenne pour la physique des particules mise à jour en juin 2020. Cette nouvelle politique pourrait servir de modèle pour d'autres expériences au CERN et dans d'autres organisations scientifiques.
Le CERN a précédemment été à la pointe sur la question du libre accès aux articles scientifiques par le biais du consortium SCOAP3, partenariat mondial réunissant des bibliothèques, des organismes de financement et des institutions de recherche de 46 pays et organisations intergouvernementales, qui est à présent la plus large initiative de libre accès au monde. De plus, le CERN collabore avec de nombreuses organisations, en particulier la Commission européenne et l'UNESCO, dans leurs efforts pour promouvoir des pratiques de science ouverte au-delà de la physique des particules.
Pour en savoir plus :
- Politique du CERN relative aux données ouvertes
- Portail des données ouvertes du CERN
- La stratégie européenne pour la physique des particules est mise à jour
- (Photo) Des bandes magnétiques, solution de stockage de données à long terme, au Centre de calcul du CERN
- (Photo) C'est sur l'accélérateur LHC que s'appuient les plus grandes expériences du CERN