Notice
Infrastructure de mésocentre générée par Guix
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Le financement du CPER pour le HPC étant découpé en plusieurs tranches, les constructeurs retenus au fil des appels d'offres seront vraisemblablement différents. Pour contrôler au mieux un cluster qui deviendra hétérogène au fil du temps, il est apparu opportun de disposer d'une toute nouvelle infrastructure système, indépendante (autant que possible) des solutions portées par les constructeurs et dans laquelle les futures machines de calcul pourraient s'insérer simplement.
La localisation des machines déployées dans GLiCID (hébergement dans deux salles machines distantes de 3km pour les 3 années qui viennent) devait être mise à profit pour rendre le cluster tolérant à la panne. La haute disponibilité engendre une complexité accrue. Or, le souhait de l'équipe était de garantir un redéploiement de l'infrastructure simple et prédictible en cas de problèmes.
La reproductibilité est un point fort de Guix, plusieurs fois présenté aux JCAD, mais surtout connu pour être un gestionnaire de paquets logiciels fonctionnel pour Linux. Disponible au CCIPL (maintenant fusionné dans GLiCID) depuis 2018, il est utilisé depuis de façon croissante.
Mais ses fonctionnalités ne s'arrêtent pas à la gestion de paquetages logiciels. En particulier, un ensemble de commandes « guix system » permet de générer des systèmes d'exploitation complets et ainsi de transférer au système d'exploitation les même caractéristiques de reproductibilité qui sont déjà connues pour le logiciel.
Nous avons choisi d'explorer cette voie pour le déploiement de GLiCID. L'exposé montrera pourquoi et comment les deux tiers de notre infrastructure sont désormais générés au travers de cet outil. Les définitions des machines sont gérées dans le serveur GIT de l'équipe, une notion d'héritage existe entre les familles de machines virtuelles, ce qui permet de définir de façon concise de nouvelles machines offrant de nouveaux services. Il devient également très simple de déployer et gérer des nouvelles infrastructures parallèles (de test, de pré-production).
Le principe repose sur la génération de machines virtuelles jetables car reproductibles. Celles-ci sont générées, stockées et versionnées sur un cluster CEPH. Elles sont ensuite déployées et réparties sur une plate-forme PVE (Proxmox Virtual Environment) de huit nœuds localisée dans les deux salles distantes. Parmi les services déployés, on peut citer : les répartiteurs de charge croisés, annuaires LDAP, serveurs NFS, contrôleurs Slurm, bases de données, serveurs WWW, monitoring Zabbix, frontales, nœuds de calculs...
Un retour d'expérience sera fait, détaillant l'incidence que ces choix ont eu (positifs comme négatifs) et pourquoi un taux de 100% n'est pas encore atteint.
Thème
Documentation
Dans la même collection
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 2 : Les ateliers de la données
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 7 : Conclusion
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 4 : Des interactions croisées, liens entre le calcul et les données.
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 1 : Introduction et présentation des intervenants
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 6 : L'accompagnement autour de la gestion des données
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 3 : les liens entre les structures
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 5 : Des interactions croisées, à propos des compétences
-
Présentation du dashboard ReproVIP pour visualiser la reproductibilité dans l'imagerie médicale
BonnetAxelLa plateforme d'imagerie virtuelle VIP [1] (https://vip.creatis.insa-lyon.fr) est un portail web de simulation et d'analyse d'images médicales. Elle existe depuis plus de 10 ans et a évolué pour
-
MesoNET : Structuration nationale des mésocentres de Calcul et de Données
RenardArnaudMesoNET répond aux besoins régionaux de calcul pour la recherche académiques, la formation et les entreprises en proposant des équipements structurants.
-
Fast Polynomial Evaluation (présentation + demo)
VigneronFrançoisWe propose a new algorithm for quickly evaluating polynomials. The FPE algorithm pre-conditions a complex polynomial P of degree d in time O(d log d), with a low multiplicative constant independent
-
Présentation des performances paralléles du code QDD CUDA Fortran sur différentes Architectures GPU
PaipuriMahendraQDD est l'acronyme de Quantum Dissipative Dynamics, un ensemble de théories développées pour prendre en compte les corrélations dynamiques incohérentes dans les clusters et les molécules.
-
Parallélisation par l'intermédiaire d'une fenêtre à mémoire partagée (MPI 3.0) : application à un c…
ElyakimePierreJADIM est un code de calcul de mécanique des fluides développé en Fortran 90 à l'Institut de Mécanique des Fluides de Toulouse (IMFT).
Avec les mêmes intervenants et intervenantes
-
Open Networking dans un mésocentre
DupontYannGLiCID est le mésocentre unique des Pays de la Loire, fusionnant les différents mésocentres pré-existants dans la région.