Conférence
Notice
Lieu de réalisation
Campus Croix Rouge - Université de Reims Champagne-Ardenne
Langue :
Français
Crédits
Yann Dupont (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
Citer cette ressource :
Yann Dupont. JCAD. (2023, 3 octobre). Infrastructure de mésocentre générée par Guix , in JCAD 2023. [Vidéo]. Canal-U. https://www.canal-u.tv/148075. (Consultée le 26 avril 2025)

Infrastructure de mésocentre générée par Guix

Réalisation : 3 octobre 2023 - Mise en ligne : 20 novembre 2023
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Le financement du CPER pour le HPC étant découpé en plusieurs tranches, les constructeurs retenus au fil des appels d'offres seront vraisemblablement différents. Pour contrôler au mieux un cluster qui deviendra hétérogène au fil du temps, il est apparu opportun de disposer d'une toute nouvelle infrastructure système, indépendante (autant que possible) des solutions portées par les constructeurs et dans laquelle les futures machines de calcul pourraient s'insérer simplement.

La localisation des machines déployées dans GLiCID (hébergement dans deux salles machines distantes de 3km pour les 3 années qui viennent) devait être mise à profit pour rendre le cluster tolérant à la panne. La haute disponibilité engendre une complexité accrue. Or, le souhait de l'équipe était de garantir un redéploiement de l'infrastructure simple et prédictible en cas de problèmes. 

La reproductibilité est un point fort de Guix, plusieurs fois présenté aux JCAD, mais surtout connu pour être un gestionnaire de paquets logiciels fonctionnel pour Linux. Disponible au CCIPL (maintenant fusionné dans GLiCID) depuis 2018, il est utilisé depuis de façon croissante.

Mais ses fonctionnalités ne s'arrêtent pas à la gestion de paquetages logiciels. En particulier, un ensemble de commandes « guix system » permet de générer des systèmes d'exploitation complets et ainsi de transférer au système d'exploitation les même caractéristiques de reproductibilité qui sont déjà connues pour le logiciel.

Nous avons choisi d'explorer cette voie pour le déploiement de GLiCID. L'exposé montrera pourquoi et comment les deux tiers de notre infrastructure sont désormais générés au travers de cet outil. Les définitions des machines sont gérées dans le serveur GIT de l'équipe, une notion d'héritage existe entre les familles de machines virtuelles, ce qui permet de définir de façon concise de nouvelles machines offrant de nouveaux services. Il devient également très simple de déployer et gérer des nouvelles infrastructures parallèles (de test, de pré-production).

Le principe repose sur la génération de machines virtuelles jetables car reproductibles. Celles-ci sont générées, stockées et versionnées sur un cluster CEPH. Elles sont ensuite déployées et réparties sur une plate-forme PVE (Proxmox Virtual Environment) de huit nœuds localisée dans les deux salles distantes. Parmi les services déployés, on peut citer : les répartiteurs de charge croisés, annuaires LDAP, serveurs NFS, contrôleurs Slurm, bases de données, serveurs WWW, monitoring Zabbix, frontales, nœuds de calculs...

Un retour d'expérience sera fait, détaillant l'incidence que ces choix ont eu (positifs comme négatifs) et pourquoi un taux de 100% n'est pas encore atteint.

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes

  • 105_yann_dupont_1.mp4
    Conférence
    00:14:10

    Open Networking dans un mésocentre

    Dupont
    Yann

    GLiCID est le mésocentre unique des Pays de la Loire, fusionnant les différents mésocentres pré-existants dans la région.