Notice
Open Networking dans un mésocentre
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
GLiCID est le mésocentre unique des Pays de la Loire, fusionnant les différents mésocentres pré-existants dans la région.
Pour préparer l'arrivée des futures tranches du nouveau calculateur et garantir une indépendance vis-à-vis des constructeurs et intégrateurs, il a été choisi de déployer une nouvelle infrastructure virtuelle à haute disponibilité et de renforcer le stockage volumétrique Ceph existant. L'ensemble est réparti dans deux salles machines distantes et repose sur notre infrastructure Ethernet historique, non tolérante à la panne.
Passer à une topologie de type «fabric» est nécessaire pour gagner en fiabilité et performance. Le routage au plus près sera important eu égard à la bande passante (100 Gb/s) et la latence induite par la distance (3km) entre les deux extrémités de la fibre.
EVPN et VxLAN sont les technologies les plus usuelles pour construire une fabric, elles sont normés et en principe interopérables, mais en pratique, l'implémentation est parfois manquante, incomplète ou non-conforme : les déploiements impliquent un Network Operating Systems uniforme et propriétaire.
L'effet induit est de se lier avec un constructeur donné, ce qui va à l'encontre de la volonté de l'équipe. De plus, les changements de titulaires des marchés rendent l'exercice difficile : nous disposions déjà de switches performants. Mais étant issus du précédent marché MatInfo, ils devenaient difficilement commandables. Ils fonctionnent sous «OS 10» mais sont compatibles ONIE.
Ce projet, issu de l'Open Compute Project, permet de décorréler la plate-forme matérielle du système d'exploitation réseau qui y fonctionne. Parmi les offres ONIE commerciales et open-source, nous avons retenu deux solutions :
-
SONiC (Software for Open Networking in the Cloud), désormais sous l'égide de la Linux Foundation, existe en version communautaire open-source ou «entreprise». Il s'agit d'une distribution Debian où les fonctionnalités du switch sont rendues par des conteneurs Docker. Gérant de nombreuses marques de puces («Barefoot», «Broadcom», etc.), il est compatible avec notre matériel.
-
RARE (Router for Academia, Research & Education) est un projet purement académique, soutenu par Géant dans le cadre d'un projet européen (porté en France par Renater). Il est uniquement disponible pour les composants «Barefoot» (pour des questions de licence) et repose sur une distribution Debian + Nix + le logiciel FreeRTR.
Nous avons complété notre parc avec du matériel WEDGE-100BF-32X. Basé sur le chipset Barefoot, il est compatible avec les deux solutions.
Le but de cette présentation courte n'est pas de donner un avis définitif sur ces différents NOS (notre choix n'est pas encore acté, nos déploiements de fabric ne sont pas encore en production à ce jour), mais de faire un retour d'expérience rapide sur ce que nous avons pu observer entre les différentes versions de SONiC opensource et entreprise (DELL et EDGE-CORE), les versions de RARE, l'interopérabilité entres les systèmes, les différences majeures d'architecture, de gouvernance et la praticité d'utiliser ces systèmes en production.
Thème
Documentation
Dans la même collection
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 2 : Les ateliers de la données
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 7 : Conclusion
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 4 : Des interactions croisées, liens entre le calcul et les données.
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 1 : Introduction et présentation des intervenants
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 6 : L'accompagnement autour de la gestion des données
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 3 : les liens entre les structures
-
Table ronde et discussions : infrastructures de calcul et ateliers de la donnée de recherche Data G…
CastexStéphanieRenardArnaudAlbaretLucieRenonNicolasDufayardJean-FrançoisPARTIE 5 : Des interactions croisées, à propos des compétences
-
Présentation du dashboard ReproVIP pour visualiser la reproductibilité dans l'imagerie médicale
BonnetAxelLa plateforme d'imagerie virtuelle VIP [1] (https://vip.creatis.insa-lyon.fr) est un portail web de simulation et d'analyse d'images médicales. Elle existe depuis plus de 10 ans et a évolué pour
-
MesoNET : Structuration nationale des mésocentres de Calcul et de Données
RenardArnaudMesoNET répond aux besoins régionaux de calcul pour la recherche académiques, la formation et les entreprises en proposant des équipements structurants.
-
Fast Polynomial Evaluation (présentation + demo)
VigneronFrançoisWe propose a new algorithm for quickly evaluating polynomials. The FPE algorithm pre-conditions a complex polynomial P of degree d in time O(d log d), with a low multiplicative constant independent
-
Présentation des performances paralléles du code QDD CUDA Fortran sur différentes Architectures GPU
PaipuriMahendraQDD est l'acronyme de Quantum Dissipative Dynamics, un ensemble de théories développées pour prendre en compte les corrélations dynamiques incohérentes dans les clusters et les molécules.
-
Parallélisation par l'intermédiaire d'une fenêtre à mémoire partagée (MPI 3.0) : application à un c…
ElyakimePierreJADIM est un code de calcul de mécanique des fluides développé en Fortran 90 à l'Institut de Mécanique des Fluides de Toulouse (IMFT).
Avec les mêmes intervenants et intervenantes
-
Infrastructure de mésocentre générée par Guix
DupontYannLe projet DaCaS (CPER Pays de la Loire) dispose d'un volet datacentre, d'un volet réseau régional et d'un volet calcul scientifique. Ce dernier a donné naissance à GLiCID (mésocentre unique des Pays