Conférence

Notice

Lieu de réalisation

Maison des Sciences de l'Homme - Dijon

Langue :

Français

Conditions d'utilisation

Droit commun de la propriété intellectuelle

Citer cette ressource :

JCAD. (2022, 11 octobre). Veille technologique et réalisations en programmation sur processeurs vectoriels à vecteurs longs , in JCAD 2022. [Vidéo]. Canal-U. https://www.canal-u.tv/134802. (Consultée le 22 janvier 2026)

Veille technologique et réalisations en programmation sur processeurs vectoriels à vecteurs longs

Réalisation : 11 octobre 2022 - Mise en ligne : 16 novembre 2022

document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Descriptif

Les processeurs dotés de vecteurs longs sont aujourd'hui peu répandus dans l'écosystème des centres de calcul. Les processeurs vectoriels NEC SX-Aurora, qui possèdent des vecteurs de 256x64 bits ont fait l'objet de veille technologique pour le portage d'applications, dans le cadre de deux partenariats de NEC : d'une part avec le mésocentre CRIANN et d'autre part avec l'entreprise qui développe la bibliothèque MUMPS [1], solveur d'algèbre linéaire parallèle de référence. Au CRIANN, ces travaux ont été menés dans la perspective du projet MesoNET dont le volet calcul vectoriel sera mis en œuvre par ce mésocentre.

La veille technologique du CRIANN a d'abord porté sur des domaines et méthodes HPC mis en œuvre par des laboratoires normands. Le potentiel des processeurs vectoriels a été évalué pour des applications de traitement d'image. Préalablement aux portages de deux applications prévus sur les ressources de MesoNET à partir de l'automne 2022, les performances de noyaux de calcul les concernant ont aussi été analysées : noyau de calcul FFT 3D/MPI mis en jeu par une application de physique des matériaux, et noyau de calcul LBM (Lattice Boltzmann Method) pour des applications ciblées d'écoulements anisothermes avec changement de phase. Des facteurs d'accélération de 4 à 6 sont fournis par un processeur vectoriel par rapport à un serveur d'architecture x86 pour ces applications d'imagerie et ces noyaux. Le rapport de force entre Aurora et GPU Volta dépend de l'intensité arithmétique des codes, les processeurs vectoriels étant plus performants en bande passante mémoire et les GPU plus performants en puissance crête. En intelligence artificielle, le modèle d'apprentissage profond ResNet50 a aussi été évalué sur Aurora avec la librairie SOL. Une évaluation fonctionnelle de bibliothèques Python optimisées (Numpy, NCLPy), ainsi que de Spark/Frovedis a aussi été réalisée. Pour anticiper de potentiels besoins pour MesoNET, l'environnement logiciel permettant le calcul hybride x86/vector engine (offloading) a été enrichi d'une version FORTRAN de l'API VEDA (Vector Engine Driver API). Enfin, la réalisation la plus aboutie du partenariat CRIANN/NEC concerne l'application de dynamique moléculaire Quantum Espresso, optimisée sur Aurora [2] pour des cas tests du laboratoire LCS de l'ENSICAEN. Un facteur d'accélération de 3,5 a été obtenu dans la comparaison entre Aurora et AMD 7642 (réduction de temps machine à iso-nombre de Watts, ou réduction du nombre de Watts à même temps machine). Les techniques de programmation mises en œuvre pour ce portage seront le cœur de la première partie d'intervention.

La deuxième partie portera sur l'optimisation vectorielle de la bibliothèque MUMPS, travail réalisé principalement par les auteurs de ce solveur, au sein de Mumps Tech [3] avec un accompagnement de NEC. Mumps Tech [3] est une start up créée par une ingénieure et un chercheur de l'Inria et un enseignant-chercheur de Toulouse INP-ENSEEIHT. MUMPS est un solveur direct multifrontal parallélisé en OpenMP et MPI. Il permet la résolution de grands systèmes linéaires creux de manière rapide et robuste. Lors de cette intervention nous aborderons la démarche d'optimisation et de vectorisation, ainsi que l'offload sur processeur X86 de la partie scalaire. Nous aborderons également les échanges ayant permis l'amélioration du compilateur. Les travaux en cours et perspectives seront également abordés (en particulier la capacité à exploiter le format Block Low-Rank avec compression de rang faible des données).

[1] http://mumps-solver.org/

[2] https://github.com/SX-Aurora/QuantumEspresso

[3] http://mumps-tech.com

Thème

Disciplines :

Documentation

PDF Diaporama 6.38 Mo

Dans la même collection

Dans la même collection

Conférence

00:05:24

Favoris

Clôture

-
02.12.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:30:21

Favoris

Présentation du Ministère

-
30.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:18:36

Favoris

Evaluation des performances d'un portage ciblé sur GPUs dans un code de mécanique des fluides

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:19:04

Favoris

AWESOMME : Application WEb pour la génération de maSse de dOnnées expertisées en iMageriE MEdicale

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:24:09

Favoris

Playing with power at runtime: slightly slowed applications, major energy savings

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:20:35

Favoris

Faire-part de naissance de GLiCID, le Groupement Ligérien pour le Calcul Intensif Distribué

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:17:21

Favoris

Informatique décisionnelle au CC-IN2P3

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:04:38

Favoris

DMP OPIDoR V3 : vers un DMP machine actionnable

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:27:26

Favoris

Recherche Data Gouv : un écosystème au service du partage et de l'ouverture des données de recherche

Un écosystème au service du partage et de l’ouverture des données de recherche
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:16:33

Favoris

MMODA: multi-messenger observatory platform of FACe

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:17:39

Favoris

Utilisation avancée d'iRods dans le projet Orchamp-vision

-
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3
Conférence

00:25:39

Favoris

Refroidissement par immersion de serveurs : premiers retours opérationnels

Le refroidissement par immersion n'est pas une nouveauté, de l'IT en général au HPC en particulier. Il y a 35 ans, les Cray-2 et successeurs avaient leur assemblage de tours immergées dans un fluide
29.11.2022
document 1 document 2 document 3
niveau 1 niveau 2 niveau 3

Voir tout