7 November 2024, 10:00

GliCID — le mésocentre unique de la région pays de la Loire — issu de plusieurs centres de calculs disséminés sur le territoire, a mis à disposition mi-2023 son premier cluster de calcul.

Disposant de nœuds de calculs et de frontales fonctionnant sous une distribution Linux très commune, avec des outils habituels tels que les modules, ce cluster est volontairement proche des précédents : Les usagers des anciens centres ne sont pas perdus.

Mais en y regardant de plus près, tout n’est pas si habituel. Guix y tient une place importante.

Guix est immédiatement utilisable par tous les utilisateurs, sans restriction, apportant ses avantages : un large choix de logiciels supplémentaires, la garantie d’une exécution correcte et reproductible sur l’ensemble des machines (le cluster dispose de plusieurs tranches hétérogènes). Le tout en totale autonomie pour l’usager : le profil adéquat doit juste être chargé (évitant de perturber des environnements historiques parfois fragiles, tels que ceux générés par les modules).

GliCID dispose de son propre canal pour enrichir le panel de logiciels avec des paquets ad-hoc, par exemple des versions d’Open MPI optimisées pour le réseau RoCE et destinées à des versions spécifiques de Fortran.

Certains logiciels très communs ou personnalisés pour le cluster sont directement mis à disposition de tous nos usagers, de façon transparente (ils n’ont pas conscience d’utiliser des paquets Guix), grâce à un profil global dédié rendu disponible à tous (via l’utilisation de/usr/local/bin).

Cette même méthode permet la mise à disposition d’un binaire global guix disposant de tous les canaux supplémentaires et mis à jour toutes les nuits.

Un tout nouvel utilisateur n’a plus à lancer le fameux premier guix pull, pour bénéficier de la logithéque complète et à jour. Cette étape, longue et normalement nécessaire lors de la toute première utilisation, est souvent mal comprise. Nous l’avons identifié comme une barrière importante à la démocratisation de l’outil, en particulier lors de formations.

Nous sommes allés plus loin dans l’utilisation de Guix. Si la partie visible (nœuds de calcul, frontales principales) reste basée sur une distribution Linux habituelle, ce n’est plus le cas de la plus grosse partie de l’infrastructure de nos clusters, qui est elle générée par Guix System (contrôleurs slurm, gestion d’identités, de haute disponibilité, bases de données, monitoring, serveurs WWW, bastions SSH, frontales et nœuds de debug…) et déployée sur des machines virtuelles gérées par Proxmox.

La stabilité et facilité de redéploiement de l’ensemble sont remarquables.

À l’avenir, certains services ou serveurs complexes restent à convertir sous Guix, tout comme certaines bibliothèques scientifiques complexes ou historiques, demandées par nos utilisateurs.

  • Inria