Un environnement numérique de recherche portable et stable : pour une recherche répétable et reproductible

Objectifs

La manifestation est organisée en partenariat avec la délégation Aquitaine du CNRS.

  • Sensibiliser les participants aux enjeux de reproductibilité et de répétabilité de la recherche
  • Améliorer la portabilité et sécuriser la réutilisation de ses outils numériques pour obtenir des résultats fidèles
  • Donner à voir des cas d’utilisation de containers et autres solutions logicielles en recherche, fournir des exemples de workflows dans une perspective utilisateur final et non pas administrateur réseaux

Cette initiation est ouverte à tous publics intéressés par les questions de : répétabilité, reproductibilité de la recherche, travail collaboratif, préservation des environnements numériques scientifiques.

Inscription en ligne obligatoire et gratuite pour toutes catégories de publics.

Programme

« Une seule mise à jour/montée de version effectuée et tout est dépeuplé »

(ancien proverbe informatique librement inspiré de Lamartine)

Vous n’obtenez plus les mêmes résultats alors que vous suivez le même protocole. Vos collègues parviennent encore moins à reproduire votre démarche alors qu’en apparence, leur environnement informatique est similaire au vôtre. Comment s’assurer d’être en mesure de réitérer des démonstrations X semaines, X mois, X années plus tard? Cette introduction aux containers (Docker et Singularity) et au gestionnaire de paquets GNU Guix se veut un panorama critique des solutions techniques, accessible à toute personne intéressée par la question de la portabilité et de la fiabilité de ses outils de recherche. Ces questions sont ici traitées sous l’angle des enjeux pour les chercheurs et chercheuses, et non pas sous l’angle de l’administration de réseaux. La formation prend la forme d’un court workshop.

Introduction, par François Pellegrini, professeur à l’Université de Bordeaux, chercheur Inria-Labri

« Fiabiliser son environnement de recherche : introduction aux containers Docker et Singularity« , Adalbert Arsen

Pourquoi déployer un container plutôt qu’une machine virtuelle? Quels sont les avantages et limites de ce type d’outils? Et surtout, à quels besoins de recherche les containers répondent-ils? Certaines revues intègrent désormais le déploiement de containers à leur workflow. Quelles étapes prévoir? Quelles compétences mobiliser? Quels sont les cas d’usages possibles dans un workflow de recherche?

« Portabilité de R : dockeriser une appli Shiny » : Vincent Guyader

« Lorsque l’on cherche à développer puis à déployer une application R (typiquement une application shiny), plusieurs aspects sont à prendre en compte (Note : Ce qui suit s’adapterait à n’importe quel « produit » basé sur R) : que va devenir cette application? Qui va être en charge de la déployer? À combien d’utilisateurs s’adresse-t-elle? Doit-elle être installée en local sur les postes des utilisateurs, ou accessible en ligne? Sera elle publique ou privée? Les réponses à ces questions vont orienter directement des choix techniques, qu’il faudra parfois mettre en place très tôt dans la phase de développement de l’appli. En effet, il y a un gap énorme entre avoir un app.R qui tourne bien en local sur son poste, et avoir une application shiny en production accessible au plus grand nombre. », V. Guyader (cf. 6èmes Rencontres R, Anglet, 2017)

« Au-delà des conteneurs. Environnements logiciels reproductibles avec GNU Guix » : Ludovic Courtès

« Docker et Singularity peuvent reproduire un environnement logiciel à l’identique mais permettent difficilement d’aller au-delà d’expérimenter. Peut on concilier reproductibilité et expérimentation pour les environnements logiciels? GNU Guix est comparable à apt-get, yum ou CONDA, mais il fournit des binaires reproductibles bit à bit avec un suivi de leur provenance. Il peut aider à la gestion d’environnements à la « module » ou VirtualEnv, ou encore provisionner des conteneurs. J’évoquerai notre expérience avec Guix en calcul intensif (HPC) », L. Courtès

En savoir + sur GNU Guix

Intervenants

Docteur en hydrologie spatiale, Adalbert Arsen a exercé des activités de recherche au seln du laboratoire LEGOS (UMR 5566) à Toulouse. Il se consacre désormais à la formation au traitement des données de recherche (programmation, analyse et traitement des données, notamment données géographiques) et possède également une expertise dans le domaine de la communication scientifique (poster scientifique, rédaction d’article, vulgarisation scientifique).

Ingénieur de recherche au centre Inria Bordeaux Sud-Ouest (Service d’Expérimentation et de Développement), Ludovic Courtès s’est spécialisé dans le calcul intensif.  Il est initiateur et co-mainteneur du projet GNU Guix et une des personnes à l’origine du projet Guix-HPC.  Il est aussi co-mainteneur de GNU Guile qui met en œuvre le langage de programmation fonctionnelle Scheme.

Data scientist, Vincent Guyader est gérant de la société ThinkR,  société spécialisée dans les applications et la formation au logiciel R. ThinkR accompagne les entreprises de tous secteurs (pharma, finance, agronomie…) dans leur problématiques de datascience nécessitant l’usage de R : création et déploiement d’application, migration SAS vers R, installation et maintenance de serveur de calcul, formation et coaching d’équipe.

Ressources

Les commentaires sont fermés.