Le book sprint challenge : 3 jours, 5 auteurs pour rédiger un manuel en français sur la reproductibilité de la recherche

Vers une recherche reproductible : Faire évoluer ses pratiques. Consulter l’ouvrage, le télécharger, le citer

Fichier en accès libre via l’archive ouverte HAL

C’est ici si vous préférez le format EPub.

Desquilbet, Loïc, Sabrina Granger, Boris Hejblum, Arnaud Legrand, Pascal Pernot, et Nicolas P. Rougier. Vers une recherche reproductible : Faire évoluer ses pratiques. Bordeaux : Urfist de Bordeaux, 2019.

Résumé

Pour un chercheur, il n’y a rien de plus frustrant que l’impossibilité de reproduire des résultats majeurs obtenus quelques mois auparavant. Les causes de ce type de déconvenues sont multiples et parfois pernicieuses. Ce phénomène participe à ce que certains identifient comme une “crise de la reproductibilité de la recherche”.
Cet ouvrage considère un ensemble de situations et de pratiques potentiellement dangereuses afin d’illustrer et de mettre en évidence les symptômes de la non-reproductibilité dans la recherche. À chaque fois, il propose un éventail de solutions allant de bonnes pratiques faciles et rapides à implémenter jusqu’à des outils plus techniques, tous gratuits et mis à l’épreuve par les auteurs eux-mêmes.
Dans ce livre rédigé lors d’un book sprint, étudiants, ingénieurs et chercheurs devraient trouver des moyens efficaces et à leur portée pour améliorer leurs pratiques de la recherche reproductible.  

Mots clés : recherche reproductible ; transparence de la recherche ; science ouverte ; crise de la réplication ; open source ; open data ; data sharing ; réutilisation des données ; standardisation ; book sprint

Publics cibles de l’ouvrage

Ce livre s’adresse à tout acteur de la recherche scientifique (chercheur.euse, personnel de soutien à la recherche) qui :

  • se pose des questions sur la recherche reproductible ou
  • souhaite améliorer ses pratiques.

Plusieurs rubriques illustrent les problématiques concrètes de la recherche reproductible. Chaque chapitre propose une gamme de solutions, allant de la plus facile à mettre en œuvre à la plus technique.

Envie de contribuer ?

Rendez-vous sur GitHub ou contactez l’Urfist par mail (urfist/at/u-bordeaux.fr), il est possible de proposer des contenus, de poser des questions aux auteurs, tant sur les contenus que sur la méthode. Vous souhaiteriez proposer une traduction de l’ouvrage? Contactez-nous.

Auteurs : Loïc Desquilbet, Boris Hejblum, Arnaud Legrand, Pascal Pernot, Nicolas Rougier

Loïc Desquilbet

Enseignant-chercheur en biostatistique et en épidémiologie clinique, Loïc Desquilbet est professeur à l’Ecole Nationale Vétérinaire d’Alfort. Chef du Département des Sciences Biologiques et Pharmaceutiques (Inserm U955, équipe 10 « Biologie du système neuromusculaire », groupe 4 « Myologie et biothérapies des myopathies canines »), il travaille dans le domaine de la recherche clinique vétérinaire, incluant la validation de méthodes de mesure (répétabilité, reproductibilité, et concordance de méthodes). L. Desquilbet travaille sur SAS et a conçu une macro SAS pour prendre en compte les variables quantitatives dans un modèle multivarié. Ses enseignements visent à former les étudiants à l’analyse critique d’articles.

Boris Hejblum

Enseignant-chercheur en biostatistique à l’Institut de Santé Publique d’Épidémiologie et de Développement (ISPED, Université de Bordeaux), Boris Hejblum est maître de conférences et membre de l’équipe SISTM dans le centre Inserm U1219 Bordeaux Population Health (BPH) et Inria Bordeaux Sud-Ouest.

Il travaille sur l’analyse de données biomédicales répétées de grande dimension, en particulier la statistique génomique dans le cadre de la recherche vaccinale ainsi que sur le traitement de dossiers médicaux informatisés par des approches de machine learning. Il développe de nouvelles méthodologies statistiques implémentées sous forme de paquets R open-source permettant leur réutilisation, et la reproductibilité des résultats de ses publications.

Arnaud Legrand

Chercheur au Laboratoire d’informatique de Grenoble, Arnaud Legrand pilote l’équipe Polaris (Inria). Il s’est spécialisé dans l’évaluation (simulation, observation, statistiques, analyse de traces) et l’optimisation de performance de grandes infrastructures de calcul (supercalculateurs, grille, calcul bénévole, clouds, …). L’axe optimisation de ses travaux porte sur la proposition ou l’évaluation de méthodes souvent sophistiquées et où il est important de conserver tous les détails pour comprendre leur performance et comment les améliorer. Arnaud Legrand co-pilote le Mooc “Recherche reproductible”.

Pascal Pernot

Physico-chimiste et directeur de recherches au CNRS, Pascal Pernot travaille au Laboratoire de Chimie Physique à l’Université Paris-Sud. Ses thématiques principales sont la gestion des incertitudes en modélisation physico-chimique, et notamment la quantification des incertitudes de prédiction des méthodes de chimie quantique et moléculaire. Il assure des formations en lien avec les méthodes standardisées de propagation des incertitudes. Il utilise l’environnement Rstudio/Github/Zenodo pour accompagner ses publications des données et codes nécessaires à la reproduction des résultats.

Nicolas Rougier

Chercheur à l’Inria, Nicolas P. Rougier est membre de l’équipe Mnemosyne project dont l’approche se situe à la frontière entre les neurosciences intégratives et computationnelles en association avec l’Institut des maladies neurodégénérativesle Laboratoire Bordelais de Recherche en Informatique, l’Université de Bordeaux et le CNRS. En 2015, il a co-fondé avec Konrad Hinsen, la revue ReScience spécialisée dans la publication d’études de réplication computationnelles. Il anime régulièrement des formations pour des doctorants, des chercheurs, des ingénieurs.

Quelques mots sur le projet. Qu’est-ce qu’un book sprint ?

(1 thème imparti + des chercheurs de disciplines variées, experts du sujet + 1 facilitateur) + 1 table des matières ex nihilo X 3 jours de travail intensif + de la motivation² = 1 book sprint

A l’origine, les book sprints ont été conçus pour documenter les logiciels libres : il s’agit d’une adaptation des code sprints des développeurs. L’accent est mis sur le travail collaboratif entre participants aux compétences diversifiées. Il s’agit d’une pratique d’écriture collaborative, pas seulement collective. Tout est écrit durant le sprint. La post-production en revanche peut nécessiter plusieurs semaines de travail une fois le sprint passé. Sur une durée de 3 à 5 jours, le travail est effectué sous la houlette d’un facilitateur, dont le rôle est d’organiser les échanges.

Pourquoi le thème de la reproductibilité de la recherche ? A quels besoins répond le livrable ?

L’objectif du book sprint de l’Urfist de Bordeaux est d’aboutir à un document à forte visée pratique conçu par des chercheurs pour des chercheurs. La littérature sur la reproductibilité de la recherche est abondante, voire pléthorique. Dans ce contexte, quelle peut être la plus-value du futur livrable ?

  • la richesse même de la littérature sur le sujet peut décourager
  • la veille sur le sujet est complexifiée par l’éclatement de la littérature dans des silos : disciplinaires (i.e. revues, littérature grise disciplinaire) comme techniques (i.e. : approche par langage informatique, par type d’outils)
  • il y a peu de littérature en français
  • il existe un risque de considérer ces problématiques comme déconnectées du cadre quotidien car trop difficiles à mettre en œuvre

Que peut apporter un book sprint à des chercheurs ?

Les enjeux et les objectifs d’un livrable issu d’un book sprint diffèrent de ceux des formats de publication classiques. Un book sprint permet de :

  • croiser des expertises dans un contexte moins formel qu’un colloque ou un séminaire
  • tester des idées avec des experts d’autres disciplines, collaborer avec des co-auteurs inattendus
  • expérimenter un mode de collaboration encore peu répandu dans le milieu universitaire français mais qui a fait ses preuves dans le milieu des logiciels libres
  • s’approprier une méthode de rédaction pour l’appliquer à d’autres projets : rédaction d’appels à projets, de supports pédagogiques, etc.
  • aboutir à une réalisation pour le bénéfice du plus grand nombre en peu de temps : le book sprint n’est pas conçu pour atteindre le même niveau de qualité qu’un article, mais permet de réaliser une première version d’un document pouvant évoluer par la suite

Facilitatrice

Formatrice à Activdesign et présidente de Floss Manuals Francophone, Elisa de Castro Guerra est spécialisée en création numérique et web. Elle travaille sur le développement d’applications web depuis plusieurs années. E. de Castro Guerra milite pour l’utilisation des logiciels libres, en particulier par la facilitation d’écriture de documentations en langue française. E. de Castro Guerra anime ainsi régulièrement des book sprints pour des associations, des entreprises.

Coordinatrice du projet, copy editor

Docteur en langue et littérature françaises, Sabrina Granger est conservatrice des bibliothèques à l’Unité Régionale de Formation à l’Information Scientifique et Technique de Bordeaux. Ses différents postes l’ont amenée à travailler dans les domaines de l’informatique documentaire, la communication en BU et les services aux chercheurs. S. Granger est co-pilote du collège « Compétences et formations » du Comité pour la Science Ouverte.

On en parle

Voir aussi :

Les commentaires sont fermés.