Vers une recherche reproductible : Faire évoluer ses pratiques. Consulter l’ouvrage, le télécharger, le citer
Fichier en accès libre via l’archive ouverte HAL
C’est ici si vous préférez le format EPub.
Desquilbet, Loïc, Sabrina Granger, Boris Hejblum, Arnaud Legrand, Pascal Pernot, et Nicolas P. Rougier. Vers une recherche reproductible : Faire évoluer ses pratiques. Bordeaux : Urfist de Bordeaux, 2019.
Résumé
Pour un chercheur, il n’y a rien de plus frustrant que l’impossibilité de reproduire des résultats majeurs obtenus quelques mois auparavant. Les causes de ce type de déconvenues sont multiples et parfois pernicieuses. Ce phénomène participe à ce que certains identifient comme une “crise de la reproductibilité de la recherche”.
Cet ouvrage considère un ensemble de situations et de pratiques potentiellement dangereuses afin d’illustrer et de mettre en évidence les symptômes de la non-reproductibilité dans la recherche. À chaque fois, il propose un éventail de solutions allant de bonnes pratiques faciles et rapides à implémenter jusqu’à des outils plus techniques, tous gratuits et mis à l’épreuve par les auteurs eux-mêmes.
Dans ce livre rédigé lors d’un book sprint, étudiants, ingénieurs et chercheurs devraient trouver des moyens efficaces et à leur portée pour améliorer leurs pratiques de la recherche reproductible.
Mots clés : recherche reproductible ; transparence de la recherche ; science ouverte ; crise de la réplication ; open source ; open data ; data sharing ; réutilisation des données ; standardisation ; book sprint
Publics cibles de l’ouvrage
Ce livre s’adresse à tout acteur de la recherche scientifique (chercheur.euse, personnel de soutien à la recherche) qui :
- se pose des questions sur la recherche reproductible ou
- souhaite améliorer ses pratiques.
Plusieurs rubriques illustrent les problématiques concrètes de la recherche reproductible. Chaque chapitre propose une gamme de solutions, allant de la plus facile à mettre en œuvre à la plus technique.
Envie de contribuer ?
Rendez-vous sur GitHub ou contactez l’Urfist par mail (urfist/at/u-bordeaux.fr), il est possible de proposer des contenus, de poser des questions aux auteurs, tant sur les contenus que sur la méthode. Vous souhaiteriez proposer une traduction de l’ouvrage? Contactez-nous.
Auteurs : Loïc Desquilbet, Boris Hejblum, Arnaud Legrand, Pascal Pernot, Nicolas Rougier
Loïc Desquilbet
Enseignant-chercheur en biostatistique et en épidémiologie clinique, Loïc Desquilbet est professeur à l’Ecole Nationale Vétérinaire d’Alfort. Chef du Département des Sciences Biologiques et Pharmaceutiques (Inserm U955, équipe 10 « Biologie du système neuromusculaire », groupe 4 « Myologie et biothérapies des myopathies canines »), il travaille dans le domaine de la recherche clinique vétérinaire, incluant la validation de méthodes de mesure (répétabilité, reproductibilité, et concordance de méthodes). L. Desquilbet travaille sur SAS et a conçu une macro SAS pour prendre en compte les variables quantitatives dans un modèle multivarié. Ses enseignements visent à former les étudiants à l’analyse critique d’articles.
Boris Hejblum
Enseignant-chercheur en biostatistique à l’Institut de Santé Publique d’Épidémiologie et de Développement (ISPED, Université de Bordeaux), Boris Hejblum est maître de conférences et membre de l’équipe SISTM dans le centre Inserm U1219 Bordeaux Population Health (BPH) et Inria Bordeaux Sud-Ouest.
Il travaille sur l’analyse de données biomédicales répétées de grande dimension, en particulier la statistique génomique dans le cadre de la recherche vaccinale ainsi que sur le traitement de dossiers médicaux informatisés par des approches de machine learning. Il développe de nouvelles méthodologies statistiques implémentées sous forme de paquets R open-source permettant leur réutilisation, et la reproductibilité des résultats de ses publications.
Arnaud Legrand
Chercheur au Laboratoire d’informatique de Grenoble, Arnaud Legrand pilote l’équipe Polaris (Inria). Il s’est spécialisé dans l’évaluation (simulation, observation, statistiques, analyse de traces) et l’optimisation de performance de grandes infrastructures de calcul (supercalculateurs, grille, calcul bénévole, clouds, …). L’axe optimisation de ses travaux porte sur la proposition ou l’évaluation de méthodes souvent sophistiquées et où il est important de conserver tous les détails pour comprendre leur performance et comment les améliorer. Arnaud Legrand co-pilote le Mooc “Recherche reproductible”.
Pascal Pernot
Physico-chimiste et directeur de recherches au CNRS, Pascal Pernot travaille au Laboratoire de Chimie Physique à l’Université Paris-Sud. Ses thématiques principales sont la gestion des incertitudes en modélisation physico-chimique, et notamment la quantification des incertitudes de prédiction des méthodes de chimie quantique et moléculaire. Il assure des formations en lien avec les méthodes standardisées de propagation des incertitudes. Il utilise l’environnement Rstudio/Github/Zenodo pour accompagner ses publications des données et codes nécessaires à la reproduction des résultats.
Nicolas Rougier
Chercheur à l’Inria, Nicolas P. Rougier est membre de l’équipe Mnemosyne project dont l’approche se situe à la frontière entre les neurosciences intégratives et computationnelles en association avec l’Institut des maladies neurodégénératives, le Laboratoire Bordelais de Recherche en Informatique, l’Université de Bordeaux et le CNRS. En 2015, il a co-fondé avec Konrad Hinsen, la revue ReScience spécialisée dans la publication d’études de réplication computationnelles. Il anime régulièrement des formations pour des doctorants, des chercheurs, des ingénieurs.
Quelques mots sur le projet. Qu’est-ce qu’un book sprint ?
(1 thème imparti + des chercheurs de disciplines variées, experts du sujet + 1 facilitateur) + 1 table des matières ex nihilo X 3 jours de travail intensif + de la motivation² = 1 book sprint
A l’origine, les book sprints ont été conçus pour documenter les logiciels libres : il s’agit d’une adaptation des code sprints des développeurs. L’accent est mis sur le travail collaboratif entre participants aux compétences diversifiées. Il s’agit d’une pratique d’écriture collaborative, pas seulement collective. Tout est écrit durant le sprint. La post-production en revanche peut nécessiter plusieurs semaines de travail une fois le sprint passé. Sur une durée de 3 à 5 jours, le travail est effectué sous la houlette d’un facilitateur, dont le rôle est d’organiser les échanges.
Pourquoi le thème de la reproductibilité de la recherche ? A quels besoins répond le livrable ?
L’objectif du book sprint de l’Urfist de Bordeaux est d’aboutir à un document à forte visée pratique conçu par des chercheurs pour des chercheurs. La littérature sur la reproductibilité de la recherche est abondante, voire pléthorique. Dans ce contexte, quelle peut être la plus-value du futur livrable ?
- la richesse même de la littérature sur le sujet peut décourager
- la veille sur le sujet est complexifiée par l’éclatement de la littérature dans des silos : disciplinaires (i.e. revues, littérature grise disciplinaire) comme techniques (i.e. : approche par langage informatique, par type d’outils)
- il y a peu de littérature en français
- il existe un risque de considérer ces problématiques comme déconnectées du cadre quotidien car trop difficiles à mettre en œuvre
Que peut apporter un book sprint à des chercheurs ?
Les enjeux et les objectifs d’un livrable issu d’un book sprint diffèrent de ceux des formats de publication classiques. Un book sprint permet de :
- croiser des expertises dans un contexte moins formel qu’un colloque ou un séminaire
- tester des idées avec des experts d’autres disciplines, collaborer avec des co-auteurs inattendus
- expérimenter un mode de collaboration encore peu répandu dans le milieu universitaire français mais qui a fait ses preuves dans le milieu des logiciels libres
- s’approprier une méthode de rédaction pour l’appliquer à d’autres projets : rédaction d’appels à projets, de supports pédagogiques, etc.
- aboutir à une réalisation pour le bénéfice du plus grand nombre en peu de temps : le book sprint n’est pas conçu pour atteindre le même niveau de qualité qu’un article, mais permet de réaliser une première version d’un document pouvant évoluer par la suite
Facilitatrice
Formatrice à Activdesign et présidente de Floss Manuals Francophone, Elisa de Castro Guerra est spécialisée en création numérique et web. Elle travaille sur le développement d’applications web depuis plusieurs années. E. de Castro Guerra milite pour l’utilisation des logiciels libres, en particulier par la facilitation d’écriture de documentations en langue française. E. de Castro Guerra anime ainsi régulièrement des book sprints pour des associations, des entreprises.
Coordinatrice du projet, copy editor
Docteur en langue et littérature françaises, Sabrina Granger est conservatrice des bibliothèques à l’Unité Régionale de Formation à l’Information Scientifique et Technique de Bordeaux. Ses différents postes l’ont amenée à travailler dans les domaines de l’informatique documentaire, la communication en BU et les services aux chercheurs. S. Granger est co-pilote du collège « Compétences et formations » du Comité pour la Science Ouverte.
On en parle
- Grand Labo, le média des chercheurs et des chercheuses : interview d’Arnaud Legrand
- « Ouvrirlascience », le site web du Comité pour la science ouverte ; rubrique « Ressources »
- Université de Bordeaux, in Actualités de la recherche : l’interview croisée de Boris Hejblum et Nicolas Rougier
- Laboratoire de Chimie Physique, Infos Lab’
- Bordeaux NeuroCampus, actualités
- Bordeaux Population Health, actualités
- Institut des maladies neurodégénératives (IMN), actualités
- EchosDoc
- Irstea, Gestion des données de recherche
- Site web des correspondants « Information scientifique et technique », de l’institut des sciences humaines et sociales (InSHS, CNRS)
- Groupement français de l’industrie de l’information, revue du web du 05 juin 2019 (réservé aux abonnés)
- Intranet Inria, rubrique « Vie scientifique – national », 17 juin 2019 ; publié par le pôle Information et édition scientifiques
Voir aussi :
- Reproductibilité de la recherche : “Vers une recherche reproductible : Faire évoluer ses pratiques” un ouvrage en français pour une recherche plus transparente
- Un book sprint pour booster vos projets de rédaction collaborative. Interview d’Elisa de Castro Guerra (FlossManuals francophone)
- Le book sprint challenge sur Twitter