Articles

Un workflow R pour une gestion simple et durable des données de la recherche

Résumé

A l’heure de l’Open Science, même si de nombreuses initiatives locales, institutionnelles et nationales prouvent que le partage des données scientifiques est désormais une nécessité, force est de constater que nous nous heurtons toujours aux mêmes difficultés de mise en œuvre. En effet, un des fondements de la science ouverte et du principe de données FAIR4 (Faciles à trouver, accessibles, interopérables et réutilisables) est la fourniture de métadonnées : ce sont des informations contextuelles permettant de découvrir un jeu de données et de le comprendre pour le réutiliser. Or il existe toujours des freins à la création de ces métadonnées, principalement techniques, faute d’outils simples et faciles à prendre en main par des non spécialistes, et ce, malgré les considérables évolutions des logiciels les plus connus, tels que Geonetwork. Un workflow a été implémenté en langage R - largement utilisé par la communauté scientifique -, permettant à partir d’un tableur partagé, éditable dans un environnement collaboratif, de générer des métadonnées conforme à la norme ISO/OGC 19115 (également d’autres standards comme l’EML), de les publier dans un catalogue de métadonnées et/ou dans un ou plusieurs entrepôts de données mais également de créer un flux de données. Nous nous proposons de détailler les mécanismes et les fonctionnalités de ce workflow.

Auteurs


Wilfried Heintz

wilfried.heintz@inra.fr

Affiliation : UMR Dynafor, INRA, F-31327 Castanet-Tolosan, France

Pays : France


Julien Barde

Affiliation : UMR MARBEC, IRD, F-34203 Sète, France

Pays : France


Emmanuel Blondel

Affiliation : Consultant indépendant, F-14000 Caen, France

Pays : France

Pièces jointes

Pas de document complémentaire pour cet article

Statistiques de l'article