Articles

Automatisation d’un processus de contrôle qualité de données au format tableur issues de Prodinra

Résumé

Les professionnels de l’Information Scientifique et Technique (IST), de l’Inra veillent à ce que les données disponibles dans l’archive ouverte ProdInra soient de qualité. Ce travail est indispensable pour l’obtention de listes de publications et d’indicateurs les plus fiables possible. Dans ce cadre, nous avons travaillé en collaboration avec un informaticien sur une automatisation d’un processus de contrôle qualité de données extraites au format tableur pour gagner en efficacité. Cet article décrit notre démarche. Il vous propose de faire de même pour votre corpus bibliographique issu de ProdInra. Vous trouverez également des conseils sur les précautions à prendre pour utiliser les fichiers de sortie. Enfin, nous proposons des évolutions en prévision du passage de ProdInra à HaL.

Auteurs


Sylvain Cariou

sylvain.cariou@inra.fr

Affiliation : SMART-LERECO, Agrocampus ouest, Inra, 35000, Rennes, France

Pays : France


Alexandra Coppolino

Affiliation : CEE-M, Inra, CNRS, Montpellier Supagro, Université de Montpellier, 34000, Montpellier, France

Pays : France


Lise Frappier

Affiliation : SMART-LERECO, Agrocampus ouest, Inra, 35000, Rennes, France

Pays : France

Pièces jointes

Pas de document complémentaire pour cet article

Statistiques de l'article

Vues: 1

Téléchargements

PDF: 1