Le Plan national pour la science ouverte oblige les projets financés sur fonds publics à diffuser ouvertement leurs données. Le partage des données peut être une condition pour obtenir un financement dans le cadre d’Horizon 2020, et pour la publication d’un article, certains éditeurs recommandent, voire exigent, l’accès aux données. Il est donc désormais nécessaire pour le chercheur de traiter et gérer ses données.
Dans ce contexte, l’équipe Archives Ouvertes de la BU vous propose ici une introduction aux grandes notions que recouvrent la gestion des données et une sélection d’outils pour vous aider dans le traitement et la diffusion de vos données.
Quelques définitions :
Données de la recherche
L’INIST (Institut de l’Information Scientifique et Technique) définit les données de la recherche comme des « enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche ».
Jeu de données
Un jeu de données (ou dataset) est définit, quant à lui, comme une « agrégation (…) de données brutes ou dérivées présentant une certaine « unité », rassemblées pour former un ensemble cohérent ».
Plan de gestion de données (PGD) ou Data Management Plan (DMP)
Le plan de gestion des données est un outil de gestion des données. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.
Que contient un DMP ? Quand faut-il le rédiger ? Vidéo proposée par DoRANum :
L’objectif des principes FAIR est de favoriser la découverte, l’accès, l’interopérabilité et la réutilisation des données partagées. Chaque principe FAIR se décline en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les humains mais aussi par les machines.
Findable
Le principe Findable a pour objectif de faciliter la découverte des données par les humains et les systèmes informatiques et requiert une description et une indexation des données et des métadonnées.
Accessible
Le principe Accessible encourage à stocker durablement les données et les métadonnées et à faciliter leur accès et/ou leur téléchargement, en en spécifiant les conditions d’accès (accès ouvert ou restreint) et d’utilisation (licence).
Interoperable
Le principe Interoperable peut se décomposer en : téléchargeable, utilisable, intelligible, et combinable avec d’autres données, par des humains et des machines.
Reusable
Le principe Reusable met en avant les caractéristiques qui rendent les données réutilisables pour de futures recherches ou d’autres finalités (enseignement, innovation, reproduction/transparence de la science).
Visualisation interactive des 4 principes FAIR proposées par la plateforme de services DoRANum :
Vous trouverez ici des ressources et des outils pour vous aider dans la gestion des données de la recherche.
DoraNum
La plateforme de ressources Doranum propose des ressources nombreuses et variées (vidéos et fiches synthétiques) pour répondre à toutes les questions sur les données de la recherche : pourquoi partager les données ? Comment rédiger un plan de gestion des données ? Comment et où déposer mes données ? Comment retrouver des données ?
CoopIST_Cirad
Fiches didactiques et ressources francophones pour rédiger, publier, évaluer et gérer les publications et les données de recherche.
DMP Opidor
DMP Opidor est un outil d’aide à l’élaboration de plans de gestion de données (ou DMP pour Data Management Plan). Vous y trouverez différents modèles de DMP ainsi que des exemples.
DATACC
Le site DATACC est consacré à l’accompagnement des chercheurs dans la gestion et l’ouverture des données de recherche en physique et chimie.
Le guide Ouverture des données de recherche. Guide d’analyse du cadre juridique en France
Document de référence qui explicite les principes à respecter en matière de diffusion des données. Il oriente sur le choix de la licence et des modalités de diffusion. Il fournit également un logigramme d’aide à la décision et une série de fiches pratiques.
Partager les données liées aux publications scientifiques – Guide pour les chercheurs
Ce guide – à destination des chercheurs – revient sur l’intérêt du partage des données avant d’expliquer de manière très concrète comment procéder pour lier données et publication.