Le cycle de vie des données
Le cycle de vie des données correspond aux différentes étapes au cours desquelles, au sein d’un projet de recherche, les données sont élaborées ou transformées.
Que contient un DMP ? Quand faut-il le rédiger ?
Les données de la recherche, c’est quoi ?
« Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images, sons, etc.), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche.» (OCDE, Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics, 2007)
Les données de la recherche sont collectées, observées ou obtenues par expérimentation à des fins d’analyse, pour produire et valider les résultats d’une recherche originale. Elles sont de natures diverses : textuelles, numériques, multimédia, informatiques… Et de niveaux d’élaboration différents : brutes, structurées ou analysées. Un exemple : les photos de vos vacances sont un jeu de données brutes ; une fois que le lieu est ajouté dans la description de chaque fichier, c’est un jeu de données structurées ; une fois qu’elles ont été triées et que seulement certaines ont été gardées pour réaliser un album, c’est un jeu de données analysées. ( Former les professionnels de l’information et de la documentation aux données de la recherche en 45 minutes, 2021)
Pourquoi gérer les données de recherche ?
Les données constituent une matière première pour l’activité de recherche, leur gestion fait partie du projet de recherche et requiert une organisation, une planification et un suivi rigoureux tout au long du projet et au-delà pour assurer la pérennité, l’accessibilité et la réutilisation de ces données. L’ANR et le programme-cadre européen de financement de la recherche et de l’innovation (Horizon Europe en 2021) exigent la rédaction d’un plan de gestion des données (Data Management Plan – DMP) de la recherche et, si possible, l’ouverture des données de la recherche.
Comment gérer les données de recherche ?
La gestion des données de recherche s’anticipe dès le début du projet, grâce à l’élaboration d’un Plan de gestion des données (Data Management Plan – DMP). Ce document unique qui décrit, pendant et à l’issue du projet de recherche, les étapes de production, de traitement, de description, de diffusion ou protection et d’archivage (conservation) des données.
Que doit contenir un Plan de gestion des données ?
Le Data Management Plan ou Plan de gestion de données est un document synthétique qui aide à organiser et anticiper toutes les étapes du cycle de vie de la donnée. Il explique pour chaque jeu de données comment seront gérées les données d’un projet, depuis leur création ou collecte jusqu’à leur partage et leur archivage (Doranum). Le degré de précision et l’agencement des champs à compléter peuvent varier d’un modèle à l’autre. Dans tous les cas, il s’agit d’une série de questions organisées en grands chapitres. On retrouve systématiquement les mêmes éléments principaux qui sont :
Les outils d’aide à la rédaction comme DMP OPIDoR donnent accès à des modèles et facilitent la rédaction du DMP grâce à des guides et des exemples personnalisés. Le chercheur peut choisir un modèle de DMP parmi tous les modèles proposés par les établissements de recherche, les financeurs. Par exemple le modèle de DMP H2020 établi par la Commission européenne ou celui du Cirad. Il est également possible de télécharger le modèle en PDF ou en docx. Un des avantages de DMP OPIDoR est de permettre le travail collaboratif sur le DMP.