Les Métadonnées


Évènements à venir


Qu’est-ce qu’un schéma de métadonnées ? Quelle différence avec les standards de métadonnées ? Comment fonctionnent-ils ? Quel est leur utilité ? Réponses dans cette vidéoc de doranum.

Les Métadonnées

Les métadonnées sont des informations permettant de décrire de manière normalisée des données ou des documents numériques (par exemple, la date pour une photo numérique). Elle contribuent à décrire les ressources, les données de la recherche et les productions réalisées comme des articles, des images de microscope, mesures, logiciels, etc… Elles sont présentes soit de manière embarquée (exemple dans un fichier informatique : photo, logiciel, document, …), soit de manière externe (exemple dans un catalogue d’accompagnement d’un jeu de données ou dans un annuaire d’entrepôts). Leur qualité garantit le partage et la possibilité de réutilisation des données.

Structure des métadonnées

Les métadonnées facilitent le travail des moteurs d’indexation et de recherche, car ils peuvent extraire automatiquement de nombreuses informations sur les documents. Cependant, pour une exploitation optimale des données, il est nécessaire de partager une nomenclature commune des métadonnées. Par exemple, aucun échange ne serait possible si la liste des mots-clefs était parfois nommée « keywords », d’autres fois « key-words », ou parfois « mots-clefs » ! Partant de ce constat, des standards ont été établis en fonction de la destination des données (dépôt, publication, archivage, etc…. ) et en fonction de la discipline. Quelques exemples :

  • CIF Core(Crystallographie, description de structures chimiques :symétrie; morphologie cristalline; données expérimentales, etc…
  • Dublin Core (interdisciplinaire), description des ressources numériques.
  • DwC (Darwin Core), domaine de la biodiversité.DDI (Data Documentation Initiative),domaine des sciences sociales, comportementales et économique.
  • EAD(Encoded Archival Description), description des archives.
  • EXIF (Exchangeable image file format), description technique et automatique d’un cliché.
  • MARC(Machine-readable cataloging), description du contenu des bibliothèques.
  • IPTC (International Press Telecommunications Council), description d’une image par l’auteur.

Exemple du standard Dublin Core :

Le Dublin Core a vocation à permettre une interopérabilité minimale entre des systèmes conçus indépendamment les uns des autres. Les règles internationales et nationales applicables à l’information bibliographique doivent être respectées. Le respect de ces règles permet de rapprocher des ressources malgré une faible structuration, et de construire des services bibliographiques grâce à l’emploi conjugué du Dublin Core, des schémas d’encodage associés et des bonnes pratiques. Certains schémas d’encodages sont préconisés directement dans la norme, d’autres sont intégrés dans les termes descriptifs du Dublin Core qualifié ; d’autres sont extérieurs mais applicables.


Nom de l’élément en français Nom de l’élément en anglais Définitions
Contenu
Titre Title Nom de la ressource
Sujet Subject Thème du contenu de la ressource
Description Description Résumé, table des matières…
Source Source Référence à une ressource à partir de laquelle la ressource actuelle a été dérivée ou créée
Langue Language Langue originale de la ressource
Relation Relation Référence à une ressource apparentée
Couverture Coverage Périmètre spatial et temporel
Propriété intellectuelle
Créateur Creator Auteur principal de la ressource
Éditeur Publisher Entité responsable de la diffusion de la ressource
Contributeur Contributor Co-auteurs associés à l’élaboration de la ressource
Droits Rights Informations sur les droits associés à la ressource
Instance particulière
Date Date Date de création ou mise à disposition
Type Type Nature du contenu : image, son texte…
Format Format Format ou taille de la ressource
Identifiant Identifier Référence univoque, DOI, URL, ISSN…

Utilisation des éléments « Dublin Core » dans « nakala » :