Qu’est-ce qu’un schéma de métadonnées ? Quelle différence avec les standards de métadonnées ? Comment fonctionnent-ils ? Quel est leur utilité ? Réponses dans cette vidéoc de doranum.
Les Métadonnées
Les métadonnées sont des informations permettant de décrire de manière normalisée des données ou des documents numériques (par exemple, la date pour une photo numérique). Elle contribuent à décrire les ressources, les données de la recherche et les productions réalisées comme des articles, des images de microscope, mesures, logiciels, etc… Elles sont présentes soit de manière embarquée (exemple dans un fichier informatique : photo, logiciel, document, …), soit de manière externe (exemple dans un catalogue d’accompagnement d’un jeu de données ou dans un annuaire d’entrepôts). Leur qualité garantit le partage et la possibilité de réutilisation des données.
Structure des métadonnées
Les métadonnées facilitent le travail des moteurs d’indexation et de recherche, car ils peuvent extraire automatiquement de nombreuses informations sur les documents. Cependant, pour une exploitation optimale des données, il est nécessaire de partager une nomenclature commune des métadonnées. Par exemple, aucun échange ne serait possible si la liste des mots-clefs était parfois nommée « keywords », d’autres fois « key-words », ou parfois « mots-clefs » ! Partant de ce constat, des standards ont été établis en fonction de la destination des données (dépôt, publication, archivage, etc…. ) et en fonction de la discipline. Quelques exemples :
- CIF Core(Crystallographie, description de structures chimiques :symétrie; morphologie cristalline; données expérimentales, etc…
- Dublin Core (interdisciplinaire), description des ressources numériques.
- DwC (Darwin Core), domaine de la biodiversité.DDI (Data Documentation Initiative),domaine des sciences sociales, comportementales et économique.
- EAD(Encoded Archival Description), description des archives.
- EXIF (Exchangeable image file format), description technique et automatique d’un cliché.
- MARC(Machine-readable cataloging), description du contenu des bibliothèques.
- IPTC (International Press Telecommunications Council), description d’une image par l’auteur.
Exemple du standard Dublin Core :
Le Dublin Core a vocation à permettre une interopérabilité minimale entre des systèmes conçus indépendamment les uns des autres. Les règles internationales et nationales applicables à l’information bibliographique doivent être respectées. Le respect de ces règles permet de rapprocher des ressources malgré une faible structuration, et de construire des services bibliographiques grâce à l’emploi conjugué du Dublin Core, des schémas d’encodage associés et des bonnes pratiques. Certains schémas d’encodages sont préconisés directement dans la norme, d’autres sont intégrés dans les termes descriptifs du Dublin Core qualifié ; d’autres sont extérieurs mais applicables.
Nom de l’élément en français | Nom de l’élément en anglais | Définitions |
---|---|---|
Contenu | ||
Titre | Title | Nom de la ressource |
Sujet | Subject | Thème du contenu de la ressource |
Description | Description | Résumé, table des matières… |
Source | Source | Référence à une ressource à partir de laquelle la ressource actuelle a été dérivée ou créée |
Langue | Language | Langue originale de la ressource |
Relation | Relation | Référence à une ressource apparentée |
Couverture | Coverage | Périmètre spatial et temporel |
Propriété intellectuelle | ||
Créateur | Creator | Auteur principal de la ressource |
Éditeur | Publisher | Entité responsable de la diffusion de la ressource |
Contributeur | Contributor | Co-auteurs associés à l’élaboration de la ressource |
Droits | Rights | Informations sur les droits associés à la ressource |
Instance particulière | ||
Date | Date | Date de création ou mise à disposition |
Type | Type | Nature du contenu : image, son texte… |
Format | Format | Format ou taille de la ressource |
Identifiant | Identifier | Référence univoque, DOI, URL, ISSN… |