Dublin Core : on n’y comprend plus rien

Au départ, Dublin Core, ça a l’air simple : il y a 15 éléments, tous facultatifs et répétables, et voilà.

Après, ça se complique : à ces 15 éléments (le Dublin Core dit « simple ») vient s’ajouter le Dublin Core qualifié, dans lequel on dispose d’attributs pour préciser le sens des 15 éléments de base.
Par exemple, pour prendre un truc simple et connu, on peut qualifier l’élément DC:coverage par l’attribut « spatial » ou « temporal ».

En fait, le DC qualifié n’est qu’une manière d’utiliser les Dublin Core metadata terms (DC terms), une liste d’éléments de métadonnées maintenus par le DCMI (Dublin Core metadata initiative).
Certains de ces éléments de métadonnées correspondent aux 15 éléments de base.
D’autres correspondent à autre chose : notamment des propriétés (isPartOf, isFormatOf etc.), des référentiels complémentaires (comme par exemple la liste des types qu’on peut utiliser dans DC:type), etc.

Tout ça fait partie d’une logique commune, le Dublin Core Abstract Model (DCAM), qui a la couleur du RDF, la saveur du RDF, mais… n’est pas du RDF.

Après, il y a différentes méthodes pour encoder le Dublin Core : en HTML, en XML, en RDF.
Dublin Core simple et qualifié correspondent à des schémas d’encodage en XML.
Il y a aussi des schémas d’encodage en RDF.

Le résultat, c’est que Dublin Core, tout le monde connaît. On sait que c’est des métadonnées, que ça s’exprime en XML, que ça va bien sur le Web et que ça a un rapport avec le Web sémantique. Mais en pratique, on n’y comprend plus rien.

Donc voici un petit glossaire à l’usage des gens qui se réfèrent au Dublin Core. C’est tout ce qu’il faut retenir pour réussir à y comprendre quelque chose.
– L’ensemble des termes du Dublin Core, c’est le Dublin Core Metadata Terms. On peut les appeler par leur petit nom : les DC terms.
– Parmi ces termes, il y a 15 éléments de base, le coeur historique du Dublin Core : c’est le Dublin Core Element Set.
– Parmi les expressions en XML du Dublin Core, le Dublin Core simple utilise les 15 éléments de base et uniquement ceux-là, alors que le Dublin Core qualifié peut utiliser d’autres DC terms.
– RDF est le langage le plus naturel pour exprimer du Dublin Core (Terms ou Elements) suivant le modèle abstrait du Dublin Core, le DCAM.
– Le DCMI est une organisation qui maintient l’ensemble.

J’espère que c’est – un peu – plus clair…

2 réflexions sur “Dublin Core : on n’y comprend plus rien

  1. Personnellement, il y a deux choses qui me bloquent avec Dublin Core et qui n’ont pas l’air résolues.

    La première est que le contenu des éléments Dublin Core n’est pas normalisé. Par exemple <dublincore:date>2007-07-05T16:35:00Z</dublincore:date> et >dublincore:date>5 Feb 2007 16:35:00</dublincore:date> sont tous les deux valables puisqu’aucune syntaxe n’est obligatoire pour la date. Peu pratique pour les programmes qui tentent de lire le Dublin Core.

    La deuxième est que je ne connais encore aucun moteur de recherche public qui puisse chercher par éléments Dublin Core, ce qui ne motive pas pour en mettre sur un site Web public (dans un catalogue de bibliothèque, c’est une question différente).

  2. Stéphane, tu as raison. Sur le premier point, on est obligés de compléter le DC par des « application profiles » : une communauté se met d’accord sur les valeurs acceptées et le contenu des éléments. Ca marche mais ça rajoute encore une couche de complexité. Sur le deuxième point, à mon avis l’avenir de DC n’est pas dans les moteurs de recherche du Web, mais plutôt dans les domaines qui s’intéressent à la structuration fine de l’information, comme les bibliothèques en effet, ou le Web sémantique.

Les commentaires sont fermés.