Marc 21 et le Web sémantique

Un article à lire : Semantic MARC, MARC 21 and the Semantic Web par les gens de Talis.

Dans cet article, ils exposent comment transformer « facilement » des données en MARC 21 en RDF, avec une méthodologie qui selon eux pourrait permettre de créer en un clin d’oeil un réseau de données entre des catalogues distants.
Ce qui m’a frappée c’est que leur stratégie repose sur la création et, je ne sais pas si on peut dire ça, l’alignement des URI qu’ils génèrent à partir des différents champs des notices. En gros, pour générer l’URI d’une ressource, ils utilisent la chaîne de caractère correspondant au champ de la notice, qu’ils normalisent (en retirant la ponctuation notamment) avant de la faire précéder d’un domaine. De cette façon, lorsque la même chaîne de caractères ou presque apparaît dans différentes notices, elles sont reliées automatiquement par cette URI commune. C’est de cette façon, notamment, qu’ils relient les notices d’autorité avec les notices bibliographiques.

Approche qui me laisse songeuse car :
– du coup ils n’exploitent pas les liens qui existent déjà entre les notices bibliographiques et d’autorité
– ils n’utilisent pas non plus de beau système d’identifiant de notices comme LCCN alors que les bibliothèques se donnent bien du mal à mettre ces URI de référence en place.

Enfin, on se retrouve avec des tas d’URI plus ou moins ambigües par rapport aux ressources qu’elles désignent : plusieurs URIs pour la même ressource, ou l’inverse. Mais est-ce si grave ?