RDF et les bibliothèques

Ce billet est une réponse au billet de Got . Son blog n’a pas de commentaires, et même s’il en avait, je ne serais pas allée raconter tout ça dedans ;-)

(…) RDF est sans aucun doute une solution prometteuse pour la diffusion, l’exploitation et l’échange des métadonnées, notamment sous la syntaxe XML (RDF/XML). C’est précisément sa raison d’être. Dans le cas de TEF, en particulier, il permettra à terme une exploitation multiple des notices TEF en l’état, sans obliger à les convertir dans un vocabulaire plus répandu comme Dublin Core notamment. Il faudra pour cela associer les notices TEF à un schéma RDF ou OWL qui précisera les relations sémantiques entre les éléments de TEF et, par exemple, les éléments du Dublin Core ou les propriétés des FRBR. Par ailleurs, formaliser TEF en RDF permettra d’expliciter la structure conceptuelle de TEF, notamment le fait qu’une notice TEF porte sur plusieurs entités (la thèse comme texte validé, les éditions, l’auteur, le jury…). Malgré ces atouts, investir dans une solution RDF est apparu comme prématuré. Etant donné les premiers usages prévisibles des notices TEF (échange de notices validées, conversion en DC-OA, en Unimarc), le supplément de complexité apporté par RDF/XML semble superflu tant que les applications et les données RDF ne sont pas plus répandues. En d’autres termes, la formalisation RDF de TEF est souhaitable, mais non prioritaire.

Ce paragraphe, tiré de la recommandation TEF, illustre parfaitement à mon sens la raison pour laquelle RDF n’est pas adopté (ni susceptible de l’être dans les prochaines années) dans les bibliothèques. Il y a toujours quelques précurseurs, comme il y en a eu pour XML, et leur rôle est d’expérimenter ces technologies et d’en faire des applications limitées. Ensuite, selon la pertinence de ces actions, l’industrie s’approprie la technologie ce qui lui donne une chance de se répandre vraiment. Or pour RDF, on n’en est pas encore là.

La réflexion sur RDF n’est pas absente des bibliothèques. Pour l’instant elle tourne essentiellement autour des FRBR, avec une réflexion sur la RDFisation du modèle (cf ce diaporama de Ian Davis), d’ailleurs très intéressante. Le schéma RDF pour les FRBR est proposé par Ian Davis et Richard Newman, ce dernier également auteur d’un projet sur les FRBR et l’annotation des images. Autre piste, la convergence avec le CRM-CIDOC, vaste ontologie du "cultural heritage" c’est à dire du patrimoine. Ceci donne à penser qu’il n’y a pas une manière canonique de RDFiser les FRBR, mais probablement plusieurs pistes possibles dont on peut espérer qu’une initiative sérieuse se dégagera.

D’autres axes de travail sont à noter même s’ils n’abordent pas de manière directe la question de RDF. Ainsi, les anglo-saxons sont en train de travailler sur une évolution du modèle AACR (équivalent plus ou moins de notre ISBD) vers quelque chose de nouveau qui s’appelle RDA. On ne me fera pas croire que la ressemblance des sigles est un hasard, même si RDF n’est écrit nulle part. Pour mémoire, les AACR – ISBD sont des normes qui décrivent le contenu de la description bibliographique et non sa structure ; c’est la sous-couche de MARC. En gros, l’ISBD dit que le titre c’est ce qui figure sur la page de titre, pas que ça doit être codé en 200. Le principe de RDA introduit quelques nouveautés intéressantes, présentées comme particulièrement pertinentes dans le domaine du numérique :

  • la prise en compte de métadonnées techniques en plus des métadonnées descriptives
  • la séparation nette de l’enregistrement des métadonnées et de leur présentation
  • on remarquera qu’en plus de la description et des accès, on a ajouté des relations (tiens donc).

En fait tout cela repose sur les FRBR et les FRAR (équivalent des FRBR pour les autorités).

Dans un autre genre, on lira dans ce très pertinent article du BBF sur Rameau et son évolution, la phrase suivante :

Ce que nous proposons en l’espèce revient, en fait, à construire des « ontologies » (au sens d’organisations structurées de la connaissance) par domaines et sous-domaines, au sein d’une liste d’autorités qui resterait commune, dont le caractère homogène serait préservé, et qui finirait par constituer elle-même une manière d’ontologie encyclopédique, en raison du réseau des liens sémantiques établi entre les vedettes …

A nouveau, on sent comme un appel à RDF (ou OWL), même s’il est ténu.

Donc finalement où est le problème ? Il n’est certainement pas dans la volonté. Des pistes de réflexion existent, mais la mise en oeuvre est une étape ultérieure et il n’y a pas d’application immédiate. L’autre problème c’est que 90% des bibliothécaires n’ont aucune idée de ce que sont les FRBR, et parmi le restant, beaucoup n’ont jamais entendu parler de RDF, ou n’ont aucune idée de ce que c’est et de comment ça marche.
En ce qui concerne la recherche bibliothéconomique et la naissance d’initiatives au sein d’institutions comme l’IFLA par exemple (en dehors de la veille pure, qu’on peut observer sur ce sujet au sein des conférences IFLA depuis 1999 environ), cela reste illusoire tant que RDF n’est pas une composante d’un applicatif immédiat.
Les geeks ont donc peut-être raison de pleurer en disant que RDF va disparaître faute d’être implémenté, mais ils ne réussiront pas à me faire culpabiliser (en tant que bibliothécaire). Notre métier nous impose un certain nombre de contraintes, parmi lesquelles je ne citerai que deux exemples : le poids de la masse documentaire accumulée depuis très très longtemps et en perpétuel accroissement, et celui de 5 siècles (au moins) de descriptions bibliographiques à rétroconvertir. Nous ne pouvons pas nous permettre d’implémenter quelque chose et de recommencer 5 ans plus tard, compte tenu de la quantité de données à manipuler et transformer à chaque fois. Ce poids de l’existant nous oblige à faire un choix entre deux voies :

  • soit développer des formats propres à notre communauté dont on sait qu’ils s’appliqueront à l’existant – c’est ce que nous avons fait avec MARC (je dis nous, mais j’étais même pas née, ou presque) – efficace mais c’est pas ce qu’on fait de plus interopérable,
  • soit fournir l’énorme effort de traîner notre machinerie derrière des formats existants, mais alors, il faut qu’ils aient fait leurs preuves, sinon l’investissement représente une prise de risque trop élevé – ce qui fera de nous des éternels mammouths traînards, mais cela vaut peut-être le sacrifice.

Pour que les bibliothèques puissent s’approprier RDF, il faudrait d’abord que RDF montre ce qu’il sait faire, prouve qu’il est essentiel pour nous aider à faire ce qu’on fait (ou ce qu’on veut faire), qu’il pourra être intégré dans des solutions industrielles par nos chers fournisseurs de SIGB (ou d’autres)… en bref, on n’apprivoise pas un mammouth juste avec des mots ;-) alors montrez-leur, montrons-leur.

PS : en relisant le billet de Got, je m’aperçois que je ne réponds pas vraiment à la question, et qu’on entre dans des débats sans fin du type l’oeuf ou la poule. Pour conclure, je ne remets pas en cause l’utilité de RDF pour représenter les métadonnées. Je dis juste que ce n’est pas évident à appliquer dans notre communauté.

3 réflexions sur “RDF et les bibliothèques

  1. Moi je sais pas, par principe j’ai décidé que j’allais utiliser RDF. Faudra juste que je comprenne ce que c’est un jour. Ça rentre plus ou moins dans mes plans de conquète du monde.

  2. Tu parles de poule et d’oeuf et tu as raison en un autre sens : pour s’imposer, RDF doit montrer ce qu’il peut faire sur de grandes masses de données hétérogènes encodées en RDF ; pour que les gens passent leurs données en RDF, RDF doit sembler incontournable. Cercle vicieux. C’est pourquoi le projet SIMILE s’évertue à générer automatiquement du RDF à partir de ce qu’on trouve aujourd’hui sur le web (HTML parsing). Je crains que par cette voie on n’arrive qu’à du Dublin Core, et non à une variété de vocabulaires hétérogènes que RDF est censé faire marcher ensemble.
    Palliatif: que ceux qui peuvent fassent don au web de leur données en RDF. C’est pour la bonne cause, et en plus, on se sent tout léger après (pour avoir fait une bonne action, mais aussi pour avoir été obligé de modéliser et donc de comprendre ses données – salutaire introspection). A titre personnel, à mon niveau, je plaiderai(s) pour exposer les métadonnées des thèses en RDF. La future application de dépôt des thèses (STAR) en regorgera. Ce sera un RDF riche, plein de points d’accrochage, de « prises » vers d’autres données déjà sur le web (mais pas en RDF) : autorités, infos sur les labos de recherche (Labintel)… J’ai déjà une première version de ce TEF/RDF (intégrant les métadonnées de gestion), mais notre urgence, dans le groupe afnor TEF, est de boucler pour l’épiphanie la version 2 de TEF, intégrant les métadonnées de gestion.

    Si les bibliothèques veulent qu’on leur en montre, elles doivent elles aussi en montrer un bout.

Les commentaires sont fermés.