Changer les catalogues (suite) : l’exemple de RLG

Un bon exemple de ce que je disais l’autre jour au sujet des catalogues comme sources de données à réutiliser dans différentes interfaces, c’est le catalogue collectif de RLG. Celui-ci ne contient pas autant de notices que le catalogue collectif d’OCLC, mais surtout il est de nature différente puisqu’il regroupe, comme son nom l’indique, des collections de bibliothèques de recherche, et comme son nom ne l’indique pas, éventuellement d’autres institutions que des bibliothèques (RLG travaille beaucoup avec les archives et les musées, et inclut aussi des institutions de recherche, des marchands de livres, etc.). Tout cela représente plus de 130 millions de notices, mais beaucoup moins de titres car le principe est de ne pas dédoublonner les notices versées pour le même ouvrage par diverses institutions.

Ce catalogue collectif a plusieurs interfaces différentes :

  • une qui s’appelle Eureka, qui est une interface Web payante,
  • une qui s’appelle RLIN21 et qui est une interface de gestion destinées aux professionnels, pour créer et dériver des notices,
  • une interface Z3950 (machines uniquement, humains s’abstenir)
  • et enfin une interface publique, portant sur un sous-ensemble limité du catalogue, qui est gratuite et très particulière et porte le nom de RedLightGreen.

Bien sûr c’est cette dernière qui m’intéresse ici.

RedLightGreen s’adresse à des utilisateurs débutants, autant qu’on puisse être débutant dans un contexte universitaire / de recherche car vu la mission de RLG, il ne s’agit pas de s’adresser au grand public dans son ensemble. Comme il fallait prendre un sous-ensemble du catalogue, ils ont choisi les monographies (vous me direz, ça simplifie bien les choses, et c’est pas faux, mais c’est la vie).

Que va-t-on proposer à ces utilisateurs d’un genre particulier pour les aider à se sentir à leur aise dans un catalogue de bibliothèque ?

Tout d’abord, une recherche vraiment simple, une seule case, à la Google. La recherche avancée, à peine avancée, prévoit simplement de sélectionner un champ et de limiter par langue.

Deuxième cadeau, la pertinence. Il est trop rare que les catalogues de bibliothèque offrent un classement de pertinence sur les résultats ; or, avec une recherche simple par mots, c’est une fonctionnalité indispensable faute de quoi on est rapidement noyé sous le bruit et l’inutile.
Dans RedLightGreen, la pertinence est basée en partie sur un regroupement pseudo FRBRien des notices : cela signifie que pour une oeuvre qui a été rééditée ou traduite plusieurs fois, on ne présente qu’un seul résultat, précisant le nombre d’éditions. Ca paraît sybillin, mais c’est rare dans les catalogues. Les réflexions de Tom Hickey (OCLC) sur le ranking basé sur les FRBR sont à consulter pour aller plus loin sur cette question.
Ensuite, la pertinence repose sur le nombre de notices concernant une même oeuvre, donc le nombre de fois où l’ouvrage a été acquis et/ou catalogué par les différentes institutions participantes. Ceci n’est possible que si on a un beau catalogue collectif et que les notices ne sont pas dédoublonnées mais seulement regroupées.

Le troisième cadeau, ce sont les rebonds dans la marge de gauche.
Les rebonds "sujet" sont construits sur les vedettes matières, et eux-mêmes énéficient d’un ranking de pertinence : celles qui apparaissent sont les vedettes-matières le plus souvent attribuées aux ouvrages qui apparaissent dans la liste de résultats.
Donc non seulement on peut rebondir, mais en plus on a une visibilité sur l’indexation sujet ce qui devrait aider notre utilisateur débutant à se familiariser avec les systèmes d’indexation imbitables des bibliothèques.

Le quatrième cadeau ce sont les services.
On peut construire des requêtes sous forme de lien basé sur le titre, l’auteur ou l’ISBN. Les notices sont également adressables – on peut enregistrer leur URL et la réutiliser. Tout cela est expliqué dans la FAQ pour bibliothécaires.
Sur la page d’affichage des notices, on trouve des liens sans complexes vers Amazon et Google.
On peut créer un profil personnel (qui s’appelle tout simplement "your list") pour désigner ses bibliothèques préférées et y trouver les ouvrages, y compris si la bibliothèque en question n’alimente pas le catalogue de RLG.
Enfin on peut exporter les notices bibliographiques sous forme de référence propre à être incluse dans une bibliographie, avec différents format de citation qui semblent correspondre aux normes en vigueur dans quelques grandes universités, genre :

Mai 68.Wolinski, Cavanna, Cabu… et al. ; préf. de Cohn-Bendit. Paris: M. Lafon, 1998.

Bien sûr, cette interface n’est pas forcément suffisante pour un chercheur ou quelqu’un qui est en quête de quelque chose de précis – le public cible ordinaire de RLG. Il ne s’agit pas de l’interface unique de RLG Union Catalog, juste une interface, avec ses objectifs, et elle se donne les moyens pour les atteindre.
Moralité, c’est pas parce qu’on fait dans les catalogues de recherche et les données en dentelle qu’on doit éviter forcément de faire simple. Il faut juste savoir à qui on s’adresse, et comment.

Réflexion à compléter par les petites notes de Nicolas sur la question de l’extraction des données depuis le catalogue, et quels services construire sur cette extraction avec quels outils.

3 réflexions sur “Changer les catalogues (suite) : l’exemple de RLG

  1. Si j’ai bien compris le système de RedLightGreen, c’est, une fois que l’étudiant/chercheur a trouvé la référence bibliographique qui l’intéressait, d’indiquer sa localisation pour trouver immédiatement l’exemplaire qui va l’intéresser — au lieu de devoir parcourir 150 lignes de références d’exemplaires.
    S’il n’y a pas d’alternative à cet affichage-là, un problème se pose pour ceux qui voudraient localiser tous les exemplaires d’une édition rare ou ancienne (ou les deux), puisqu’il semble impossible de demander l’affichage de tous les résultats sans indiquer de bibliothèque « d’appartenance ».

  2. Vraiment intéressante, cette question de la pertinence des résultats pour une recherche mot-notice. Dans la même veine, la solution adoptée par OAISTER qui consiste à pondérer les résultats en fonction du champ (titre, sujet, ou autre) dans lequel apparaît l’occurrence recherchée (c’est le « weighted hit frequency »). Sur le même modèle en somme que les moteurs de recherche web qui pondèrent sur l’URL, le titre de la page HTML, le corps de la page etc.

Les commentaires sont fermés.