RSS à la BDIC

Publié le 29/05/2006 par manuefig

Non, ce n’est pas un nouveau message de jargon cryptique, mais simplement une belle découverte : la Bibliothèque de Documentation Internationale Contemporaine a mis en place sur son site Web un système d’espace personnel largement basé sur RSS.

On peut ainsi choisir quelles parties du site on souhaite voir s’afficher quand on est connecté, mais aussi :

les actus de la bibliothèque
les fils RSS de grands quotidiens nationaux et internationaux
les fils RSS de votre choix – blog ou autre
des « fils RSS bibliographiques » qui permettent de suivre l’entrée de nouveaux documents dans les collections en fonction de domaines de recherche
la revue de la bibliothèque, Matériaux pour l’histoire de notre temps
les nouvelles acquisitions.

On peut même créer des alertes bibliographiques sur les collections de la BDIC ou sur le Web, et les recevoir par mail ou les afficher dans son espace.

Pour moi c’est un peu la réalisation d’un vieux rêve : tout ce que vous avez toujours rêvé de faire avec RSS dans votre bibliothèque sans oser le réaliser. Bravo à eux.

Preum’s !!!

Publié le 24/05/2006 par manuefig

Ah oui alors, je veux à tout prix être la première à annoncer la sortie du nouveau BBF spécial "Les bibliothèques sur le Web" !

Dedans, il y a un bel article de mon geek sur les blogs et les wikis.

A part ça, tout a l’air à peu près super intéressant dans ce numéro. Il y a même un article sur la BNuE et un sur le Dépôt légal du Web .

Alors voilà, demain, c’est férié, ça va nous laisser le temps de bouquiner.

Confiture numérique et archivistique

Publié le 17/05/2006 par manuefig

Je manque un peu d’énergie pour entrer dans les détails, alors voici une liste de ressources à utiliser, lire, exploiter, dans les domaines de prédilection qui sont les miens habituellement.

Sur les bibliothèques numériques, lire Scan this book !, un article de Kevin Kelly, déjà signalé par Lafeuille mais je l’avais vu sur Netbib, apparemment il faut se dépêcher de le lire avant qu’il ne soit plus en accès libre.

Mon fils RSS a un Dlib de retard, aussi c’est dans celui d’avril que je vous recommanderai :

un article sur les identifiants et les droits – oui, les deux en même temps, et même : les ISSN et MPEG-21 rights data dictionnary. Puis des études de cas.
un article sur la valeur de la préservation, valeur au sens propre, il s’agit de décisions budgétaires.

Enfin ceci dit vous pouvez aussi consulter directement le Dlib de mai.

Repéré sur DCC, un powerpoint sur les questions juridiques appliquées à la bibliothéconomie numérique.

Vu sur Catalogablog, un rapport sur l’intégrité dans les archives numériques, chez HP.

Enfin, via OAnews, petite visite sur le blog d’un archiviste qui a des choses intéressantes à dire (je l’avais d’ailleurs déjà cité) : Archivemati.ca. C’est un billet aux saveurs de Web 2.0 mais il le dit lui-même :

Although the “Web 2.0″ term probably has a limited shelf life, I expect it will at least get people’s attention as they scan a conference program.

Après il parle de plein de choses intéressantes sur l’accès aux collections d’archives numériques, notamment sur les communautés.

Bibliothèques et communautés

Publié le 15/05/2006 par manuefig

J’en ai un peu marre d’entendre parler à tort et à travers de Web 2.0 et, partant, de bibliothèques 2.0. A la question "êtes-vous un bibliothécaire 2.0" je répondrais volontiers non si j’avais le choix. Comme le dit si justement idsuisse, on ne crée pas un réseau communautaire avec seulement des outils et sans y mettre de sens ; une communauté ne se résume pas à la somme de ses individus.

Si on retourne dans les rayons de la bibliothèque "de brique et de mortier", on y trouvera, niché entre deux étagères, le topos suivant : une bibliothèque c’est un lieu, dans un lieu il y a des gens, donc c’est une communauté. Or il n’y a rien de plus faux évidemment, et s’il suffisait d’ouvrir les portes pour que se crée la communauté cela se saurait, et de même, s’il suffisait de créer un blog ou de lancer un wiki pour susciter une communauté virtuelle, on aurait vraiment à s’en faire de n’avoir pas déjà commencé.

En lisant un document signalé par Librarian.net qui présente plusieurs interviews de bibliothécaires sur le sujet des communautés, j’ai essayé de faire converger ces réflexions et je suis arrivée aux conclusions suivantes.

Un lieu

Bon d’accord, la notion de lieu reste un ciment fort pour les communautés. Mais le lieu ne suffit pas, il faut qu’il soit agréable, vivant. Le lieu se définit essentiellement, en fait, par ce qui s’y passe (valorisation et animation).
L’enjeu principal n’est pas de créer le lieu mais d’inciter les gens

à y entrer
à y revenir
à y rester.

Ces problématiques sont bien connues sur le Web. Comment convaincre l’usager de s’attarder plus des 10 ou 30 secondes moyennes sur le site ? Pire encore, comment le convaincre d’y revenir, encore et encore ? La réponse est simple, il faut faire de l’animation – faire que ça bouge, offrir du service. Pas si facile.

Un modèle économique

Parce que tout cela va bien sûr, en premier lieu, coûter de l’argent. Il faut donc une volonté politique forte pour que cela marche, à moins d’arriver à faire rentrer des revenus en organisant des ventes de livres désherbés ;-) Il faut réussir à dégager un budget spécialement dédié à cette activité de création de communauté, alors que celle-ci est loin d’être identifiée dans la bibliothèque, et encore moins sur le site Web de celle-ci.
Après il y a la question du retour sur investissement : comme le disait justement Karl repris par Hubert, les entreprises qui nous vendent le Web 2.0 y gagnent quelque chose en terme de réutilisation des données, de publicité, etc. Qu’ont à y gagner les bibliothèques ? Tout simplement le droit de survivre, disent certains qui estiment les communautés inévitables.
Bref, on est loin du « plug and play » prétendument apporté par les outils dits du « web 2.0 ». Parce qu’il va falloir aussi…

… des personnels motivés

On construira la communauté avec des gens, et ces gens ça ne peut pas être seulement les usagers. Il faut donc réunir une équipe étoffée de bibliothécaires qui ont envie de créer cette communauté, de l’animer, de la faire vivre.
Eviter que cela soit uniquement lié aux personnes, à savoir un ou deux bibliogeeks prêts à modérer les commentaires entre 20h et 22h (je dis pas que c’est mal, mais c’est pas suffisant ;-)
L’équipe ne peut se construire à côté ou contre le reste de l’établissement : il faut qu’elle emmène tout le monde dans son sillage, éviter l’épreuve de force de la résistance au changement, dont tout le monde ressort perdant.

Un public motivé

Comme pour le lieu, il faut éviter de tomber dans l’idée facile que le public identifié, voire captif, de la bibliothèque est équivalent à sa communauté. Créer la commuanuté va nécessiter de bien connaître ce public, puis de le motiver, de l’inviter à participer à la communauté. Il faudra aussi se débrouiller pour qu’il soit assez nombreux pour atteindre la masse critique.

Pas une communauté, des communautés

Dans la plupart des exemples donnés par les bibliothécaires interviewés, il ne s’agissait pas de créer une communauté autour de la bibliothèque, mais différentes communautés autour de projets s’adressant à un public ciblé : les immigrés, les non-voyants, les adolescents, les étudiants de premier cycle…
Autant de projets que de publics, donc, et chacun doit être vivant, avec des bibliothécaires motivés et un public motivé.

La transparence

Je garde le meilleur pour la fin : il faut jouer le jeu des nouveaux outils et de la communauté, la traiter d’égal à égal, savoir être transparent dans ses actes et ses paroles.
Est-il possible que notre culture francophone, qui hiérarchise et dramatise en général toutes les relations à la fois dans et hors la bibliothèque, sache jouer le jeu de la transparence ? Nous verrons.

Lorsque les bibliothèques françaises commenceront à mettre en place des projets de communautés virtuelles politiquement forts, avec un réel soutien politique et surtout professionnel, un travail sincère d’identification des publics et d’adaptation à leurs besoins, et le tout en toute transparence, je croirai à l’utilisation des outils du web 2.0.

Fusion

Publié le 04/05/2006 par manuefig

Le groupe RLG dont je parlais justement hier a annoncé aujourd’hui son intention de fusionner avec OCLC.

C’est un événement dans le monde bibliothéconomique, car ce sont les deux plus grosses organisations (à but non lucratif) internationales qui sont vraiment sur le créneau des bibliothèques en général et des technologies en bibliothèque en particulier.
Si je ne me trompe pas, OCLC agit plutôt comme prestataire de service, mais avec une grosse composante recherche et développement développant aussi des projets ouverts et libres. RLG est plutôt à caractère associatif avec une forte participation des bibliothèques membres dans les différents projets.

RLG va devenir un programme au sein de la partie R&D d’OCLC, à partir du 1er juillet, si deux tiers des membres accordent un vote favorable à cette décision. Le catalogue collectif de RLG sera versé dans WorldCat. On ne sait pas trop ce qu’il adviendra des autres projets RLG.

D’après le blog Hanging together tenu par l’équipe de RLG, eux-mêmes l’ont appris à 10h hier matin… Et on peut lire dans les commentaires de ce billet :

It feels like the library world equivalent of Apple and Microsoft merging.

Mise à jour :

Comme d’habitude j’ai l’impression de lire le fonds de ma pensée chez Dorothea. Analyse à ne pas manquer.

Changer les catalogues (suite) : l’exemple de RLG

Publié le 03/05/2006 par manuefig

Un bon exemple de ce que je disais l’autre jour au sujet des catalogues comme sources de données à réutiliser dans différentes interfaces, c’est le catalogue collectif de RLG. Celui-ci ne contient pas autant de notices que le catalogue collectif d’OCLC, mais surtout il est de nature différente puisqu’il regroupe, comme son nom l’indique, des collections de bibliothèques de recherche, et comme son nom ne l’indique pas, éventuellement d’autres institutions que des bibliothèques (RLG travaille beaucoup avec les archives et les musées, et inclut aussi des institutions de recherche, des marchands de livres, etc.). Tout cela représente plus de 130 millions de notices, mais beaucoup moins de titres car le principe est de ne pas dédoublonner les notices versées pour le même ouvrage par diverses institutions.

Ce catalogue collectif a plusieurs interfaces différentes :

une qui s’appelle Eureka, qui est une interface Web payante,
une qui s’appelle RLIN21 et qui est une interface de gestion destinées aux professionnels, pour créer et dériver des notices,
une interface Z3950 (machines uniquement, humains s’abstenir)
et enfin une interface publique, portant sur un sous-ensemble limité du catalogue, qui est gratuite et très particulière et porte le nom de RedLightGreen.

Bien sûr c’est cette dernière qui m’intéresse ici.

RedLightGreen s’adresse à des utilisateurs débutants, autant qu’on puisse être débutant dans un contexte universitaire / de recherche car vu la mission de RLG, il ne s’agit pas de s’adresser au grand public dans son ensemble. Comme il fallait prendre un sous-ensemble du catalogue, ils ont choisi les monographies (vous me direz, ça simplifie bien les choses, et c’est pas faux, mais c’est la vie).

Que va-t-on proposer à ces utilisateurs d’un genre particulier pour les aider à se sentir à leur aise dans un catalogue de bibliothèque ?

Tout d’abord, une recherche vraiment simple, une seule case, à la Google. La recherche avancée, à peine avancée, prévoit simplement de sélectionner un champ et de limiter par langue.

Deuxième cadeau, la pertinence. Il est trop rare que les catalogues de bibliothèque offrent un classement de pertinence sur les résultats ; or, avec une recherche simple par mots, c’est une fonctionnalité indispensable faute de quoi on est rapidement noyé sous le bruit et l’inutile.
Dans RedLightGreen, la pertinence est basée en partie sur un regroupement pseudo FRBRien des notices : cela signifie que pour une oeuvre qui a été rééditée ou traduite plusieurs fois, on ne présente qu’un seul résultat, précisant le nombre d’éditions. Ca paraît sybillin, mais c’est rare dans les catalogues. Les réflexions de Tom Hickey (OCLC) sur le ranking basé sur les FRBR sont à consulter pour aller plus loin sur cette question.
Ensuite, la pertinence repose sur le nombre de notices concernant une même oeuvre, donc le nombre de fois où l’ouvrage a été acquis et/ou catalogué par les différentes institutions participantes. Ceci n’est possible que si on a un beau catalogue collectif et que les notices ne sont pas dédoublonnées mais seulement regroupées.

Le troisième cadeau, ce sont les rebonds dans la marge de gauche.
Les rebonds "sujet" sont construits sur les vedettes matières, et eux-mêmes énéficient d’un ranking de pertinence : celles qui apparaissent sont les vedettes-matières le plus souvent attribuées aux ouvrages qui apparaissent dans la liste de résultats.
Donc non seulement on peut rebondir, mais en plus on a une visibilité sur l’indexation sujet ce qui devrait aider notre utilisateur débutant à se familiariser avec les systèmes d’indexation imbitables des bibliothèques.

Le quatrième cadeau ce sont les services.
On peut construire des requêtes sous forme de lien basé sur le titre, l’auteur ou l’ISBN. Les notices sont également adressables – on peut enregistrer leur URL et la réutiliser. Tout cela est expliqué dans la FAQ pour bibliothécaires.
Sur la page d’affichage des notices, on trouve des liens sans complexes vers Amazon et Google.
On peut créer un profil personnel (qui s’appelle tout simplement "your list") pour désigner ses bibliothèques préférées et y trouver les ouvrages, y compris si la bibliothèque en question n’alimente pas le catalogue de RLG.
Enfin on peut exporter les notices bibliographiques sous forme de référence propre à être incluse dans une bibliographie, avec différents format de citation qui semblent correspondre aux normes en vigueur dans quelques grandes universités, genre :

Mai 68.Wolinski, Cavanna, Cabu… et al. ; préf. de Cohn-Bendit. Paris: M. Lafon, 1998.

Bien sûr, cette interface n’est pas forcément suffisante pour un chercheur ou quelqu’un qui est en quête de quelque chose de précis – le public cible ordinaire de RLG. Il ne s’agit pas de l’interface unique de RLG Union Catalog, juste une interface, avec ses objectifs, et elle se donne les moyens pour les atteindre.
Moralité, c’est pas parce qu’on fait dans les catalogues de recherche et les données en dentelle qu’on doit éviter forcément de faire simple. Il faut juste savoir à qui on s’adresse, et comment.

Réflexion à compléter par les petites notes de Nicolas sur la question de l’extraction des données depuis le catalogue, et quels services construire sur cette extraction avec quels outils.

Confiture bibliothéconomique

Publié le 24/04/2006 par manuefig

Allez, maintenant que j’ai un peu retrouvé la forme, il faut bien élaguer un peu le résidu des vacances. Confiturons.

Digital images archiving study par le JISC : des trucs sur la conservation des images numérisées. Inclut des trucs sur les métadonnées, sur le modèle OAIS.
Draft du "info" URI scheme à relire.
Expression des concepts clé des FRBR en RDF.
Sortie du METS navigator téléchargeable sur Sourceforge. Un machin en Java.
Un guide sur les institutionnal repositories à l’usage des bibliothécaires. Pourquoi et comment, court et efficace, avec des recommandations.

Merci à toujours les mêmes (Catalogablog, 10KYBlog, etc. j’ai la flemme de mettre les liens.)

e-bibliothécaires

Publié le 20/04/2006 par manuefig

Hier, j’étais invitée à cette journée par les conservateurs stagiaires de l’ENSSIB pour y parler de choses qui me tiennent à coeur. Je crois que j’ai réussi à intéresser les gens avec un sujet comme la conservation du document numérique, ce qui n’était pas gagné.
L’après-midi j’ai dû faire un changement de personnalité schizophrénique pour parler de mon blog, mais ça a été moins dur que je n’aurais cru, notamment grâce à la bonne ambiance qui régnait.

Cela a été l’occasion de rencontrer des tas de gens, certains que je connaissais virtuellement, d’autres que j’avais déjà rencontré, certains blogueurs, d’autres pas blogueurs mais bien présents sur le Web… C’était un peu comme Paris-Carnet mais en sérieux et avec moins de bière ;-)

La table-ronde de l’après-midi avec Nicolas, Marlène et les autres était plutôt sympa, je doute qu’on ait changé le monde et on se connaît trop bien (virtuellement) pour réellement provoquer du débat, mais c’était agréable (vu depuis l’estrade en tout cas).

Bref, une bonne journée au final, il manquait quelques personnes de la biblioblogosphère mais on a bien pensé à eux, et ce sera pour une prochaine fois.

Changer les catalogues

Publié le 20/04/2006 par manuefig

Les bibliothécaires américains semblent être en train de constater qu’il y a un vrai problème avec les catalogues de bibliothèque actuels, et un sacré besoin d’évolution. Les rapports fleurissent sur le sujet, en voici deux :

décembre 2005, bibliothèque de l’Université de Californie : Rethinking How We Provide Bibliographic Services for the University of California
mars 2006, Library of Congress : The Changing Nature of the Catalog and its Integration with Other Discovery Tools.

J’avoue avoir été carrément déçue par le second. J’aurais peut-être dû lire attentivement les annexes plutôt que de me contenter de parcourir les recommandations, mais globalement, ce qui est proposé me paraît assez peu novateur. Faire de la recherche fédérée, mutualiser le catalogage, mieux intégrer les ressources électroniques, je ne vois pas bien ce qu’il y a de révolutionnaire là-dedans. Enfin le rapport ne cesse de faire référence à un modèle économique abscons suivant lequel il faudrait équilibrer les dépenses liées au catalogage et la « demande » des utilisateurs pour ce « produit ».

Le premier est un peu plus ouvert vers les usagers et comporte quelques idées innovantes apparemment un peu plus appronfondies. On y trouve par exemple des réflexions sur les différents formats de métadonnées, l’extraction automatique des descriptions, la recherche plein texte et l’utilisation des FRBR. Idées qui n’était pas absentes de celui de la LoC mais qui sont ici mieux développées.

Je m’attendais à voir des recommandations sur l’annotation des notices par les lecteurs en mode wiki et la mise en places des recommandations d’ouvrage à partir de ce qu’on à déjà consulté (à la Amazon). Apparemment, ce sujet est évoqué mais pas intégré dans les propositions d’évolution ; admettons qu’il est trop tôt.

Par contre, on continue de voir le catalogue comme un outil à la fois unique et ambivalent, LE lieu où l’on produit ET consulte les notices. Il y a là un problème : comment un tel produit intégré pourrait-il s’adapter aux innombrables usages possibles qui naissent et perdurent sur le Web ? Moi je verrais bien l’évolution du catalogue vers un statut de base "pivot", contenant des données en XML qu’on pourrait réutiliser à volonté, dans des applications adaptées aux différents types d’usagers.
Celui qui veut feuilleter, parcourir, découvrir au hasard devait pouvoir le faire. Celui qui veut améliorer le catalogue, donner son avis, devrait pouvoir le faire. Celui qui a une bibliographie de son prof et doit trouver rapidement la dernière édition d’un ouvrage courant dans la bibliothèque la plus proche devrait pouvoir le faire. Celui qui utilise Google parce qu’il ne sait pas que les bibliothèques existent devrait pouvoir tomber sur nos données. Celui qui cherche un truc précis et rare, même si c’est au bout du monde, devrait pouvoir le trouver très vite. Celui qui veut dépouiller intégralement un fonds ou une partie de collection devrait pouvoir le faire. Ce ne sont que quelques exemples.
Non, il n’y a pas un « consommateur » type du catalogue unique et indivisible. Il y a des usages, multiples, différents, et aucun outil miracle ne saura tous les contenter. Il faut des données fiables et souples, qu’on peut sortir, transformer, adapter, réutiliser. Pour moi c’est ça le futur du catalogue.

(Je me suis emportée, là, mais j’ai encore plein d’idées que je mettrai dans d’autres billets. Et vous ?)

MPEG21 DIDL, en détail (3e partie)

Publié le 06/04/2006 par manuefig

Après avoir évoqué MPEG21, et quelques généralités sur MPEG21 DIDL, entrons maintenant dans le vif du sujet, en nous intéressant au modèle de données de la Déclaration d’objet numérique.

Je parlais de quatre « niveaux », il s’agit en fait bien sûr d' »entités », et il y en a bien plus de quatre. Pour que ce soit plus clair, je propose de les regrouper par fonction.

D’abord, il y a les entités de structure. Ce sont les quatre que j’ai citées : container – item – component – resource. J’y ajouterai également anchor et fragment, vous allez voir pourquoi.
Item est l’entité centrale du modèle, puisque c’est celle qui correspond au Digital Item c’est-à-dire au niveau qu’on envisage de manipuler.
Container est, comme son nom l’indique, un conteneur. Il peut contenir d’autres conteneurs et/ou un ou plusieurs items, mais il ne peut pas exister s’il n’y a pas d‘item dedans. Le conteneur est en principe constitué de manière logique (pour rassembler des items) et il est optionnel.
Les items sont constitués de components qui eux-mêmes contiennent des resources. Un composant ne peut exister sans un item. Il contient la resource et ses métadonnées associées, métadonnées qui ne doivent pas être descriptives à ce niveau (uniquement techniques ou assimilé). Les resources sont des objets numériques physiques qui disposent d’une adresse pérenne.
Enfin anchor et fragment servent à pointer sur une partie à l’intérieur d’une ressource.

Les entités de description sont les deuxièmes plus importantes du modèles, surtout descriptor. Celui-ci est une enveloppe de métadonnées qui peut être associée à un item, un component ou une ressource.
Dans ce descriptor on trouve un statement qui correspond à l’énoncé de l’information.
A ce stade, le modèle n’est pas très directif sur la façon d’utiliser ces enveloppes de métadonnées. On sait juste, comme dit plus haut, qu’il vaut mieux mettre le descriptif au niveau de l‘item et le technique au niveau des ressources.
On peut rajouter ici annotation, qui est une information sur une entité dont la particularité est de ne pas avoir d’impact sur ladite entité.

Après, il y a les entités de choix et là excusez moi, mais je ne vais pas m’étendre car c’est terriblement compliqué. En gros on peut rendre un item conditionnel en fonction de conditions et de prédicats, auxquels on attribue des sélections et des assertions.
Ce genre de trucs doit permettre de gérer des droits d’accès ou de faire de la négociation de contenu. Cela ne m’intéresse pas vraiment ici.

Pour finir, on va donc combiner ces différents éléments pour obtenir la Déclaration complète. C’est ce qui est exprimé dans la figure ci-dessus (cliquer pour agrandir). Les containers contiennent des items, qui eux-mêmes contiennent un ou plusieurs components, qui eux-mêmes contiennent une ou plusieurs ressources. Les métadonnées sont accrochées à deux niveaux : celui de l‘item et celui du component.
Cette méthode permet d’exprimer des granularités et des structures d’objets. Celles-ci sont entremêlées avec leurs descriptions, contrairement à METS qui sépare les métadonnées et l’organisation des ressources.
A mon humble avis, un tel modèle paraît assez satisfaisant conceptuellement, mais soulève de grosses difficultés d’implémentation. Je ne sais pas si j’irai jusqu’à parler de ça, parce que la semaine prochaine je suis en vacances :-)

Source : la norme partie 2 – DID (attention fichier PDF zippé)

Figoblog

Un blog sur Internet, la bibliothéconomie et la confiture de figues

Archives de Catégorie: Bibliothéconomie