ELAG 2007 : « papers »

ELAG est un groupe européen qui rassemble des personnes intéressées par l’informatique documentaire en bibliothèque. Il se réunit tous les ans au printemps dans une ville européenne différente pour aborder des sujets d’actualité qui tournent traditionnellement beaucoup autour du SIGB. Mais, les bibliothèques étant ce qu’elles sont, la conférence s’est également ouverte ces dernières années au numérique et à la question des services offerts sur le Web, et donc cette année proposait pour thème : Libraries 2.0.

Comme dans toute conférence ELAG, il y avait trois grandes parties :

  • les « papers », conférences « plénières » à laquelle tout le monde (un peu plus de 100 personnes) assistait – c’est ce dont je vais parler ici
  • les "progress reports", ou lecture commentée des revues d’avancement envoyées par les participants sur leur institution : un exercice très formel et sans grand intérêt si vous voulez mon avis, donc je n’en dirai pas plus mais vous pouvez les consulter
  • les « workshops », des travaux en groupe qui feront l’objet d’un autre billet.

Donc voici mon compte-rendu des « papers ». La plupart des liens pointent vers les présentations au format PDF.

Ressources électroniques

Un des sujets les plus "classiques" de mon point de vue dans les conférences plénières était la question des ressources électroniques et leurs différentes déclinaisons en bibliothèque, notamment à travers le prisme de l’open access. Nous avons eu quelques présentations qui relèvent plutôt de l’état de l’art que d’autre chose, sur les archives ouvertes en Catalogne, les logiciels open source et l’usage des revues électroniques.

Dans la même veine, l’historique des 25 années d’informatisation en Catalogne reflète assez bien l’esprit d’ELAG, dont l’objectif est également de faire lumière sur la bibliothèque qui accueille la conférence.

Par contre la présentation du modèle de référence DELOS pour les bibliothèques numériques (j’en avais parlé il y a quelques temps) correspondrait au versant le plus innovant de ce thème classique.

Formats et Protocoles

Plus intéressant (toujours à mon humble et partial avis), nous avons eu des présentations plus ou moins détaillées sur l’évolution de l’environnement normatif des catalogues.

On nous a ainsi vanté l’intérêt des SOA (service-oriented architecture), qui favorisent la modularité des systèmes dans une logique orientée objet et service, au contraire de la traditionnelle logique applicative des SIGB, à travers l’exemple d’un système monté par Bibsys en Norvège.

Parmi les nouveautés à regarder de près, on nous a présenté RDA le successeur des AACR qui sont l’équivalent anglo-saxon des ISBD (pardon, je jargonne mais en gros il s’agit simplement de règles de catalogage). Les RDA voudraient principalement apporter

  • une déconnexion claire entre le contenu et le support
  • la suppression des jargons antédiluviens et des latinismes barbares (s.n., s.l., couv.ill. en coul., et al. ça vous parle à vous ?)
  • la prise en compte des FRBR, au moins au niveau de la terminologie
  • et enfin la convergence avec d’autres formats de descriptions appartenant à d’autres communtautés comme LOM pour le e-learning, ONIX pour les éditeurs ou encore, tout dernièrement, le Dublin Core.

Enfin, Herbert Van de Sompel en personne était là pour présenter ORE, le nouveau projet de l’Open Archive Initiative. Basiquement, il s’agit de promouvoir un modèle de données et un protocole qui permette non plus d’échanger seulement des métadonnées comme on le faisait avec l’OAI, mais les objets eux-mêmes ou des parties de ces objets. Pour y parvenir, on exposerait des cartes de structures qui constitueraient des représentations ("surrogates") des objets numériques et permettraient d’en réutiliser seulement des parties ou des versions données.
C’est intéressant mais assez complexe et je ne suis pas sûre que ce soit l’outil dont nous avons besoin pour résoudre le problème de l’interopérabilité des bibliothèques numériques ; l’avenir nous le dira.

Google, Amazon & Co

Nos amis du Web 2.0 étaient bien sûr les grands favoris de la compétition, et plusieurs conférences se sont intéressées à l’impact de ces outils sur les bibliothèques. Qui de discuter de l’accès à nos ressources via Google, qui d’envisager Amazon comme un concurrent ou un allié : nous ne sommes pas vraiment dans des débats très révolutionnaires. Toutefois quelques idées intéressantes sur la fourniture de documents à distance (sujet ô combien élimé, mais qu’on peut toujours renouveler par le hype technologique) ou le référencement (quoique je préfère le terme "exposure" employé par l’intervenante en anglais) méritent de retenir notre attention.

La conférence sur le knowledge management a été une de celles qui m’ont le plus plu, car en démystifiant un peu le vocabulaire et les idées reçues dans ce domaine, elle mettait le doigt sur le vrai problème : non pas celui des "bibliothèques 2.0", mais celui des "bibliothécaires 2.0". L’idée que j’en ai retenu c’est que le web 2.0 est avant tout un problème de collaboration et il faut que les bibliothécaires, et en particulier les "managers", s’investissent et montrent la voie à leurs semblables avant que cela ait une chance de marcher. Jeunes conservateurs, à vos blogs !!!

… to be continued…

Le Scribe du XXIe siècle

Le Scribe du XXIe siècle est mi-humain, mi machine.

La machine est une station de numérisation équipée d’un appareil photo numérique, d’une vitre pour aplatir les pages, et d’un logiciel libre, assemblés par Internet Archive. La partie humaine tourne les pages et déclenche les prises de vue dans un silence religieux.

Dans son scriptorium, le Scribe du XXIe siècle reproduit 500 pages de livres en une heure. A Toronto, 13 Scribes ont ainsi reproduit 200 000 ouvrages depuis 2004, et produisent régulièrement 1000 livres numériques par semaine.

Merci à Digitization101.

Certifié conforme

Trois nouveaux outils sont aujourd’hui disponibles pour évaluer la conformité d’un "entrepôt", "archive", enfin un de ces machins où on conserve les documents numériques sur le long terme, avec l’essentielle norme OAIS (expliquée de manière accessible ici).

Voici TRAC : fruit d’un travail de RLG (Research Liraries Group) et du CRL (Center for Research Libraries), le Trustworthy Repositories Audit & certification (TRAC): Criteria and Checklist est une liste de critères à passer en revue pour s’assurer qu’on mérite le titre d’entrepôt de confiance.

DRAMBORA lui est carrément une "boîte à outils" pour faire l’audit d’un tel entrepôt. Ladite boîte nécessite un enregistrement pour être téléchargée, et comporte un document rédigé, et un "template" pour l’audit sous forme de fichier Word ou Exel. La méthodologie est celle de la gestion des risques, et c’est le Digital Curation Center et le projet européen DPE qui en sont à l’origine.

Enfin, le réseau allemand NESTOR a publié un catalogue de critères qu’on peut passer en revue pour vérifier sa capacité à préserver les documents numériques de manière fiable.

Dans ces trois méthodes, on va retrouver plus ou moins les mêmes éléments :

  • l’organisationnel, c’est-à-dire vérifier qu’on la bonne gestion, l’organisation, les compétences, la viabilité financière pour accomplir cette tâche, et qu’on garantit la transparence qui permet d’établir la confiance
  • la gestion des objects numériques : vérifier qu’on se donne les moyens d’avoir des objets préservables dans le temps et de collecter toutes les informations (aussi appelées métadonnées) nécessaires pour leur préservation, la maintenance des accès et des performances, et la surveillance de l’environnement technologique par la veille
  • l’infrastructure et la sécurité, bref les moyens techniques de la conservation.

Allez, c’est une occasion rêvée, merveilleuse, et attendue de clamer haut et fort, en gras, en majuscules, et souligné : stocker ce n’est pas archiver ! Il ne suffit pas d’avoir de gros serveurs pour préserver des documents numériques.

Manifeste, témoignage et bibliothèques numériques

DELOS est un projet européen sur les bibliothèques numériques initié en 2004. Dans le Dlib de mars/avril 2007 ils présentent leur digital library manifesto : un texte déclaratif qui remet à plat les définitions des bibliothèques numériques et de leurs systèmes.

Extrait et traduction de la terminologie :

  • Digital Library (DL) : une organisation, éventuellement virtuelle, qui collecte, gère et préserve sur le long terme un riche contenu numérique, et offre à ses communautés d’utilisateurs des fonctionnalités spécialisées d’accès à ce contenu, avec une garantie de qualité et suivant des politiques (chartes ?) codifiées.
  • Digital Library System (DLS) : un système logiciel basé sur une architecture éventuellement distribuée, qui fournit toutes les fonctionnalités dont une bibliothèque numérique (DL) donnée a besoin. Les usagers interagissent avec une bibliothèque numérique (DL)à travers ce système.
  • Digital Library Management System (DLMS) : un logiciel générique qui fournit l’infrastructure pour 1) produire et administrer un système de bibliothèque numérique (DLS) avec ses fonctionnalités fondamentales et 2) intégrer d’autres modules logiciels pour offrir des fonctions plus spécialisées.

Ensuite on y trouve plusieurs schémas qui modélisent les bibliothèques numériques, leurs systèmes et leurs relations avec les usagers.

Autant ce manifeste est conceptuel et déclaratif, autant le témoignage de James Billington, directeur de la Library of Congress, devant le Congrès américain, est ancré dans le concret et les projets. Beaucoup de chiffres y sont donnés sur les contenus numériques, leur préservation à long terme dans le cadre du programme NDIIPP, et l’accès dans le cadre de la World Digital Library.

Quelques petits chiffres au hasard :

  • il a fallu deux siècles à la Library of Congress pour amasser une quantité d’information équivalente à celle qui est produite sur le Web toutes les 15 minutes
  • un site Web a une durée de vie moyenne de 44 à 75 jours
  • il y a 11 millions d’items (?) sur le site American Memory
  • le budget pour numériser les 5 premiers millions d’items d’American Memory était estimé à 60 millions de dollars en 1994
  • Google subventionne le lancement de la World Digital Library à hauteur de 3 millions de dollars
  • Le nouveau centre de conservation de l’audiovisuel (NAVCC) coûte plus de 150 millions de dollars à son mécène, une fondation nommée PHI, pour y conserver 5 millions d’items et prévoir 25 ans d’accroissement.

« LA » bibliothèque (la nuit)

Je sais pas si vous avez déjà remarqué, mais souvent, l’aspect mythique qui environne ces endroits où l’on conserve et consulte des livres, conduit les gens à parler de LA bibliothèque, comme entité unique, faisant abstraction de la multiplicité des lieux et des natures des bibliothèques. Quand j’étais étudiante, j’allais travailler « à la bibliothèque » et quand j’étais enfant, j’allais à « la bibliothèque » emprunter des romans.

Et de même, Alberto Manguel dans son dernier bouquin (La bibliothèque, la nuit) ne parle pas de "sa" bibliothèque personnelle, mais de "la" bibliothèque : qu’il s’agisse de celle qu’il a constitué dans sa grange, de celle qu’il fréquentait dans sa jeunesse, ou des innombrables bibliothèques mythiques ou réelles qu’ils nous fait visiter en écriture.

D’habitude, j’apprécie vraiment Manguel ; je l’ai même cité une fois ou l’autre sur ce blog. Mais là, je dois dire que j’ai trouvé ce bouquin à l’image de son titre : bizarre, grandiloquent, et même parfois incohérent. La vision qu’il donne de la bibliothèque m’est totalement innacceptable, engoncée dans des a-prioris et une sacralisation mièvre et naïve de la bibliothèque et de l’objet livre. Son rejet clair et net de tout ce qui est numérique n’est même pas argumenté (j’étais curieuse de savoir comment il le justifierait, mais il ne le justifie pas : c’est du niveau du sentiment). Alexandrie, Babel, Dewey, Robinson Crusoe, toutes les tartes à la crème bibliothéconomiques y sont.

Bref, ce bouquin présente quelques historiettes intéressantes du point de vue de l’histoire des bibliothèques, mais elles sont tellement noyées dans la mélasse d’un discours barbant et pompeux sur « la » bibliothèque qu’il m’est tombé des mains avant la fin.

A l’ENSSIB, on cesse de dire « la bibliothèque » : on apprend à les appréhender dans leur multiplicité, leur diversité, leur vraie richesse au-delà du mythe. A la fin on devient « conservateur des bibliothèques », au pluriel : symbole peut-être d’une entrée dans la vie professionnelle où les bibliothèques, devenues réelles, n’ont plus rien à voir avec ce que nous décrit, de l’extérieur, le livre de Manguel.

Worldcat identities

Moi aussi j’avais hâte qu’ils annoncent Worldcat identities.

Lorcan Dempsey nous l’avait montré en avant-première aux entretiens de la BnF. Ca avait l’air chouette. C’est carrément bluffant.

En deux mots, c’est un espèce de mash-up de données sur des auteurs : les livres qu’ils ont écrits, quand il les ont écrits, dans quelle langue, ce qu’on a écrit sur eux…

Je vous laisse découvrir.

La bibliothèque numérique du monde

Le projet de "World digital library" a été annoncé dès 2005 par J. Billington, directeur de la Library of Congress. Il y a peu, le monsieur était à Paris à l’UNESCO pour présenter sa bibliothèque numérique du monde : un projet assez différent de ceux qui relèvent de la "numérisation de masse" puisqu’il s’agit plutôt de valoriser des fonds patrimoniaux représentatifs de la culture du monde. Une expo virtuelle géante en quelque sorte.

Bref, je suis tombée aujourd’hui sur le site de la World digital library ou plutôt de son projet puisque pour l’instant, ce qu’il y a à voir c’est surtout une vision… Ne loupez à aucun prix cette vidéo. C’est un petit bijou de marketing, une remarquable mise en scène et en écrans du numérique (et ce n’est pas facile de filmer le numérique).

Je ne sais pas si cette débauche de « hype » bien léché me fait vraiment envie en tant que professionnelle des bibliothèques. Disons que si on m’avait demandé de faire la maquette d’une grande bibliothèque numérique internationale, je n’aurais probablement pas fait cela ;-) Mais il faut avouer que c’est assez prometteur.

Collections ou accès ?

La semaine dernière, j’ai été invitée à l’ENSSIB pour participer à un débat sur le thème : "collections ou accès" ?

A départ, cette opposition paraissait absurde à la bibliothécaire patrimoniale que je suis : pour moi c’est collections ET accès, indissociablement. Mais en écoutant parler P. Bazin (BM de Lyon) c’est devenu plus clair et je pense que ses propos méritent d’être rapportés ici, en espérant que je ne les trahirai pas trop.

Dans une vision traditionnelle de la bibliothèque, la collection est au centre de l’organisation, de l’entité bibliothèque. Cela se traduit par une vision rationnaliste du développement de la collection, exprimée dans une charte.
Or cette vision est aujourd’hui dépassée : on positionne beaucoup plus la bibliothèque en termes d’accès, et en fonction des usagers (P.B. refuse le terme d‘usages, trop tourné vers le concept, pour préférer celui d‘usager qui est plus ancré dans le concret.)
Un certain nombre de concepts peuvent aider à adapter la collection aux logiques d’accès, notamment celui de l‘accompagnement : dans l’idée que les lecteurs sont de plus en plus experts et que la société de l’information est une société où les concepts de la bibliothéconomie sont entrés dans la vie courante, le bibliothécaire se positionne non pas en autorité, mais en médiateur qui peut accompagner le lecteur dans sa quête de la connaissance. Le guichet du savoir est emblématique de cette démarche et de l’idée que le bibliothécaire n’est plus médiateur d’une collection, mais des contenus eux-mêmes.

Ce qui est intéressant de mon point de vue, c’est l’idée que l’Internet, et plus particulièrement le Web 2.0, rend visibles un certain nombre d’évolutions (participation des utilisateurs, relativité des documents entre eux) qui sont également vraies dan la bibliothèque traditionnelle.
Finalement ce n’est pas nouveau, et Ranganathan (ah ah, vous voyez j’y viens) l’avait déjà énoncé : les livres sont faits pour être utilisés, à chaque lecteur son livre, épargnons le temps du lecteur… Vous remarquerez que la notion de collection n’apparaît pas dans les 5 lois de Ranganathan ; on est au plus près du contenu, et au plus près de l’usager.

Dans le monde numérique, le couple contradictoire et complémentaire collections/accès pourrait s’exprimer par numérisation de masse/web 2.0.
La numérisation de masse rend la collection accessible, disponible. On n’est plus sur le modèle de l’ancienne charte documentaire, raisonnée, organisée et parfois rigide. L’idée d’encyclopédisme dans la constitution de la collection repose sur les "épaules de géants" – on s’appuie sur des collections déjà constituées par le temps dans les bibliothèques, donc elles sont pertinentes a priori – et sur le mythe de la reproduction absolue – on sera capable de tout numériser.
Pour que cette masse soit intelligible, il va cependant falloir trouver un moyen de la valoriser, et cette valorisation ne peut se faire qu’au plus près des usagers et de leurs pratiques : à chaque lecteur son livre, à chaque livre son lecteur.

Or il n’y a pas un usager et une seule pratique : il y a tout un spectre d’usages possibles qu’il va falloir identifier, capter et animer pour construire les différentes vues que ces usages constituent sur la collection.
Dans la bibliothèque physique, cette animation peut prendre la forme d’expositions, de conférences, etc.
Dans la bibliothèque numérique, ce sont les outils du Web 2.0 : blogs, forums, wikis, commentaires, tags, etc.

Moralité, il n’y a plus une collection organisée à laquelle s’adressent les usagers. Il y a un fonds dans lequel les usagers puisent pour faire émerger des collections organisées.

Les 5 lois de Ranganathan

Me voici encore sur les routes, et pas le temps de bloguer.

Pendant mon absence je vous propose de méditer les 5 lois de la bibliothéconomie de Ranganathan :

  • les livres sont faits pour être utilisés
  • à chaque lecteur son livre
  • à chaque livre son lecteur
  • épargnons le temps du lecteur
  • la bibliothèque est un organisme en développement.

Retrouvez l’ouvrage complet de Ranganathan ici.

Fontenay la nef de l'abbaye

Je vous proposerai une petite réflexion sur les lois de Ranganathan dans le monde numérique à mon retour (des promesses…)

Les objectifs de la numérisation

Bon, à la demande générale ;-) je vais éclaircir un peu le propos de mon billet sur la numérisation de masse, et parler des objectifs de la numérisation.
Question de base : pourquoi numérise-t-on dans les bibliothèques, et comment ?

D’abord, une bibliothèque qui se lance dans la numérisation ne le fait jamais dans l’absolu, comme si elle partait d’une table rase. Elle bénéficie d’un existant : ses missions, sa politique documentaire, ses collections. C’est donc à partir de ces trois principaux éléments qu’elle va se lancer dans la numérisation.

Il y a plusieurs raisons pour se lancer dans la numérisation et historiquement la première, dans les bibliothèques, a été la valorisation. Sur le fond, la valorisation numérique présente peu de différences avec la valorisation traditionnelle. Il s’agit de faire connaître les trésors de la bibliothèque à un public plus large au moyen d’une présentation attrayante (ludique, pédagogique, esthétique) et dont l’accès est plus ouvert que celui des salles de lecture (une exposition, un livre).
Vous voyez tout de suite ce que cela implique : une numérisation de valorisation porte sur des objets particuliers (précieux, rares), vise un public particulier (le fameux "grand public") et emploie des formes particulières. Ce genre d’initiative débouche sur des expositions virtuelles, des présentations de collections numériques, et sur des interfaces comme le tourne-page.
Avantage : c’est joli, ludique, attrayant, ça donne une bonne image de la bibliothèque et ça plaît aussi aux gens qui ne sont pas spécialistes.
Inconvénient : ce genre d’interface est inutilisable par des personnes qui s’intéressent au même document à d’autres fins (un peu comme si on demandait à un chercheur spécialiste de la génétique des textes de travailler sur un manuscrit de Proust exposé dans une vitrine).

Ce qui m’amène à un deuxième type de numérisation : la numérisation "à la demande" ou spécialisée. Cette fois c’est l’inverse : au lieu de s’adresser au grand public, on fait une numérisation destinée à répondre aux besoins spécifiques d’une personne ou d’une communauté identifiée. Dans une optique commerciale, cela peut déboucher sur une banque d’achat d’images, ou sur des banques de textes. Dans une optique de recherche, cela peut déboucher sur une base de données spécifique à un type d’étude particulier, ou sur une numérisation limitée en quantité et de très haute qualité.
Avantage : le public est déjà ciblé et on répond précisément à ses attentes donc le succès est plus facilement assuré, au moins auprès d’un nombre limité de personnes.
Inconvénient : c’est toujours inutilisable par des personnes qui s’intéressent au même document à d’autres fins (typiquement, c’est bien de ne numériser que des enluminures mais celui qui travaille sur le texte du manuscrit se retrouve le bec dans l’eau). Ou alors cela ne couvre qu’un spectre documentaire/thématique très limité.

Troisième cas, la numérisation de sauvegarde. Je désigne par ce terme le fait d’utiliser la numérisation comme support de conservation préventive et de substitution. Hors jargon bibliothéconomique : on numérise le bouquin pour que les gens consultent la version numérique à la place d’abîmer l’original. Cette numérisation répond à des plans de sauvegarde des collections, ça veut dire qu’on commence par numériser les documents qui sont en danger : les plus fragiles (mais pas forcément les plus précieux, typiquement la presse ou les cassettes vidéo). Avant on faisait du microfilm, mais soyons sérieux, bientôt (?) cela coûtera trois fois plus cher de réparer un lecteur de microfilms que d’acheter un PC, et de toutes façons plus personne ne saura le faire. Il faut donc passer au numérique.
Avantage : une grande facilité de consultation par rapport à l’ancien support de substitution, qui n’offrait que des capacités limitées de lecture simultanée et une "expérience de lecture" peu optimisée.
Inconvénient : pas de public assuré pour consulter cette numérisation, et comme les originaux sont en voie de disparition, il faut qu’elle soit fiable, authentique et pérenne car c’est bientôt (ou déjà) le seul moyen d’accéder à ces documents là.

Quatrième cas, la bibliothèque numérique proprement dite : la bibliothèque va projeter ses missions, sa politique documentaire et ses collections dans le monde numérique, de façon à présenter un ensemble cohérent et organisé de documents en ligne. Les missions de la bibliothèque numérique sont plus ou moins calquées sur ses missions dans la vraie vie : recherche pour une bibliothèque de recherche, patrimonial pour une bibliothèque patrimoniale, etc. Donc cela peut recouper en partie les trois types ci-dessus, avec une notion de gestion de collection et de masse critique en plus.
Il y a beaucoup à dire sur la bibliothèque numérique : voir par exemple , ici, etc.
Avantage : c’est un service cohérent avec une politique documentaire, des missions, des services, etc. capable en principe de répondre aux besoins d’un public diversifié.
Inconvénient : c’est très compliqué et coûteux à organiser. Même très très compliqué.

Le dernier que je citerai n’est pas un type de numérisation à proprement parler. C’est un état d’esprit… dont je parlais ici : l’utopie de la reproduction universelle, où tous les documents seraient passés sur un nouveau support, plus performant. Frédéric Barbier rappelle dans son article du BBF que c’est bien une utopie car à chaque changement de support on perd une partie de l’information. Le cauchemar de Babel, le mythe de l’indexation permettant d’"organiser l’information du monde", la recherche d’un changement de paradigme digne de l’invention de l’imprimerie, et la bibliothèque sans murs constituent l’imaginaire de la numérisation de masse.
Cet état d’esprit témoigne des espoirs que l’on place aujourd’hui dans la numérisation de masse. Mais on prend peut-être le problème à l’envers, en pensant que c’est la technologie (la numérisation, avec OCR, indexation et tout le toutim) qui peut résoudre des problèmes. D’abord il faut fixer des objectifs (valoriser, rendre les documents plus accessibles, aider un certain public, diffuser le savoir, organiser l’information du monde, générer des revenus ?) et à partir de ces objectifs on définit les technologies appropriées pour répondre à la question.

Il y a maintes manières de faire de la numérisation, et à chaque objectif correspondent des technologies appropriées, en fonction aussi des moyens dont on dispose. Tous les choix me paraissent respectables ; la seule chose qui ne l’est pas, c’est de numériser par pur attrait de la technicité sans se fixer d’objectif.