Wiki-bibliothèque numérique

On parle beaucoup en ce moment de wikipedia, l’encyclopédie libre, et de wikinews, le site d’actualité libre. Validation de l’information et tout ça, je ne relance pas le débat.

Par contre, avant de lire ce billet de S. Bailly, je n’avais jamais entendu personne s’extasier sur Wikisource : une bibliothèque numérique libre.

Le projet : un site wiki pour permettre à n’importe qui de mettre en ligne des textes libres de droit. On y trouve de tout, de la littérature aux sciences en passant par, devinez quoi… les sources historiques. C’est vrai, quoi, si chacun mettait ses transcriptions d’actes du 17e siècle en accès libre sur un wiki, il y aurait moins de travail pour les paléographes. Mais si vous voulez mon avis, le problème de la validation reste plus que jamais entier.

Réflexions sur Google et la numérisation

Bon, je ne reviendrai pas sur cette annonce qu’on a vu mille fois depuis hier : Google a lancé un projet en partenariat avec des bibliothèques américaines, notamment Harvard et Stanford, pour numériser leurs livres.

Je voudrais juste soulever quelques réflexions et questions, glanées de ça de là sur le Web et ailleurs, concernant cet étonnant projet.

La question des droits d’auteur. Les gens des métiers du livre, en entandant cette annonce, s’inquiètent aussitôt du respect de leurs droits quant à la diffusion de ces livres sur le Web. Pas d’inquiétude : Google se contente de les indexer et de les chercher, mais on ne pourra en voir que de petites portions, voire rien du tout. En ce qui me concerne, mon inquiétude est contraire. Google est un acteur commercial et il se protège de la complexité des droits d’auteurs par une politique restrictive, soit. Mais ces fonds appartiennent à des bibliothèques ; ils sont publics ; elles auraient pu choisir de les mettre en libre accès sur le Web. La délégation de la numérisation change le modèle naturel de communication sur le Web des bibliothèques, et ça m’inquiète.

La délégation. Justement, à propos de la délégation, Hubert a raison de se demander quelles seront les modalités de cette délégation. Qu’une bibliothèque accepte lorsqu’on lui offre sur un plateau l’utopie de la reproduction absolue, je peux le comprendre. Mais il faudrait encore qu’elle ne se retrouve pas ensuite, comme c’est parfois le cas aujourd’hui avec les microfilms, obligée de payer pour disposer de ses propres collections.

Le côté obscur de la force. Ce côté obscur, ce n’est pas seulement la situation de monopole, mais aussi le manque de transparence. Le Web est un espace de chaos et la méthode de Google est sans doute la meilleure pour l’appréhender. Mais indexer pêle-mêle en plein texte des millions de livres, c’est vouloir appliquer le chaos à un matériau par nature structuré. C’est aussi nier les "épaules des géants" revendiquées par GoogleScholar, et le travail fait par les bibliothèques numériques pour essayer de donner à leurs lecteurs des contenus plus structurés, plus accessibles, plus fonctionnels. La transparence, c’est aussi garantir au lecteur l’origine de ce qu’il consulte, lui offrir la traçabilité, le contexte, et la fidélité à l’original qui n’est possible qu’avec le mode image. Numériser, ce n’est pas éditer : numériser impose de respecter l’histoire du matériau, parce qu’elle fait partie de sa compréhension de manière intrinsèque. Je suis curieuse de savoir ce que Google répondra à cela.

Le chaos et la science. Je ne vois pas comment les chercheurs pourront se passer de cette transparence et de cette mise en contexte. Je ne vois pas non plus comment la méthode du chaos peut entrer en adéquation avec un monde scientifique de plus en plus spécialisé. Quand la sérendipité augmente, la précision diminue. Et puis, finalement, la recherche plein-texte sans la consultation, c’est comme de donner les clefs des magasins à un lecteur, puis lui interdire d’allumer la lumière.

Le débat est ouvert.

Ressources numériques diverses

Un tout petit peu en vrac, voici quelques lectures intéressantes pour la semaine.

Cette semaine seulement, les trois derniers numéros de la revue Program: electronic library & information systems sont en libre accès. A noter, des articles sur OpenURL, sur la gestion des droits des documents scientifiques et académiques, les métadonnées au format ONIX… A copier vite vite avant qu’il ne soit trop tard !

A lire et à voir, sur le site de l’enssib, les actes d’une journée sur l’indexation des ressources pédagogiques numériques, où il est question de différents formats de métadonnées, standards et études de cas, avec des vidéos des interventions.

A lire presque sur le même sujet, un rapport de la DLF sur l’intéropérabilité entre bibliothèques numériques et cours en ligne.

Merci à RessourceShelf et à Diglet.

Le BBF nouveau est arrivé

Le dernier numéro de notre périodique bibliothéconomique national est consacré au patrimoine, avec trois premiers articles excellents sur la définition du terme lui-même. Pour les consulter en toute liberté, passer par la page d’accueil pour s’authentifier.

Pour Michel Melot, le patrimoine n’est pas créé par la communauté mais la définit. Ainsi,

L’existence d’un patrimoine n’est pas, pour une communauté, un supplément d’âme : le patrimoine est nécessaire à l’existence de cette communauté. La communauté n’existe que parce qu’elle se représente dans des objets patrimoniaux.

Il en donne pour exemple, entre autres, la langue, la mémoire, et bien sûr les biens matériels, le patrimoine individuel lui-même ne se définissant que par rapport à une collectivité. J’admire toujours autant Michel Melot, ses idées lumineuses et ses métaphores décapantes, par exemple :

On pourrait en dire autant de l’alphabet dit « phonétique » dont la norme imposée par l’imprimerie pourrait être accusée comme « Windows » d’abus de position dominante.

Pour Frédéric Barbier, qui entame avec une définition éthymologique rigoureuse, c’était à l’origine justement tout le contraire :

là où la collectivité définissait son patrimoine selon des catégories juridico-politiques, c’est, aujourd’hui, le patrimoine qui définit et fonde la collectivité.

L’aspect intrinsèque du patrimoine pour la communauté serait donc une création de notre ère contemporaine en mal d’identité.

Le même Frédéric Barbier pousse plus loin son analyse et nous invite à nous méfier de « l’utopie de la reproduction » qui accompagne l’apparition de chaque nouvelle technologie, aujourd’hui la numérisation :

D’une manière générale, l’expert, donc le bibliothécaire, devra être sensible aux utopies de la reproduction : l’utopie de la reproduction universelle (tous les textes seraient transposés sur un nouveau support)(…). L’utopie, aussi, de la reproduction « transparente » – laquelle rejoint, dans une certaine mesure, l’utopie de l’information « transparente »…

Enfin, Henri-Jean Martin interviewé par le BBF déclare

le patrimoine est une création continue

et que

La lecture publique (…) ne devrait pas exister

avec un petit côté provocateur qui lui sied si bien.

On profitera aussi dela page "panorama du Web" qui signale un grand nombre de ressources sur la numérisation du patrimoine avec quelques exemples de collections numérisées.

Les feuilles mortes se ramassent à la pelle

C’est très pénible d’être obligé de regarder son écran de travers tellement on a le nez bouché (ben oui, le fait de pencher la tête permet de déboucher au moins partiellement mais bonjour l’ergonomie du poste de travail). Donc vous ne m’en voudrez pas si je fais court et mélangé.

  • voici un truc avec plein de ressources sur l’expérience utilisateur. A première vue on dirait un blog mais non. Ca s’appelle DeyAlexander parce que le type s’appelle Alexander Dey, ce qui prouve que dans la vie avoir un nom qui jette c’est pratique, ça évite d’avoir à se creuser.
  • voici un autre truc très marrant, à première vue on dirait un wiki mais en fait non. On peut s’amuser beaucoup avec le javascript et en fait ce n’est qu’une page HTML statique. Enfin j’aime bien la navigation, c’est original.
  • Le dernier Journal of Digital Information a pour thème : "Digital Libraries and User Needs". On y trouve des articles intéressants sur la participation des utilisateurs au design (lire "à l’architecture de l’information") d’un site de bibliothèque numérique. En particulier, il y a un article sur un test utilisateurs concernant l’OAI.
  • On apprend que Yahoo rejoint Google dans le projet d’indexation de WorldCat – c’est le projet qui nous vaut le petit outil dont je parlais l’autre jour.

Bon j’arrête avec ma liste décousue. Je pense avoir à peu près éclusé tout ce que j’avais mis de côté ce week-end… Et merci au fait à : Infodesign, à Fred Cavazza et à Library Stuff J’espère que ça ira mieux demain, et je vous promets plein de trucs intéressants et de question existentielles avec des réflexions et même peut-être un effort rédactionnel qui sait.

Bibliotecas de America latina

Ceux qui ont bien fait leurs devoirs de vacances savent déjà tout sur les bibliothèques sud-américaines (grâce au Journal de l’IFLA, qu’on ne peut pas imprimer contrairement à ce que je suggérais…)

Pour les autres, voici un petit résumé de la promenade à faire sur le Web.

La visite commence sur le site de l’association des bibliothèques nationales d’Amérique du Sud, l’ABINIA. On y découvre les adresses desdites bibliothèques nationales. Celles qui ont un site web :

Et un petit bonus spécial collections patrimoniales en Argentine :

Bonne visite (ya de quoi faire !!!)

Quelques ressources

C’est le retour de vacances, eh oui, toutes les bonnes choses ont une fin (vous en saurez plus à ce sujet bientôt). Reprenons doucement mais avec sérieux, par la présentation de quelques ressources d’intérêt.

Open Video Project est un répertoire de ressources vidéo libres de droits (ou à peu près) disponibles sur Internet. On peut visualiser des tas de petits films courts du début du 20e siècle, mais aussi des films "publics" américains comme ceux de la Nasa… Pour ceux qui, comme moi, sont trop jeunes pour avoir assisté aux premiers pas de l’homme sur la lune (fichier en Mpeg). Vu à la télé.

Pas encore de ressources, mais un intéressant projet, sur Open Audio books, un projet en forme de blog dont l’idée est d’appeler des bénévoles à lire des chapitres de livres libres de droits pour les diffuser librement sur Internet. En anglais, évidemment. Vu sur Library stuff.

Enfin, spécialement dédicacé à mes amis les historiens du livre, la bibliothèque de l’Université de Virginie diffuse de belles numérisations de livres français du 16e siècle : le site s’intitule Renaissance in print. Un site par ailleurs bien documenté, qui donne des exemples, des explications pédagogiques et des liens sur les différents types d’ouvrages (livres d’emblèmes, livres d’heures, etc.) Hélas pas encore traduit en français, mais ça pourrait venir.

Qu’est-ce qu’une bibliothèque numérique ?

Le mois dernier, sur la liste DigLib, s’est tenue une intéressante discussion partie d’une question simple mais redoutable :

What is a digital library ?

Je m’étais dit que j’en ferais une petite synthèse, et aujourd’hui justement, Eric Hellman est venu clore (ou relancer ?) le débat avec un message qui fait plus ou moins le point sur la question.

Pour résumer l’ensemble des discussions, peu de gens se sont attardés sur les problèmes de types de documents, par exemple en opposant analogique et numérique. Ce débat est apparemment dépassé.

La définition de la bibliothèque numérique n’est pas unique mais trine (c’est plus joli). Une bibliothèque numérique, c’est :

  • des ressources, du personnel qualifié, bref une organisation
  • mise au service d’objectifs définis et d’un public déterminé, c’est à dire d’une politique documentaire
  • et qui se caractérise par la gestion d’une collection : sélection, acquisition, accès et conservation à long terme, enfin une offre de services.

Eric Hellman résume tout ceci en deux points : une bibliothèque a un public déterminé, et son but premier est d’optimiser l’utilité de la collection pour ce public :

« Any collection of digital ressources managed with the primary goal of miximizing the collection’s utility to a defined user community ».

Ensuite il se prête à un petit jeu pour différencier, parmi les ressources disponibles aujourd’hui sur le Web, les bibliothèques numériques des autres.
En résumant son propos, on peut dire ceci :

  • les ressources dont le but premier est de vendre ne s’adressent pas à un public déterminé, ce ne sont pas des bibliothèques numériques (ex. Amazon, iTunes, Science Direct)
  • Les ressources qui ne gèrent pas une collection mais seulement l’accès à une collection ne sont pas des bibliothèques numériques (ex. Google, le site de la Library of Congress)

Etc.

Le résultat laisse songeur puisque sont qualifiés de bibliothèque numérique, selon ses critères, PubMed, Internet Archive, Jstor et FirstSearch d’OCLC. A noter qu’au moins deux de ceux-ci se qualifient eux-mêmes d’"archives"…

J’aurais tendance à penser pour ma part qu’il est dangereux de trop simplifier la définition. Il n’est pas vraiment plus simple de dire ce qu’est une bibliothèque, entre un bâtiment, une étagère dans mon salon, un fournisseur de services, trois caisses en plastique dans le grenier d’une école… Je pourrais re-citer Michel Melot :

la bibliothèque sans livres, on pourra l’appeler (…) médiathèque, cyber-café ou tout simplement peut-être un jour, l’Univers.

Ressources :

Exotisme

Ca vous est égal, mais la nuit dernière j’ai rêvé que je partais en voyage à New York. C’était super, à dire vrai je tombais complètement amoureuse de cette ville.

Alors forcément, aujourd’hui je ne pouvais qu’être aguichée par ce sympathique projet : un plan de métro des bloggeurs new-yorkais, réalisé en fonction de leur emplacement dans la ville. Dans le genre ramenons l’Internet à l’échelle locale, ça m’a plu.

Pour continuer dans l’exotisme, je vous invite à visiter African Online Digital Library : une bibliothèque numérique avec des textes, des images, plein de ressources sur l’Afrique dont beaucoup en français.

Plus exotique encore, la Bibliothèque numérique indienne (autant vous prévenir, celle-ci ne m’a pas laissé un souvenir impérissable).

J’ai oublié de noter mes sources, ça sent le relâchement dû aux vacances.