Pendant ce temps, à New York…

… naît une nouvelle bibliothèque numérique : celle de la New York Public Library. Dont les serveurs sont tombés à l’heure qu’il est, mais ce n’est pas mon billet qui va alourdir considérablement la charge.

Enfin, c’est dommage car justement, je voulais écrire combien je trouvais leur interface agréable, facile à utiliser, inventive.

Pour cette bibliothèque numérique, le contenu se compose essentiellement d’images : photos, dessins, gravures, enluminures, cartes, affiches, etc. C’est vrai, le mode texte, c’est totalement la classe, mais les bibliothèques ne conservent pas que des documents textuels. Ceci dit, on peut imaginer que cette politique documentaire tournée vers l’iconographie vient en complémentarité d’un gros projet de numérisation de textes avec un partenaire privé ;-)

Que dire sur cette interface ? La recherche est simplissime, une seule case, avec un bon moteur (Lucene) qui tourne derrière. Les résultats se présentent sous forme de vignettes, assez petites pour qu’on puisse en mettre beaucoup, assez grandes pour qu’on voie de quoi il s’agit. Les images sont de bonne qualité, on peut les visualiser avec les notices ou sans. Chaque description comporte un lien vers la notice dans le catalogue. Il y a aussi des « rebonds », pas sur un seul champ mais sur plusieurs, avec un système de cases à cocher (je trouve ça excellent mais mon geek pense que personne ne se servira de cette fonction).

Parce qu’il faut aussi critiquer, regrettons le manque de citabilité et les URL de 3 km de long.

Quand je vois ce boulot, je ne peux m’empêcher d’espérer que leur collaboration avec Google ne les empêchera pas de récupérer une bonne copie de la numérisation, et de l’intégrer avec autant de réussite à leur propre bibliothèque numérique. Hélas, seulement en mode texte, donc en perdant au passage, pour les chercheurs utilisateurs avertis de cette remarquable interface, une partie du contexte (c’est-à-dire du sens) de l’ouvrage.

Merci à ResourceShelf et Deakialli.

Numérisation, bibliothèque numérique

On m’a posé il y a peu la question suivante : la numérisation est-elle un acte technique ? Je suis généralement la première à dire que numériser n’est pas seulement un acte technique. Mais en fait ce n’est pas la numérisation elle-même qui a des retombées politiques, culturelles, etc. C’est la façon dont elle est faite et mise à disposition du public. Quand je parle de numérisation, cela désigne en général dans mon esprit le processus de production de l’information. Ce processus s’inscrit dans un contexte qui a beaucoup d’autres dimensions que la technique : le budget, la sélection, les compétences, l’organisation, le public, les services, la valorisation, etc.

Dans les bibliothèques, il existe quelque chose qu’on appelle le circuit du document. Ce « circuit » c’est en fait l’enchaînement de toutes les étapes qui vont du passage du bon de commande auprès du libraire jusqu’à la mise à disposition du livre pour le public. En passant par la livraison, le catalogage, l’équipement, la cotation, etc.

Toutes ces étapes véritablement techniques constituent en partie le coeur de la bibliothéconomie et du savoir-faire de notre métier. Et pourtant, aucune bibliothèque ne peut être réduite à son circuit du document.

Une bibliothèque, c’est d’abord une politique documentaire, la gestion de compétences, des services au public, un lieu, une politique culturelle et de valorisation (éventuellement par l’édition mais aussi par des expositions par exemple). Le circuit du document n’est qu’une organisation technique au service de cette organisation politique et culturelle.

C’est un peu la même chose pour la numérisation. La numérisation n’est pas un acte technique neutre, parce qu’elle est décidée par une politique documentaire, donc un choix intellectuel. Parce qu’elle a un coût, donc un budget public, elle dépend de forces politiques. Parce qu’elle est mise à disposition du public dans un site Web, qui présente certaines interfaces, certaines fonctionnalités : techniques aussi mais dont le choix est essentiel pour définir les services offerts par le site ; politiques parfois quand il s’agit de formats ouverts, d’accessibilité, etc. Parce qu’elle fait l’objet d’une valorisation, par des pages éditoriales sur le site, par la mise en valeur de corpus cohérents de documents, par des projets de collaboration avec des chercheurs qui font un travail éditorial autour de cette numérisation.

La numérisation est à la bibliothèque numérique ce que le circuit du document est à la bibliothèque. La mission de la bibliothèque est de donner accès à des documents. La numérisation, en tant que mission de bibliothèque, n’est qu’un outil qui sert à donner accès à ces mêmes documents, dans le même cadre organisationnel, mais d’une nouvelle manière, avec une nouvelle dimension, dans un nouveau contexte.

La numérisation, dans ce sens du terme, est donc bien un acte technique et on peut facilement le déléguer à un tiers, éventuellement privé. Ce qui est plus grave, et même dangereux, c’est de déléguer à un tiers les aspects de bibliothèque numérique : la sélection documentaire, le choix des techniques et des formats, le choix des services d’accès, le contrôle des compétences et du budget, la valorisation du produit de cette numérisation. On risque de perdre alors le contrôle des aspects politiques et culturels de la numérisation, de ce qu’elle représente comme enjeu pour la bibliothèque, pour sa communauté (le public), et pour le Web.

505

La Bibliothèque du Congrès annonce qu’elle va désormais enrichir ses notices grâce à la zone 505 (note de contenus formatés). Cette zone MARC sera destinée à des informations générées automatiquement à partir des tables des matières des ouvrages, auparavant simplement signalées par un lien dans la zone 856 (zone de lien justement).

Voilà un moyen simple et automatique, donc sans douleur, pour améliorer la visibilité des notices bibliographiques et leur pertinence à l’égard des contenus. Une initative du BEAT : Bibliographic enrichement advisory team (ça jette comme nom, non ?).

Merci à ResourceShelf.

Les bibiothèques du monde face à la propriété intellectuelle

Quelques-uns des grands regroupements américains et internationaux de bibliothèques, incluant l’ALA , l’ARL et l’IFLA vient de publier une déclaration de principes sur les droits d’auteur. Ces associations s’expriment dans le cadre du WIPO, le World Intellectual Property Organization, pour défendre des notions aussi simples et indispensables que le domaine public, le droit à la copie privée, le droit à l’usage dans un cadre public et pour l’enseignement, le droit au contournement des mesures techniques de protection, etc.

Une déclaration claire, résolue, qui ne semble avoir rien de présompteux. Et pourtant, si on voulait l’appliquer en France, il faudrait revenir en arrière sur des décisions législatives récentes, comme le droit de prêt, et aussi prendre enfin en compte la notion de "fair use" pour l’enseignement et la recherche.

Ce texte est à rapprocher de celui qu’avaient diffusé les associations de bibliothécaires français en février 2004, tirant la sonnette d’alarme sur la fin de l’équilibre entre la diffusion des biens culturels et les droits de propriété intellectuelle.

Il faut espérer qu’un maximum d’organismes et d’acteurs bibliothéconomiques vont se rallier à la bannière de ces principes, afin de faire entendre la voix des bibliothèques, qui font partie des derniers acteurs à défendre avec un tout petit peu de reconnaissance de la part des pouvoirs ces valeurs et cet équilibre indispensables à la diffusion de la culture et des savoirs.

Via Open Access News.

Contrôle qualité pour l’EAD

Si vous produisez des descriptions en EAD, vous pouvez être intéressés par le nouvel outil proposé par RLG : le EAD Report Card. Cet outil se donne pour objectif de vérifier la qualité des fichers EAD, avec pour critère la conformance avec les recommandations de RLG : EAD best practice guidelines.

Ces guidelines, émises en 2002, avaient pour objectif d’améliorer l’interopérabilité des descriptions en EAD par la désignation d’un "coeur" (core data elements) qui permette de définir un niveau basique d’uniformité entre les différentes applications possibles de la DTD.

L’outil proposé par RLG permet de vérifier la conformité avec ces recommandations à deux niveaux : seulement les éméments obligatoires, ou tous les éléments. Il s’utilise en ligne mais une version téléchargeable, capable de traiter des gros fichiers, est prévue.

Générateur automatique de sites web de bibliothèques

J’ai eu un petit coup de coeur pour cette initative espagnole : le générateur de sites Web de bibliothèques publiques.

L’idée : les bibliothèques publiques ont toutes les mêmes besoins en matière de site Web. Par contre, elles manquent de moyens et de compétences techniques. Alors on met à leur disposition un outil pour générer automatiquement des pages, suivant une maquette paramétrable et à l’aide d’une procédure simple. Quelques informations sur la bibliothèque, quelques photos, les actualités, la liste des nouveautés, un lien vers le catalogue… et le tour est joué !

Je suis sûre que les mauvais esprits vont trouver le moyen de dire que c’est affreusement castrateur de cantonner ces bibliothèques dans ce schéma pré-déterminé, qu’on les prive de leur liberté d’expression et d’innovation, quoi d’autre, que l’outil fait des sites moches et pas accessibles… Enfin la réalité c’est qu’avant il n’y avait rien, et maintenant, il y a quelque chose.

C’est l’occasion de visiter par exemple le site de la Bibliothèque publique de Salamanque, ne serait-ce que pour voir les photos… c’est un bijou, comme tout le reste de la ville.

C’est une initative de la sous-direction des bibliothèques, au ministère de la Culture (ne vous embrouillez pas, on est en Espagne). Via Véase además.

La photo c’est pas Salamanque mais Tolède. Mais vous n’allez pas m’en vouloir pour cette imperfection ?!

Geeks et bibliothèques numériques

Quand on lit ce qu’Eric Baillargeon écrit sur Constellation W3 au sujet du nouveau portail de la Bibliothèque nationale du Québec, on se dit que les bibliothèques numériques ont encore du chemin à faire avant d’acquérir la moindre once de reconnaissance devant cette communauté exigeante que sont les geeks. Ceci dit il a raison : ce portail a des URL pas possibles (avec 2 http par exemple !) Quant à la navigation par pop-up je ne vais pas me mettre à la défendre.

Le principal reproche qu’adresse Eric Baillargeon à ce portail, c’est son manque d’accessibilité. Sujet que l’on ne peut négliger puisque maintenant, garantir l’accessibilité est une obligation légale pour les sites Web publics.

Ceci dit, si on s’intéresse au contenu, c’est assez prometteur, il faut lire l’article original d’un autre Baillargeon pour se faire une idée. Il y a entre autres un gros projet de numérisation de presse ancienne. Et ils n’ont pas peur de mettre des documents dans des résolutions lisibles (par exemple pour les cartes).

Mais bon, tout n’est pas perdu : du côté de chez Sébastien Paquet l’image de la bibliothèque, associée par ses missions à celle du monde du libre, est plutôt reluisante. Et s’il y a besoin de s’en convaincre (que les bibliothèques ont à voir avec le libre), j’ajouterai un lien vers cette bibliographie sur les bibliothèques et l’open source (citée par Gatsu-gatsu) et un autre vers FreeBiblio, un site d’actualités sur les bibliothèques et les logiciels libres.

Comptes-rendus sur l’organisation des connaissances

Suite à une journée d’études qui a eu lieu à Paris 8 (laboratoire Paragraphe) sur l’organisation des connaissances, nous avons la chance de trouver deux comptes-rendus de blogueuses qui manifestement étaient sur place :

  • sur le nouveau et prometteur Tribune libre
  • sur Arkandis, récent aussi et plutôt orienté knowledge management.

Sur ce deuxième, je lis :

Avec la numérisation, le document s’est liquéfié. Le document était cristallin, parfait, organisé, il avait une identité qui ne pouvait pas être remise en cause. Avec la numérisation, le texte sort de sa linéarité et donc de sa géométrie au profit d’une recomposition lié au regard de son utilisateur. La métaphore de l’information liquide semble parfaitement en cohérence avec le vocabulaire utilisé pour en parler: « baigner dans l’information, se noyer dans l’information, un océan d’informations, surfer ». On pourrait donc parler de déglaciation du document par la numérisation.

Evidemment, le sujet me touche, même s’il s’agit d’un compte-rendu dont je ne connais pas l’exactitude par rapport aux mots de l’intervenant, Michel Authier.

L’utilisation du mot "numérisation" me semble ici recouvrir une réalité plus large que celle que j’ai l’habitude de mettre sous ce terme, il s’agirait plutôt d’un "passage au numérique" plus global. L’idée de la liquéfaction fait assez résonnance avec ma déconstruction, même si l’une est liquide et l’autre franchement solide.

Par ailleurs, les réflexions que m’inspirent cet extrait tournent autour de la relation entre le document et le lecteur, qui devient ici auteur ou "recompositeur" d’une information liquéfiée. Dans la numérisation bibliothéconomique, on cherche à recoller les morceaux, à empêcher la liquéfaction du document, à coller à l’original bien solide, à s’assurer que le lecteur n’aura rien à "recomposer" par lui-même sauf si tel est son choix – tout autant qu’un lecteur-papier peut recomposer ses notes et ses photocopies pour son analyse (au sujet de la numérisation, lire aussi la bonne analyse de Persée sur Homo Numericus). La numérisation (toujours au sens bibliothéconomique du terme) ne serait donc ni vraiment liquide, ni tout à fait solide, une sorte de bourbier en somme ?

Plus sérieusement, il y a aussi cette réflexion que je me faisais cet après-midi : la numérisation permet d’atteindre une forme d’idéal de la structure du document et de la collection qui serait impossible à atteindre avec les supports traditionnels. On n’a plus des livres de différentes couleurs, textures, formes. Fini le casse-tête de ne pas pouvoir classer le petit in-18 à côté du grand in-folio qui traite du même sujet. La numérisation autorise une organisation logique complète qui échappe aux lois de la structure physique. Je rejoins l’idée d’un liquide : qu’on peut mélanger, adapter parfaitement à son récipient, maîtriser.

Encore merci à ces deux blogueuses ; trop souvent les blogs se nourissent d’eux-mêmes dans la liquidité d’un univers strictement numérique. Ces comptes-rendus, c’est un peu de vraie vie, et ça fait du bien.

Mise à jour :

Les actes de la journée (en vidéo) : ici.

Boîte à outils du catalogueur

A tous ceux qui s’intéressent de près ou de loin au catalogage, je recommande ce billet de ResourceShelf qui signale deux très riches ressources pour les catalogueurs :

Il y a plein de liens intéressants à suivre, par exemple dans la partie lectures du premier. Je n’en citerai qu’un dans la masse : What should catalogs do ?, un récapitulatif sur les bienfaits des catalogues bien faits.

C’est très orienté catalogage et pas trop nouvelles techno / métadonnées, ce qui me change un peu de mon ordinaire ; mais pour compenser, on peut aller voir le numéro de Library High Tech sur MARC et les métadonnées (2), gratuit cette semaine.