Relire Borges

En lisant cet article signé par un sénateur (vu chez S. Bailly), je me suis dit qu’il était vraiment temps de relire Borges et sa Bibliothèque de Babel :

La bibliothèque imaginée par Borges est une métaphore de l’univers (…) « Et si la bibliothèque contenait tous les mondes » écrit Borges. 50 ans avant l’avènement du Web, Borges avait déjà inventé le concept d’hyperlien et d’hypertexte, et pressenti l’avènement des mondes virtuels ! (…) « La bibliothèque universelle, Borges l’a rêvée, Google l’a fait »

Cela me laisse sans voix. Il faut relire la nouvelle de Borges avant de parler du « rêve » de la bibliothèque universelle. Ce n’est pas un rêve, mais bien un cauchemar, dans lequel la bibliothèque devenue inutile par excès de perfection en vient à menacer l’humain.

Lisez donc plutôt cet autre article d’Alberto Manguel, l’auteur des excellents Une histoire de la lecture et Le livre d’images.

Avec ce projet, Google tend vers le cauchemar de Borges à propos de la bibliothèque de Babel: tout ce qui peut être dit ou écrit par la combinaison des lettres de l’alphabet y est. (…) En un sens, Internet est l’incarnation de ce labyrinthe-là.

Bon la conclusion est en fait la même : Internet (Google ?) est l’incarnation de cette bibliothèque de Babel. Rêve ou cauchemar, telle est la question.

L’information n’est pas connaissance

Quand on fait une recherche dans Google.com, en la faisant précéder par exemple du mot "books", on se voit maintenant proposer l’accès à des références issues de google print, une à trois en général.
Si on clique sur la référence en question, on arrive sur une page de consultation d’un livre, avec au centre, la page où se trouvent les mots cherchés, surlignés en jaune, avec la possibilité d’avancer ou de reculer de trois pages. A gauche, on voit la couverture du bouquin et quelques liens qui permettent de relancer une recherche dans l’ouvrage ou d’aller sur Amazon et dans quelques autres librairies.

Google’s mission is to organize the world’s information

(la mission de google est d’organiser l’information du monde) nous dit-on sur la page de présentation de Google print. Et c’est bien de cela qu’il s’agit, en effet.
Cette recherche plein texte, lancée sur des pages et des pages de livres numérisés, nous permet de faire sortir du lot au maximum trois résultats, quelle que soit la requête. La consultation des mots trouvés donne accès à un ensemble qui fait au maximum six pages.
Somme-toute, qu’a-t-on obtenu par cette requête ? Dans le meilleur des cas, l’information que ces mots figurent dans un ouvrage que vous pouvez par ailleurs acheter. Je vous souhaite de ne pas vous intéresser aux figues (figs) car Google choisira pour vous, au hasard (???), trois livres qui contiennent selon toute vraisemblance des illustrations (figures, abrégé "figs"…)

Il faut relire Borgès et sa fameuse Bibliothèque de Babel, composée de livres tous identiques (410 pages, quarante lignes par page) qui constituent toutes les combinaisons possibles de caractères des 25 alphabets connus. Cette bibliothèque qui contient virtuellement tous les livres possibles, et parmi eux, probablement, le catalogue de la bibliothèque, les hommes cherchent à la comprendre et à y découvrir les phrases qui ont un sens, car

pour une ligne raisonnable, pour un renseignement exact, il y a des lieues et des lieues de cacophonies insensées, de galimatias et d’incohérences.

La bibliothèque de Babel, elle est « éclairée, solitaire, infinie, parfaitement immobile, armée de volumes précieux, inutile, incorruptible, secrète ». Destinée à survivre à la fin de l’humanité, elle brille par son immensité, sa perfection, et son absurdité.

Tout ça pour dire qu’une bibliothèque (qu’elle soit numérique ou non) n’est pas seulement un lieu où on entasse de l’information pour lancer des recherches dessus. Les deux outils essentiels de la bibliothéconomie, que sont la politique documentaire et la classification, permettent de mettre chaque ouvrage dans un contexte particulier. Dans une bibliothèque, un livre ne peut pas être compris s’il est isolé. Par exemple, la présence de Mein Kampf n’a pas le même sens dans la bibliothèque municipale de Vitrolles au rayon "société" que dans une bibliothèque spécialisée dans l’histoire du XXe siècle au rayon "idéologies" (l’exemple est un peu extrême, et bien sûr fictif, mais assez parlant).
La mise en contexte des ouvrages, dans une bibliothèque, est donc essentielle. Cela signifie que l’on ne s’intéresse pas à un livre parce qu’il contient certains mots, mais parce qu’il contient des idées, une argumentation, une analyse, et parce que cette analyse s’articule avec d’autres livres, qui la coroborrent, la contredisent, l’analysent à son tour.

La mission des bibliothèques n’est pas d’organiser l’information, elle est d’organiser la connaissance : celle qui est produite par les auteurs. Et l’organisation de la connaissance permet de donner du sens à la collection, qui elle-même génère à son tour, par l’intermédiaire des chercheurs qui l’utilisent, de la connaissance.

Je terminerai par une citation de T.S. Eliot (Choruses from the Rock, 1934) :

Where is the wisdom we have lost in knowledge?

Where is the knowledge we have lost in information?

Où est passée la sagesse que nous avons perdue dans la connaissance ? Où est passée la connaissance que nous avons perdue dans l’information ?
L’Internet de demain sera-t-il la bibliothèque de Babel ?

Mise à jour :

Vous avez vu ça, chez Libé ils sont d’accord avec moi :

Bibliothéconomie numérique

A lire sur le site de Ukoln, un guide de bonnes pratiques datant de l’an dernier et destiné aux institutions patrimoniales qui mettent des contenus en ligne.

Il y est question de gestion de projet, de numérisation, de CMS , de métadonnées, de préservation des données numériques, d’accessibilité… Tout ce qu’il faut.

J’en profite pour signaler la naissance d’une conférence internationale exclusivement consacrée à la bibliothéconomie numérique : Digital Curation Conference.

The term digital curation is used in this call for the actions needed to maintain digital research data and other digital materials over their entire life-cycle and over time for current and future generations of users.

Leur site nous promet aussi l’élaboration d’un manuel sur le sujet.

Merci à Lorcan Dempsey et à Diglet.

Pendant ce temps, à New York…

… naît une nouvelle bibliothèque numérique : celle de la New York Public Library. Dont les serveurs sont tombés à l’heure qu’il est, mais ce n’est pas mon billet qui va alourdir considérablement la charge.

Enfin, c’est dommage car justement, je voulais écrire combien je trouvais leur interface agréable, facile à utiliser, inventive.

Pour cette bibliothèque numérique, le contenu se compose essentiellement d’images : photos, dessins, gravures, enluminures, cartes, affiches, etc. C’est vrai, le mode texte, c’est totalement la classe, mais les bibliothèques ne conservent pas que des documents textuels. Ceci dit, on peut imaginer que cette politique documentaire tournée vers l’iconographie vient en complémentarité d’un gros projet de numérisation de textes avec un partenaire privé ;-)

Que dire sur cette interface ? La recherche est simplissime, une seule case, avec un bon moteur (Lucene) qui tourne derrière. Les résultats se présentent sous forme de vignettes, assez petites pour qu’on puisse en mettre beaucoup, assez grandes pour qu’on voie de quoi il s’agit. Les images sont de bonne qualité, on peut les visualiser avec les notices ou sans. Chaque description comporte un lien vers la notice dans le catalogue. Il y a aussi des « rebonds », pas sur un seul champ mais sur plusieurs, avec un système de cases à cocher (je trouve ça excellent mais mon geek pense que personne ne se servira de cette fonction).

Parce qu’il faut aussi critiquer, regrettons le manque de citabilité et les URL de 3 km de long.

Quand je vois ce boulot, je ne peux m’empêcher d’espérer que leur collaboration avec Google ne les empêchera pas de récupérer une bonne copie de la numérisation, et de l’intégrer avec autant de réussite à leur propre bibliothèque numérique. Hélas, seulement en mode texte, donc en perdant au passage, pour les chercheurs utilisateurs avertis de cette remarquable interface, une partie du contexte (c’est-à-dire du sens) de l’ouvrage.

Merci à ResourceShelf et Deakialli.

Numérisation, bibliothèque numérique

On m’a posé il y a peu la question suivante : la numérisation est-elle un acte technique ? Je suis généralement la première à dire que numériser n’est pas seulement un acte technique. Mais en fait ce n’est pas la numérisation elle-même qui a des retombées politiques, culturelles, etc. C’est la façon dont elle est faite et mise à disposition du public. Quand je parle de numérisation, cela désigne en général dans mon esprit le processus de production de l’information. Ce processus s’inscrit dans un contexte qui a beaucoup d’autres dimensions que la technique : le budget, la sélection, les compétences, l’organisation, le public, les services, la valorisation, etc.

Dans les bibliothèques, il existe quelque chose qu’on appelle le circuit du document. Ce « circuit » c’est en fait l’enchaînement de toutes les étapes qui vont du passage du bon de commande auprès du libraire jusqu’à la mise à disposition du livre pour le public. En passant par la livraison, le catalogage, l’équipement, la cotation, etc.

Toutes ces étapes véritablement techniques constituent en partie le coeur de la bibliothéconomie et du savoir-faire de notre métier. Et pourtant, aucune bibliothèque ne peut être réduite à son circuit du document.

Une bibliothèque, c’est d’abord une politique documentaire, la gestion de compétences, des services au public, un lieu, une politique culturelle et de valorisation (éventuellement par l’édition mais aussi par des expositions par exemple). Le circuit du document n’est qu’une organisation technique au service de cette organisation politique et culturelle.

C’est un peu la même chose pour la numérisation. La numérisation n’est pas un acte technique neutre, parce qu’elle est décidée par une politique documentaire, donc un choix intellectuel. Parce qu’elle a un coût, donc un budget public, elle dépend de forces politiques. Parce qu’elle est mise à disposition du public dans un site Web, qui présente certaines interfaces, certaines fonctionnalités : techniques aussi mais dont le choix est essentiel pour définir les services offerts par le site ; politiques parfois quand il s’agit de formats ouverts, d’accessibilité, etc. Parce qu’elle fait l’objet d’une valorisation, par des pages éditoriales sur le site, par la mise en valeur de corpus cohérents de documents, par des projets de collaboration avec des chercheurs qui font un travail éditorial autour de cette numérisation.

La numérisation est à la bibliothèque numérique ce que le circuit du document est à la bibliothèque. La mission de la bibliothèque est de donner accès à des documents. La numérisation, en tant que mission de bibliothèque, n’est qu’un outil qui sert à donner accès à ces mêmes documents, dans le même cadre organisationnel, mais d’une nouvelle manière, avec une nouvelle dimension, dans un nouveau contexte.

La numérisation, dans ce sens du terme, est donc bien un acte technique et on peut facilement le déléguer à un tiers, éventuellement privé. Ce qui est plus grave, et même dangereux, c’est de déléguer à un tiers les aspects de bibliothèque numérique : la sélection documentaire, le choix des techniques et des formats, le choix des services d’accès, le contrôle des compétences et du budget, la valorisation du produit de cette numérisation. On risque de perdre alors le contrôle des aspects politiques et culturels de la numérisation, de ce qu’elle représente comme enjeu pour la bibliothèque, pour sa communauté (le public), et pour le Web.

Geeks et bibliothèques numériques

Quand on lit ce qu’Eric Baillargeon écrit sur Constellation W3 au sujet du nouveau portail de la Bibliothèque nationale du Québec, on se dit que les bibliothèques numériques ont encore du chemin à faire avant d’acquérir la moindre once de reconnaissance devant cette communauté exigeante que sont les geeks. Ceci dit il a raison : ce portail a des URL pas possibles (avec 2 http par exemple !) Quant à la navigation par pop-up je ne vais pas me mettre à la défendre.

Le principal reproche qu’adresse Eric Baillargeon à ce portail, c’est son manque d’accessibilité. Sujet que l’on ne peut négliger puisque maintenant, garantir l’accessibilité est une obligation légale pour les sites Web publics.

Ceci dit, si on s’intéresse au contenu, c’est assez prometteur, il faut lire l’article original d’un autre Baillargeon pour se faire une idée. Il y a entre autres un gros projet de numérisation de presse ancienne. Et ils n’ont pas peur de mettre des documents dans des résolutions lisibles (par exemple pour les cartes).

Mais bon, tout n’est pas perdu : du côté de chez Sébastien Paquet l’image de la bibliothèque, associée par ses missions à celle du monde du libre, est plutôt reluisante. Et s’il y a besoin de s’en convaincre (que les bibliothèques ont à voir avec le libre), j’ajouterai un lien vers cette bibliographie sur les bibliothèques et l’open source (citée par Gatsu-gatsu) et un autre vers FreeBiblio, un site d’actualités sur les bibliothèques et les logiciels libres.

Comptes-rendus sur l’organisation des connaissances

Suite à une journée d’études qui a eu lieu à Paris 8 (laboratoire Paragraphe) sur l’organisation des connaissances, nous avons la chance de trouver deux comptes-rendus de blogueuses qui manifestement étaient sur place :

  • sur le nouveau et prometteur Tribune libre
  • sur Arkandis, récent aussi et plutôt orienté knowledge management.

Sur ce deuxième, je lis :

Avec la numérisation, le document s’est liquéfié. Le document était cristallin, parfait, organisé, il avait une identité qui ne pouvait pas être remise en cause. Avec la numérisation, le texte sort de sa linéarité et donc de sa géométrie au profit d’une recomposition lié au regard de son utilisateur. La métaphore de l’information liquide semble parfaitement en cohérence avec le vocabulaire utilisé pour en parler: « baigner dans l’information, se noyer dans l’information, un océan d’informations, surfer ». On pourrait donc parler de déglaciation du document par la numérisation.

Evidemment, le sujet me touche, même s’il s’agit d’un compte-rendu dont je ne connais pas l’exactitude par rapport aux mots de l’intervenant, Michel Authier.

L’utilisation du mot "numérisation" me semble ici recouvrir une réalité plus large que celle que j’ai l’habitude de mettre sous ce terme, il s’agirait plutôt d’un "passage au numérique" plus global. L’idée de la liquéfaction fait assez résonnance avec ma déconstruction, même si l’une est liquide et l’autre franchement solide.

Par ailleurs, les réflexions que m’inspirent cet extrait tournent autour de la relation entre le document et le lecteur, qui devient ici auteur ou "recompositeur" d’une information liquéfiée. Dans la numérisation bibliothéconomique, on cherche à recoller les morceaux, à empêcher la liquéfaction du document, à coller à l’original bien solide, à s’assurer que le lecteur n’aura rien à "recomposer" par lui-même sauf si tel est son choix – tout autant qu’un lecteur-papier peut recomposer ses notes et ses photocopies pour son analyse (au sujet de la numérisation, lire aussi la bonne analyse de Persée sur Homo Numericus). La numérisation (toujours au sens bibliothéconomique du terme) ne serait donc ni vraiment liquide, ni tout à fait solide, une sorte de bourbier en somme ?

Plus sérieusement, il y a aussi cette réflexion que je me faisais cet après-midi : la numérisation permet d’atteindre une forme d’idéal de la structure du document et de la collection qui serait impossible à atteindre avec les supports traditionnels. On n’a plus des livres de différentes couleurs, textures, formes. Fini le casse-tête de ne pas pouvoir classer le petit in-18 à côté du grand in-folio qui traite du même sujet. La numérisation autorise une organisation logique complète qui échappe aux lois de la structure physique. Je rejoins l’idée d’un liquide : qu’on peut mélanger, adapter parfaitement à son récipient, maîtriser.

Encore merci à ces deux blogueuses ; trop souvent les blogs se nourissent d’eux-mêmes dans la liquidité d’un univers strictement numérique. Ces comptes-rendus, c’est un peu de vraie vie, et ça fait du bien.

Mise à jour :

Les actes de la journée (en vidéo) : ici.

Numériser ce n’est pas éditer (2)

Lire aussi le (1) : Les joies de la déconstruction numérique.

Dans le cadre du numérique, les champs d’action des différents métiers de la chaîne du livre sont à redéfinir. L’équilibre auteur – éditeur – lecteur devient biaisé. L’élément livre, qui faisait le lien entre l’auteur et le lecteur dans la bibliothèque, n’était pas une production de la bibliothèque. La numérisation, qui tient le même rôle, en est une.

Et pourtant, apportant une solution au fameux paradoxe de la conservation vs. la communication, la diffusion par la numérisation est clairement une mission de la bibliothèque. Mais on ne se contente pas de scanner un livre : il faut aussi des outils pour recréer un objet physique consultable et compréhensible. La bibliothèque devient productrice de ces outils. Son rôle d’intermédiaire en est changé.

La bibliothèque produit : elle fait acte de publication. Le problème est de définir la frontière entre la mise au public et l’édition, frontière de plus en plus insensible qui amène assez facilement à une tentation d’amalgame.

Dans la numérisation en mode image, les frontières sont relativement simples à délimiter. Pour le bibliothécaire, l’essentiel est de garder l’intégrité de l’ouvrage : le montrer dans une forme aussi proche que possible de celle qui a été communiquée au public à l’origine. On est plus dans le domaine du fac-similé ou de la réimpression que de l’édition.

La numérisation en mode texte pose plus de problèmes car le balisage est une intervention sur le contenu du texte lui-même. Le balisage est-il une forme d’édition ou une adaptation d’un support à un autre ? Il devrait, pour ne pas outrepasser les limites de la numérisation, se limiter strictement à un marquage qui n’interprète pas le texte ou le document, conserver une sacro-sainte neutralité… en admettant que cela soit possible.

L’acte d’éditer, c’est – cela a toujours été – produire ; produire quelque chose de nouveau qui n’existait pas auparavant. L’édition électronique et la numérisation vont utiliser les mêmes matériaux, outils, techniques de base, peut-être la même réflexion sur les interfaces par exemple : mais c’est leur objectif et leur nature qui diffèrent. On parle souvent de la valeur ajoutée apportée par l’édition. Il serait pourtant faux de dire que la numérisation n’ajoute aucune valeur. Mais l’édition ajoute une valeur intellectuelle alors que la numérisation est un acte technique qui s’appuie sur l’existant.

La numérisation et l’édition électronique ne sont cependant pas incompatibles. On peut faire une édition et une numérisation en même temps. Le bibliothécaire, à travers la numérisation, l’interface, les métadonnées, préserve l’intégrité de l’ouvrage. L’éditeur peut dès lors intervenir pour replacer cette numérisation dans un nouveau contexte, produit par un auteur. L’auteur produit le texte, et l’éditeur met en forme pour le Web le texte de l’auteur et assure l’intégration et la relation avec le document numérisé.

Quand on dit « numériser », c’est clair, on se situe dans un contexte informatique. Quand on dit « éditer », rien ne précise le support concerné par cet acte intellectuel. Nous avons dit, « numériser, ce n’est pas éditer » : on pourrait tout aussi bien répondre, « écrire pour le Web, ce n’est pas réimprimer ».

(A suivre)

Les joies de la déconstruction numérique (1)

J’aime bien dire (et mon geek ne me contredira pas sur ce point ;-) que le numérique change à la fois beaucoup et pas grand chose dans la façon dont on appréhende le document, ou même, la bibliothèque.

Quand on essaye de définir ce qu’est une bibliothèque numérique, on en arrive assez rapidement à repartir des bonnes vieilles missions de la bibliothèque tout court : sélectionner, décrire, ranger, communiquer, etc.

Du point de vue du document, la numérisation est un exercice plus complexe que simplement passer un bouquin dans un scanner. Parce que numériser un livre, c’est le déconstruire : il faut ensuite lui rendre son intégrité par les métadonnées, la navigation et les interfaces. La tentation aussi est grande d’en profiter pour rajouter de l’information, voire de l’analyse, ce en quoi il faut aussi se méfier car numériser, ce n’est pas éditer. L’intégrité du document prime donc sur le reste, la numérisation doit tenir pour essentiels les concepts de respect de l’original et de mise en contexte, à la fois à l’échelle du document, mais aussi du corpus ou du fonds dans lequel il se trouve.

C’est seulement à ce prix que la numérisation est utile, parce qu’elle est alors un véritable support de substitution pour le chercheur, parce qu’elle garantit grâce à cette intégrité du document la confiance que peut avoir le chercheur dans la traçabilité du document qu’il étudie (un peu comme pour les vaches folles).

Et tout ça pour dire, avec Zid : non au dépeçage des manuscrits médiévaux, qu’il soit virtuel ou dans la vraie vie (non, on ne s’en fout pas ;-)

A lire aussi, cet article de mon geek qui récapitule un certain nombre de nos idées essentielles sur ce sujet.

Ca faisait longtemps qu’on voulait faire un billet à quatre mains là-dessus, alors je pense qu’il y aura une suite. A suivre donc.

Internet, une menace pour les bibliothèques ?

Alors que Google se lance dans une numérisation de masse sans précédent, décidé à faire entrer le livre dans le Web dans des proportions jusque-là inégalées, on se demande si les bibliothèques devraient trembler de peur devant ceux qui annoncent que bientôt, complètement dépassées par l’Internet, elles devront fermer leurs portes.

En ce qui concerne les américains, on peut dire qu’ils sont plutôt confiants. Cet article rapporte les résultats d’une étude qui montre au contraire que sur les cinq dernières années, l’usage d’Internet et celui des bibliothèques aux Etats-Unis ont été parfaitement complémentaires. Une population jeune, avec un niveau d’éducation élevée, tend à utiliser aussi bien les bibliothèques qu’Internet dans une démarche de recherche d’information globale.

La présidente de l’ALA citée dans cet autre article fait la même constatation sur l’augmentation de la fréquentation des bibliothèques américaines depuis l’explosion du Web.

Les bibliothèques ont donc encore de beaux jours devant elles, pour peu qu’elles se montrent capables de suivre le mouvement. Comme le suggère ce plaidoyer pour que la bibliothèque nationale canadienne numérise l’intégralité de son fonds (à condition que l’Etat fasse en sorte qu’elle puisse en avoir le droit).

Tout ceci est bel et bien, et nous laisse imaginer que les bibliothèques numériques devraient prendre un poids important dans le Web, étant donné la masse de contenu qu’elles ont déjà à leur disposition. Mais quand on lit les conclusions du dernier rapport du Pew Internet & American Life Project, qui analyse une enquête menée auprès d’experts du Web sur les tendances futures, on se dit qu’il y a du souci à se faire. Même s’il évoque une menace pesant plutôt sur les actualités et la publication dans les formes où on les connaît actuellement, ce rapport flagelle le manque de dynamisme des institutions. Et les bibliothèques y sont à peine évoquées, ce qui n’apparaît pas comme un signe très prometteur.

La question n’est sans doute pas de savoir si les bibliothèques sont ou non menacées par Internet. Mais bien plutôt de savoir quelle sera l’ampleur de la remise en cause nécessaire pour les adapter à un monde régi par d’autres règles et d’autes modèles que ceux qui ont toujours été les leurs.

Merci à Peter Scott, ShelfLife, et ResourceShelf.

(Je sais pas ce que j’ai à être aussi sérieuse ce soir, ça doit être un résidu des discussions animées du week-end ;-)