Bibliothéconomie numérique

A lire sur le site de Ukoln, un guide de bonnes pratiques datant de l’an dernier et destiné aux institutions patrimoniales qui mettent des contenus en ligne.

Il y est question de gestion de projet, de numérisation, de CMS , de métadonnées, de préservation des données numériques, d’accessibilité… Tout ce qu’il faut.

J’en profite pour signaler la naissance d’une conférence internationale exclusivement consacrée à la bibliothéconomie numérique : Digital Curation Conference.

The term digital curation is used in this call for the actions needed to maintain digital research data and other digital materials over their entire life-cycle and over time for current and future generations of users.

Leur site nous promet aussi l’élaboration d’un manuel sur le sujet.

Merci à Lorcan Dempsey et à Diglet.

PURL + OAI = POI

Les identifiants pérennes, retour de la vengeance.

Je viens de découvrir, via Catalogablog lui même via Lorcan Dempsey un système d’identifiants pérenne que je ne connaissais pas mais qui en combine deux que je connaissais :

Le système s’appelle POI pour PURL-based Object Identifier.

Les particularités de ce système : on n’a pas besoin d’enregistrer les POI pour chaque ressource, il suffit d’avoir un entrepôt OAI dans lequel les ressources ont des identifiants. On peut ensuite transformer de manière implicite les identifiants OAI en identifiants POI de la manière suivante :

un document qui porte l’identifiant :

oai:mon-nom-de-domaine.org:123456

a l’identifiant POI suivant :

http://purl.org/poi/mon-nom-de-domaine.org/1233456

Evidemment la conséquence de cette petite transformation est que le nouvel identifiant POI est compréhensible par un navigateur grâce au protocole HTTP. Et ensuite on utilise le résolveur PURL pour résoudre les POI et pointer vers les ressources elles-mêmes.

Pendant ce temps, à New York…

… naît une nouvelle bibliothèque numérique : celle de la New York Public Library. Dont les serveurs sont tombés à l’heure qu’il est, mais ce n’est pas mon billet qui va alourdir considérablement la charge.

Enfin, c’est dommage car justement, je voulais écrire combien je trouvais leur interface agréable, facile à utiliser, inventive.

Pour cette bibliothèque numérique, le contenu se compose essentiellement d’images : photos, dessins, gravures, enluminures, cartes, affiches, etc. C’est vrai, le mode texte, c’est totalement la classe, mais les bibliothèques ne conservent pas que des documents textuels. Ceci dit, on peut imaginer que cette politique documentaire tournée vers l’iconographie vient en complémentarité d’un gros projet de numérisation de textes avec un partenaire privé ;-)

Que dire sur cette interface ? La recherche est simplissime, une seule case, avec un bon moteur (Lucene) qui tourne derrière. Les résultats se présentent sous forme de vignettes, assez petites pour qu’on puisse en mettre beaucoup, assez grandes pour qu’on voie de quoi il s’agit. Les images sont de bonne qualité, on peut les visualiser avec les notices ou sans. Chaque description comporte un lien vers la notice dans le catalogue. Il y a aussi des « rebonds », pas sur un seul champ mais sur plusieurs, avec un système de cases à cocher (je trouve ça excellent mais mon geek pense que personne ne se servira de cette fonction).

Parce qu’il faut aussi critiquer, regrettons le manque de citabilité et les URL de 3 km de long.

Quand je vois ce boulot, je ne peux m’empêcher d’espérer que leur collaboration avec Google ne les empêchera pas de récupérer une bonne copie de la numérisation, et de l’intégrer avec autant de réussite à leur propre bibliothèque numérique. Hélas, seulement en mode texte, donc en perdant au passage, pour les chercheurs utilisateurs avertis de cette remarquable interface, une partie du contexte (c’est-à-dire du sens) de l’ouvrage.

Merci à ResourceShelf et Deakialli.

Banyuls

Terre de vignes
Lavée de vent
De vent salé
Sang de la terre
Rougit mon verre
Le goût du temps

Terre de montagnes
Tranchées de pierre
Vent de la terre
Souffle les vagues
Larmes d’écume
Sur la mer

Terre de parfums chantant le soleil
Les arbres fruitiers, les fleurs d’oranger
L’olivier, le thym, le miel

Terre de souvenirs et de prières
Une chapelle blanche, langue sans frontières
Sur les ruines amères des guerres

Terre de bonheur
Et de sourire
Sois bienvenu
Terre d’amitié
Soleil du coeur
A partager

Terre de soleil
Quand il s’éveille
Dore la mer
Puis sur les cimes
L’ombre s’étend
Heure du couchant

J’aimerai tellement prendre ta main
Et la clef des champs le long des chemins
Bordés de sarments de vin

Terre où nous pourrions cueillir le goût des figues
La senteur des fleurs, couleurs de la garrigue
Et regarder grandir nos coeurs

Technology watch

Deux rapports de veille technologique parus presque en même temps sont à signaler.

Le premier, c’est le "Technology Watch Report 3" de Digicult (attention très gros PDF de plus de 100 pages). Ce rapport examine six technologies jugées esentielles dans les tendances actuelles : les logiciels open source, le traitement du langage naturel, la recherche d’informations, les systèmes de localisation (genre GPS), la visualisation des données, la robotique et la réalité virtuelle.

Au programme : des définitions, le replacement dans le contexte stratégique, les implications en particulier pour les domaines scientifiques et culturels, des explications techniques, des études de cas et des scénarios, des perspectives pour la mise en oeuvre et la faisabilité. Incontournable.

Le second intitulé The large-scale archival storage of digital objects, Technology Watch Report est signé par la British Library et est accessible sur le site du DPC(Digital preservation coalition). Beaucoup moins long mais aussi beaucoup plus spécialisé, il traite de la problématique de la mise en place d’un système d’archivage à long termes de documents numériques dans tous ses aspects : le stockage, l’obsolescence des techniques, les logiciels, les coûts…

Merci à Ten Thousand Years Blog et à Digitizationblog.

Le W3C et les identifiants

Le W3C se penche depuis belle lurette sur l’identification pérenne des ressources numériques (dont vous devez avoir sacrément marre d’entendre parler ici à force, mais tant pis).

Il y a eu d’abord les URI (identifiants de ressources), puis les URN(noms de ressources), tous deux dès 1994.

Les URL (localisation de ressources) arrivent après, aussi bizarre que cela puisse paraître pour nous (mais du point de vue modélisation, c’est logique). Le fameux Cool URIs don’t change, document fondateur de la question de la pérennité de l’identification des ressources sur le Web, date de 1998.

Passé le tournant du siècle, on entre dans le Web sémantique et de nouveaux besoins apparaissent en termes d’identification : identifier des choses abstraites, des choses qui ne sont pas nécessairement des pages Web, et qu’elles puissent être identifiées par n’importe qui de façon unique sur le Web. Ces nouvelles réflexions donnent naissance au scheme "tag", une syntaxe simple pour permettre à n’importe qui de nommer de manière pérenne et unique une ressource (ou une personne, un concept quelconque). Les "tag URIs" ont une syntaxe simple qui permet à tout un chacun de générer des identifiants uniques :

tag:mon-nom-de-domaine.org,2005-03-01:nom

Ce genre d’identifiants est utilisé par exemple pour identifier les billets de blogs dans le format Atom.

En ce début d’année 2005, le W3C publie deux nouveaux documents :

  • l’un qui est une nouvelle version des URIs
  • l’autre qui concerne les IRIs (identifiants internationaux), qui ont l’air d’être des sortes d’URIs mais j’avoue que la portée de tout cela m’échappe encore.

Le 16 février 2005, le W3C a donc annoncé qu’il relançait le groupe URI, pour travailler donc sur les URIs et sur les IRIs.

Toute l’histoire est récapitulée ici.

Pour ceux qui auraient l’impression de n’avoir rien compris à ce billet : z’en faîtes pas, c’est normal.

Numérisation, bibliothèque numérique

On m’a posé il y a peu la question suivante : la numérisation est-elle un acte technique ? Je suis généralement la première à dire que numériser n’est pas seulement un acte technique. Mais en fait ce n’est pas la numérisation elle-même qui a des retombées politiques, culturelles, etc. C’est la façon dont elle est faite et mise à disposition du public. Quand je parle de numérisation, cela désigne en général dans mon esprit le processus de production de l’information. Ce processus s’inscrit dans un contexte qui a beaucoup d’autres dimensions que la technique : le budget, la sélection, les compétences, l’organisation, le public, les services, la valorisation, etc.

Dans les bibliothèques, il existe quelque chose qu’on appelle le circuit du document. Ce « circuit » c’est en fait l’enchaînement de toutes les étapes qui vont du passage du bon de commande auprès du libraire jusqu’à la mise à disposition du livre pour le public. En passant par la livraison, le catalogage, l’équipement, la cotation, etc.

Toutes ces étapes véritablement techniques constituent en partie le coeur de la bibliothéconomie et du savoir-faire de notre métier. Et pourtant, aucune bibliothèque ne peut être réduite à son circuit du document.

Une bibliothèque, c’est d’abord une politique documentaire, la gestion de compétences, des services au public, un lieu, une politique culturelle et de valorisation (éventuellement par l’édition mais aussi par des expositions par exemple). Le circuit du document n’est qu’une organisation technique au service de cette organisation politique et culturelle.

C’est un peu la même chose pour la numérisation. La numérisation n’est pas un acte technique neutre, parce qu’elle est décidée par une politique documentaire, donc un choix intellectuel. Parce qu’elle a un coût, donc un budget public, elle dépend de forces politiques. Parce qu’elle est mise à disposition du public dans un site Web, qui présente certaines interfaces, certaines fonctionnalités : techniques aussi mais dont le choix est essentiel pour définir les services offerts par le site ; politiques parfois quand il s’agit de formats ouverts, d’accessibilité, etc. Parce qu’elle fait l’objet d’une valorisation, par des pages éditoriales sur le site, par la mise en valeur de corpus cohérents de documents, par des projets de collaboration avec des chercheurs qui font un travail éditorial autour de cette numérisation.

La numérisation est à la bibliothèque numérique ce que le circuit du document est à la bibliothèque. La mission de la bibliothèque est de donner accès à des documents. La numérisation, en tant que mission de bibliothèque, n’est qu’un outil qui sert à donner accès à ces mêmes documents, dans le même cadre organisationnel, mais d’une nouvelle manière, avec une nouvelle dimension, dans un nouveau contexte.

La numérisation, dans ce sens du terme, est donc bien un acte technique et on peut facilement le déléguer à un tiers, éventuellement privé. Ce qui est plus grave, et même dangereux, c’est de déléguer à un tiers les aspects de bibliothèque numérique : la sélection documentaire, le choix des techniques et des formats, le choix des services d’accès, le contrôle des compétences et du budget, la valorisation du produit de cette numérisation. On risque de perdre alors le contrôle des aspects politiques et culturels de la numérisation, de ce qu’elle représente comme enjeu pour la bibliothèque, pour sa communauté (le public), et pour le Web.

Joyeux anniversaire moi

Cette année, pour mon anniversaire (c’était lundi) j’ai été bien gâtée. Entre autres cadeaux tous au goût ou à la couleur de figue, j’ai eu ce magnifique bouquin, La magie de la figue dans la cuisine provençale de Gui Gedda.

C’est un hymne à la figue, la bourgeassotte, la figue noire de Solliès. On y trouve des recettes au nom enchanteur, au hasard : velouté de figues aux langoustines et rosé de Provence, terrine de canard aux figues et aux poivrons rouges, feuilles de figuier en surprise de poisson aux écailles de figues, gigotines de poulet farcies à la mousseline de figues, gâteau solliès-pontois à la confiture de figues, etc. Des recettes toutes en subtilité, en finesse, complexes et délicieuses.

En plus, pour mettre les bougies, Mimi m’a concocté le cake aux figues sèches, avec des pignons et du miel de tilleul, un régal.

Ce serait vraiment un injure à la beauté de ce livre et à l’ingéniosité de son auteur que de publier sauvagement ses recettes sur le Web, donc n’y comptez pas. Mais je lui adresse toute mon admiration gourmande et ma reconnaissance figuesque.

Pour ceux qui auraient oublié de me souhaiter mon anniversaire, c’est à dire tout le monde sauf les présents et Seb, il n’est pas trop tard, le reste de ma liste est !