La bibliothèque numérique dont j’ai rêvé

Ayant été hors jeu pendant plusieurs mois en 2008, c’est avec d’autant plus de confort que je m’accorde, pour une fois, un petit message publicitaire sur Gallica 2 et Europeana.

La nouvelle version de Gallica 2, mise en ligne à la mi-janvier, comporte plein de fonctionnalités que j’appelais de mes voeux depuis longtemps, comme des fils RSS paramétrables en fonction d’une recherche, un widget :

Vieux Paris [lithographie par J. Jacottet], Musée Carnavalet : [photographie de presse] / [Agence Rol]
Vieux Paris [lithographie par J. Jacottet], Musée Carnavalet : [photographie de presse] / [Agence Rol]

Mais on peut aussi consulter des documents sonores, et même écouter en synthèse vocale les livres dont la qualité d’OCR est suffisante (supérieure à 95%) par exemple on a bien ri en écoutant certains passages de celui-là.

Europeana, je ne rentrerai pas dans les détails, mais il faut entrer dans le Thought labs où se font les premières expérimentations avec Web sémantique inside
Les mésaventures d’Europeana à son lancement (et je le rappelle, même s’il y a 2 millions d’objets dedans, ce n’est qu’un prototype) me semblent montrer à quel point les nouvelles interfaces de bibliothèque numérique, et quelque chose d’aussi simple que la mise en valeur de vignettes, représentent un enjeu pour la visibilité des contenus culturels, au niveau national et au niveau européen.

Donc, un grand bravo, un grand merci à tous ceux qui ont dépensé une énergie conséquente sur ces projets durant ces dernières années. Il nous reste deux petites semaines pour dire adieu à l’ancienne version de Gallica. On sait qu’il y aurait encore beaucoup à faire, mais on a fait du chemin.

Le côté obscur de la force ?

La politique d’OCLC est assez décriée en ce moment, notamment autour de leur volonté de revoir les conditions d’utilisation des notices de Worldcat.

Noter qu’une première version de cette politique avait été diffusée, suscitant des réactions assez vives. Etait en particulier incriminée la politique du « champ 996 », un champ ajouté aux notices récupérées de Worldcat dans lequel on mentionne la provenance de la notice et un lien vers la OCLC policy.

Le jour même, après la polémique ci-dessus, OCLC retire son texte pour le retravailler. Quelques jours plus tard, il en publie une nouvelle version. On peut comparer les deux versions ici.
A noter :

  • une clarification (simplification, peut-être un peu radicale) des types de partenaires
  • le retrait de certaines phrases qui donnaient un aspect « fermé » à la politique (sans pour autant que cela change le fond des différentes clauses, à mon avis).

On voit bien qu’ils ont essayé de retirer tout ce qui pouvait avoir l’air provocant. Ce qui apparaissait comme des obligations devient des incitations (par ex. ne pas retirer la mention d’origine des notices).

OCLC utilise ensuite son blog pour entrer dans le débat et expliquer sa politique :

  • la politique actuelle date des années 80 et a besoin d’être révisée dans le contexte du Web
  • la mention de provenance avec le lien vers la politique n’est pas dans un esprit de « propriété », mais de « source »
  • OCLC s’est inspiré de la Creative Commons pour l’aspect commercial / non commercial
  • l’objectif de la politique est de protéger la communauté contre des usages commerciaux concurrentiels qui pourraient la détruire.

Ce qui n’empêche pas la polémique de continuer, comme on peut le voir sur cette liste de tous les billets de blog qui abordent ce sujet… Et il y en a qui s’amusent bien :

OCLC a affiché sa volonté de discuter avec la communauté en organisant une rencontre le 16 janvier, et en repoussant la mise en oeuvre de la nouvelle politique de plusieurs mois. Pour autant, ils se font épingler jusque dans la presse avec cet article du Guardian qui prétend expliquer « pourquoi vous ne trouvez pas de livres de bibliothèques dans votre moteur de recherche » par les visées protectionnistes d’OCLC, opposées à OpenLibrary et aux travaux de Talis, et même à la publication du catalogue Libris dans le Linked Data et aux travaux d’Ed Summers.

Ce dernier complète (et dépasse) l’analyse du Guardian dans un billet remarquablement complet et pertinent qui évoque la problématique du référencement et le fichier « robots.txt » de Worldcat.

Ça doit être la mode d’analyser les fichiers d’exclusion de robots aux Etats-Unis, hier c’était celui de la Maison Blanche, passé de 2400 lignes à d’exclusion à une seule… le 20 janvier 2009.

Quelques minutes plus tard : tiens, je viens d’apprendre que OCLC va absorber OAIster. Vous avez dit monopole ?

Le premier catalogue dans le linked data

Dans un de mes derniers billets, je vous parlais de LIBRIS, le catalogue collectif suédois, développé en méthode agile. Il s’avère aujourd’hui, d’après un article sur Nodalities (blog Talis), que Libris serait aussi le premier catalogue de bibliothèque intégralement disponible dans le Linked data.

Sur cette page technique on peut voir que leur préoccupation de rendre le catalogue « machine-readable » a pris une diversité de formes : une API spécifique nommée Xsearch, à laquelle s’ajoutent OpenSearch, unAPI, Z3950 et SRU, et OpenURL-Coins.
Mais dans l’article ils expliquent bien que tout cela, pour passionnant que cela soit, ne va pas aussi loin que le Linked Data qui permet de relier les données avec d’autres ressources disponibles sur le Web, et qu’ils « sont tombés amoureux de SPARQL » (je cite).

Tout est expliqué sur un blog spécifique. En anglais, pas en suédois ;-) Je leur tire une nouvelle fois mon chapeau. A l’heure où LCSH.info a été débranché pour des raisons institutionnelles, il était temps que d’autres bibliothèques se positionnent sur le Linked Data et montrent qu’elles n’ont pas peur de rendre leurs données plus visibles et plus accessibles.

Quelques bonnes résolutions pour 2009

Je souhaite une excellente année 2009 à tous les lecteurs de ce blog, réguliers ou occasionnels.

Pour fêter cet an Neuf (oui, je sais, elle est éculée la blague, mais on ne peut la faire qu’une fois par siècle, il faut en profiter), je voulais partager ici une de mes résolutions : ne plus avoir peur de la technologie.

Je vous vois déjà en train de vous esclaffer à l’idée que je puisse avoir peur de la technologie, mais je vous assure que je suis loin d’être un « early adopter », en général je n’accepte de m’intéresser à une technologie que quand je n’ai plus le choix parce que ce serait vraiment rétrograde de faire autrement. Pour preuve, j’ai eu ma première connexion internet chez moi en 2000, mon premier téléphone portable en 2001, et la Nintendo DS que je viens d’offrir à ma fille était la première console de jeu que je tenais entre mes mains de toute ma vie.
Heureusement, il se trouve que je partage mon quotidien avec un véritable, authentique « early adopter ». J’ai donc décidé d’exploiter cette chance pour essayer de progresser.

Ainsi je suis en train de lire un livre sur son Sony Reader.
Quelques impressions, comme ça à chaud : d’abord, c’est pas pratique, parce qu’avant quand il achetait un livre je pouvais le lire après. Maintenant, cela me demande de longues et ardues négociations puisque pendant que je lis, il ne peut plus profiter de son joujou. Donc, le Sony reader est un danger pour la sérénité du couple ;-) ou il faut en avoir 2 !
Sinon, je trouve que c’est une expérience très proche de celle d’un livre ordinaire, en papier. Bien sûr, on peut en avoir plusieurs dans le même volume d’encombrement… mais vu que je lis rarement plusieurs livres en même temps, et que je pars rarement en vacances assez longtemps pour avoir besoin d’en emmener plusieurs, cela ne fait pas une grosse différence pour moi (si ce n’est que cela va ralentir, fort heureusement, l’augmentation exponentielle de notre métrage linéaire, qui commençait à devenir difficilement compatible avec l’espace disponible, surtout quand on refuse de désherber…)
Enfin, l’autre jour dans le train, j’ai demandé à ma fille (qui a 8 ans) « passe-moi mon livre, s’il te plaît » et elle m’a répondu « ce n’est pas un livre et il n’est pas à toi ». Visiblement elle parlait du support alors que moi je pensais au contenu ; en tout cas, cela a mis fin à la discussion et je me suis débrouillée pour l’attraper toute seule.

Pour Noël, je me suis fait offrir une caméra ce qui va me permettre d’entrer dans l’univers du Web des vidéos, ce que je n’avais fait que timidement jusqu’à présent. Je n’aimais pas ça parce qu’il faut passer du temps à les regarder, on ne peut pas se contenter de les lire en diagonale !
Du coup, j’ai testé Dailymotion et j’ai commencé à envisager de pouvoir encapsuler des trucs sur ce blog : des diaporamas pour l’instant, et demain, des vidéos, et pourquoi pas des screencasts (j’ai testé dernièrement Screentoaster qui est pas mal du tout).

En rouge et noir…

Comme cadeau de Noël, Figoblog s’offre (avec l’aide de Got) un nouveau look. Sortez un peu de votre agrégateur pour venir le voir ! Aucun rapport avec Jeanne Mas ou un quelconque revival année 80, j’avais juste envie de sobriété et de quelque chose de minimaliste, avec du noir pour économiser la planète ;-)

Joyeux Noël !!!

… n’oublie pas mon petit soulier…

… Imaginez…

C’est Noël. Paris se couvre d’un manteau de flocons blancs qui étouffe le bruit de la circulation. L’esplanade de la BnF, entièrement recouverte, s’est transformée en un grand terrain de jeu.

Tout à coup, faisant taire les cris de joie des enfants, retentit le tintement mélodieux d’une nuée de grelots. Les nuages se percent d’une trouée lumineuse, et le traineau du père Noël apparaît, tiré par quatre rennes fringants et volants.
Après avoir voleté quelques instants au-dessus du jardin, il se dirige vers un groupe de bibliothécaires qui se tenaient là au pied d’une tour, se réchauffant les mains à leur gobelet de café, et devisant agréablement des mérites comparés de Google et du catalogue Bn-Opale Plus.

« Je vous ai entendus, déclare le père Noël, et j’ai décidé de vous faire un cadeau. Vous pouvez me demander chacun une fonctionnalité que j’ajouterai au catalogue. Celle que vous voulez. »

Si vous étiez dans ce groupe de bibliothécaires … qu’est-ce que vous demanderiez ? (Perso, je pense que je choisirais la FRBRisation, parce que vu le travail qu’il y a sur les données, un coup de main du père Noël serait le bienvenu ;-)

(PS : soyez nombreux à répondre ! je compte sur vous !)
(PPS : pas de mauvais esprit, hein, soyez constructifs, ne m’obligez pas à modérer…)

Catalogues de bibliothèques et développements agiles

Dans le dernier numéro de Code4Lib Journal, deux informaticiens de la bibliothèque nationale de Suède publient un article intitulé « User-Centred Design and Agile Development: Rebuilding the Swedish National Union Catalogue ».

Il s’agit d’un retour d’expérience sur l’adoption d’une méthode de développement dite « agile » pour le catalogue collectif des bibliothèques suédoises, Libris.
Il s’agissait de reconstruire le système de A à Z, en un an seulement, y compris la partie moteur de recherche. Pour favoriser l’innovation, ils ont opté pour mener en parallèle une conception orientée utilisateurs, s’appuyant sur des études d’usages, et un développement itératif de type agile (SCRUM).
Côté étude d’usages, ils ont d’abord fait un questionnaire, puis des focus groups conduits sur la base de scénarios d’utilisation, et enfin des tests d’usabilité sur un prototype et une interface en version beta. Tout ça nous est assez familier, mais ce qui est nouveau, c’est d’adapter la méthode de développement de façon à ce que les retours des utilisateurs puissent être pris en compte dans la réalisation informatique au fil de l’eau.

Dans une méthode agile, l’objectif est de prendre en compte le fait que les conditions et les objectifs peuvent évoluer avec le temps, même pendant que se déroule le projet.
Cela implique de favoriser :
– les individus et leurs interactions plutôt que les processus et les outils
– les logiciels qui fonctionnent plutôt qu’une documentation extensive
– la collaboration avec le client plutôt la négociation contractuelle
– de répondre au changement plutôt que suivre un plan pré-établi.

Comme le dit très justement l’article, ces principes, pour séduisants qu’ils sont surtout vus depuis les utilisateurs du futur système, posent un certain nombre de problèmes. D’abord, ils sont plus inconfortables pour les décideurs, qui perdent en visibilité sur les charges et les dates ce que le projet gagne en souplesse. Il est donc important d’obtenir dès le départ le soutien des décideurs sur la méthodologie, et de bien leur expliquer que même s’ils ne peuvent pas voir les spécifications, le produit final sera bon. D’autre part, le code ainsi construit peut au final s’avérer instable, ce qu’ils ont résolu dans le projet cité en planifiant une session de 3 semaines dédiée à une évaluation fine de la qualité du code.
Tout cela est en grande partie une question de confiance et un des facteurs décisifs du projet a été la mise à disposition d’un espace commun pour les développeurs, où se tenaient également les réunions de travail avec l’équipe projet.

En conclusion, leur retour d’expérience est plutôt bon sur la méthode agile, qui semble avoir évité bien des écueils. Ce qui leur manque c’est plutôt la documentation et le transfert de compétences entre développeurs. Et ils auraient voulu impliquer encore davantage les utilisateurs dans le processus.
Je ne voudrais pas paraphraser la conclusion, qui est classe, donc la voici :

Finally, we would like to conclude that working with user-centred design in combination with iterative development is a better, faster and cheaper way of software development, compared to traditional models. Better – the product being released at the end is a more up-to-date and bug-free version than had we worked with a more traditional approach. Faster – it is our conviction that with traditional methodology we would not have finished on time, or at least not with the same amount of features implemented. Cheaper – if the same number of people are able to do a better job in a shorter amount of time, it is a more cost-effective way of getting the job done.

Il faut reconnaître que le résultat est pas mal du tout : même en suédois, on arrive à s’en servir ce qui prouve que niveau usabilité, c’est plutôt bien fait !!! Enfin pour expérimenter moi aussi la méthode agile en ce moment, je dois dire que cela me paraît effectivement très prometteur pour les projets innovants en bibliothèque.
Merci à Pintini pour la référence.

… quand tu descendras du ciel…

Cette année, les bibliothèques ont récolté un drôle de cadeau de Noël. Il s’appelle RDA, pèse 35 méga octets (zippé) et mesure plusieurs centaines de pages (en pdf). Cette version finale est actuellement en cours de relecture, commentaires à rendre pour le 2 février.

Alors, à la demande expresse de Got qui n’arrête pas de me dire qu’on n’y comprend rien, je vais essayer de vous situer les RDA dans le paysage du catalogage.

Evidemment, c’est une vision extrêmement simplifiée, mais on peut quand même essayer de différencier 3 grandes étapes.
La première période (jusqu’aux années 1990) se caractérise par une approche d’informatisation pragmatique : on a mis l’accent sur la structure (MARC) au détriment des modèles.
La 2e période fait l’objet d’un effort de modélisation conceptuelle (FRBR). La structure MARC évolue vers XML, tandis que le Dublin Core se développe en parallèle (à la fois pour la structure, le modèle et le format).
Dans la 3e période, celle qui est devant nous, le modèle conceptuel reste valable. Le Dublin Core converge avec les structures et des bibliothèques (RDA vocabulary) et peut être exprimé en RDF. RDA remplace les anciennes règles de catalogage. L’utilisation de RDF rend inutile le besoin d’un format pour les notices (on exprime directement les données). Au niveau de l’encodage, le passage par XML facilite la conversion vers RDF.

Souvenez-vous, il y a 3 ans… en décembre 2005, le premier draft de RDA m’inspirait des réflexions pleines d’espoir, de FRBRisation et même de Web sémantique qui ne disait pas son nom.
Et bien aujourd’hui, il dit son nom : il suffit de voir ces deux présentations de Diane Hillmann (elles disent à peu près la même chose, mais de manière différente, j’ai une nette préférence pour la 2e) :

Si vous avez l’intention de relire les RDA pour envoyer des commentaires (c’est que vous travaillez probablement à la BnF ! sinon, envoyez-moi un CV ;-) cette version en ligne temporaire peut vous être utile, elle sera plus pratique que de naviguer dans les PDF ou dans la version papier.