Les vrais gens

Message personnel : le fil RSS en HTML est désormais compatible avec Liferea.

A part ça, c’était un très bon Paris Carnet. La bière avait un drôle de goût d’eau, mais l’assistance était de qualité. Je félicite un certain nombre de participants pour leur capacité à m’aider à me souvenir de leur blog, découvert à cette occasion :

  • Sok et sa fameuse méthode consistant à refuser de parler de son blog (je t’ai repéré quand même !)
  • le socionome avec une agréable conversation sur les mérites de faire une thèse
  • labosonic que je remercie pour la thérapie de comptoir.

J’ai aussi eu la joie et l’honneur de croiser le capitaine, Padawan, MeloDye, Eric un nouveau, et LoGeek. Merci à eux.

Les absents ont cruellement, cruellement manqué.

Enfin une très spéciale dédicace à Nimwendil, pour qui je publie pour la première fois une photo d’un truc que j’ai fait…

Vous grokkez ?

Grokker est un outil de visualisation qui utilise Yahoo (et quelques autres sources) pour proposer une façon alternative de naviguer dans des résultats de recherche.

Ce qui est intéressant, c’est qu’on a une approche originale de la recherche d’information : sur une requête, l’outil propose différents points de vues, différentes façons d’aborder le mot recherché. Pour prendre un exemple, si on cherche des informations sur Paris, au lieu de bêtement trier les pages où le mot "Paris" apparaît le plus volontiers, il fait des recoupements et propose des liens commerciaux, des hôtels, des bulletins météo, des ressources sur la Tour Effeil, sur l’histoire de Paris, etc. On peut ensuite zoomer sur cette carte d’informations, explorer de plus près l’un des aspects, et aller jusqu’à une vignette et un descriptif des sites recensés.
Comparé à un moteur traditionnel, textuel, on va donc passer beaucoup plus de temps à explorer les résultats, et beaucoup moins à cliquer sur les sites pour voir ce qu’il y a dedans.
Gain de temps ? Cela reste à voir, notamment en fonction de la pertinence du terme recherché et de celle des outils qui vont proposer les rapprochements d’idées.

Pour évaluer l’intérêt d’avoir ces différents points de vue sur l’information, vous pouvez jouer avec le "grokker puzzle" et essayer de deviner la requête à partir des résultats de la recherche… (accès par le petit menu en bas de cette page)

Deux autres outils sympas pour montrer l’intérêt de la visualisation pour la recherche, ou plutôt, l’appréhension de certains types d’information :

  • Newsmap pour les actualités
  • Gnod pour la musique et les bouquins.

Et enfin un article, à l’usage des bibliothécaires, qui fait le point sur ce sujet dans Library Journal.

Gérer l’épuisement avec Gantt

Parfois, l’épuisement accumulé finit par dépasser l’entendement, et à l’heure où d’habitude je me retrouve jovialement devant mon pc pour bloguer, je sens que toute énergie m’a quitté. Ces deux dernières semaines, j’ai eu pléthore de ces moments, où l’envie d’écrire, dévorante, vitale, le disputait à une fatigue irrationnelle qui semblait empêcher mes neurones de se connecter entre eux pour fonctionner normalement.

Dans ce genre de moments, je me réfugie dans des tâches primitives, comme par exemple réaliser un diagramme de Gantt avec Excel. Alors je vous recommande chaudement ce tutoriel, qui marche très bien, même si, pour un cerveau fatigué et peu efficace, certaines de ces infos en anglais restent résolument opaques (par exemple j’ai jamais réussi à afficher les bonnes dates sur l’axe horizontal).

Si vous êtes un vrai geek, ce tutoriel ne vous sera d’aucune utilité et vous auriez plutôt intérêt à consulter celui-là qui donne la démarche à suivre avec Open Office, et en plus il est en français.

Au terme de cette enrichissante expérience avec les diagrammes de Gantt, j’ai réussi à planifier six mois d’activité intense et à meubler une demi-journée d’épuisement. Comme quoi, les diagrammes de Gantt, c’est vraiment utile.

Merci au del.icio.us d’Outils Froids.

Ici et ailleurs

Je vous propose une petite promenade internationale sur le thème de la préservation du document numérique, ici et ailleurs.

Ici, c’est aux Archives de France dont la directrice a donné une interview sur ce sujet. Plus que les propos de Madame la DAF, ce sont les questions posées qui m’interpellent :

Depuis quelques années, le nombre des sites Internet, de blogs, de forums est en croissance exponentielle. Ces données numériques fonctionnent comme révélateurs d‘une époque, d’un mode de vie, d’une société. Comment conserver cette mémoire numérique ? Comment trier, conserver et transmettre aux générations futures cette colossale masse d’information ?

Je crois qu’il n’est pas clair pour tout le monde qu’écrire un blog, c’est faire acte de publication, avec tout ce que ça implique. Traditionnellement, les Archives conservent des documents produits au cours d’une activité (généralement administrative), je vous renvoie à la Loi sur les archives pour ça. Les publications (dont les blogs) relèvent pour leur part du Dépôt Légal, donc de la future loi DADVSI.

Ici toujours, la Gazette du Cines s’intéresse aussi à l’archivage pérenne des documents numériques.

Ailleurs, maintenant.
Pas très loin, en Belgique, on apprend que l’Université Catholique de Louvain va utiliser VITAL (de VTLS) pour gérer son "digital repository". C’est peut-être une des premières percées de nos éternels fournisseurs de SIGB sur le marché de la préservation numérique (quelqu’un a des infos sur des expériences antérieures dans ce domaine, ou avec d’autres fournisseurs de SIGB ?) VITAL est basé sur le système open source Fedora.
En Espagne, on peut lire ce billet où il est question, également, de patrimoine numérique, de dépôt légal, et du rôle des bibliothèques.

Et maintenant, un peu de lecture…
A consulter, cette bibliographie (pdf) sur la préservation du document numérique.
A lire, ce rapport des archives nationales de Grande Bretagne : Your Data At Risk: Why you should be worried about preserving(pdf, 15p.).
A re-lire, ce rapport daté d’août 2003, par la NSF et la LOC, intitulé It’s about time (pdf, 52 p.), qui faisait le point sur les enjeux de la recherche et des actions à mener dans le domaine du numérique.
A dépouiller, les communications de la conférence PV2005 sur le même thème.
A dénicher tant bien que mal, un livre sur les "institutional repositories" paru ou à paraître en janvier 2006, en espérant qu’une de nos bibliothèques françaises (hum, parisienne si possible, merci) ait la bonne idée de l’acheter.
A saluer, la naissance de nouveaux blogs tournés vers la conservation et l’archivage, numériques ou non :

  • Sous la poussière : peut-être le premier blog d’archiviste en France (euh en Suisse) (quelqu’un a des infos sur les blogs d’archivistes francophones sinon ?)
  • IST-677 : un blog pédagogique sur la préservation du document numérique, piloté par Digitization 101 ce qui assure des contenus de qualité.

Merci à Culture et Tic, Blogokat, FRBR, Deakialli, ResourceShelf, 10kyBlog, Digital Curation News, et Lorcan Dempsey.

DRM et bibliothécaires

On a beaucoup parlé des DRM, ici et ailleurs, surtout pour en dire qu’ils étaient mauvais. La question à se poser est peut-être de savoir s’ils sont forcément mauvais, ou ce qu’on pourrait faire pour qu’ils le soient moins.

Cet article donne un début de réponse : un bon DRM devrait

  • éviter de violer l’ordinateur sur lequel il s’installe,
  • expirer quand l’oeuvre tombe dans le domaine public,
  • faire une différence entre protéger une oeuvre et protéger une manifestation (au sens FRBR du terme)
  • ne pas être plus restrictif que dans le monde analogique
  • il ne devrait pas être illégal de les contourner (on peut avoir plein de bonnes raisons pour faire ça)
  • permettre l’accès aux personnes handicapées
  • déposer ses spécifications dans une bibliothèque pour permettre les futures migrations et émulations.

On est encore loin du compte.

La première chose à faire, en tant que bibliothécaires, c’est de ne pas rejeter en bloc les DRM mais de chercher à comprendre comment ils marchent, les problèmes qu’ils posent et ce qu’on peut y faire. C’est ce que nous aide à faire ce gros rapport (pdf, 44p.) : Digital rights management, a guide for librarians par Michael Godwin publié sur le site de l’ALA. Il y est question des maux des DRM pour les bibliothécaires, mais aussi des procédés techniques, du cryptage au watermarking en passant par les enjeux du P2P. Incontournable.

Remous de la blogosphère

Non je n’ai pas disparu, je suis juste un peu occupée cette semaine. Mais malgré tout, j’observe silencieusement depuis quelques temps les remous de la blogosphère, et elle en fait des remous en ce moment.

D’abord il y a eu les voisins qui ont mis la clef sous la porte, comme ça, sans prévenir, déclenchant une tempête dans la microblogosphère bibliothéconomique. En même temps, ils ont continué, ailleurs.

La mort prématurée de ce pilier de la biblioblogosphère a attristé certains, révolté d’autres, et encore suscité les réactions les plus diverses comme par exemple un irrépressible besoin d’inventaire, témoignage peut-être d’une déformation professionnelle que nous ne saurions blâmer.

Ailleurs, on découvre que ce que certains avaient pris avec espoir pour un florissement de biblioblogs n’était qu’un exercice pédagogique, et peut-être un feu de paille – bien que nous ne puissions qu’encourager ces nouvelles blogovocations dans notre métier et souhaiter qu’ils poursuivent, peut-être ailleurs, leur découverte.

Encore un peu plus loin de notre coeur blogosphérique, j’ai suivi avec passion le débat entre deux célèbres blogueurs sur le thème de la préservation à long terme des documents numériques, quand ils sont protégés par des DRM – sujet qui me tient particulièrement à coeurcomme vous le savez peut-être.

Et enfin, cette semaine, c’est l’affaire Garfieldd qui me touche, parce qu’il était fonctionnaire, et en particulier parce qu’il était fonctionnaire et qu’il ne l’est plus.
Je ne lisais pas ce blog, mais je me suis suffisamment documentée pour rester pétrifiée.
Ce genre d’approche risque à mon avis de priver la blogosphère d’une de ses richesses : le mélange des genres. Vous pouvez parler de votre travail, mais alors évitez d’étaler votre vie privée. Votre vie privée ne regarde que vous, mais votre travail n’en fait pas partie.

Un dernier conseil pour la route : bloguez nombreux, bloguez heureux, mais faites attention, la confiture de figues se marie très mal avec les collections de bibliothèques qu’elles soient papier ou numériques (principalement à cause des excès de sucre)…

Coins coins

Allez, ce soir je parle des petits canards.
Nan, sérieux.
Ce soir, je parle des Context Objects in Span (COinS).

Ces choses consistent à mettre dans des pages HTML des liens encodés suivant la norme OpenURL. A quoi ça sert, me direz-vous ? Bon, je vais faire un exemple.

Imaginons que j’aie lu un bouquin nommé Dawle Duckling de Toni Buzzeo et Margaret Spengler et que je veuille en parler sur mon blog. Pour compléter mon billet et faire une référence complète, et interprétable par des machines, le mieux est d’encoder un lien openURL que les gens pourrons brancher sur un outil de leur choix pour en faire un lien utile à leurs yeux.

Le mode d’emploi est le suivant :

  • Je vais sur le générateur de Coins et je remplis les métadonnées dans le formulaire.
  • ledit générateur transforme automatiquement les infos en un bout de code contenant un lien Coin OpenURL, que je colle dans mon blog.
  • comme il est sympa, Coin me donne aussi à titre d’exemple le lien Amazon
  • vous allez sur le site des extensions de Coin et vous récupérez le bookmarklet "Find in a library"
  • vous allez sur mon blog et cliquez sur le bookmarklet pour transformer le Coin en lien « Find in a library »
  • vous cliquez sur le lien et tombez sur la notice dans OpenWorldCat.

Voilà, maintenant si vous êtes un peu geek, vous développez un bookmarklet pour le résolveur OpenURL de votre bibliothèque, et ça vous permet de rechercher les références quand vous tombez sur un Coin.

Des infos chez Lorcan Dempsey et des applications chez David Bigwood

Et un petit exemple de Coin coin-coin :


Dawdle Duckling

Répertoires de formats

J’ai déjà eu l’occasion de vous parler des répertoires de formats et de leur utilité pour la préservation du document numérique ici ou . Comme j’ai eu la chance depuis de me pencher de plus près sur ce problème, je vous livre quelques idées et liens utiles.

Alors d’abord, pourquoi un répertoire de formats ? La question peut être abordée de plusieurs points de vue :

  • la sélection : j’ai un contenu, dans quel format le représenter ?
  • l’identification : j’ai un objet numérique, dans quel format est-il ?
  • la validation : j’ai un objet numérique censé être au format X, est-ce exact ?
  • la caractérisation : j’ai un objet au format X, quelles sont ses propriétés ?
  • l’évaluation : J’ai un objet au format X avec des propriétés Y, quel est le risque d’obsolescence ?
  • le traitement : j’ai un objet au format X avec des propriétés Y, comment réaliser l’opération Z sur ce format ?

Répondre à toutes ces questions revient à parcourir les différentes étapes qui vont nous conduire de la création du document numérique à sa préservation sur le long terme, en passant par l’étape essentielle qu’est l’injection dans une archive OAIS. Parce que dans cette archive on a besoin de savoir la nature de ce qui est conservé, et parce qu’on a besoin de créer des programmes capables d’émuler ou de migrer ce contenu, avoir un référentiel qui contient les moyens d’identifier ces formats et leurs spécifications est indispensable.

Cette prise de conscience n’est pas nouvelle dans le monde du numérique, et il existe aujourd’hui différentes initiatives qui visent au moins en partie à atteindre cet objectif.

D’abord il y a des choses qui existent depuis un bout de temps et n’ont pas un objectif de conservation : par exemple le répertoire des MIME TYPE de l’IANA, celui du département de la justice américain (à vendre sur CD-Rom), ou le Wotsit des programmeurs. Aucun de ces répertoires ne répond au besoin spécifique de conservation, parce qu’il manque des données essentielles et notamment les signatures, internes ou externes, qui permettent d’identifier (automatiquement de préférence) le format auquel on a affaire.

A l’opposé, on trouve des initiatives dont l’objectif est exclusivement l’évaluation en vue de la conservation, et qui mettent donc l’accent sur la méthodologie d’évaluation des risques d’obsolescence des formats. Parmi ceux-ci, je citerai deux initiatives : l’Inform Metodology d’OCLC et le travail de la Library of Congress sur les formats.
La première est au sens strict une méthologie de gestion des risques. Je pense qu’elle a plus ou moins été appliquée par la NLA qui n’a hélas pas encore publié les résultats de son travail.
La seconde est une méthodologie de projet de numérisation, qui inclut le problème de la sélection d’un format quand on numérise. L’approche est assez complète mais il manque le principe de la validation automatique du format, c’est à dire l’utilisation de logiciels qui vérifient la conformité du format et de ses propriétés par rapport aux attentes de l’archive. C’est donc une approche bibliothéconomique assez classique. Par contre, la méthode d’évaluation en vue de la préservation est intéressante.

Et puis pour finir je parlerai des répertoires de formats qui ont pour but l’identification et la validation des formats, tout en étant neutres et objectifs (pas d’évaluation donc), ce qui augmente les chances de recevoir des descriptions de formats propriétaires de la part de leurs producteurs. L’un d’eux, dont j’ai déjà parlé, est Pronom avec son outil DROID. En apparence, on a là celui qui va le plus loin dans l’accomplissement de l’objectif cité, puisqu’il est le seul à mettre au point un répertoire de formats avec l’outil qui va avec pour les identifier automatiquement. Dans les faits, il est encore assez peu rempli.

Le dernier dont je parlerai ici, GDFR , mérite un coup de chapeau car il vient d’obtenir 2 ans de financement de la part de la Mellon foundation. Propulsé par les gens de la bibliothèque universitaire d’Harvard, GDFR a pour objectif de constituer un répertoire de formats neutre, global, international, complet, etc. Il s’est doté d’un modèle de données qu’on peut voir à l’oeuvre dans l’expérimentation FRED, c’est -à-dire qu’il s’est doté de règles qui définissent le contenu de la description d’un format, incluant un identifiant pérenne ce qui est très utile pour toutes sortes d’applications. Pas loin de GDFR, on trouve aussi un outil de validation automatisée : JHOVE qui contrairement à DROID, ne fonctionne pas en attanquant directement un répertoire de formats, mais grâce à des plug-ins qui contiennent les infos nécessaires. En cela JHOVE est une sorte d’outil inachevé, et on peut espérer qu’avec le développement de GDFR il deviendra plus complet. Lire cet article intéressant sur GDFR.

Monsieur Stephen Abrams, de Harvard, est personnellement une mine d’informations que je remercie pour son défrichage intense du sujet (en espérant qu’il pardonnera mes récupérations parfois littérales de ses idées). Il était à Gottingen pour iPRES et vous pouvez lire, écouter et même regarder son intervention ici. Merci aussi à Julien dont j’ai récupéré l’historique.

Lien vers la version officielle.

Recette du chutney de figues

Voilà, comme promis, je suis de retour pour vous souhaiter une bonne année 2006 pleine de figues. Pour fêter ça, voici donc une recette pour l’année prochaine.

Comme ce n’est pas très facile de trouver des figues fraîches en cette saison, et que tout le monde n’est pas assez prévoyant pour avoir fait un chutney en septembre, voici une recette apppropriée et de saison pour accompagner vos foies gras et autres… hum… foies gras.

Recette du chutney de figues sèches

  • Couper 500g de figues sèches en 4. Arroser d’un verre de muscat et d’un verre d’eau. Laisser macérer une nuit.
  • Couper un oignon en lamelles et le faire revenir dans une cuiller à soupe d’huile d’olive dans une casserole.
  • Ajouter une pomme coupée en dés, les figues, un peu de canelle, gingembre, sel, poivre, une cuiller à soupe de vinaigre balsamique. Cuire 5 mn.
  • Ajouter 3 cuillers à soupe de miel liquide. Cuire 30mn en tournant et mouillant à l’eau autant que nécessaire.
  • Dans une poële à sec faire griller 100g de pignons. Les ajouter à la préparation.
  • Ma touche finale : une cuiller à soupe de confiture de figues maison préparée avec des figues fraîches quand il en était encore temps ;-)
  • Mixer, mettre au frais.

Cette quantité convient parfaitement pour nourrir une trentaine d’affamées lors d’un réveillon. J’avais la flemme de faire la conversion pour une assemblée plus raisonnable… Mais cela se conserve quelques jours au frigo et plusieurs semaines au congélateur.

Joyeux Noël

Et voilà, c’est mon tour de partir en vacances !

Je vous souhaite un joyeux noël et une bonne année.

Avec un peu de chance je vous ramènerai une nouvelle recette à la figue en cadeau à la rentrée ;-)

Rendez-vous le 4 janvier.