Il se passe des trucs à Metz !

J’ai vécu suffisamment d’années dans la jolie ville de Metz pour avoir tous les a-priori négatifs du monde sur ce qu’il est susceptible de s’y passer. Et pourtant, je dois bien reconnaître qu’il s’y passe des trucs, y compris dans le monde des blogs, y compris en dehors de la présence de jeunes dessinatrices particulièrement talentueuses.

La bibliothèque de l’Université Paul Verlaine (de Metz, donc) a lancé son blog, qui accompagne en fait une petite revue destinée aux professionnels des bibliothèques.
Pour l’instant trois numéros sont parus :

Alors voilà, après leur avoir accordé un temps de rodage, je voulais quand même saluer cette initiative et mon collègue Jean-François, compagnon de découverte du Web au cours d’un projet qui a finalement vu le jour aussi incroyable que cela puisse paraître. Comme quoi, on a pas mal progressé depuis ;-)

Questions existentielles de la vie

Faisons un jeu.
Il s’agit de répondre en le moins de temps possible à trois questions essentielles de la vie :

  • pourquoi appelle-t-on l’inspection générale de la police « boeuf carotte » ?
  • qu’est-ce que la classification Coda ?
  • pourquoi le pingouin de Linux s’appelle-t-il Tux ?

Les outils autorisés sont Google et Yahoo. Le but du jeu est bien sûr d’avoir la réponse dans les trois premiers résultats.

Les boeuf-carotte résistent : bien sûr, il faut se débarrasser des bruyantes recettes de cuisine (et les opérateurs booléens sont très peu efficaces, il faut bien le dire). J’ai fini, après de nombreux tâtonnements, par formuler ma requête de la manière suivante : "boeuf carotte pourquoi police" (presque équivalent à "boeuf carotte police" mais pas tout à fait).
Sur Google, je fais d’abord chou-blanc, puis après avoir rajouté un fatidique tiret (entre boeuf et carotte) je trouve quelque chose. Le premier lien (ABC de la langue française) est prometteur mais m’oblige à farfouiller longuement dans le site pour un résultat décevant. Le second m’apprend que les boeuf-carotte séviraient aussi dans les restaurants. Le troisième lien ne donne rien.
Sur Yahoo, le premier résultat ne donne rien, mais le deuxième m’envoie sur le Forum de l’Essor de la Gendarmerie Nationale où je trouve – beaucoup plus bas – une réponse à ma question (je ne dis pas que c’est la bonne réponse).
En y regardant de plus près, le premier lien de la première requête dans Google donnait la même réponse, mais rien dans la liste de résultats ne me permettait de l’imaginer.

Deuxième question : à la demande d’une lectrice je cherche des infos (rapides) sur la classification coda.
Google nous envoie sur les blogs : Bibliobsession (en fait, le fil RSS de Bibliobsession) et moi-même – sympa mais pas très utile. Il va aussi chercher une notice dans le répertoire du CCfr.
En premier résultat, Yahoo m’envoie sur un lien bizarre sans titre, mais un peu plus bas je trouve un court texte qui explique la classification coda et son application dans une bibliothèque parisienne.

Moralité :

  • les opérateurs booléens ne servent à rien, il vaut mieux additionner les mots pertinents que d’essayer de retrancher ceux qui ne le sont pas
  • il ne faut pas tenir compte de la présentation des résultats, et relancer la requête dans la page trouvée
  • yahoo propose une vision du monde très différente de celle de Google. Mais pas moins pertinente.

Et vous, vous savez pourquoi le pingouin de Linux s’appelle Tux ;-) ?

Bye bye Hippo

On l’a appris il y a peu, l’hippopotame fait partie depuis cette année des espèces considérées comme menacées.

Tout cynisme mis à part, je vous invite à aller visiter la bibliothèque numérique des animaux en voie de disparition : ARKive. (ARK parce qu’est c’est l’Arche de Noé des animaux en danger – Ark en anglais).
On y trouve des tas de photos (et même parfois des films) de l’hippopotame et des autres… l’ambition de ce site étant de constituer une mémoire de ces espèces pour le jour où elles auront disparu. J’espère quand même qu’ils ont songé à la préservation de leurs fichiers numériques et de leurs métadonnées parce que sinon !

Ca me fait tout drôle de penser que ce doudou-hippo est peut-être un des derniers de son espèce, d’ailleurs lui-même après 5 ans de bon et loyaux services est bien mal en point, cette photo est peut-être une des ultimes traces numériques de son âge d’or ;-)

A visiter aussi : PlanetArkive pour les enfants.

Point haut d’été

Le format Open Document, après avoir été standardisé par OASIS l’année dernière, vient d’être accepté par l’ISO sous le doux nom de 26300. A titre de rappel, il s’agit du format de traitement de texte basé sur XML utilisé notamment par la suite Open Office.

C’est un petit pas pour la bureautique mais un grand pas pour la préservation du document numérique… Euh je peux peut-être trouver un truc plus intelligent à dire, là…

La fondation Open Document annonce également qu’elle vient de terminer le développement d’un plug-in qui va bien pour que M$Word arrive à parler Open Document. Amis de Microsoft, faites comme d’habitude : rien.

En fait ils ne font pas rien puisqu’ils travaillent à un format concurrent qui s’appelle… Office OpenXML, sans blague.

Source DCC.

Fusion

Le groupe RLG dont je parlais justement hier a annoncé aujourd’hui son intention de fusionner avec OCLC.

C’est un événement dans le monde bibliothéconomique, car ce sont les deux plus grosses organisations (à but non lucratif) internationales qui sont vraiment sur le créneau des bibliothèques en général et des technologies en bibliothèque en particulier.
Si je ne me trompe pas, OCLC agit plutôt comme prestataire de service, mais avec une grosse composante recherche et développement développant aussi des projets ouverts et libres. RLG est plutôt à caractère associatif avec une forte participation des bibliothèques membres dans les différents projets.

RLG va devenir un programme au sein de la partie R&D d’OCLC, à partir du 1er juillet, si deux tiers des membres accordent un vote favorable à cette décision. Le catalogue collectif de RLG sera versé dans WorldCat. On ne sait pas trop ce qu’il adviendra des autres projets RLG.

D’après le blog Hanging together tenu par l’équipe de RLG, eux-mêmes l’ont appris à 10h hier matin… Et on peut lire dans les commentaires de ce billet :

It feels like the library world equivalent of Apple and Microsoft merging.

Mise à jour :

Comme d’habitude j’ai l’impression de lire le fonds de ma pensée chez Dorothea. Analyse à ne pas manquer.

Changer les catalogues (suite) : l’exemple de RLG

Un bon exemple de ce que je disais l’autre jour au sujet des catalogues comme sources de données à réutiliser dans différentes interfaces, c’est le catalogue collectif de RLG. Celui-ci ne contient pas autant de notices que le catalogue collectif d’OCLC, mais surtout il est de nature différente puisqu’il regroupe, comme son nom l’indique, des collections de bibliothèques de recherche, et comme son nom ne l’indique pas, éventuellement d’autres institutions que des bibliothèques (RLG travaille beaucoup avec les archives et les musées, et inclut aussi des institutions de recherche, des marchands de livres, etc.). Tout cela représente plus de 130 millions de notices, mais beaucoup moins de titres car le principe est de ne pas dédoublonner les notices versées pour le même ouvrage par diverses institutions.

Ce catalogue collectif a plusieurs interfaces différentes :

  • une qui s’appelle Eureka, qui est une interface Web payante,
  • une qui s’appelle RLIN21 et qui est une interface de gestion destinées aux professionnels, pour créer et dériver des notices,
  • une interface Z3950 (machines uniquement, humains s’abstenir)
  • et enfin une interface publique, portant sur un sous-ensemble limité du catalogue, qui est gratuite et très particulière et porte le nom de RedLightGreen.

Bien sûr c’est cette dernière qui m’intéresse ici.

RedLightGreen s’adresse à des utilisateurs débutants, autant qu’on puisse être débutant dans un contexte universitaire / de recherche car vu la mission de RLG, il ne s’agit pas de s’adresser au grand public dans son ensemble. Comme il fallait prendre un sous-ensemble du catalogue, ils ont choisi les monographies (vous me direz, ça simplifie bien les choses, et c’est pas faux, mais c’est la vie).

Que va-t-on proposer à ces utilisateurs d’un genre particulier pour les aider à se sentir à leur aise dans un catalogue de bibliothèque ?

Tout d’abord, une recherche vraiment simple, une seule case, à la Google. La recherche avancée, à peine avancée, prévoit simplement de sélectionner un champ et de limiter par langue.

Deuxième cadeau, la pertinence. Il est trop rare que les catalogues de bibliothèque offrent un classement de pertinence sur les résultats ; or, avec une recherche simple par mots, c’est une fonctionnalité indispensable faute de quoi on est rapidement noyé sous le bruit et l’inutile.
Dans RedLightGreen, la pertinence est basée en partie sur un regroupement pseudo FRBRien des notices : cela signifie que pour une oeuvre qui a été rééditée ou traduite plusieurs fois, on ne présente qu’un seul résultat, précisant le nombre d’éditions. Ca paraît sybillin, mais c’est rare dans les catalogues. Les réflexions de Tom Hickey (OCLC) sur le ranking basé sur les FRBR sont à consulter pour aller plus loin sur cette question.
Ensuite, la pertinence repose sur le nombre de notices concernant une même oeuvre, donc le nombre de fois où l’ouvrage a été acquis et/ou catalogué par les différentes institutions participantes. Ceci n’est possible que si on a un beau catalogue collectif et que les notices ne sont pas dédoublonnées mais seulement regroupées.

Le troisième cadeau, ce sont les rebonds dans la marge de gauche.
Les rebonds "sujet" sont construits sur les vedettes matières, et eux-mêmes énéficient d’un ranking de pertinence : celles qui apparaissent sont les vedettes-matières le plus souvent attribuées aux ouvrages qui apparaissent dans la liste de résultats.
Donc non seulement on peut rebondir, mais en plus on a une visibilité sur l’indexation sujet ce qui devrait aider notre utilisateur débutant à se familiariser avec les systèmes d’indexation imbitables des bibliothèques.

Le quatrième cadeau ce sont les services.
On peut construire des requêtes sous forme de lien basé sur le titre, l’auteur ou l’ISBN. Les notices sont également adressables – on peut enregistrer leur URL et la réutiliser. Tout cela est expliqué dans la FAQ pour bibliothécaires.
Sur la page d’affichage des notices, on trouve des liens sans complexes vers Amazon et Google.
On peut créer un profil personnel (qui s’appelle tout simplement "your list") pour désigner ses bibliothèques préférées et y trouver les ouvrages, y compris si la bibliothèque en question n’alimente pas le catalogue de RLG.
Enfin on peut exporter les notices bibliographiques sous forme de référence propre à être incluse dans une bibliographie, avec différents format de citation qui semblent correspondre aux normes en vigueur dans quelques grandes universités, genre :

Mai 68.Wolinski, Cavanna, Cabu… et al. ; préf. de Cohn-Bendit. Paris: M. Lafon, 1998.

Bien sûr, cette interface n’est pas forcément suffisante pour un chercheur ou quelqu’un qui est en quête de quelque chose de précis – le public cible ordinaire de RLG. Il ne s’agit pas de l’interface unique de RLG Union Catalog, juste une interface, avec ses objectifs, et elle se donne les moyens pour les atteindre.
Moralité, c’est pas parce qu’on fait dans les catalogues de recherche et les données en dentelle qu’on doit éviter forcément de faire simple. Il faut juste savoir à qui on s’adresse, et comment.

Réflexion à compléter par les petites notes de Nicolas sur la question de l’extraction des données depuis le catalogue, et quels services construire sur cette extraction avec quels outils.

L’INA m’a bluffée

J’ai attendu quelques jours avant de me connecter à la nouvelle vidéothèque numérique de l’INA… que celui dont le site Web n’a jamais été submergé ou victime d’une défaillance technique leur jette la première pierre. Voilà, donc c’était pour dire que je ne suis pas la première à en faire la remarque, mais chapeau.

Bien sûr on peut les complimenter sur l’intérêt de leurs abondantes ressources et la pertinence de leur modèle économique, mais je voudrais aller un peu plus loin que ça et les féliciter pour leur site, pour son organisation et pour leur architecture de l’information remarquable.

Quelques leçons à prendre sur le site de l’INA.

Ce qui est chouette…

D’abord dans cette catégorie je mettrais la navigation par listes. Elle n’est pas encore à facettes – on doit suivre l’arborescence préétablie – mais pour butiner la collection c’est vraiment très bien.

Mon deuxième va aux fonctionnalités de personnalisation. D’abord j’aime beaucoup la petite barre de vignettes pour récapituler la navigation sur le site, on peut trouver cela gadget mais c’est joli. Ensuite, il y a un panier pour acheter et un espace personnel pour ranger ses vidéos préférées. Et on a même envie de s’inscrire (et pourtant ce genre d’impulsion est rare chez moi).

Mon troisième va à la visualisation des documents, avec des zones spécifiques pour les fonctions d’achat, pour les fonctions de « sociabilité » (genre envoyer à un ami, qui marche pas super bien apparemment ceci dit) et une zone de rebond sur mots-clefs bien pratique, suffisamment discrète et visible à la fois.

Enfin un petit bonus pour le formulaire de recherche, conçu intelligemment dans la façon d’affiner la requête et qui possède un tri sur pertinence. Les listes de résultats sont bien aussi.

Ce qui est moins chouette…

Après on peut toujours trouver des défauts et discuter. Le graphisme est un peu minimaliste et trop statique, la chronologie est laborieuse et donne de faux espoirs (je recherche encore la vidéo de Vanessa Paradis à 5 ans dans l’Ecole des Fans :-( toute une époque). Les textes ne sont pas très lisibles et tous ces petits ascenseurs partout, ça perturbe.

Le forum truffé de remarques désobligeantes montre bien qu’il ne suffit pas de mettre un forum avec de jolies catégories et qu’il faut susciter une communauté. Je leur souhaite d’y arriver.

Enfin leur splash screen sur le site institutionnel ressemble tellement à une pub en flash pour Ikea que je l’ignorais par réflexe et il m’a fallu 3 minutes pour trouver l’entrée du site.

Enfin bon, il y en a toujours qui vont trouver les moyens de critiquer (non je n’ai pas regardé le code source et même, je m’en fous, na) mais tout ça pour dire que depuis le Louvre j’avais pas vu de site de ressources numériques publiques aussi bluffant. Et puis c’est vrai que les petits films sont vraiment sympas à regarder.

Dragons

Hier j’ai voulu emmener ma puce voir l’exposition sur les dragons au Museum. Mais en arrivant devant la Grande Galerie de l’Evolution, nous sommes tombés sur la foule de gens qui ont eu la même idée (comme je le dis toujours, à Paris on est tellement nombreux que statistiquement, quand on a une idée, il y a forcément au moins 1000 autres personnes qui ont la même en même temps. Même si c’est une idée très originale, ce qui n’était pas le cas en l’occurence). Tous ces gens étaient manifestement prêts à attendre plus d’une heure sous une pluie battante, certains s’étant détournés vers la galerie de paléontologie et d’anatomie comparée où de fait une queue inhabituelle s’étendait également.

Je ne suis pas fan des longues attentes sous la pluie donc nous avons pour notre part laissé tomber. La bonne nouvelle quand même, c’est que l’expo a son site Web : Dragons entre science et fiction qui est vraiment très chouette. La navigation se fait en forme de jeu ; sur chaque page il y a deux à quatre dragons à trouver, et cela donne accès à un bonus, un petit jeu ou une vidéo. Je vous recommande chaudement le film "Pourquoi les dragons n’existent plus" sur la page "Totalement hybrides", elle nous a valu un sacré fou-rire. Le tout, sans pluie et sans attendre. Ajoutez à cela quelques coloriages de dragons et voilà une journée de pluie bien occupée.

C’est beau quand même le Web.

Ma table lumineuse

Pour sauvegarder des informations personnelles dans un espace numérique, on connaissait les paniers (« mettre dans le panier », un grand classique des sites qui veulent vous faire acheter quelque chose) et même parfois les caddies.

Evidemment, tout cela n’est pas très bibliothéconomique ; on a rarement vu les lecteurs parcourir les rayonnages armés d’un grand panier en osier ou d’un caddie de supermarché. Que pourrait-on inventer ? Le chariot à livres ? Le pupitre ?

A la bibliothèque numérique de l’INHA ils ont trouvé qu’il fallait que ce soit non seulement bibliothéconomique, mais encore histoire-de-l’art-esque, d’où probablement le choix du terme de "table lumineuse". Ca m’a interloquée, j’attends toujours de trouver le bouton où il y a la lumière.

Le choix du PDF pour le visualiseur, avec toutes ces fenêtres qui s’ouvrent pour un oui ou pour un non, est aussi assez décevant à mon avis – même si c’est un beau PDF avec une table de structure physique et des vignettes des pages.

A part ça il y a plein d’estampes numérisées et ça c’est chouette.

Recette de la quiche lorraine

C’est pour une urgence.

Préchauffer le four thermostat 7.
Etaler une pâte brisée et faire des trous à la fourchette. Disposer 100g de lardons, et une tranche de jambon coupée en dés.
Dans un bol, casser un oeuf, ajouter 4 grosses cuillers à soupe de crème fraîche, une poignée de gruyère rapé, mélanger.
Verser la préparation sur la pâte, ajouter encore du gruyère.
Mettre au four 20 mn.

Une quiche c’est bien pour deux et demie personnes, mais si on est quatre et demie il vaut peut-être mieux en faire deux (ou une quiche lorraine et une quiche à autre chose).
Servir avec une salade de tomates.