Le bon grain de l’ivraie

Chiche que j’aborde un sujet dont tout le monde parle : les folksonomies.

Avec les folksonomies en général, et le tagging en particulier, ce qui fait le plus peur aux bibliothécaires, c’est le problème de la qualité. Olivier Le Deuff dans son article décrit bien les problèmes que l’on rencontre en confiant à des utilisateurs inexpérimentés le soin d’indexer des documents.

Je vous suggère de voir comment Google aborde le problème. Un double problème, en fait :

  • on ne sait pas indexer des images et on n’a pas les ressources pour le faire,
  • les utilisateurs peuvent le faire mais ils sont stupides.

Comment contrôler le travail d’utilisateurs incompétents ? Il suffit de les pousser sur la pente glissante qui les entraîne vers le bas.

Pour preuve, ce nouveau service : Google image labeler.

Pour motiver sa communauté d’utilisateurs, Google présente le taguing sous forme de jeu : vous avez un partenaire tiré au hasard et un peu moins d’1 minute pour taguer un maximum d’images. Pour qu’une image soit taguée, il faut que vous et votre partenaire inconnu saisissiez le même tag. A chaque image taguée, vous gagnez 100 points.

Qu’est-ce qu’on gagne ? Rien, mais la rapidité et l’émulation rendent le jeu prenant et il est difficile de s’arrêter. Du coup, les utilisateurs vont taguer plein d’images, et avec des tags supposés plus pertinents puisque deux utilisateurs les ont choisis en même temps.

C’est très malin, mais à mon avis pas très efficace. En effet, on est plus tenté de « gagner » que d’être utile et efficace, donc au lieu de réfléchir à ce qui décrirait le mieux l’image, on essaye d’imaginer ce que le partenaire va trouver. Au final on aura plein d’images taggées « red », « people », « man », « map » ou « building ». Je ne sais pas si ça aidera beaucoup, mais Google nous le dira.

A part ça, chez Panlibus ils pensent aussi que Google abuse d’utiliser un nouveau terme, "label", alors que le monde entier dit "tag". Franchement.

Bab-el-ENSSIB

L’enssib vient de sortir un nouveau site d’édition électronique : Babel Edit. Pour l’instant on y trouve les actes d’une rencontre sur l’indexation des ressources pédagogiques numériques, mais à venir, d’après le message de biblio-fr, on y trouvera les actes d’autres journées.

Le site constitue donc un des éléments de la nouvelle "bibliothèque de l’enssib" et turbine avec Lodel (
de même que le Figo et, je viens de l’apprendre, le site de la Sorbonne).

Ce qui est bien de la part de l’enssib & co, c’est de nous montrer qu’il n’y a pas un outil magique qui répond à tous les besoins. Pour faire un blog on utilise un logiciel de blog, pour faire de l’édition électronique on utilise un logiciel d’édition électronique. Et ça marche.

Changer les catalogues

Les bibliothécaires américains semblent être en train de constater qu’il y a un vrai problème avec les catalogues de bibliothèque actuels, et un sacré besoin d’évolution. Les rapports fleurissent sur le sujet, en voici deux :

J’avoue avoir été carrément déçue par le second. J’aurais peut-être dû lire attentivement les annexes plutôt que de me contenter de parcourir les recommandations, mais globalement, ce qui est proposé me paraît assez peu novateur. Faire de la recherche fédérée, mutualiser le catalogage, mieux intégrer les ressources électroniques, je ne vois pas bien ce qu’il y a de révolutionnaire là-dedans. Enfin le rapport ne cesse de faire référence à un modèle économique abscons suivant lequel il faudrait équilibrer les dépenses liées au catalogage et la « demande » des utilisateurs pour ce « produit ».

Le premier est un peu plus ouvert vers les usagers et comporte quelques idées innovantes apparemment un peu plus appronfondies. On y trouve par exemple des réflexions sur les différents formats de métadonnées, l’extraction automatique des descriptions, la recherche plein texte et l’utilisation des FRBR. Idées qui n’était pas absentes de celui de la LoC mais qui sont ici mieux développées.

Je m’attendais à voir des recommandations sur l’annotation des notices par les lecteurs en mode wiki et la mise en places des recommandations d’ouvrage à partir de ce qu’on à déjà consulté (à la Amazon). Apparemment, ce sujet est évoqué mais pas intégré dans les propositions d’évolution ; admettons qu’il est trop tôt.

Par contre, on continue de voir le catalogue comme un outil à la fois unique et ambivalent, LE lieu où l’on produit ET consulte les notices. Il y a là un problème : comment un tel produit intégré pourrait-il s’adapter aux innombrables usages possibles qui naissent et perdurent sur le Web ? Moi je verrais bien l’évolution du catalogue vers un statut de base "pivot", contenant des données en XML qu’on pourrait réutiliser à volonté, dans des applications adaptées aux différents types d’usagers.
Celui qui veut feuilleter, parcourir, découvrir au hasard devait pouvoir le faire. Celui qui veut améliorer le catalogue, donner son avis, devrait pouvoir le faire. Celui qui a une bibliographie de son prof et doit trouver rapidement la dernière édition d’un ouvrage courant dans la bibliothèque la plus proche devrait pouvoir le faire. Celui qui utilise Google parce qu’il ne sait pas que les bibliothèques existent devrait pouvoir tomber sur nos données. Celui qui cherche un truc précis et rare, même si c’est au bout du monde, devrait pouvoir le trouver très vite. Celui qui veut dépouiller intégralement un fonds ou une partie de collection devrait pouvoir le faire. Ce ne sont que quelques exemples.
Non, il n’y a pas un « consommateur » type du catalogue unique et indivisible. Il y a des usages, multiples, différents, et aucun outil miracle ne saura tous les contenter. Il faut des données fiables et souples, qu’on peut sortir, transformer, adapter, réutiliser. Pour moi c’est ça le futur du catalogue.

(Je me suis emportée, là, mais j’ai encore plein d’idées que je mettrai dans d’autres billets. Et vous ?)

Bureautique en ligne

Si vous ne lisez ni outils froids, ni Fred Cavazza, vous avez pu passer à côté de deux outils qui pourtant valent le détour : Thumbstacks et Writely.

Le premier est un outil qui permet de créer des diaporamas entièrement en ligne. Le résultat est franchement impressionnant au regard de la simplicité de l’outil. Sa seule faiblesse c’est qu’il faut avoir un outil de manipulation d’images à côté, mais sinon c’est vraiment léger et propre.

Le second permet d’importer un fichier depuis un traitement de texte, de le travailler, si besoin de manière collaborative, et de le réexporter soit en HTML, soit en PDF, soit de nouveau dans un format de type traitement de texte. C’est aussi très ergonomique et convaincant.

Pour l’instant je pense qu’il est compliqué de faire entrer ce genre d’outils vraiment dans les pratiques quotidiennes ; mais pour des gens qui comme moi passent sans cesse d’un ordinateur à un autre, cela a peut-être un sens.

Vidéoconférence

Totem Consult signale ce dossier du Journal du Net euh du Management enfin c’est pareil, sur les réunions virtuelles. On y trouve un tour d’horizon des différentes méthodes pour organiser des vidéoconférences, y compris à travers le Web.

Mais il ne présente que des solutions logicielles assez coûteuses alors que je sais qu’il en existe des plus ouvertes, comme Access Grid, un projet de l’Argonne National Laboratory.

Ce logiciel utilise un système de grid pour permettre de partager des vidéos et des flux audio, mais aussi des applications comme un navigateur web partagé, un diaporama partagé…

Access Grid est vraiment très complet, il ferait presque le café à la pause… en tout cas ça doit être vraiment super si on réussit à le faire marcher. Le problème étant de réussir à le faire marcher, justement. Alors si quelqu’un qui aurait utilisé ce logiciel passe dans le coin, qu’il n’hésite surtout pas à me faire partager ses lumières, cela me rendrait grandement service…

Gérer l’épuisement avec Gantt

Parfois, l’épuisement accumulé finit par dépasser l’entendement, et à l’heure où d’habitude je me retrouve jovialement devant mon pc pour bloguer, je sens que toute énergie m’a quitté. Ces deux dernières semaines, j’ai eu pléthore de ces moments, où l’envie d’écrire, dévorante, vitale, le disputait à une fatigue irrationnelle qui semblait empêcher mes neurones de se connecter entre eux pour fonctionner normalement.

Dans ce genre de moments, je me réfugie dans des tâches primitives, comme par exemple réaliser un diagramme de Gantt avec Excel. Alors je vous recommande chaudement ce tutoriel, qui marche très bien, même si, pour un cerveau fatigué et peu efficace, certaines de ces infos en anglais restent résolument opaques (par exemple j’ai jamais réussi à afficher les bonnes dates sur l’axe horizontal).

Si vous êtes un vrai geek, ce tutoriel ne vous sera d’aucune utilité et vous auriez plutôt intérêt à consulter celui-là qui donne la démarche à suivre avec Open Office, et en plus il est en français.

Au terme de cette enrichissante expérience avec les diagrammes de Gantt, j’ai réussi à planifier six mois d’activité intense et à meubler une demi-journée d’épuisement. Comme quoi, les diagrammes de Gantt, c’est vraiment utile.

Merci au del.icio.us d’Outils Froids.

Coins coins

Allez, ce soir je parle des petits canards.
Nan, sérieux.
Ce soir, je parle des Context Objects in Span (COinS).

Ces choses consistent à mettre dans des pages HTML des liens encodés suivant la norme OpenURL. A quoi ça sert, me direz-vous ? Bon, je vais faire un exemple.

Imaginons que j’aie lu un bouquin nommé Dawle Duckling de Toni Buzzeo et Margaret Spengler et que je veuille en parler sur mon blog. Pour compléter mon billet et faire une référence complète, et interprétable par des machines, le mieux est d’encoder un lien openURL que les gens pourrons brancher sur un outil de leur choix pour en faire un lien utile à leurs yeux.

Le mode d’emploi est le suivant :

  • Je vais sur le générateur de Coins et je remplis les métadonnées dans le formulaire.
  • ledit générateur transforme automatiquement les infos en un bout de code contenant un lien Coin OpenURL, que je colle dans mon blog.
  • comme il est sympa, Coin me donne aussi à titre d’exemple le lien Amazon
  • vous allez sur le site des extensions de Coin et vous récupérez le bookmarklet "Find in a library"
  • vous allez sur mon blog et cliquez sur le bookmarklet pour transformer le Coin en lien « Find in a library »
  • vous cliquez sur le lien et tombez sur la notice dans OpenWorldCat.

Voilà, maintenant si vous êtes un peu geek, vous développez un bookmarklet pour le résolveur OpenURL de votre bibliothèque, et ça vous permet de rechercher les références quand vous tombez sur un Coin.

Des infos chez Lorcan Dempsey et des applications chez David Bigwood

Et un petit exemple de Coin coin-coin :


Dawdle Duckling

Pratique

Vous l’avez peut-être remarqué, je ne suis pas très en forme cette semaine donc excusez-moi si les billets sont courts et mélangés.

Aujourd’hui, quelques trucs pratiques…

Le premier c’est une page de personnalisation de fil RSS pour obtenir les nouveautés de sa bibliothèque. On peut choisir par classe de la Dewey ou une autre classification plus générale, et on choisit les critères de tri des résultats ainsi que la fréquence d’actualisation.

Le second c’est Lookleap, un outil qui sert à générer des URL raccourcies pour citer une ressource. Il permet aussi d’annoter des pages Web et d’envoyer des mails préformattés avec un lien. Enfin, si on lui donne à manger un PDF, il en propose une version "cache" très propre en HTML. Un peu comme la transformation du PDF proposée par Google, mais en propre. C’est spécial pour les gens qui haïssent le PDF.

Le dernier est un manuel de numérisation édité électroniquement et accessible librement en ligne. L’ouvrage date de 2005 et on peut l’acheter 30$ sur Amazon (pour les gens qui arrivent pas à lire sur écran ;-) mais il faudra attendre le 30 novembre !

Où trouver des bibliothèques numériques ?

Faire un tour d’horizon des initiatives de numérisation dans le monde peut sembler au premier abord une tâche titanesque, tant elles sont nombreuses, diverses et dispersées. En réalité, on peut se féliciter du fait que des tas de gens ont déjà fait la liste des bibliothèques numériques existantes…

On trouve une liste de projets de bibliothèques numériques sur wikipedia : évidemment comme tout ce qui figure dans cette encyclopédie, il se peut que cela n’apparaisse pas comme parfait dans le détail mais alors il suffit d’ajouter sa propre contribution.

Notre ami germanique du blog NetBib a lui aussi fait une liste qui est extraordinaire de richesse, de détail et de pertinence. Chaque bibliothèque numérique est reliée à l’entrée correspondante dans le blog quand elle existe, ce qui devrait réjouir les gens qui ont la chance de pratiquer l’allemand.

Au Canada, la British Columbia International Digital Library propose aussi de répertorier des bibliothèques numériques, en mettant l’accent sur celles qui sont en mode texte. On trouve des bibliothèques numériques classées par nom, par sujet ou encore par lieu, une bibliographie et une liste de portails et de répertoires.

J’avais déjà mentionné en "brève" ce billet d’Archivalia qui donne aussi quelques pistes mais pour trouver directement des livres.

Et puis maintenant, on en trouve aussi plein dans mon delicious, et je n’en ai pas encore fini. D’ailleurs, pour les gens qui en ont adopté le fil RSS, j’espère que vous me pardonnez cette avalanche de références que je n’ai pas toujours le temps de commenter, il n’y en a plus pour longtemps ;-)

On se remet au boulot

Voilà, je suis partie presque 4 semaines, c’est long, et pendant ce temps la bibliothéconomie a continué d’avancer… Je vous propose un petit rattrappage des événements bibliothéconomiques depuis la fin juillet.

17 juillet : OCLC annonce la mise à disposition d’un résolveur OpenURL gratuit. Un mois plus tard, CrossRef en fait autant.

24 juillet : annoncé sur 10kyBlog, est créé un calendrier international des conférences en sciences de l’information – il est pour l’instant complètement vide.

27 juillet : l’IFLA propose un brouillon des FRAR (Functionnal Requirements for Authority Records), l’équivalent des FRBR mais pour les notices d’autorité. A réviser pour le 28 octobre.

29 juillet : OCLC sort le DeweyBrowser, une interface jolie pour parcourir une collection d’e-books classés en Dewey. Un peu gadget mais ya de l’idée.

2 août : sur le FRBR blog , on s’intéresse à l’expression des FRBR en RDF avec deux textes de référence : un pour les core concepts et un autre pour les extended concepts.

3 août : Juriblog annonce dans le nouveau numéro d’Archimag un article sur la blogosphère et son impact dans le monde de la documentation (pas encore lu).

3 août : première publication par le JISC d’un premier bout du Digital Curation Manual, consacré à l’open source.

Août (sans date précise) : plusieurs sources évoquent la création de ColLib, un wiki destiné à organiser l’information en libre accès dans le domaine des sciences de l’info, notamment en permettant l’étiquetage (ou tagging) de notices OAI.

10 août : nos amis de Catalogablog lancent un bookmark partagé qui récapitule les "MARC Tools", outils disponibles pour manipuler le format MARC.

11 août : nos amis de Google annoncent une pause dans le programme Google print, destinée à permettre jusqu’en novembre aux détenteurs de droits de se faire connaître s’ils ne souhaitent pas que leurs ouvrages soient scannés par le "library project". Cette pause est présentée comme une nouvelle fonctionnalité du programme ("new feature"), comme c’est mignon.

17 août : la Library of Congress lance un nouveau site d’étude sur le Copyright, avec pour objectif de faire reconnaître légalement les exceptions propres aux bibliothèques.

Je pense avoir fait à peu près le tour. Mes sources sont les mêmes que d’habitude, excusez la flemme de tout récapituler. La photo vient de la cathédrale d’Auch.