Vent printanier

Des fois j’ai un besoin quasi maladif de changement et l’hiver fait partie de ces moments là. En particulier le mois de février.

J’ai essayé plusieurs trucs comme changer d’agrégateur RSS, mais je viens de renoncer parce que vraiment, Bloglines c’est trop bien. C’est comme ça : parfois, il n’y a rien à changer.

Alors j’ai décidé de me rabattre sur la feuille de style du Figoblog.
Quelques ressources que je n’ai pas utilisé :

  • Web design from scratch : un super site qui explique sur quoi est basé le design d’aujourd’hui. Mais personnellement, je suis résolument Web 1.0. Vu chez Ergopole.
  • Background maker : le top des outils pour fabriquer des fonds colorés qui font vraiment trop, trop Web 1.0 pour le coup. Ca m’a amusé mais j’ai pas réussi à intégrer ça. Vu chez Romuald.
  • Les bonnes idées de Yahoo pour faire des sites très Web 2.0, vu chez Fred Cavazza.

Donc voilà, le Figodesign nouveau est arrivé, et c’est pas la peine de vous plaindre que c’était mieux avant, plus joli, plus équilibré ou quoi que ce soit. Des fois, il faut que ça change, un point c’est tout… et ça changera encore.

Vous grokkez ?

Grokker est un outil de visualisation qui utilise Yahoo (et quelques autres sources) pour proposer une façon alternative de naviguer dans des résultats de recherche.

Ce qui est intéressant, c’est qu’on a une approche originale de la recherche d’information : sur une requête, l’outil propose différents points de vues, différentes façons d’aborder le mot recherché. Pour prendre un exemple, si on cherche des informations sur Paris, au lieu de bêtement trier les pages où le mot "Paris" apparaît le plus volontiers, il fait des recoupements et propose des liens commerciaux, des hôtels, des bulletins météo, des ressources sur la Tour Effeil, sur l’histoire de Paris, etc. On peut ensuite zoomer sur cette carte d’informations, explorer de plus près l’un des aspects, et aller jusqu’à une vignette et un descriptif des sites recensés.
Comparé à un moteur traditionnel, textuel, on va donc passer beaucoup plus de temps à explorer les résultats, et beaucoup moins à cliquer sur les sites pour voir ce qu’il y a dedans.
Gain de temps ? Cela reste à voir, notamment en fonction de la pertinence du terme recherché et de celle des outils qui vont proposer les rapprochements d’idées.

Pour évaluer l’intérêt d’avoir ces différents points de vue sur l’information, vous pouvez jouer avec le "grokker puzzle" et essayer de deviner la requête à partir des résultats de la recherche… (accès par le petit menu en bas de cette page)

Deux autres outils sympas pour montrer l’intérêt de la visualisation pour la recherche, ou plutôt, l’appréhension de certains types d’information :

  • Newsmap pour les actualités
  • Gnod pour la musique et les bouquins.

Et enfin un article, à l’usage des bibliothécaires, qui fait le point sur ce sujet dans Library Journal.

De la bouteille de Klein aux extra-terrestres

Il y a quelques temps, j’ai découvert la 4e dimension : celle de la bouteille de Klein. Je précise que j’étais arrivée là via le noeud de Moebius d’Olivier. Pour paraphraser l’article de Wikipedia, il s’agit d’imaginer un mouvement de la surface qui serait impossible dans notre dimension, lui permettant de s’interpénétrer elle-même.

Poursuivant ma quête de la 4e dimension, j’ai atterri sur des sites scientifiques qui m’ont révélé une nouvelle dimension des interfaces de bibliothèques numériques… D’abord ici où vous pouvez manipuler la bouteille de Klein avec la souris, puis … Ce deuxième site présente des modèles de cinématique, c’est-à-dire des machines qui sont faites juste pour fonctionner. On peut, pour certaines, les voir à l’oeuvre et même les manipuler avec la souris, aussi.

Dans le genre original, vous pouvez aussi visiter une bibliothèque numérique un peu particulière, consacrée aux cynlindres enregistrés, les premiers supports sonores du siècles dernier. On peut les écouter et les copier (oui, ils sont dans le domaine public, et le site lui-même est en Creative Commons).

N’oubliez pas, pour terminer cette promenade scientifico-étrange, de changer votre logiciel de grid si vous participez au SETI project : ce projet de recherche d’une intelligence extra-terrestre entre dans une nouvelle phase.

Visualiser des documents numériques

Ces derniers temps, on m’a demandé à plusieurs reprises de réfléchir à des maquettes de visualisation de documents numériques et j’ai aussi eu l’occasion de donner mon avis sur celle (entre autres) de l’OCA, Open library. Alors je crois qu’il faut que je m’explique sur ce concept d‘exemple inquiétant d’un phénomène de résistance des mentalités à la technologie qui n’est sans doute que transitoire – même si Got fait ça déjà si bien dans son Du livre électronique au wiki, que tout le monde a déjà cité mais qu’importe, un peu de pub, ça fait pas de mal.

Donc première chose, un visualiseur se conçoit de manière générique. A moins que la politique documentaire de votre projet de numérisation soit de sélectionner uniquement les in-8° imprimés en Times corps 12, il faut prévoir que vous allez devoir potentiellement donner accès à des trucs aussi affreusement divers que de des journaux (en colonnes et en très petits caractères sur des très grandes feuilles), des manuscrits et des livres anciens (en couleur pour que ce soit joli, et en détail pour que ce soit utilisable), des dictionnaires (écrits tout petit sur du papier tout fin), toutes sortes de feuillets dépliants de tableaux et autres trucs de taille non conventionnelle cachés entre deux pages, et pourquoi pas des photos, des estampes, des objets en 3D et même, horreur suprême, des plans qu’on ne peut pas lire si on ne peut pas les retourner à 180°.
Donc un bon visualiseur doit être capable de zoomer, de retourner l’image, de s’adapter à la taille du document pour la lecture à l’écran et pour l’impression : c’est un minimum, on peut faire toutes ces choses avec un livre.
Vous pouvez toujours contourner le problème en proposant une interface de consultation dédiée pour chaque type de document. C’est le modèle anglosaxon, à découvrir aux USA, en Angleterre ou encore en Ecosse.

Deuxièmement, un visualiseur doit être capable de gérer ce qu’on peut appeler le paratexte, et les métadonnées. Ce paratexte, c’est notamment la pagination de l’ouvrage, sa table des matières, sa notice… C’est plutôt pas mal dans la Bibliothèque virtuelle des humanistes.
Cela impose aussi d’être capable de gérer différentes versions d’un même document et là, ça se complique. Si le document est indexé en plein texte, cela veut dire qu’on en a une version textuelle. De plus en plus, on propose une version textuelle imparfaite, obtenue automatiquement par OCR, et "cachée" virtuellement derrière l’image, ce qui signifie qu’on enregistre toutes les coordonnées des mots sur la page pour être capable de savoir précisément sur quelle page et à quel endroit de la page se trouve un mot. C’est ce qui permet de souligner joliment (enfin chacun ses goûts) en jaune l’occurence trouvée, ou de placer un petit post-it entre les pages virtuelles de notre livre numérique.
Dans ce cas-là, on peut faire de la recherche plein-texte, mais on ne bénéficie pas de toutes les choses merveilleuses qu’on pourrait faire si on avait accès à cette version textuelle : la copier pour pouvoir la transcrire plus rapidement, jeter un oeil pour évaluer la pertinence de l’OCR et donc le risque de "silence" sur sa requête… On voit ça correctement mis en oeuvre dans Persée.
Si on a une version textuelle corrigée du texte en plus de l’image, une véritable numérisation en mode texte, ça se complique encore plus. Il faut imaginer les outils qui permettent de passer en souplesse d’une version à l’autre, suivant les besoins. Pour voir ce que ça donne quand c’est bien fait, rendez-vous sur les Cartulaires numérisés d’Ile de France.
Je ne parlerai même pas de la question de la visualisation d’une numérisation uniquement en mode texte, il y aurait trop à dire.

Enfin, en vrac (ou en confiture ;-) parmi les choses auxquelles il faut penser :

  • une référence simple et efficace, c’est à dire de belles URL propres, si possible sur chaque page du document numérisé
  • la gestion des documents multiples, les périodiques par exemple ; réfléchir comment on va passer d’un numéro au suivant
  • les possibilités d’impression et de téléchargement d’une page, de plusieurs pages
  • les outils d’aperçus ou de feuilletage, comme les vignettes ou les mosaïques
  • les documents complexes, qui mélangent de l’image et du son, ou du son et du texte, ou autre chose
  • l’accessibilité pour les personnes handicapées
  • etc.

Je ne parlerai pas non plus du problème de l’accès aux documents qui est en amont de la visualisation proprement dite, mais il y aurait beaucoup à dire.

Pour finir sur cette question essentielle de savoir ce qui me chiffonne dans les interfaces qui "imitent" le livre, comme Open library, c’est que d’emblée elles rejettent la spécificité du média numérique.
Le tourne-page, la visualisation en double page, les petits post-its et autres gadgets sont en fait très rassurant pour des gens qui sont peu familiarisés avec Internet, ce qui est le cas de la plupart des décideurs qui tiennent les cordons de la bourse. Mais en proposant une telle interface, on se prive des possibilités ouvertes par le nouveau média pour manipuler le document. On se prive également des possibilités ouvertes par l’ancien média, puisqu’en essayant de copier ce qui était performant sur le papier, on perd de la qualité et de la lisibilité sur l’écran.
Il ne nous reste plus qu’à télécharger l’ouvrage entier en PDF ce qui, à mes yeux, est certes une fonctionnalité indispensable mais aussi un constat d’échec sur l’appropriation du numérique.

Je ne suis pas résolument opposée à l’interface que propose Open library. Je trouve juste qu’elle met de manière excessive l’accent sur des fonctionnalités qui ne sont finalement que "jolies", aux dépends de ce qu’elle pourrait proposer d’efficace, de pertinent et de pratique. Mais je suis consciente que c’est peut-être moi qui ai tort.

Je vous recommande tout de même la lecture de deux articles sympathiques en relation plus ou moins avec ce sujet :

Vers des contenus participatifs ?

J’ai été interpellée par ce billet sur ResourceShelf qui évoquait cette annonce d’Internet Archive.

Un événement se produit et pour garder le plus possible de souvenirs de cet événement, on met tout le monde à contribution, tous les volontaires. A la fois pour faire de la politique documentaire – repérer les ressources pertinentes – et pour mettre en oeuvre la collecte elle-même.

Cette démarche est tout à fait dans l’esprit du Web, elle me fait assez penser à Wikipedia.
(Au passage, merci à Tristan pour m’avoir fait découvrir Uncyclopedia, une anti-encyclopédie-wiki qui ne véhicule que de l’information partiale, inutile et drôle – on remarquera que même une initiative de ce genre ne peut se passer de règles du jeu et d’une forme de contrôle par la communauté.)

Les bibliothèques ne pourront pas éternellement faire l’économie de ce genre de démarche participative dès lors qu’elles touchent au domaine du numérique. Les usagers familiers du Web ne comprendront (ne comprennent déjà ?) pas pourquoi un éditeur privé comme Amazon ou des fondations comme Internet Archive les invitent à participer à l’élaboration (ou à l’évaluation) des contenus, alors que les institutions du service public s’y refusent.

Il faudra donc trouver des solutions pour permettre aux lecteurs d’ajouter leur grain de sel dans l’information, sans pour autant mettre en danger la validation de celle-ci. Des systèmes de validation a posteriori sont possibles, les Archives des Yvelines en ont monté un très sympathique consultable ici. N’hésitez pas à demander un mot de passe et à tester les annotations, c’est gratuit et instantané.
Le principe est de permettre aux utilisateurs qui sont en train de consulter les archives de proposer une transcription, celle-ci étant fortement cadrée par les champs prédéfinis par les archivistes. On a ainsi un usage très contrôlé de l’annotation, qui devrait satisfaire à la fois les utilisateurs et les archivistes puisque la marge d’erreur (ou de loufoquerie) est assez faible.

Reste à savoir si les lecteurs marcheront dans la combine, ce qui revient à se demander si les bibliothèques sauront susciter une communauté d’utilisateurs désireux de construire ensemble quelque chose de meilleur. Ces communautés existent sur le Web, elles existent autour d’outils comme Wikipedia et elles existent dans les archives surtout avec les généalogistes. J’ai plus de doutes pour les bibliothèques.

Catalogue is not dead

Le nouveau BBF vient de sortir avec pour titre alléchant : "Mort et transfiguration des catalogues".

Je n’ai pas encore eu le temps de le lire, évidemment, et je ne l’aurai pas non plus ce week-end, hélas. Mais je pense que ce sera un grand moment. Au programme : la visualisation, le XML, les classifications, la recherche fédérée, le renseignement à distance, Google scholar, et même le livre ancien. Je m’en pâme d’avance.

J’en profite pour glisser au passage quelques liens thématiques…

Sur Urfist Info est signalée une initative de Thomson Gale pour offrir l’accès (ou plutôt, la recherche) aux revues qu’on peut lire dans les bibliothèques. Le portail, AccessMyLibrary, vous donne les références de l’article en vous précisant poliment : Read the rest of this article for free courtesy of your local library. Charming.

Kesako nous renvoie quand à lui vers une bibliothèque virtuelle privée, en fait des agrégats de blogs et d’autres ressources classées par thèmes, dont l’organisateur n’est autre que Marcus Zillman en personne. Je vois pas trop le rapport avec le sujet, ceci dit. Est-ce qu’en collant tout plein de blogs ensemble et en les classant par thèmes, on génère une bibliothèque (même privée) ? Le doute m’étreint.

Chez Karl on découvre un programme qui permet de gérer sa bibliothèque personnelle, lecteur de codes à barres intégré dans la webcam. C’est délire mais ça ne vaut pas une bonne classification Dewey dans son salon (en plus il faut être sous Mac).

Enfin du côté de chez Catalogablog on découvre CAT-OAI, un opac basé entièrement sur un entrepôt OAI. En fait le but est d’intégrer des entrepôts OAI dans un opac. A regarder de plus près.

Je vous souhaite un bon week-end, occupez-vous bien, lisez le BBF, cataloguez votre bibliothèque personnelle, intégrez-y des notices en OAI et des blogs, classez-la en Dewey, et je vous retrouve lundi pour de nouvelles aventures bibliothéconomiques.

Enfin un wiki bibliothéconomique

Les wikis, on commence à savoir ce que c’est, et parfois même à leur reconnaître un certain sérieux (quoique controversé) : cf l’expérience wikipedia qu’on ne présente plus.

Mais bon, nous, dans les bibliothèques, nous sommes des gens sérieux. Déjà, les blogs, on avait un peu de mal, mais alors les wikis : mon dieu, quelle horreur, des informations non validées et incontrôlables.

Et pourtant… C’est d’une logique presque évidente. Les gens utilisent les catalogues. Les gens font un certain travail en plus (non le catalogage n’est pas une fin en soi…). En plus les gens lisent les livres (contrairement aux bibliothécaires).Donc, ça serait quand même bien de laisser les gens s’exprimer, entre eux, surtout qu’ils n’attendent que ça. Sans intervenir, sans valider, juste leur donner la possibilité de le faire. Et pas avec des interfaces d’annotation collaborative gaz à tous les étages, juste avec un espace Web modifiable simplement et facilement. Un wiki, quoi.

J’ai envie de sabrer le champagne en lisant qu’un des très sérieux acteurs internationaux des bibliothèques, OCLC, se lance dans l’aventure wiki. L’idée: permettre aux utilisateurs de Worldcat, où qu’ils se trouvent, de faire des commentaires, ajouts, notes de lectures etc. en wiki et de les relier aux notices du métacatalogue. Il est même question de mettre du FRBR dans la sauce. Pour cela ils développent un logiciel : MetaWiki.

On en apprend plus sur le blog de Thom Hickey lui-même membre d’OCLC.

Alors, maintenant ça devient sérieux cette idée de wiki ?

Pêle-mêle dans les cartons, 2

Toujours en plein déménagement, toujours dans les cartons. Voici ce que j’ai relevé d’intéressant dans mon aggrégateur ventru et débordant :

  • le 2005 special 301 report fait le point sur l’efficacité des droits de propriété intellectuelle dans 90 pays.
  • OAI une interview de la directrice d’OAIster et un témoignage sur la génération de métadonnées en Dublin Core avec un outil nommé My META Maker
  • un article dans Ariadne qui compare trois systèmes de gestion d’entrepôts de documents numériques : LOCKSS, EPrints et DSpace
  • des ressources sur la typographie et l’écriture sur le Web : ici et . J’ai bien apprécié ce site.
  • Dans le dernier Journal de l’IFLA il y a un article sur "Copyright Protection as Access Barrier for People who read differently" (p.52).

Bonne lecture et à dans quelques jours.

Pêle-mêle dans les cartons

Comme vous avez pu le remarquer, je ne suis pas très disponible en ce moment : c’est les vacances, je déménage, dans mon nouvel appartement je n’ai qu’une connexion RTC… et en plus mon hébergeur a des soucis avec ses bases MySQL. Bref, je fais de mon mieux, mais on a l’impression que je délaisse un peu le Figoblog ces derniers temps. Et c’est pas faux.

Sur le principe du carton dans lequel on fourre pêle-mêle, dans l’urgence, tout ce qu’on veut emporter en se disant qu’on fera le tri plus tard, voici donc ce que je peux vous proposer :

  • naissance de Digital Medievalist, une revue d’histoire médiévale en open access (le pendant anglo-saxon de notre médiéviste et l’ordinateur je présume)
  • la TEI a maintenant son wiki, un cadre collaboratif pour annoncer, travailler, partager ses feuilles de styles… un peu vide pour l’instant mais qui sait
  • une webographie sur la couleur pour bien assortir son site Web, à compléter chez les z’ed et chez Lithium. (Pour l’heure c’est plutôt les couleurs de mon salon qui me préoccupent, mais ça peut peut-être marcher aussi ;-)

Je recommande aussi la lecture d’un article sur le rôle des DRM dans l’open access : vous savez, les DRM, ces affreux trucs qui empêchent de faire ce qu’on veut avec les documents. Alors, peuvent-ils avoir une utilité pour le libre accès ? Aussi étrange que ça puisse paraître, la réponse est bien sûr : oui ! Car gérer automatiquement des droits d’accès, ce n’est pas seulement prendre des mesures de protection techniques commerciales. Cela peut aussi être encoder en RDF une licence Creative Commons qui permet de dire aux machines du monde entier qu’on garantit le libre accès à ce qu’on écrit. Et par exemple, de rechercher ces contenus libres avec Yahoo.

Merci à Peter Scott et à Peter Suber. Durée estimée des cartons pêle-mêle : au moins jusqu’à la fin des vacances scolaires…

Ordinateurs et bibliothèques

Les présentations de la conférence Computers in Libraries 2005 sont en ligne.

Il y en a un peu pour tous les goûts, je note par exemple :

  • le design d’interfaces pour la recherche fédérée
  • les blogs collaboratifs (retour d’expérience de LISnews)
  • les moteurs de recherche
  • les bibliothèques et la gestion de contenu
  • OpenURL
  • la visualisation de données
  • Google et le contrôle de l’information (sympa celui-là, dommage qu’il ne mentionne pas les extra-terrestres
  • XML et XSLT
  • l’OAI

Bon j’arrête. Si j’étais sympa j’aurais mis à chaque fois le lien vers les présentations mais bon, mettre des liens vers tous ces fichiers powerpoint, beuah.

Cela vaut le détour en tout cas.