Ithaca

Hier a été une journée particulièrement longue – oui, quand on voyage dans ce sens de la planète, ça rallonge vachement – et aujourd’hui c’était ma journée de relâche. J’en ai donc profité pour visiter une partie d’Ithaca.

Ithaca, on s’en rend compte dès qu’on arrive dans son petit aéroport familial, est une toute petite ville avec un très gros campus, celui de Cornell. Le tout se situe au bord d’un immense lac, Cayuga Lake, et il y a de belles chutes d’eau et des grands parcs un peu partout dans la région. C’est la région des "lacs des doigts", il suffit de regarder la carte pour comprendre pourquoi ils portent ce nom. C’est la première fois que je vais vraiment aux Etats-Unis et ça ressemble à ce que j’imaginais, en tout cas à une certaine vision qu’on nous en donne en particulier à la télé et dans certains films.

Ithaca falls

Le campus de Cornell est magnifique. N’ayant jamais vu d’autres campus américains, je ne peux pas comparer, mais par rapport à tous les endroits glauques que j’ai pu voir appeler « campus » dans ma vie, il n’y a même pas de comparaison. Il s’étale grassement sur une hauteur de la ville, avec des grandes pelouses et des immenses bâtiments d’un peu tous les styles (mais il y en a quand même beaucoup dans le style médiévalisant-flamboyant, je ne sais pas comment on dit) qui alternent avec des petits pavillons coquets. Il y a plein d’écureuils partout, il paraît que c’est un peu l’équivalent de nos pigeons donc eux doivent trouver cela dégueulasse, mais pour ma part, en bonne européenne, je les ai trouvés plutôt mignons. Le campus est traversé au Nord par un espèce de grand ravin au fond duquel coule une rivière qui tombe en cascade vers la ville. On peu aller au pied de la cascade, c’est très joli.

Campus de Cornell

La ville quand à elle, c’est un petit centre qui ressemble à n’importe quel petit centre ville de province de chez nous (sauf que ici tout est ouvert le dimanche). Quand on vient du campus on emprunte des rues très calmes et toutes droites avec des pavillons en bois clair, tous différents mais tous un peu pareils, et ils ont des écureuils qui courent dans le jardin, des citrouilles sous l’auvent et parfois un drapeau américain accroché contre la porte d’entrée. Toutes ces maisons silencieuses, avec le soleil et le chant des grillons (ou je ne sais quels insectes suspects du Nouveau Monde), ça avait un côté à la fois calme et inquiétant – mais j’ai peut-être trop regardé Virgin suicides. Je ne saurais pas vous dire si je suis tombée par chance sur la rue la plus typique du coin, où si tout est comme cela, mais c’était une expérience.

J’ai arrêté là mes explorations, parce qu’il fallait aussi que je récupère du décalage horaire. Mais si un jour je devais revenir par ici, j’essayerais de bénéficier d’une voiture pour aller un peu plus loin, par exemple aux chutes de Taughannock.

Malheureusement je ne peux pas vous mettre de photos pour l’instant, ayant oublié un de mes éléments essentiels de la panoplie du parfait geek en voyage, mais je les rajouterai en rentrant.

Encore en vadrouille

IPRES est une des grandes conférences internationales annuelles dans le domaine de la préservation du numérique. Elle a lieu cette année à Cornell University, Ithaca, les 9 et 10 octobre 2006… la semaine prochaine quoi.

C’est plus loin que Göttingen mais j’ai quand même la chance d’y aller ! Je vous ferai des comptes-rendus réguliers si j’ai le temps.

Bienvenue à Cornell

Mise à jour :

Juste avant de commencer à bloguer le contenu de la conférence, je voudrais préciser quelques points. Il n’y a rien de pire que de bloguer une conférence en balançant ses notes en ligne directement, c’est indigeste au possible. Donc comme je suis sympa je vais faire des synthèses, et un seul billet par session. J’essayerai de les faire dans l’ordre et au fur et à mesure, mais il faudra être patient. En outre je ne synthétiserai que ce qui m’a intéressé (désolée pour les autres).

Par ailleurs, les présentations sont en anglais et je synthétise en français, donc je suis désolée si je prends quelques libertés avec les contenus originaux. De la même façon je n’hésiterai pas à donner mon avis, sinon ça sert à quoi d’avoir un blog, franchement.

Pérenniser le document numérique

C’est le premier bouquin en français entièrement consacré à ce sujet :

Pérenniser le document numérique. Séminaire INRIA, 2-6 octobre 2006, Amboise. Ouvrage coordonné par Lisette Calderan, Bernard Hidoine et Jacques Millet. ADBS, 2006.

Epigraphie

Back to the future

J’en ai à peine cru mes yeux en lisant cet article dans Dlib : Repository Librarian and the Next Crusade – The Search for a Common Standard for Digital Repository Metadata. Ecrit par des gens du LANL, il défend une théorie époustouflante : MARCXML serait le meilleur format de métadonnées possible pour des entrepôts numériques…

C’est très étonnant car comme ils le disent eux mêmes :

Au début, MARC et MARCXML étaient perçus comme trop bibliocentriques et trop rigides. L’équipe était également préoccupée par la viabilité et le manque de popularité de ce format dans la communauté. (…) Le grand nombre de combinaisons d’étiquettes/indicateurs/sous-champs pouvaient suggérer que la complexité de ce standard serait problématique.

Ensuite ils mettent leur priorité sur 3 fonctionnalités du format : granularité, transparence, extensibilité. Là encore, on se sent assez loin de MARC et même de MARCXML. Mais c’est là que l’effet pervers des tableaux de comparaison de fonctionnalités fait son office et montre qu’on peut leur faire dire tout ce que l’on veut.

En comparant MARCXML à ONIX et PRISM (rapidement écartés) et également Dublin Core et MODS, en se limitant à des métadonnées descriptives et aux sujets les plus complexes, on réussit à "prouver" que MARCXML est meilleur que tous ses petits copains.

D’où la conclusion :

Utilisé dans le monde entier et supporté par de nombreux outils, MARC est omniprésent dans la communauté des bibliothèques (…)

Et d’autres vérités du même acabit. Nous voici en plein retour vers le futur : le format de métadonnées le plus prometteur pour l’avenir serait un format particulièrement vieilli, compliqué, rigide, non lisible par des humains (sauf s’ils ont suivi des cours de bibliothéconomie auquel cas on peut se demander s’ils sont vraiment toujours humains ;-) et limité à la communauté des bibliothèques. Et extensible pourvu qu’on tolère d’en arriver à ça :

 administration metadata

Cela me fait hurler… Amis spécialistes de XML, du Web sémantique et des métadonnées, je vous en prie, dîtes-moi ce que vous en pensez : serais-je déjà encore en retard (ou en avance) sur mon temps ?

Retour

Me voici de retour !

Comme je n’ai pas l’intention de raconter ici mes vacances en Grèce, je vous recommande si jamais cela vous intéresse d’aller lire nos réflexions intelligentes sur les petites cases.

Ensuite vous pourrez subir l’inévitable diaporama des vacances, qui commence ici :

Arrivée à l'Acropole

et se trouve également . Enfin quand même cela pourrait être notable de remarquer que j’ai bel et bien cueilli des figues.

Puis retour à la normale ;-)

PS : ah oui et j’oubliais, j’ai créé un groupe sur les figues dans Flickr, n’hésitez pas à contribuer, j’accepterai un peu tout : figues, figuiers, choses à la figue, photos de plats et recettes…

Il y a un livre dans mon moteur

Maintenant que l’on sait pourquoi il ne faut pas dire moteur de recherche, je vous propose de parler plutôt des outils de consultation des bibliothèques numériques.
Quelques particularités par rapport aux moteurs classiques du Web : quelle que soit leur génération, les outils de consultation des bibliothèques numériques

  • cherchent dans des collections organisées suivant une logique raisonnée (qu’on appelle la « politique documentaire »),
  • et les choses qu’ils cherchent sont décrites de façon structurée, au moins en partie (avec des métadonnées appelées également notices).

Sans renier la recherche plein-texte, qui peut se révéler utile dans certains cas, on peut observer que dans un contexte de données fortement structurées et organisées, même les spécialistes du plein-texte font reposer leurs outils de recherche sur les métadonnées, et parfois pas que les leurs.

Pour moi un outil de consultation de bibliothèque numérique devrait se constituer de plusieurs couches qui, loin de s’opposer, se combinent. Parmi elles

  • une couche de butinage (par carte, par thème ou par facettes)
  • une couche qui exploite toute la richesse des données structurées
  • une couche de fouille au coeur du texte.

Je suis de plus en plus convaincue que tout cela peut (doit ?) être intégré dans un ensemble cohérent, assez bien exprimé par l’idée d’outil de consultation.

Google print n’offre que la dernière couche, la plus basse (mais il le fait très bien).
Je me suis déjà très longuement étendue sur la première couche qui était une de mes préoccupations essentielles jusqu’à il y a peu.
Enfin pour celle du milieu, le meilleur outil actuellement c’est à mon avis Worldcat.

Worldcat réalise très bien la synthèse entre la recherche simple et les facettes. Dès qu’on a cherché quelque chose, on se trouve devant un choix d’affinage simple, clair et utile, sous forme de liens proposés dans le menu de gauche, liens qui sont regroupés en facettes.
La principale raison pour laquelle je suis si séduite par cette interface, c’est qu’elle est fluide pour l’utilisateur et qu’elle lui épargne la saisie : l’énergie que l’on déploie à remplir les cases d’une recherche par champs. Ce que fait l’utilisateur dans Worldcat, quand il clique sur certains de ces liens, revient à une recherche par champs, mais en s’évitant une saisie fastidieuse (et risquée).
Par ailleurs, comme ces liens sont construits sur des métadonnées structurées, et non sur des analyses automatiques de type clusters, on n’a pas l’impression d’être à moitié perdu mais on garde le contrôle de sa recherche.

Et la lecture devient écriture.

Folksobibliographie

Je les range là pour mémoire : quelques articles sur les folksonomies, les communautés et autres problèmes liés aux vrais gens dans le Web 2.0.

Ouf, ça fait un peu de vide dans mon aggrégateur ;-)

L’art de la numérisation… au bout des doigts

Un nouveau bouquin vient de paraître sur la numérisation : Mark Jordan, Putting Content Online: A practical guide for libraries, Chandos Publishing, September 2006. Tout en anglais of course. Je n’ai bien entendu aucune idée de ce qu’il y a dedans, pour l’instant.

Enchaîné

Sinon, j’aime bien l’optimisme de Lorcan Dempsey : et si les "doigts" numérisés par Google avaient finalement du sens, ou du charme, c’est selon ?

Alcool de figues

figue

A vous mes chers nombreux lecteurs qui ne savez pas quoi faire de vos innombrables figues, voici une idée : vous pouvez essayer d’en faire de l’alcool. Voici une recette de liqueur de figues qui n’a pas l’air trop compliquée, il faut juste être patient.

J’avais aussi donné celle-là l’an dernier.

Quant à moi j’ai refait une confiture mélange mirabelles et figues et c’est toujours aussi excellent.