Ordinateurs et bibliothèques

Les présentations de la conférence Computers in Libraries 2005 sont en ligne.

Il y en a un peu pour tous les goûts, je note par exemple :

  • le design d’interfaces pour la recherche fédérée
  • les blogs collaboratifs (retour d’expérience de LISnews)
  • les moteurs de recherche
  • les bibliothèques et la gestion de contenu
  • OpenURL
  • la visualisation de données
  • Google et le contrôle de l’information (sympa celui-là, dommage qu’il ne mentionne pas les extra-terrestres
  • XML et XSLT
  • l’OAI

Bon j’arrête. Si j’étais sympa j’aurais mis à chaque fois le lien vers les présentations mais bon, mettre des liens vers tous ces fichiers powerpoint, beuah.

Cela vaut le détour en tout cas.

Technology watch

Deux rapports de veille technologique parus presque en même temps sont à signaler.

Le premier, c’est le "Technology Watch Report 3" de Digicult (attention très gros PDF de plus de 100 pages). Ce rapport examine six technologies jugées esentielles dans les tendances actuelles : les logiciels open source, le traitement du langage naturel, la recherche d’informations, les systèmes de localisation (genre GPS), la visualisation des données, la robotique et la réalité virtuelle.

Au programme : des définitions, le replacement dans le contexte stratégique, les implications en particulier pour les domaines scientifiques et culturels, des explications techniques, des études de cas et des scénarios, des perspectives pour la mise en oeuvre et la faisabilité. Incontournable.

Le second intitulé The large-scale archival storage of digital objects, Technology Watch Report est signé par la British Library et est accessible sur le site du DPC(Digital preservation coalition). Beaucoup moins long mais aussi beaucoup plus spécialisé, il traite de la problématique de la mise en place d’un système d’archivage à long termes de documents numériques dans tous ses aspects : le stockage, l’obsolescence des techniques, les logiciels, les coûts…

Merci à Ten Thousand Years Blog et à Digitizationblog.

Identifiants, versions, hiérarchisation

Prenez un célèbre moteur de recherche dans sa version "scientifique".

Donnez-lui plusieurs versions d’un même article à référencer, issues d’archives ouvertes, de bibliothèques, et du site de l’éditeur.

Donnez-lui un identifiant type DOI qui lui permette d’identifier la version qui vient de l’éditeur.

Demandez-lui de la faire apparaître en premier.

Et surtout, ayez confiance.

Les source est ici et ici.

Mon moteur et moi

Encore un rapport du Pew Internet & American life project : cette fois sur les usages des moteurs de recherche.

Les conclusions du rapport sont assez prévisibles : les internautes sont satisfaits de leurs moteurs de recherche préférés et ils ont tendance à être fidèle à un, voire deux outils. Par contre, ils ne sont pas très au fait des implications politiques et économiques de l’usage des moteurs. Un des paradoxes soulignés dans le résumé, par exemple : seul un utilisateur sur 6 pense pouvoir différencier clairement les liens sponsorisés ou payés, alors que la moitié d’entre eux déclarent qu’il cesseraient d’utilser leur moteur préféré s’ils pensaient que sa politique à ce sujet n’est pas claire.

Cela montre assez bien la relation ambigue de l’internaute à son outil. Entre une méfiance théorique et une pratique presque inconsciente, il n’y a parfois qu’un pas. Et vous, seriez-vous prêts à vous passer de votre moteur de recherche préféré ?

Réflexions sur Google et la numérisation

Bon, je ne reviendrai pas sur cette annonce qu’on a vu mille fois depuis hier : Google a lancé un projet en partenariat avec des bibliothèques américaines, notamment Harvard et Stanford, pour numériser leurs livres.

Je voudrais juste soulever quelques réflexions et questions, glanées de ça de là sur le Web et ailleurs, concernant cet étonnant projet.

La question des droits d’auteur. Les gens des métiers du livre, en entandant cette annonce, s’inquiètent aussitôt du respect de leurs droits quant à la diffusion de ces livres sur le Web. Pas d’inquiétude : Google se contente de les indexer et de les chercher, mais on ne pourra en voir que de petites portions, voire rien du tout. En ce qui me concerne, mon inquiétude est contraire. Google est un acteur commercial et il se protège de la complexité des droits d’auteurs par une politique restrictive, soit. Mais ces fonds appartiennent à des bibliothèques ; ils sont publics ; elles auraient pu choisir de les mettre en libre accès sur le Web. La délégation de la numérisation change le modèle naturel de communication sur le Web des bibliothèques, et ça m’inquiète.

La délégation. Justement, à propos de la délégation, Hubert a raison de se demander quelles seront les modalités de cette délégation. Qu’une bibliothèque accepte lorsqu’on lui offre sur un plateau l’utopie de la reproduction absolue, je peux le comprendre. Mais il faudrait encore qu’elle ne se retrouve pas ensuite, comme c’est parfois le cas aujourd’hui avec les microfilms, obligée de payer pour disposer de ses propres collections.

Le côté obscur de la force. Ce côté obscur, ce n’est pas seulement la situation de monopole, mais aussi le manque de transparence. Le Web est un espace de chaos et la méthode de Google est sans doute la meilleure pour l’appréhender. Mais indexer pêle-mêle en plein texte des millions de livres, c’est vouloir appliquer le chaos à un matériau par nature structuré. C’est aussi nier les "épaules des géants" revendiquées par GoogleScholar, et le travail fait par les bibliothèques numériques pour essayer de donner à leurs lecteurs des contenus plus structurés, plus accessibles, plus fonctionnels. La transparence, c’est aussi garantir au lecteur l’origine de ce qu’il consulte, lui offrir la traçabilité, le contexte, et la fidélité à l’original qui n’est possible qu’avec le mode image. Numériser, ce n’est pas éditer : numériser impose de respecter l’histoire du matériau, parce qu’elle fait partie de sa compréhension de manière intrinsèque. Je suis curieuse de savoir ce que Google répondra à cela.

Le chaos et la science. Je ne vois pas comment les chercheurs pourront se passer de cette transparence et de cette mise en contexte. Je ne vois pas non plus comment la méthode du chaos peut entrer en adéquation avec un monde scientifique de plus en plus spécialisé. Quand la sérendipité augmente, la précision diminue. Et puis, finalement, la recherche plein-texte sans la consultation, c’est comme de donner les clefs des magasins à un lecteur, puis lui interdire d’allumer la lumière.

Le débat est ouvert.

Google scholar et au-delà

La sortie de Google scholar a fait à peu près autant de bruit dans la blogosphère qu’un coup de gong, et j’hésitais à me lancer dans le chorus général car je ne voyais pas trop quoi apporter de plus. J’ai donc décidé d’attendre que le soufflet retombe un peu mais je crois en effet qu’il serait dommage de ne pas en parler du tout.

Google scholar est un outil assez époustouflant. Si on cherche des ressources dans un domaine « académique » quel qu’il soit, surtout anglophone mais pas seulement, il ne nous déçoit pas et fournit la même profusion de ressources que Google tout court.

Il fait un pas de plus dans la classification des ressources, en différenciant les références d’articles (citations), les articles en pdf, les livres.

Il fait un pas de plus dans la description bibliographique, en donnant dès le premier écran, le titre mais aussi l’auteur, la date, la source, les différentes versions.

Il fait un pas de plus dans la mise en contexte, en donnant le nombre de citations connues pour chaque référence, et en permettant d’afficher ces citations avec leurs propres citations.

Il fait un pas de plus dans la localisation, en proposant, pour les livres, de les trouver dans une bibliothèque, voire dans votre bibliothèque s’il identifie d’où vous vous connectez.

Bon, allez, je l’avoue, la première fois que j’ai testé Google scholar, je me suis dit, oups, vite, je dois trouver un autre métier ! Je pense finalement qu’il serait bon de relativiser cet emportement. Il y a quand même des limites, les mêmes que depuis toujours, la principale étant l’opacité de Google scholar. Quelles ressources indexe-t-il ? quel algorithme utilise-t-il pour les classer ? Et la stratégie googelienne de plus en plus englobante d’omniprésence n’a rien de rassurant.

Et puis, une des choses qui me frappe le plus, c’est le déferlement d’outils dérivés que crée la sortie de ce nouveau moteur. On connaissait déjà les outils développés par Ingenta, et le comparateur de recherches de Peter Jasco. J’ajouterais une extension pour Firefox qui utilise OpenURL pour lier les notices (oui, maintenant je pense qu’on peut dire ça) de Google scholar au plein texte des articles, extension qu’on peut adapter à son propore résolveur OpenURL au prix d’un peu de geekerie (merci à Library Stuff). Et encore le bookmarklet de visualisation qui permet d’avoir une vue graphique des articles citant une référence (merci à Open Access News).

Ma conclusion, toute personnelle, c’est que Google scholar est sans aucun doute un outil formidable. C’est aussi et peut-être surtout, le « bruit du gong », celui qui va nous réveiller, nous sortir de nos acquis, nous rappeler que non, nous n’avons pas fait le tour de la question du signalement des ressources validées, et que non, nous ne pouvons pas nous passer de l’innovation permanente et quotidienne qui conditionne notre survie.

Les feuilles mortes se ramassent à la pelle

C’est très pénible d’être obligé de regarder son écran de travers tellement on a le nez bouché (ben oui, le fait de pencher la tête permet de déboucher au moins partiellement mais bonjour l’ergonomie du poste de travail). Donc vous ne m’en voudrez pas si je fais court et mélangé.

  • voici un truc avec plein de ressources sur l’expérience utilisateur. A première vue on dirait un blog mais non. Ca s’appelle DeyAlexander parce que le type s’appelle Alexander Dey, ce qui prouve que dans la vie avoir un nom qui jette c’est pratique, ça évite d’avoir à se creuser.
  • voici un autre truc très marrant, à première vue on dirait un wiki mais en fait non. On peut s’amuser beaucoup avec le javascript et en fait ce n’est qu’une page HTML statique. Enfin j’aime bien la navigation, c’est original.
  • Le dernier Journal of Digital Information a pour thème : "Digital Libraries and User Needs". On y trouve des articles intéressants sur la participation des utilisateurs au design (lire "à l’architecture de l’information") d’un site de bibliothèque numérique. En particulier, il y a un article sur un test utilisateurs concernant l’OAI.
  • On apprend que Yahoo rejoint Google dans le projet d’indexation de WorldCat – c’est le projet qui nous vaut le petit outil dont je parlais l’autre jour.

Bon j’arrête avec ma liste décousue. Je pense avoir à peu près éclusé tout ce que j’avais mis de côté ce week-end… Et merci au fait à : Infodesign, à Fred Cavazza et à Library Stuff J’espère que ça ira mieux demain, et je vous promets plein de trucs intéressants et de question existentielles avec des réflexions et même peut-être un effort rédactionnel qui sait.

3, 2, 1, moteur !

Lecture du jour : un article d’Alexandre Serres : Recherche d’information sur Internet : où en sommes-nous, où allons-nous ?. Il fait le point sur les outils de recherche documentaire sur Internet, avec une approche très accessible qui permet de comprendre le minimum d’enjeux techniques nécessaires (cela s’adresse aux documentalistes de CDI).

Pour en savoir plus sur l’utilisation des moteurs de recherche aujourd’hui, on peut consulter cette étude sur les usages des moteurs de recherche.

Et pour se souvenir qu’il ne faut pas se contenter d’utiliser un seul moteur (on est des professionnels que diable), même si c’est lui qui donne les meilleurs résultats, voici un exemple d’outil intéressant : OJOSE (Online JOurnals Search Engine) permet de mener une recherche sur les principaux périodiques en ligne, incluant des bases bibliographiques comme celles de l’INIST, aussi bien que des revues en ligne, et même Amazon et Google. On peut regretter qu’on ne puisse pas interroger plus d’une ressource à la fois, mais le fait d’avoir une interface unique peut parfois rendre des services quand même…

Merci à Open Access News, et à JLR peut-être hélas pour la dernière fois.

Jargon de la recherche

On connaissait déjà le jargon du métier, que ce soit le métier de bibliothécaire ou celui d’archiviste. Dans le genre toujours plus loin, voici maintenant le glossaire du jargon de la recherche documentaire : le Search terms glossary.

C’est l’outil à utiliser si vous vous êtes toujours demandé ce qu’est une recherche vectorielle ou une recherche en langage naturel (à condition de se poser la question en anglais cela va de soi).

Pour aller encore plus loin, j’ai sous la main un petit article qui explique ce qu’est la logique floue (fuzzy logic en anglais). J’ai pas vraiment le courage de le résumer, tout ce qu’il y a à savoir c’est que grâce à la recherche floue, peut-être un jour ne sera-t-on plus obligés d’expliquer aux lecteurs que s’ils ne connaissent pas le titre exact, ça va être dur de retrouver leur bouquin ;-)

Merci à Librarian in black et à RessourceShelf.

Figoblog en vacances (mais pas les autres)

Entre deux chateaux de sable, j’ai décidé de revenir voir un peu par ici si la blogosphère s’agite, et oui, on a beau être en plein mois d’août, elle s’agite. Alors, histoire de ne pas accumuler trop de retard, voici quelques devoirs de vacances à faire cette semaine…

Côté actualité des blogs,

Côté bibliothéconomie, d’une manière plus générale,

  • réfléchir sur les droits d’auteurs et les DRM avec Juriblog et LibraryLaw blog
  • dans le dernier numero d’Ariadne lire aussi l’article sur la gestion des droits, celui qui explique le protocole SRU (successeur en XML de Z3950), une note de lecture d’un livre sur l’architecture de l’information… etc., intéressant ce numéro
  • recherche fédérée : deux articles à lire, l’un dans Dlib et l’autre trouvé sur Information literacy weblog
  • enfin, les courageux pourront imprimer et lire sur la plage les 91 pages du dernier Journal de l’IFLA (en PDF) où il est question essentiellement des bibliothèques d’Amérique latine, forcément (ils en ont de la chance ceux qui y vont cette année…)

Je vous rassure, j’en garde un peu pour plus tard. Bon c’est pas tout ça mais mes vacances m’attendent moi…