Rien de nouveau

Publié le 14/06/2004 par manuefig

L’idée du jour, c’est que l’information est une denrée recyclable. Même si elle trouve beaucoup de sa valeur dans l’actualité, l’information devient connaissance en étant dûment conservée (ce n’est pas à nous bibliothécaires qu’on va apprendre cela !) Pour preuve…

Robin Good signale un site qui regroupe des composants réutilisables pour les interfaces utilisateur. L’enjeu du site : ne pas réinventer la roue, et faire le point sur le travail qui a déjà été fait en terme d’interface, qu’il s’agisse de Web ou de logiciels. Et en plus ils s’en vantent :

There’s nothing new here.

Ailleurs, on nous démontre en la personne d’Alain Giffard qu’on peut faire un blog avec du rétrospectif plutôt qu’avec de l’actualité. Presque une "archive ouverte" personnelle… et en tout cas certainement une bonne ressource pour faire l’historique des NTIC vues par la Culture depuis dix ans.

Sur Open Access News, on nous rappelle si besoin était que les "nouvelles" technologies, ici OAI, ne remettent pas en cause ce qui fait la base du métier de bibliothécaire. Elles viennent s’inscrire tout naturellement entre deux missions ancestrales ou fonctions solidement établies.

Enfin sur Biblioacid, dans un article remarquable qui nous met l’eau à la bouche pour cette semaine, Hervé Le Crosnier nous conte son attachement au mail comme forme d’écriture dans le ciel, tout en soulignant ce que les blogs changent, et ce qu’ils ne pourront pas changer… peut-être ?

Alors nous y voilà : rien de nouveau. Recyclage de liens, recyclage de choses lues, vues, entendues, recyclage de matériau pour un possible usage futur, tel est le blog : peut-être une tentative désespérée de fixer quelque part, même sous une forme marquée par le sceau du temps qui passe, la fugitive trace des heures passées à parcourir le Web. Un geste bibliothéconomique par excellence.

Escalibade

Publié le 13/06/2004 par manuefig

Rien à voir avec les figues, mais cette recette catalane de ma maman mérite tout de même le détour.

Prendre une aubergine, un poivron rouge, un poivron vert, deux tomates, deux oignons doux. Les couper en lamelles.

Disposer les légumes dans un plat allant au four, en faisant des couches stratigraphiques de couleur : au fond les aubergines, au-dessus le poivron rouge, puis le poivron vert, puis les tomates, et les oignons en dernier.

Saler, poivrer, huile-d’oliver.

Mettre au four 45mn à 210°. Ensuite laisser refroidir, et manger froid assaisoné au vinaigre.

Miam Miam.

Validation de l’information

Publié le 11/06/2004 par manuefig

La validation de l’information sur Internet, voila un sujet qui a toujours fait frémir les bibliothécaires. Aujourd’hui, avec les blogs, les wikis et toutes ces choses qui sont des sites perso mais sont aussi parfois un peu plus que cela, ce sujet fait aussi frémir les journalistes.

A ce sujet, Mediatic a mentionné il y a quelques temps une petite étude sur la validité de l’information sur Wikipedia. Elle semble tirée d’une journée d’études journalistique où il s’est dit des choses aussi sur les blogs.

A propos, quelqu’un pourrait me dire, franchement, l’intérêt de créer un blog dont l’unique but est de démontrer que les blogs sont stupides et ne servent à rien… Surtout que prendre pour cible les blogs de bibliothécaires est particulièrement mal venu, vu le nombre d’entre eux qui sont professionnels et intéressants. Quant aux autres, est-ce que, parce qu’ils sont bibliothécaires, ils n’ont pas le droit de raconter simplement leur vie comme le font tant de gens sur le Web ? Décidément, il y a des trolls partout, et ils ont vraiment du temps à perdre.

Mise à jour :

Je brûle d’envie d’ajouter un sympathique billet du blog outils de veille qui dit si bien la difficulté d’être veilleur, devant cette masse d’information non validée…

URL, identifiants et compagnie

Publié le 09/06/2004 par manuefig

Plein de questions un peu partout en ce moment sur les identifiants, les URI (qui sont cool s’ils ne changent pas), les URL, ce qu’ils veulent dire, combien de temps ils durent et comment les utiliser.

Je trouve amusant de voir les différents points du vue sur le sujet :

du côté des geeks blogueurs, l’identifiant de rêve c’est le mod_rewrite d’Apache, ou le permalink du blog associé à la grave question de savoir comment il va se bidouiller dans le fil RSS et survivre en cas de déménagement.
du côté des geeks standard, la question devient tout de suite plus complexe : les URL doivent-elles avoir un sens ? d’où la question qui en découle aussitôt du rapport entre URN et URL, à savoir entre nom et adresse…
enfin du côté des geeks bibliothéconomiques (oui oui, ça existe, un peu), l’identifiant à l’honneur est notre bon vieux ISBN mangé à la sauce URN, URI et RDF.

Et nous, les bibliothécaires ? Nous qui jonglons depuis toujours avec des identifiants pérennes locaux basés sur des adresses (les cotes) ou internationaux basés sur des noms (ISSN, ISBN…), pour nous c’est quoi un identifiant pérenne, un URI, un URN ? Comme d’habitude, cela recouvre une réalité complexe et mouvante, sur laquelle personne n’est d’accord, qui implique à la fois les problèmes des métiers du livres en général et les besoins particuliers de nos systèmes informatiques…

Un petit tour d’horizon :

W3C : URIs, URLs, and URNs: Clarifications and Recommendations
PURL
Handle
DOI
ARK
le système local des australiens

DOAJ passe à l’article

Publié le 08/06/2004 par manuefig

Le DOAJ est un répertoire de revues en libre accès qui indexe plus d’un millier de titres.

Il vient de lancer, le 3 juin, un moteur de recherche au niveau article (auteur, titre, mots-clef, résumé) qui porte sur environ 270 titres (ceux qui fournissent les métadonnées appropriées). On peut croiser la recherche avec le titre du journal ou l’ISSN pour faire une recherche dans les article d’un titre.

J’ai été un peu en mal d’informations techniques hélas, mais tout ceci semble reposer sur l’utilisation d’OAI et d’OpenURL.

Errol

Publié le 07/06/2004 par manuefig

Voici un petit outil qui s’agite depuis un moment dans un coin de mes marque-pages : Errol.

Errol est à la fois un projet pour créer des identifiants pérennes à partir de requêtes OAI, un outil de navigation dans des entrepôts OAI, et un générateur de valeur ajoutée : on peut par exemple créer le fil RSS d’un entrepôt OAI en utilisant la syntaxe suivante

« http://errol.oclc.org/ » + RepositoryIdentifier + « .rss »

A noter toutefois, le « OAI Viewer » ne fonctionne vraiment bien que sous IE, et il faut que l’entrepôt OAI de vos rêves soit enregistré dans leur répertoire pour que ça fonctionne. Mais sinon c’est pas mal.

Pour en savoir plus sur les implications profondes du projet, consulter les Powerpoint de son papa Jeff Young : ici et là.

Premières figues

Publié le 06/06/2004 par manuefig

Les voici, les premières figues de l’année. Elles ne sont pas très belles, elles n’ont pas beaucoup de goût, mais… c’est tout de même un bonheur !

Aujourd’hui, c’est bien ma fête…

Compte-rendu d’expérience

Publié le 05/06/2004 par manuefig

Cette semaine, les premières figues fraiches sont apparues à l’étalage des épiciers arabes de luxe. Eh oui, dans mon quartier c’est comme ça, quand on veut les plus beaux fruits de Paris, et avant tout le monde, on va chez les épiciers arabes et on paye… Bref, je me disais qu’il était plus que temps, avant que cette info ne se périme, que je donne les résultats de mon enquête sur la confiture de figues sèches.

Donc, j’en ai testé trois : une au jus de raisin, une aux pommes et une au thé.

La confitures de figues sèche au jus de raisin, franchement m’a donné du fil à retordre. Beaucoup d’opérations dans un temps limité pour aboutir à un résultat décevant. Cette confiture est à la confiture de figues ce que la figue sèche est à la figue. Bof, quoi.

Celle qui a mariné dans des pommes râpées est à la limite plus proche de la compote de pommes que de la confiture de figues. Peut-être qu’il faudrait rententer en diminuant le ratio de pommes.

Quant à la confiture de figues sèches au thé de Zabelle, elle était tellement bonne, extraordinaire et sublime que je la mangeais à la petite cuiller en bloguant (si, si, demandez à mon geek). Elle était tellement incroyablement délicieuse qu’elle mérite que je résume ici la recette.

on fait mariner les figues sèches coupées en dé une nuit entière dans du thé bien fort (j’avais opté pour un thé de qualité, à la fois fleuri et fruité, et bien m’en a pris je crois).
le lendemain, on jette le thé et on met les figues dans une marmite avec un poids de sucre équivalent au poids de figues qu’on avait au départ, et on fait fondre à feu doux.
une fois le sucre fondu, on augmente le feu pendant dix minutes.
enfin, on mixe le tout et on empote.

Le résultat ressemble à la pâte qu’il y a à l’intérieur des Figolu, en 1000 fois meilleur. Je pense que je tiens une technique pour fabriquer des Figolu améliorés… je vous tiendrai au courant.

OpenURL : qu’est-ce que c’est ?

Publié le 04/06/2004 par manuefig

OpenURL est un protocole en cours de normalisation qui sert à créer des liens contextuels. Concrètement, il s’agit de lier des métadonnées (par exemple, les références bibliographiques d’un article) à la ressource elle-même (l’article en plein-texte).

Vous me direz, un protocole de métadonnées, très bien, on en a déjà qui fonctionnent parfaitement, OAI par exemple. Oui mais là, il ne s’agit pas d’un simple lien, mais d’un lien contextuel. Pour une ressource (toujours notre article) on connaît le contexte dans lequel elle est citée (la bibliographie qui la cite), décrite (les métadonnées de l’article et qui les a rédigées), utilisée (le lecteur qui la recherche et les droits dont il dispose), et la façon dont on utilise le protocole (quel résolveur, pour obtenir quel service) pour la lier à ce qu’elle décrit (l’article lui-même).

En fait, la norme OpenURL Framework se compose de trois choses

le ContextObject : le paquet de métadonnées qui contient les informations sur une ressource et son contexte
l’OpenURL proprement dit : un protocole de transport de ces paquets basé sur HTTP
le registry qui contient les spécifications des différents éléments constitutifs des ContextObjects et de l’OpenURL.

Qu’est-ce qu’un ContextObject ?

Il s’agit d’un paquet de métadonnées qui décrivent une ressource et son contexte :

les métadonnées elles-mêmes (referent)
leur source : qui a rédigé ces métadonnées (referrer)
l’objet qui contient l’objet référencé par les métadonnées, par exemple la bibliographie où est prise la citation (referring entity)
l’utilisateur qui demande le service (requester)

Plus au niveau du protocole lui-même :

l’adresse du résolveur de lien utilisé (resolver)
le type de service demandé par l’utilisateur, par exemple "obtenir le texte intégral de l’article" (service type entity).

Que peut-on mettre dedans ?

A l’origine, un ContextObject décrit une ressource bibliographique et son contexte. En réalité, on peut y mettre un peu ce qu’on veut… pourvu que les métadonnées soient dans le bon format.

Le format d’origine pour représenter les ContextObject d’appelle Key Encoded Value (KEV) Il repose sur des paires clef/valeur (par exemple : Nom=Paul).

Dans la deuxième version de la norme (OpenURL 1.0), on peut décrire les ContectObjects en XML, avec un schéma associé spécifique : le schéma XML ContextObject Format (CTX).

A cela s’ajoutent des métadonnées supplémentaires, que l’on peut soit inclure directement dans le ContextObject, soit référencer sous forme de lien (on donne alors l’adresse du schéma qu’elles suivent et l’adresse où on peut les trouver).

Les métadonnées stockées dans le ContextObject doivent suivre les formats de métadonnées autorisés, stockés dans le repository : en KEV on dispose de formats pour books / dissertation / journal / patent, et chacun de ces formats possède sa traduction en XML. En outre, pour le XML seulement, s’y ajoutent entre autres MARC21 et oai_dc.

Les métadonnées ajoutées sous forme de lien peuvent suivre n’importe quel schéma pourvu que celui-ci ait une adresse (URI) et qu’il soit dans le même langage que le ContextObject (soit KEV, soit XML, au choix).

Concrètement, comment ça marche ?

Sur cette question, j’ai été éclairée par le JC-blog et par un papier intitulé tout ce que vous avez toujours voulu savoir sur SFX sans oser le demander.
Les étapes sont les suivantes :

quelqu’un crée un ContextObject. Par exemple, un éditeur de revues en lignes comme Elzevier. Ou alors, une bibliothèque avec son catalogue.
le lecteur voit, à côté de la référence bibliographique, un bouton qui correspond à ce ContextObject.
le lecteur clique, aussitôt le ContextObject est envoyé sous forme de requête HTTP à un résolveur de lien, qui analyse les métadonnées, les droits de l’usager et le service demandé.
en fonction de ce qui a été spécifié pour l’interface, le résolveur trie les références auxquelles le lecteur peut avoir accès et écarte celles auxquelles il n’a pas accès.
en réponse, le lecteur reçoit une liste de liens correspondant à sa demande, par exemple l’article complet chez Elzevier + l’article dans une archive ouverte. Mais pas l’article chez un autre éditeur pour lequel sa bibliothèque n’est pas abonnée.

Mais alors, quelles différences entre OpenURL 0.1. et OpenURL 1.0 ?

OpenURL 0.1 a été créé sur la base d’une architecture développée par un logiciel résolveur de lien nommé SFX. C’est à partir de ce produit qu’a été développée la standardisation du protocole de liens contextuels dans le cadre d’OpenURL.

L’OpenURL 1.0. repose donc en quelque sorte sur un retour d’expérience de l’utilisation d’OpenURL 0.1. La norme ainsi élargie a été spécifiée par un document soumis à approbation par NISO de janvier à mars 2004.

Ce qu’OpenURL 1.0 apporte par rapport à 0.1 :

il intègre le XML
les notions de « requester », « referring entity » et « service type entity » qui n’étaient pas proprement spécifiées auparavant
il supporte plusieurs formats de métadonnées et de nombreux namespaces (parmi lesquels : DOI, identifiants OAI, URN, ISBN, ISSN …), et ce de manière extensible
la 2e partie de la norme intègre la spécification du repository qui contient les spécifications des formats de description des objets contextuels (KEV et XML) + les formats de métadonnées autorisés + les namespaces autorisés + les spécifications de l’encodage des caractères + les spécifications des protocoles de transport des données + les « communautés de profils » qui définissent un mode d’exploitation choisi de la norme (il y en 2, une compatible avec la version 0.1 qui utilise KVE, l’autre étendue qui utilise XML).

Il en résulte que OpenURL 1.0 est d’application potentiellement plus large que la précédente car rien ne spécifie que la ressource décrite doit obligatoirement être d’ordre bibliographique.

En conclusion, OpenURL permet à des résolveurs de liens de lier des métadonnées, pourvu qu’elles soient encodées dans un certain format, à des ressources paramétrées, en tenant compte des droits de l’utilisateur et d’autres paramètres éventuels.

L’application la plus évidente est l’interconnexion des bases de données bibliographiques avec les bases de journaux en ligne, qui se fait directement et de manière quasi transparente pour l’utilisateur, grâce à ce protocole. Mais avec la norme 1.0, cette fonctionnalité pourrait être étendue, et il y a d’autres idées à creuser : booster le catalogue, faire des passerelles avec un entrepôt OAI… que sais-je encore.

Ressources

La norme

ici et là

Publications

Library Journal – The Lure of Linking
Ariadne – The OpenURL and OpenURL Framework: Demystifying Link Resolution
Du catalogue de la bibliothèque aux ressources du web : applications documentaires de la génération de liens contextuels par Marc Maisonneuve, Paris : ADBS Éditions, 2003 (revue dans le BBF)

Site Web

celui du comité à l’origine de la norme avec une bibliographie et des powerpoints.

Classifications appliquées au Web sémantique

Publié le 02/06/2004 par manuefig

Rapidement, avant que ces ressources ne disparaissent sous la pile virtuelle de choses intéressantes que j’amasse en ce moment, voici deux sites intéressants pour les cliqueurs fous qui chercheraient des centaines de liens sur la classification de l’information pour le Web sémantique :

tout d’abord, le livre de Glenda Browne et Jon Jermey intitulé Website Indexing: enhancing access to information within websites : un vrai livre en papier, hélas probablement difficile à trouver… mais les auteurs nous font le cadeau en ligne de la table des matières, d’un glossaire et d’une longue liste de liens.
et aussi, sur le site SearchTools, une liste d’outils pour comprendre et utiliser les classifications, catégorisations, taxonomies etc.

Merci à InfoDesign et à Michel Dumais.

Figoblog

Un blog sur Internet, la bibliothéconomie et la confiture de figues

Archives d’Auteur: manuefig