Delicious, Chrome et quelques réflexions sur les URI

Cet été, le service de favoris partagés « delicious » a changé de peau. Il est passé d’un design minimaliste résolument « Web 0.1 » à quelque chose de minimaliste aussi, mais plutôt dans la veine « 2.0 » avec des icônes en forme de muffins et des trucs comme ça. Ce changement fait assez peu de différence à mes yeux vu que je n’utilise ce service qu’à travers le « bookmarklet » de mon navigateur préféré, et le fil RSS que je visionne dans mon agrégateur préféré, donc je ne le vois pour ainsi dire jamais. Mais par contre, j’ai bien remarqué qu’ils avaient changé l’adresse de leur site : de http://del.icio.us ils sont passés à http://delicious.com.

Ce changement me paraît totalement emblématique à la fois de la démocratisation (recherchée ou effective, cela reste à savoir) du service, et d’un état de fait du Web d’aujourd’hui qui est la transparence – ou plutôt, l’invisibilité – des URI. Je m’explique : le nom du service d’origine était une astuce géniale qui utilisait et détournait le principe des noms de domaines « en-point-quelque-chose » : l’extension « .us » était avalée par le reste du nom de domaine, ne se prononçait plus, s’effaçait devant l’identité du service. « delicious.com » c’est carrément triste à côté (et même, si on veut, « www.delicious.com » !!!)
Quand on voit la confusion qui existe aujourd’hui dans l’esprit des gens (là je pense à l’internaute qui sait utiliser un webmail, poster sur un blog, mettre ses photos dans flickr mais n’a aucune idée de comment tout cela fonctionne) autour de la notion d’adresse URL, cette évolution semble toutefois logique. Cette astuce, qui, à part les « web-geeks », pouvait la comprendre ? Ca devait surtout compliquer le bouche-à-oreilles (non, pas en un seul mot, tu tape D-E-L, puis point, puis…)
Le navigateur de Google, Chrome, s’assoit sans vergogne sur la distinction entre une recherche et une adresse : de toute façons, franchement qui s’embarasse de retenir une adresse quand le moyen le plus rapide de la retrouver est de rechercher le site dans Google ? Donc autant n’avoir qu’une seule « barre » qui va, suivant ce qu’on lui demande, envoyer directement l’adresse demandée ou répondre par une liste de résultats Google. Personnellement cette confusion m’agace mais ça doit être mon côté bibliothécaire à chignon qui aime que chaque chose soit bien identifiée, rangée, classée (ou alors c’est l’influence des cases du voisin).

Admettons alors que le changement d’URI du service Delicious soit dans l’air du temps. Mais au fait, qui se soucie encore d’enregistrer des favoris, alors qu’on peut les twitter, les facebooker, les smober, ou faire n’importe quoi d’autre d’un coup de commande ubiquity (à tester d’urgence si vous ne l’avez pas déjà fait – vous n’êtes pas près d’abandonner Firefox…) ? Heureusement, il reste http://identi.ca/ !

Publicités

Des URI sympas pour le Web sémantique

En date du 1er avril, le W3C annonce avoir mis à jour le document Cool URIs for the Semantic Web, passé du statut de « draft » à celui de « interest group note » (ceux qui y comprennent quelque chose à la normalisation apprécieront cette évolution ;-)

C’est un document qui explique comment attribuer des URI à des ressources abstraites (c’est à dire, des ressources qui ne correspondent pas à une page Web). En particulier il décrit comment gérer la négociation de contenu qui va permettre de renvoyer tantôt une page Web, tantôt la référence d’une ressource abstraite suivant l’URI qu’on demande.

Quand on manipule des URI non actionnables, qui ne pointent pas forcément vers quelque chose (par exemple les info URI), on n’a pas ce genre de problème. Mais c’est quand même un document tout à fait essentiel à avoir sous la main quand on conçoit des URI pour le Web sémantique.

Marc 21 et le Web sémantique

Un article à lire : Semantic MARC, MARC 21 and the Semantic Web par les gens de Talis.

Dans cet article, ils exposent comment transformer « facilement » des données en MARC 21 en RDF, avec une méthodologie qui selon eux pourrait permettre de créer en un clin d’oeil un réseau de données entre des catalogues distants.
Ce qui m’a frappée c’est que leur stratégie repose sur la création et, je ne sais pas si on peut dire ça, l’alignement des URI qu’ils génèrent à partir des différents champs des notices. En gros, pour générer l’URI d’une ressource, ils utilisent la chaîne de caractère correspondant au champ de la notice, qu’ils normalisent (en retirant la ponctuation notamment) avant de la faire précéder d’un domaine. De cette façon, lorsque la même chaîne de caractères ou presque apparaît dans différentes notices, elles sont reliées automatiquement par cette URI commune. C’est de cette façon, notamment, qu’ils relient les notices d’autorité avec les notices bibliographiques.

Approche qui me laisse songeuse car :
– du coup ils n’exploitent pas les liens qui existent déjà entre les notices bibliographiques et d’autorité
– ils n’utilisent pas non plus de beau système d’identifiant de notices comme LCCN alors que les bibliothèques se donnent bien du mal à mettre ces URI de référence en place.

Enfin, on se retrouve avec des tas d’URI plus ou moins ambigües par rapport aux ressources qu’elles désignent : plusieurs URIs pour la même ressource, ou l’inverse. Mais est-ce si grave ?

Bibliothèque numérique de l’université de Michigan

L’université de Michigan a mis en ligne les ouvrages numérisés par Google dans le cadre de leur « partenariat », sur ce site : MBooks.

Au programme : une gestion de droits digne de ce nom, de beaux identifiants pérennes (Handle : http://hdl.handle.net/2027/mdp.39015004214865), et un entrepôt OAI contenant plus de 100 000 enregistrements, dont ils fournissent même le code source.

Eh oui, c’est ça la « library touch » : des standards et de belles métadonnées.

Les identifiants, c’est important

Ca fait longtemps que je le dis, et je l’ai encore répété récemment aux Journées Réseaux (JRES 2007) à Strasbourg, les identifiants, c’est important.

Quand on met quelque chose en ligne, il faut faire attention à ses identifiants, à tous les niveaux : l’objet, le document, la portion de document, la page. Quand on met quelque chose en ligne, il faut toujours penser que les gens vont en stocker l’adresse et essayer de le retrouver plus tard.

Si en plus on fait le malin en proposant des fonctionnalités de type « widget » qui permettent de citer quelque chose d’encore plus petit qu’une page, par exemple, un morceau d’image, il faut faire encore plus attention à ses identifiants. Parce que sinon ça donne ça :

et quand on essaye d’accéder au document, ça donne ça :

Et quand même, c’est pas pérenne, c’est pas propre, c’est indigne d’une bibliothèque numérique. Mais au fait : ce n’est pas une bibliothèque numérique. Alors, on les pardonne ? Ben… en fait non.

Quelques publications

Quand je ne suis pas occupée à écrire ce blog, il m’arrive parfois d’écrire ailleurs ; cela me semble utile de référencer un peu de cette bibliographie ici en vue de potentiels usages futurs. Ainsi j’ai été hébergée deux fois par la revue IPN, qui est la publication de la section Préservation de l’IFLA (plus connue sous le petit nom de « IFLA-PAC »).

La première fois c’était en décembre 2006 pour un article sur les identifiants pérennes qui est en fait une reprise de celui-ci, mais dans IPN il y a une traduction en anglais.

La seconde fois était dans le numéro de juillet 2007, où j’ai écrit une petite introduction sur la gestion des risques. C’était en fait une version rédigée de ce que j’ai présenté au Symposium IFLA PAC, intervention dont on peut consulter le diaporama ici.

Lectures

Quelques petites choses à lire ces prochains jours…

Sur les identifiants pérennes, ce rapport fait le tour des systèmes existants et propose un certain nombre de conseils d’implémentation. Il est publié par la CERL et l’European Commission on Preservation and access, en creative commons ;-)

Un article dans Dlib sur les audits de systèmes d’archivage et la certification. Un sujet qui m’avait passionnée à IPRES. Il y a quelques autres références sur le même sujet dans le dernier DPC/PADI What’s new in digital preservation.

Plusieurs documents publiés en Grande-Bretagne et autour de la British Library, sur le thème des droits de propriété intellectuelle.

IPRES : Divers

A part cela, j’ai assisté à différentes « sessions concurrentes » et à des choses qui m’ont personnellement moins intéressée (je ne dis pas que ce n’était pas intéressant en soi). De cela, je ne ferai pas de compte-rendu extensif. En tout état de cause je ne peux pas vous parler non plus des sessions concurrentes auxquelles je n’ai pas assisté, et en particulier celle sur les métadonnées (désolée Fred, j’avais donné priorité aux identifiants).

Quelques petites choses quand même à retenir au passage…

Kopal : il s’agit d’une initiative allemande dont l’objectif est de constituer un framework de préservation pouvant être déployé de façon répartie dans plusieurs archives.
Pour faire vite, il se constitue d’une partie centrale, le "Core", qui gère l’archive (les AIP) et qui repose sur le logiciel DIAS d’IBM (encore eux !) Ensuite, ils ont développé une application Open source, KOLIBRI, qui s’installe dans les différente archives et sert à constituer les SIP et les DIP qui seront versés dans le Core (cette conférence n’était pas OAIS-free ; pour ceux qui ne seraient pas familier avec les notions de SIP, AIP etc vous pouvez les retrouver ici)
Tout ceci fonctionne avec des métadonnées en METS et en LMER, un format qu’ils ont constitué à partir de l’expérience de la bibliothèque de Nouvelle Zélande.

Planets : un projet européen qui se donne pour objectif de réfléchir à un peu tous les aspects de la préservation numérique. Le projet est censé aboutir à un "testbed" qui permettra de démontrer comment on met en oeuvre un projet de préservation. J’attends de voir ça.

N2T : un résolveur d’identifiants pérennes qui se donne pour objectif de résoudre le problème de la pérennité des noms de domaine, rien que cela. Vous êtes une petite institution, vous gérez déjà vos URL (ou vos identifiants ARK, DOI, Handle ou ce que vous voulez), mais vous vous inquiétez sur un possible changement de votre nom de domaine dans les années qui viennent ? Ce projet est pour vous (non, non, je ne pense à personne en particulier ;-)
Il s’agit de rassembler un consortium d’institutions, qui vont tout simplement utiliser de façon intelligente et raisonnée les redirections HTTP pour créer un réseau de pérennisation des identifiants.
C’est une réponse organisationnelle à un problème qui est tout sauf technique : on reconnaîtra bien là les merveilleuses initiatives de mon collègue de la California Digital Library (enfin rencontré en chair et en os !!!)

MathArc : un exemple de projet thématique, piloté par Cornell, qui utilise aDORe, METS, l’OAI, les Web services, Premis, Handle, NOID et l’OAIS – rien que parce qu’il y a tous ces mots dedans, je trouve cela joli.

Vous l’aurez compris, tout cela était un peu technique ;-) Mais ça fait du bien parfois de ne pas se sentir seule face à toutes ces choses, et de se retrouver dans une pièce avec 220 personnes qui ont les mêmes préoccupations tordues que soi !

Confiture numérique et archivistique

Je manque un peu d’énergie pour entrer dans les détails, alors voici une liste de ressources à utiliser, lire, exploiter, dans les domaines de prédilection qui sont les miens habituellement.

Sur les bibliothèques numériques, lire Scan this book !, un article de Kevin Kelly, déjà signalé par Lafeuille mais je l’avais vu sur Netbib, apparemment il faut se dépêcher de le lire avant qu’il ne soit plus en accès libre.

Mon fils RSS a un Dlib de retard, aussi c’est dans celui d’avril que je vous recommanderai :

Enfin ceci dit vous pouvez aussi consulter directement le Dlib de mai.

Repéré sur DCC, un powerpoint sur les questions juridiques appliquées à la bibliothéconomie numérique.

Vu sur Catalogablog, un rapport sur l’intégrité dans les archives numériques, chez HP.

Enfin, via OAnews, petite visite sur le blog d’un archiviste qui a des choses intéressantes à dire (je l’avais d’ailleurs déjà cité) : Archivemati.ca. C’est un billet aux saveurs de Web 2.0 mais il le dit lui-même :

Although the “Web 2.0″ term probably has a limited shelf life, I expect it will at least get people’s attention as they scan a conference program.

Après il parle de plein de choses intéressantes sur l’accès aux collections d’archives numériques, notamment sur les communautés.

Confiture bibliothéconomique

Allez, maintenant que j’ai un peu retrouvé la forme, il faut bien élaguer un peu le résidu des vacances. Confiturons.

Merci à toujours les mêmes (Catalogablog, 10KYBlog, etc. j’ai la flemme de mettre les liens.)