Reblog : les technos du Web sémantique ont-elles tenu leurs promesses ?

Il y a quelques années, quand j’ai proposé à Gautier et Antoine de publier au Cercle de la librairie une synthèse de ce que nous avions appris en pratiquant avec ces technologies, mon objectif était de stabiliser nos connaissances dans un manuel, afin de les rendre réutilisables. C’est ainsi qu’est né Le web sémantique en bibliothèque, le livre, fin 2013. J’espérais aussi qu’on pourrait arrêter de se répéter en formation et que cela nous aiderait à passer à autre chose…

Je ne pensais pas si bien dire, puisque dès l’année suivante, j’écrivais « qu’il ne serait ni possible, ni utile de former tous les catalogueurs ou tous les bibliothécaires au Web sémantique« . Nous avons poursuivi cette réflexion au fil des conférences et formations, adaptant petit à petit notre discours à un nouveau constat : les technologies du Web sémantique ne répondraient pas à tous nos espoirs, et devaient trouver leur juste place dans le paysage de la donnée d’une manière plus générale. Un constat parfois amer, quand il s’agissait d’y renoncer dans le contexte de la production, parfois plein d’espoir quand les grands acteurs du web les intégraient dans leur stratégie d’interopérabilité.

Gautier revient aujourd’hui sur cette réflexion avec une somme en 4 articles, dont la lecture est indispensable pour qui veut comprendre l’évolution de notre pensée ces 5 dernières années s’agissant de cette technologie que nous avons longtemps mise en avant :

Le Web sémantique nous aide-t-il vraiment à améliorer la visibilité des ressources patrimoniales sur le Web ? Pourquoi le Linked Entreprise Data n’a-t-il pas révolutionné la conception des systèmes d’information ? Dans quels cas l’investissement dans un mapping vers RDF en vaut-il la peine ? Comment peut-on continuer à défendre les modèles orientés entités si on ne veut plus les implémenter en RDF ? Vous trouverez réponse à ces questions et bien plus sur Les Petites Cases.

Vous l’avez compris, je souscris largement aux conclusions qu’il présente et que nous partageons dans notre cadre professionnel, dans les formations que nous assurons ensemble ou chacun de notre côté, et dans notre salon ;-) Mais j’apporterais peut-être quand même pour ma part une nuance ou un complément d’information.

Dans son 2e billet, Gautier revient sur les limites d’OAI-PMH et dans sa conclusion, il remet en cause l’idée de décentralisation en arguant qu’elle est illusoire en l’état actuel de la technologie. L’OAI-PMH, malgré ses faiblesses, est un modèle qui fonctionne bien parce que justement, il procède par recentralisation des données qui ont été moissonnées. Or, la communauté patrimoniale à l’heure actuelle se focalise sur le développement d’un standard qui vise à réaliser la décentralisation des bibliothèques numériques en termes de contenus : IIIF. Dans une démarche caractéristique de la manière dont la communauté appréhendait le Web sémantique il y a 5 ans, IIIF utilise certains éléments de la technologie – les URI, le JSON-LD – sans se réclamer du Web sémantique ou du Linked Data. Pour Gautier, le choix de JSON-LD est anecdotique et relève d’un espoir qu’on avait à l’époque : que ce genre de détail ferait « cheval de Troie » pour installer la technologie. Pour moi, il témoigne d’une forme de maturité qui replace les briques de la techno à leur juste place dans un ensemble plus large. Néanmoins, le problème est toujours le même : pour exploiter les données, même avec IIIF, il faut rencentraliser les métadonnées. Et pour les recentraliser, il faut qu’elles soient homogènes ce qui exige soit de se mettre d’accord sur une syntaxe commune quelle qu’elle soit, soit de faire des conversions ou mappings…

En fin de compte, ce détail montre que la communauté patrimoniale est encore en train de réfléchir à son modèle d’agrégation des données. L’interopérabilité reste le principal (l’unique ?) cas d’usage du Web sémantique, et les portails ont encore de beaux jours devant eux. Nous garderons donc un œil attentif dans cette direction…

Bibliothèque numérique de l’université de Michigan

L’université de Michigan a mis en ligne les ouvrages numérisés par Google dans le cadre de leur « partenariat », sur ce site : MBooks.

Au programme : une gestion de droits digne de ce nom, de beaux identifiants pérennes (Handle : http://hdl.handle.net/2027/mdp.39015004214865), et un entrepôt OAI contenant plus de 100 000 enregistrements, dont ils fournissent même le code source.

Eh oui, c’est ça la « library touch » : des standards et de belles métadonnées.

Ceci est un blog sérieux

A tous les gens qui seraient susceptibles de débarquer ici pour la première fois, suite à un événement impromptu survenu dans ma vraie vie, je voudrais dire que ce blog a beau être rose fluo (j’ai essayé de changer, mais franchement vous seriez déçus) c’est quand même un blog vachement sérieux.

Il y est question de sujets aussi graves que les rapports de la commission européenne sur les droits d’auteurs qui impactent la numérisation, la construction de la bibliothèque numérique du monde, et la préservation des données numériques.

Y sont évoquées des tas de technologies compliquées comme le passage de MARC en RDF, l’impact de l’OAI sur l’interopérabilité, et les services de terminologie.

Ce blog se pose des tas de questions existentielles pour l’avenir de la bibliothéconomie numérique, telles que la modélisation conceptuelle des accès, les entrepôts du Web 2.0, et l’univers des données scientifiques du futur.

Enfin ce blog est truffé de références vers des sites originaux et pertinents, comme la Chronologie d’histoire de l’art du Metropolitan Museum of Art et le moteur BabyGo destiné aux enfants.

En plus, ce blog est vraiment sérieux car il cite ses sources : Resourceshelf et Catalogablog souvent, mais parfois aussi Open Access News et des collègues français comme Affordance. Alors, hein, si c’est pas sérieux tout ça !!! Le seul problème c’est qu’en ce moment je manque de temps pour bloguer aussi sérieusement que je le voudrais… Enfin, il reste toujours les figues ;-)

A lire

Aujourd’hui, un peu de lecture…

D’abord cet article dans ArXiv, via Catalogablog, dans lequel est fait le lien entre l’OAI et l’OAIS (ce qui risque de semer encore de la confusion ; pour éclaircir le sujet c’est par ici). Cet article sera présenté à PV 2005.

Ensuite le dernier numéro de First Monday dans lequel on notera en particulier un article de Karen Coyle sur les métadonnées de gestion des droits.

Un petit dernier via ResourceShelf : un article sur les bibliothèques numériques destinées aux enfants, et en particulier l’interface d’ICDL dont je vantais les mérites tantôt.

Un bon « systems librarian »

On peut découvrir depuis quelques jours le projet MyLibrary@Ockham, qui est un projet original de services autour d’une collection des documents harvestés en OAI. L’idée est de réunir ces notices OAI et d’essayer d’améliorer la fonction de rebonds en leur ajoutant quoi, je vous le donne en mille : des facettes !!! L’interface de consultation n’est à mon avis pas tout à fait adaptée pour en exploiter tout le potentiel, mais l’idée est réjouissante. Pour en savoir plus sur ce projet c’est par ici.

C’est Eric Lease Morgan qui est derrière ce projet, et au passage, sur le LitaBlog, il nous donne les clefs pour devenir, comme lui, un bon "systems librarian" capable de faire des beaux projets comme celui-là. C’est très facile, il suffit de maîtriser :

  • XML et XSL
  • les bases de données relationnelles
  • l’indexation (au sens informatique du terme)
  • les serveurs Web, en particulier Apache
  • et un langage de programmation : Perl, Java ou PHP.

Evidemment pour tout cela il vaut mieux aussi savoir se débrouiller sous Linux.

Alors, vous en êtes ?

(Merci à Catalogablog et Librarian.net.)

Catalogue is not dead

Le nouveau BBF vient de sortir avec pour titre alléchant : "Mort et transfiguration des catalogues".

Je n’ai pas encore eu le temps de le lire, évidemment, et je ne l’aurai pas non plus ce week-end, hélas. Mais je pense que ce sera un grand moment. Au programme : la visualisation, le XML, les classifications, la recherche fédérée, le renseignement à distance, Google scholar, et même le livre ancien. Je m’en pâme d’avance.

J’en profite pour glisser au passage quelques liens thématiques…

Sur Urfist Info est signalée une initative de Thomson Gale pour offrir l’accès (ou plutôt, la recherche) aux revues qu’on peut lire dans les bibliothèques. Le portail, AccessMyLibrary, vous donne les références de l’article en vous précisant poliment : Read the rest of this article for free courtesy of your local library. Charming.

Kesako nous renvoie quand à lui vers une bibliothèque virtuelle privée, en fait des agrégats de blogs et d’autres ressources classées par thèmes, dont l’organisateur n’est autre que Marcus Zillman en personne. Je vois pas trop le rapport avec le sujet, ceci dit. Est-ce qu’en collant tout plein de blogs ensemble et en les classant par thèmes, on génère une bibliothèque (même privée) ? Le doute m’étreint.

Chez Karl on découvre un programme qui permet de gérer sa bibliothèque personnelle, lecteur de codes à barres intégré dans la webcam. C’est délire mais ça ne vaut pas une bonne classification Dewey dans son salon (en plus il faut être sous Mac).

Enfin du côté de chez Catalogablog on découvre CAT-OAI, un opac basé entièrement sur un entrepôt OAI. En fait le but est d’intégrer des entrepôts OAI dans un opac. A regarder de plus près.

Je vous souhaite un bon week-end, occupez-vous bien, lisez le BBF, cataloguez votre bibliothèque personnelle, intégrez-y des notices en OAI et des blogs, classez-la en Dewey, et je vous retrouve lundi pour de nouvelles aventures bibliothéconomiques.

Archives numériques intéropérables

RLG vient de publier le compte-rendu d’une rencontre intitulée : 2005 RLG International Archival Gateways Meeting. Cette rencontre qui avait lieu aux archives nationales de Grande Bretagne avait pour objectif d’aborder la question de l’intéropérabilité de la numérisation des archives sur le plan international. On notera qu’il y a une présentation de la Direction des archives de France.

J’en profite pour signaler que sur le portail France-Généalogie on peut consulter l’outil Nomina, un service qui interroge 4 bases réparties en utilisant l’OAI.

Pêle-mêle dans les cartons, 2

Toujours en plein déménagement, toujours dans les cartons. Voici ce que j’ai relevé d’intéressant dans mon aggrégateur ventru et débordant :

  • le 2005 special 301 report fait le point sur l’efficacité des droits de propriété intellectuelle dans 90 pays.
  • OAI une interview de la directrice d’OAIster et un témoignage sur la génération de métadonnées en Dublin Core avec un outil nommé My META Maker
  • un article dans Ariadne qui compare trois systèmes de gestion d’entrepôts de documents numériques : LOCKSS, EPrints et DSpace
  • des ressources sur la typographie et l’écriture sur le Web : ici et . J’ai bien apprécié ce site.
  • Dans le dernier Journal de l’IFLA il y a un article sur "Copyright Protection as Access Barrier for People who read differently" (p.52).

Bonne lecture et à dans quelques jours.

Ordinateurs et bibliothèques

Les présentations de la conférence Computers in Libraries 2005 sont en ligne.

Il y en a un peu pour tous les goûts, je note par exemple :

  • le design d’interfaces pour la recherche fédérée
  • les blogs collaboratifs (retour d’expérience de LISnews)
  • les moteurs de recherche
  • les bibliothèques et la gestion de contenu
  • OpenURL
  • la visualisation de données
  • Google et le contrôle de l’information (sympa celui-là, dommage qu’il ne mentionne pas les extra-terrestres
  • XML et XSLT
  • l’OAI

Bon j’arrête. Si j’étais sympa j’aurais mis à chaque fois le lien vers les présentations mais bon, mettre des liens vers tous ces fichiers powerpoint, beuah.

Cela vaut le détour en tout cas.

Tout sur l’OAI

Vous saurez tout sur l’OAI quand vous aurez visité la page du Workshop du CERN intitulé Implementing the benefits of OAI. On y trouve les diapos des intervenants, en powerpoint et en pdf, et même parfois en vidéo.

Notamment, l’introduction intitulée OAI and OAI-PMH for absolute beginners tient ses promesses en faisant le tour de la question avec simplicité et clarté.

Puisque j’en suis à parler d’OAI, je recommande l’article d’Herbert Van de Sompel et alii dans le Dlib du mois dernier (pas le nouveau qui vient de sortir et contient d’ailleurs un autre article sur SRU et l’OAI).

Dans cet article, les auteurs abordent la problématique de l’utilisation de l’OAI quand on veut non pas se contenter d’échanger des métadonnées, mais échanger les ressources elles-mêmes. Parmi les problèmes soulevés, il y en a un qui m’est cher en ce moment : la difficulté de faire correspondre les métadonnées et les identifiants avec la localisation réelle de la ressource. Enfin le propos est d’utiliser l’OAI pour échanger des formats de métadonnées complexes, comme METS et MPEG21, qui permettent à la fois de localiser précisément toutes les parties d’une ressource, et de connaître toutes les modifications qui l’affectent. Le protocole OAI rejoint alors le modèle OAIS, deux standards qui à part ça et malgré leur ressemblance phonétique n’ont rien à voir entre eux.

Merci à Catalogablog.