Le catalogue en prison

A l’origine, le catalogue était un meuble, composé de tiroirs et de fiches, trônant dans la salle de référence. Pour le consulter, il fallait s’y rendre. Les données étaient prisonnières d’un objet.

Alors, on a fait des catalogues imprimés : diffusés en plusieurs exemplaires, on pouvait les consulter à distance. Mais c’étaient toujours des catalogues en papier, uniquement compréhensibles pour les yeux avisés de lecteurs humains. Les données étaient prisonnières d’un support.

Alors, on a fait des SIGB : informatisées, les données devenaient manipulables par machine ce qui facilitait grandement leur accès, leur gestion, leur production. Mais le SIGB était une boîte noire, rigide, parfois incompréhensible : les données étaient prisonnières d’un logiciel.
Les SIGB libres ont été un espoir qu’on pourrait ouvrir la boîte, mais ça n’a pas pris. Sans doute parce que ça n’en valait pas l’investissement : même si on pouvait, grâce au code source ouvert, tourner une vis ici, ajuster un boulon là, les données étaient toujours prisonnières de la base de données.

Alors, on a créé les formats standards et les protocoles d’échange. Grâce à eux, on peut sortir les données du SIGB pour les échanger ou les réutiliser. Mais malgré l’étonnante capacité de notre communauté à se normaliser et se contraindre elle-même, il y avait toujours une étiquette de champ inapropriée, un $a appliqué de manière différente, un indicateur vide avec un sens particulier, une donnée locale non standard. Les protocoles sont toujours une barrière, un passage obligé pour faire sortir – aux forceps – les données.
Ajuster les mappings entre les formats et paramétrer les protocoles est une opération horriblement complexe, et coûteuse. Ou alors, elle « lave plus blanc » en nivelant les données par le bas, les privant de leur richesse.
Les données sont prisonnières de leur propre structure.

Arrive le Web sémantique. En atomisant la structure des données, il les rend toutes égales, et libres.

Au-delà des formats et des protocoles, le Web sémantique a le pouvoir de vraiment libérer les données. Libres, nos données seront plus riches, plus pérennes, plus interopérables. Osons redonner le pouvoir aux données.

Publicité

2 réactions sur “Le catalogue en prison

  1. Le format est une notion qui est double :
    – format sémantique
    – format technique

    Le monde des bibliothèques a une chance ENORME avec son format iso2709. C’est un format technique : n’importe quel fichier au format iso2709 est lisible avec un outil de lecture d’iso2709. C’est une chance dont je voudrais bien que chaque bibliothécaire ait conscience !!! D’ailleurs, ceux qui rencontrent des difficultés pour migrer les données qui ne sont pas dans l’iso2709 (informations d’abonnement, lecteurs, historique des prêts -dans les limites légales bien sur- ) doivent être bien d’accord !!!

    Une fois le fichier décodé techniquement, effectivement, il y faut le décoder sémantiquement. Des normes comme l’UNIMARC font effectivement leur boulot pour cette part. Avec les contraintes du respect approximatif et/ou des approximations de la norme elle-même (doublons d’information, contenu mal spécifié…)

    Pour moi, tout logiciel devrait être accompagné de la documentation et des moyens de le quitter. Que les utilisateurs n’y comprennent goutte ne me choque pas. Mais que les informaticiens chargés de déployer un nouveau système ne puissent y voir clair, voilà qui enferme l’utilisateur.
    Qu’il s’agisse d’un logiciel libre ou non, d’ailleurs, là n’est pas la question. Au bémol qu’un logiciel libre dispose normalement de ressources sur le web pour faire le « reverse engeneering » nécessaire. Et que les choses sont publiques et librement diffusables.

    Je vous conseille la lecture de http://www.formats-ouvers.org le site de Thierry Stoehr, un peu mono-maniaque (;-) Thierry : amitiés) , mais très intéressant sur la question.

    Pour finir, je ne vois pas en quoi le web sémantique va libérer quoi que ce soit sur cette question. Je trouve votre conclusion et votre enthousiasme déroutants : « En atomisant la structure des données, il les rend toutes égales, et libres. » C’est un peu bref, et, pour vous faire part de mon sentiment de technicien sur la question, probablement inexact. Mais si vous détaillez, je pourrai affiner mon opinion !

    Ps : à peine lourdingue le mecanisme de captcha. Ca fait au moins 6 fois que j’essaye de valider

  2. Paul, merci de vos remarques, au demeurant très justes, sur les logiciels et les formats. Pour votre dernière question, je vous invite à parcourir mes derniers billets sur le RDF, ainsi que les derniers billets des Petites Cases et de Christian Fauré qui vous aideront peut-être à y voir plus clair. En tout état de cause, vous avez aussi le droit de penser que le Web sémantique n’apporte rien par rapport à notre arsenal actuel d’outils : beaucoup le pensent, je l’ai longtemps pensé moi-même. Seul l’avenir nous le dira ;-)

Les commentaires sont fermés.