Back to the future

J’en ai à peine cru mes yeux en lisant cet article dans Dlib : Repository Librarian and the Next Crusade – The Search for a Common Standard for Digital Repository Metadata. Ecrit par des gens du LANL, il défend une théorie époustouflante : MARCXML serait le meilleur format de métadonnées possible pour des entrepôts numériques…

C’est très étonnant car comme ils le disent eux mêmes :

Au début, MARC et MARCXML étaient perçus comme trop bibliocentriques et trop rigides. L’équipe était également préoccupée par la viabilité et le manque de popularité de ce format dans la communauté. (…) Le grand nombre de combinaisons d’étiquettes/indicateurs/sous-champs pouvaient suggérer que la complexité de ce standard serait problématique.

Ensuite ils mettent leur priorité sur 3 fonctionnalités du format : granularité, transparence, extensibilité. Là encore, on se sent assez loin de MARC et même de MARCXML. Mais c’est là que l’effet pervers des tableaux de comparaison de fonctionnalités fait son office et montre qu’on peut leur faire dire tout ce que l’on veut.

En comparant MARCXML à ONIX et PRISM (rapidement écartés) et également Dublin Core et MODS, en se limitant à des métadonnées descriptives et aux sujets les plus complexes, on réussit à "prouver" que MARCXML est meilleur que tous ses petits copains.

D’où la conclusion :

Utilisé dans le monde entier et supporté par de nombreux outils, MARC est omniprésent dans la communauté des bibliothèques (…)

Et d’autres vérités du même acabit. Nous voici en plein retour vers le futur : le format de métadonnées le plus prometteur pour l’avenir serait un format particulièrement vieilli, compliqué, rigide, non lisible par des humains (sauf s’ils ont suivi des cours de bibliothéconomie auquel cas on peut se demander s’ils sont vraiment toujours humains ;-) et limité à la communauté des bibliothèques. Et extensible pourvu qu’on tolère d’en arriver à ça :

 administration metadata

Cela me fait hurler… Amis spécialistes de XML, du Web sémantique et des métadonnées, je vous en prie, dîtes-moi ce que vous en pensez : serais-je déjà encore en retard (ou en avance) sur mon temps ?

10 réflexions sur “Back to the future

  1. La corde est là dans le coin avec un arbre ;)

    Plus sérieusement, pousser la BNF à publier ses données dans un format RDF et ainsi mettre en ligne le premier catalogue monstrueux de données bibliographiques en ligne ?

    En passant tu pourrais envoyer un mail à mon accolyte Karl Dubost du W3C ;)

  2. (J’ai bien peur d’avoir eu un petit problème de formatage. Sans alinéas, c’est un poil compact. – Désolé…)

  3. Les bibliothécaires (dont je suis) nous feront toujours rire.

    Allez, une longue citation pour oublier tout ça:

    [Les deux personnages, grammairiens, « en vêtements noirs, petits mantelets, petites fraises et grands chapeaux pointus », sont en route pour le Nouveau Monde.]

    Don Léopold Auguste

    Chère grammaire, belle grammaire, délicieuse grammaire, fille, épouse, mère, maîtresse et gagne-pain des professeurs!
    Tous les jours je te trouve des charmes nouveaux! Il n’y a rien dont je ne sois capable pour toi!
    […]
    Qu’est-ce qui se passe là-bas? qu’est-ce qui arrive au castillan? Tous ces soldats à la brigande lâchés tout nus dans ce détestable Nouveau-Monde,
    Est-ce qu’ils vont nous faire une langue à leur usage et commodité sans l’aveu de ceux qui ont reçu patente et privilège de fournir à tout jamais les moyens d’expression?
    Une langue sans professeurs, c’est comme une justice sans juges, comme un contrat sans notaire! Une licence épouvantable!
    On m’a donné à lire leurs copies, je veux dire leurs mémoires, dépêches, relations comme ils disent. Je n’arrêtais pas de marquer des fautes!
    […]
    Mais ces méchants poussent tout droits devant eux et quand ils ne peuvent plus passer, ils sautent!
    Vous trouvez que c’est permis?
    […]
    Ils disent que c’est plus commode. Commode! Commode! ils n’ont que ce mot-là à la bouche, ils verront le zéro que je vais leur flanquer pour leur commode!

    Don Fernand

    Voilà ce que c’est pour un pays que de sortir de ses traditions!

    Don Léopold Auguste

    La tradition, vous avez dit le mot.
    Comme on voit que vous avez fréquenté les livres de notre solide Pedro, comme nous l’appelons, le rempart de Salamanque, le professeur Pedro de las Vegas, plus compact que le mortier!
    « La tradition, tout est là! » dit ce sage Galicien. Nous vivons sur un héritage. Quelque chose dure avec nous que nous devons continuer.
    […]
    Est-ce un bon et authentique Castillan qui nous a ainsi pris par la main pour nous mener au delà de la mer vers notre Couchant?
    C’est un Génois, un métèque, un aventurier, un fou, un romantique, un illuminé plein de prophètes, un menteur, un intrigant, un spéculateur, un ignorant qui ne savait pas regarder une carte, bâtard d’un Turc et d’une Juive!
    […]

    Don Fernand

    Je hais ces fabricateurs de théories. Ce sont des choses qu’on n’aurait pas permises autrefois.

    Don Léopold Auguste

    Vous l’avez dit, cavalier! Il devrait y avoir des lois pour protéger les connaissances acquises.
    Prenez un de nos bons élèves par exemple, modeste, diligent, qui dès ses classes de grammaire a commencé à tenir son petit cahier d’expressions,
    Qui pendant vingt années suspendu aux lèvres de ses professeurs a fini par se composer une espèce de petit pécule intellectuel : est-ce qu’il ne lui appartient pas comme si c’était une maison ou de l’argent?
    Et au moment qu’il se prépare à jouir en paix des fruits de son travail, où il va monter en chaire à son tour,
    Voilà un Borniche ou un Christoufle quelconque, un amateur, un ignorant, un tisserand qui fait le marin, un chanoine frotté de mathématiques, qui vient foutre tout en l’air,
    Et qui vous dit que la terre est ronde, que ce qui ne bouge pas bouge et que ce qui bouge est ce qui ne bouge pas, que votre science n’est que paille et que vous n’avez qu’à retourner à l’école!
    Et alors toutes ces années que j’ai passées à apprendre le système de Ptolémée, à quoi est-ce qu’elles m’ont servi, s’il vous plaît?
    Je dis que ces gens sot des malfaiteurs, des brigands, des ennemis de l’Etat, de véritables voleurs!

    Don Fernand

    Peut-être des fous simplement.

    Don Léopold Auguste

    S’ils sont fous, qu’on les enferme! s’ils sont sincères, qu’on les fusille! Voilà mon opinion.

    Don Fernand

    J’ai toujours entendu mon feu père me recommander de craindre les nouveautés.
    […]
    Je serais encore plus fort de cet avis si je n’y sentais pas je ne sais quoi de malpropre et qui ne s’ajuste pas.

    Don Léopold Auguste

    C’est que vous allez trop loin et que vous n’avez pas bien lu le solide Pedro.
    Non, non, que diable, on ne peut pas rester éternellement confit dans la même confiture!
    « J’aime les choses nouvelles », dit le vertueux Pedro. « Je ne suis pas un pédant, Je ne suis pas un rétrograde.
    « Qu’on me donne du nouveau. Je l’aime. Je le réclame. Il me faut du nouveau à tout prix. »

    Don Fernand

    Vous me faites peur!

    Don Léopold Auguste.

    « Mais quel nouveau? » ajoute-t-il. « Du nouveau, mais qui soit la suite légitime de notre passé. Du nouveau et non pas de l’étranger. Du nouveau qui soit le développement de notre site naturel.
    « Du nouveau encore un coup, mais qui soit exactement semblable à l’ancien! »

    (Claudel. Le soulier de satin, Troisième journée scène II.)

  4. Quel bond en arrière !

    Tout ce que cet article montre c’est que MARCXML, format créé par des bibliothécaires, répond parfaitement aux attentes… des bibliothécaires.

    Je pose la question : pourquoi et pour qui créons-nous des entrepôts numériques? pour nous mêmes ? pour avoir la joie de se sentir des spécialistes et des experts, bien loin du commun des mortels ?

    Que signifie un format « transparent » ? La faculté d’être compris du plus grande nombre ? Non : « a standard widely known throughout the community ». La communauté des bibliothécaires, bien sûr.

    Et l’utilisateur dans tout ça ? Vous aurez remarqué comme moi qu’il est totalement absent de cet article. Cette affaire ne le concerne pas.

    Enfin, puisqu’il s’agit de mesurer « l’efficacité » d’un format, je termine en posant la question : efficacité pour faire quoi ?

    Si jamais tu décides toi aussi de partir en « croisade », Manue, je me rallierai à ton panache blanc.

  5. Ah je l’avais bien dit. MarcXML, c’est quand même plus solide que de l’EAD magique en Ge’ez éthiopien :op
    (un travailleur adepte de l’usmarc!)

  6. Heu…

    Je ne suis pas vraiment spécialiste de quoique ce soit dans ce que tu as dit. Enfin si, je connais à peu prêt les limites d’XML, qui me font souvent dire le plus grand mal de ce langage au demeurant pratique et utile.
    Il y a quelque chose qui me choque dans ton exemple. J’ai une certaine logique jusquauboutiste. Si j’utilise du XML, j’utilise du XML. D’aucuns l’utilisent pour encapsuler du binaire, je trouve ça déjà un peu bizarre et lourd, mais grand bien dans leur face. Bref, le truc que je trouve bizarre c’est qu’ils ont l’air d’utiliser une syntaxe autre qu’XML dans leur nœuds, pour être à nouveau traitées par des machines.
    Je trouve ça inutile, XML fait correctement son boulot pour la structuration et/ou la description de données. Rajouter une syntaxe à l’intérieur alourdie encore plus le processus, ainsi que le déploiement (faut rajouter les moulinettes spécifiques à ce langage). Je ne sais pas, peut-être que les autres modèles utilisent ce genre de chose ?
    Je ne suis pas contre une structuration autre qu’XML, mais si on choisie XML autant aller jusqu’au bout.
    Pour donner un exemple :

    
      Bidule
      Anathème
    
    

    Pour moi c’est logique.

    [personne: nom:Bidule prenom:Anathème]
    

    Tout va bien c’est logique.

    [data: nom:Bidule prenom:Anathème]
    

    Bhaaaaaaa ! Caca !

    Voilà ce que je trouve bizarre dans la syntaxe que tu donnes en exemple. Je ne sais pas si je suis à côté de la plaque ou pas, parce que je connais mal après les domaines concernés ainsi que leurs enjeux.

  7. <personne>
    <nom>Bidule</nom>
    <prenom>Anathème</prenom>
    </personne>
    

    glop

    [personne: nom:Bidule prenom:Anathème]
    

    glop

    <personne>[data: nom:Bidule prenom:Anathème]</personne>
    

    Pas glop
    Désolé pour tout ce bruit vraiment…

  8. J’ai réussi à comprendre le commentaire de Nico (avec les exemples, et les balises, ça aide) mais j’avoue que là Karl ça me dépasse. Pour les ignares comme moi qui ne savent pas ce que c’est qu’une indirection, il y a toujours ça : http://en.wikipedia.org/wiki/Indirection. Lire également : Qu’estce qu’on encode ?, en l’occurence, à mon avis, ils auraient dû se demander si ce qu’ils voulaient encoder, c’était bien des fiches de catalogue, ou plutôt des métadonnées.

  9. L’absurde de l’article et de marcXML c’est pas tant d’avoir utiliser XML, mais bien d’avoir serializer en XML non pas le modele MARC mais la syntaxe des fiches elle-meme. Ajoutant ainsi une indirection. C’est Ubuesque.

Les commentaires sont fermés.