Le mapping ultime

Dans ce communiqué de presse, est annoncée la naissance d’une initiative ambitieuse : Vocabulary mapping framework.
Il s’agit d’une extension des travaux de rapprochement entre les RDA et ONIX, visant à rendre intéropérables les principaux standards de métadonnées descriptives : Dublin Core, Onix, RDA, MARC21, DOI, FRBR, LOM, etc.
La méthode proposée : réaliser un mapping universel permettant de créer des passerelles (crosswalks) entre ces vocabulaires afin de faciliter les transformations d’un format à un autre. Les mappings seront exprimés en RDF/OWL. Ce résultat est attendu pour le 9 novembre 2009, où il sera formellement présenté lors d’une conférence à la British Library.
Les étapes suivantes envisagées sont la génération automatique de mappings entre n’importe quelle paire de formats, et l’existence d’un site qui permettra de maintenir et de faire évoluer les conversions.
Derrière le projet, on trouve le DOI, la British Library et le JISC (entre autres).

Mon avis personnel : le projet n’est pas seulement ambitieux, mais un petit peu délirant. J’ai beau croire fort dans les technologies du Web sémantique, pas sûr qu’elles permettront de résoudre tous les problèmes de mappings en 6 mois.
Et puis :
– est-ce que cela a vraiment un sens de faire un mapping absolu, indépendamment de la nature et de la spécificité des données et de la façon dont chaque format est implémenté ?
– n’y a-t-il pas un peu à boire et à manger dans la liste de métadonnées ci-dessus (des formats, des modèles conceptuels, des vocabulaires, des systèmes, etc…)
– enfin quel est l’intérêt du DOI (et de l’IDF, International DOI Foundation) pour soutenir un tel projet : le revendre ? vendre les résultats ? vendre le service ? rendre plus de gens dépendants du DOI ? mettre le DOI au centre du monde (ce petit monde qu’est le milieu de l’informatique documentaire) ?

A suivre de très près.

4 réflexions sur “Le mapping ultime

  1. On se posait les mêmes questions avec Unicode, et ça a marché. Pourtant, il a fallu prendre en compte des encodages plus nombreux et plus hétérogènes encore. Espérons que les gens de l’IDF sont de ce niveau : il leur faudra quelques compétences techniques, mais surtout diplomatiques.

  2. Il existe une différence de taille entre unicode et cette initiative : le but poursuivi par les différents encodages de caractères est le même alors que les différents modèles/formats/schémas pour exprimer des métadonnées descriptives ont des buts légèrement différents (dans ce domaine, le diable se cache dans les détails).

    C’est tout simplement irréalisable, d’autant qu’il existe au sein d’une communauté qui utilise un de ces formats des façons différentes de l’utiliser.

  3. Bof. Je trouve au contraire qu’il est plus que temps de s’intéresser aux transformations d’un schéma vers les autres plutôt que d’obliger tout le monde à connaître (mal) tous les schémas.

    Un format pivot est idéal pour cela et ensuite, pondre 9 x 2 = 18 transformations, ce n’est pas la mort pour des gens qui connaissent XSLT, et il doit en exister encore :-)

  4. Effectivement, un schéma donné peut être utilisé sémantiquement de plusieurs façons (contrairement à ce qui est dit sur l’Unicode), disons avec des variantes. Une telle transformation donnerait alors parfois d’étranges résultats, mais pas forcément plus étrange que l’utilisation du schéma initial.
    Peut-être une tentative pour définir un ensemble temporairement universel de métadonnées… :)

Les commentaires sont fermés.