L’identification pérenne des ressources numériques (3)

Dans les épisodes précédents (1 et 2), nous avons vu que définir un système d’identification pérenne de ressources numériques passait par le choix d’un certain nombre de propriétés et de fonctionnalités du système.

Ceci étant posé, l’heure est maintenant venue de faire un choix parmi les sytèmes d’identification pérenne existants aujourd’hui sur le Web.

Si on essaye de faire une typologie des différents systèmes, on se trouve bien en peine de trouver un critère qui permette de les classer tous. En fait, il y a plusieurs critères à prendre en compte, parmi lesquels on peut citer :

  • l’indépendance : il y a les systèmes où les identifiants sont donnés par le créateur de la ressource, et les systèmes où ils sont donnés par un tiers
  • l’unicité : il y a des systèmes qui garantissent l’unicité seulement au sein d’un système, d’autres qui la garantissent de manière totale et mondiale à l’échelle du Web
  • la structure : il y a des systèmes qui attribuent des identifiants opaques, ou aveugles, et d’autres qui donnent des identifiants signifiants
  • etc.

Je pourrais continuer comme ça presque indéfiniment. En fait, ce qu’il faut retenir, c’est que la plupart des systèmes combinent ces différents aspects à différents niveaux. Le choix va être difficile car il n’existe pas de critère de différenciation clair et net. Ils ont chacun leur façon de concevoir les choses, de les organiser.

Il est donc plus constructif de partir, non de leurs différences, mais de leurs points communs.

Les systèmes d’identification pérenne utilisent généralement tous une structure en trois parties de type :

SCHEME – NAMING AUTHORITY – NAME

Le « scheme », c’est un préfixe qui permet d’identifier le système dans lequel l’identifiant est unique. Par exemple, OAI, ARK, URN:NBN…

La « naming authority » ou autorité nommante, c’est une organisation qui a reçu, de l’autorité centrale en charge de définir le système, l’autorisation et le pouvoir d’attribuer des identifiants. Cette autorité peut être désignée par son nom, par un code attribué au sein du ssytème, par un code ou un nom codé qu’elle détient par ailleurs (comme un nom de domaine), etc.

Enfin, le nom, c’est une chaîne de caractères qui identifie la ressource de manière unique, au sein de ce système et pour cette autorité. En général, l’autorité nommante peut se retrouver assez libre de la façon dont elle structure ses noms, tant qu’elle garantit leur unicité en son sein. Elle peut aussi déléguer à une sous-autorité l’attribution de noms dans un domaine plus petit.

On voit bien comment, dans un seul identifiant, les critères que j’ai cités plus haut peuvent s’imbriquer : suivant l’existence et la nature du « scheme », l’unicité est garantie à une échelle plus ou moins importante. Suivant la façon dont l’autorité nommante est codée, cela détermine son degré d’indépendance, ou de dépendance à l’égard d’un système ou d’une autorité plus haute. Enfin, la structure de l’identifiant peut varier, au sein d’un même système, en fonction de chaque autorité.

Nous avons donc maintenant notre identifiant, du moins sa structure. Cependant, tout seul et sorti de son contexte, il est inopérant : nous avons besoin de savoir à quoi il correspond. Pour cela, deux types d’outils sont à notre disposition :

  • les résolveurs,
  • les métadonnées.

Je les garde pour la prochaine fois.

Une réflexion sur “L’identification pérenne des ressources numériques (3)

Les commentaires sont fermés.