L’identification pérenne des ressources numériques

Quand on crée des ressources numériques en ligne, qu’il s’agisse de numérisation, d’une édition ou tout simplement d’une entrée de blog, on se demande comment leur donner une identification fiable et durable sur le réseau.

La problématique de l’identification pérenne a des implications multiples que je vais essayer d’aborder (pas en un seul billet !).

La première question qu’on doit se poser, c’est pourquoi ? Ou plus précisément, quel objectif on cherche à atteindre. La terminologie reflète déjà deux axes possibles. Quand on dit référence stable, ou lien permanent, on se préoccupe manifestement de la capacité d’un tiers à nommer et retrouver la ressource : autrement dit, la citabilité. Quand on parle d’identifiant, ou URI , on est plutôt dans une problématique d’unicité et de pérénnité dans le cadre d’une utilisation pratique par des machines.

Déjà, dans ces deux optiques, il y a un choix à faire. Un identifiant peut être plus facilement généré par une machine. Celle-ci va tabler sur des combinaisons alphanumériques très longues pour garantir l’unicité, ce qui ne lui pose pas de problèmes particuliers, mais est ingérable pour un utilisateur humain.

La citabilité a elle aussi plusieurs dimensions. Les systèmes d’identification comme DOI par exemple ont l’avantage de constituer une référence que le lecteur peut retenir pour établir ses citations. C’est un modèle de confiance. Cependant, le lecteur doit partir à la recherche de cette référence dans la description de la ressource : elle n’apparaît pas dans la barre d’URL. Le lecteur non averti va plutôt se contenter de copier-coller l’URL, ce qui n’aura pas fait avancer beaucoup la stabilité de sa citation.

Il y a aussi une idée répandue selon laquelle une URL « citable » doit être intuitive, c’est-à-dire : signifiante, et rédigée en langage humain. En fait, si on reprend le raisonnement du copier-coller, cela ne change pas forcément grand-chose à la citabilité. Par contre, cela peut poser un certain nombre de problèmes. Si on utilise le titre, on est confronté aux caractères peu adaptés aux URL, ne serait-ce que les espaces et les accents. De plus un titre n’est pas forcément unique : il m’arrive souvent de reprendre plusieurs fois le même titre de billet. On peut utiliser un élément plus stable, par exemple un autre numéro de référence comme l’ISBN et l’ISSN. Malheureusement, la vie de ces numéros n’est pas forcément aussi pérenne et unique qu’on le voudrait : si une revue change de titre, elle change aussi d’ISSN.

Il faut donc bien réfléchir à ce qu’on attend de son système d’identification pérenne, définir ses fonctionnalités. C’est la première étape. On verra ça en détail dans la suite.

2 réactions sur “L’identification pérenne des ressources numériques”

Hubert dit :

14/02/2005 à 12:39

Ces petits cours sont plutôt intéressants. Juste une remarque au passage sur l’URL citable et signifiante. Visiblement, à ce que j’en comprends, ce type d’URL améliore le référencement et la recherche (pourquoi comment… ?). Google semble bien aimer les URL avec date et titre (ce qui permet d’éviter le pbe du titre unique).
Manue dit :

11/07/2006 à 04:02

A l’usage, Google digère très bien les identifiants opaques, s’ils sont cohérents et qu’on les assaisonne d’un peu de métadonnées dans la page Web. Désolée d’avoir mis autant de temps à répondre à ce commentaire ;-)

Les commentaires sont fermés.

Figoblog

Un blog sur Internet, la bibliothéconomie et la confiture de figues

L’identification pérenne des ressources numériques

2 réactions sur “L’identification pérenne des ressources numériques”