IPRES : Audit et certification

Cette session portait sur les initiatives visant à auditer les entrepôts/archives de préservation de documents numériques pour savoir s’il sont dignes de confiance (trusted ou plutôt trustworthy). Les trois interventions étaient présentées par :

Cornell Library

Les trois interventions étant fortement convergentes, il est facile de les synthétiser autour de 3 points.

1. Les buts de la démarche d’audit

A quoi bon auditer des archives, me direz-vous ? Le but le plus évident est d’obtenir une forme de certification, un "label" permettant d’établir que l’archive est digne de confiance. Mais Robin Dale nous a bien fait valoir qu’avant d’atteindre ce but, il y a d’autres intérêts à cet audit pour le fonctionnement même de l’archive, comme par exemple, disposer de critères pour différencier une véritable archive de préservation d’un "bête" Institutionnal Repository. Finalement, le but de la démarche d’audit est avant tout d’évaluer les vulnérabilités et les risques qui pèsent sur l’archive, en toute transparence, pour établir une confiance.
Pour résumer, le but n’est pas d’avoir écarté tous les risques, mais de les connaître et de les annoncer.

2. Les méthodes d’évaluation et les preuves

Le principal outil de l’audit, c’est la fameuse "checklist", une liste de critères préétablis qui vont permettre d’évaluer l’archive. Il en existe une faite par RLG, celle de NESTOR devrait paraître bientôt en version anglaise. Ces critères se veulent être des indicateurs objectifs (on a entendu plusieurs fois le terme de "metrics").
Du côté de l’archive, Seamus Ross a mis l’accent sur le besoin de disposer d’un certain nombre de preuves sur lesquelles peut reposer l’évaluation. Il y en a trois sortes :

  • la documentation : charte, spécifications, profils de postes, rapport annuel, n’importe quoi
  • les interviews du personnel, faites par l’auditeur
  • et enfin les démonstrations et observations directes.

L’évaluation repose ainsi sur la mesure de l’écart qui existe entre ce que dit la documentation, ce que pense le personnel et ce qui se passe en réalité.

3. Normalisation, modèles économiques

Le problème, c’est que faire un audit, ça coûte cher : non seulement à celui qui le fait, mais aussi à l’institution auditée. Il va donc falloir trouver un modèle économique, sachant que le système de preuves montre bien qu’une auto-évaluation ne peut être suffisante.
Il n’y a pas vraiment eu de réponse à cette question de qui va faire les audits. La checklist, une fois unifiée au plan international, pourrait être proposée à l’ISO mais cela ne résoud pas ce problème.
Il existe aussi une crainte que l’existence d’un système de certification conduise dans certains cas à exiger cette certification pour certaines actions (ex. de la loi sur le copyright qui ferait une exception de conservation uniquement pour les archives certifiées). La réponse pourrait être d’avoir plusieurs niveaux de certification, permettant d’établir des réseaux de confiance entre institutions des différents niveaux.

Ithaca

Hier a été une journée particulièrement longue – oui, quand on voyage dans ce sens de la planète, ça rallonge vachement – et aujourd’hui c’était ma journée de relâche. J’en ai donc profité pour visiter une partie d’Ithaca.

Ithaca, on s’en rend compte dès qu’on arrive dans son petit aéroport familial, est une toute petite ville avec un très gros campus, celui de Cornell. Le tout se situe au bord d’un immense lac, Cayuga Lake, et il y a de belles chutes d’eau et des grands parcs un peu partout dans la région. C’est la région des "lacs des doigts", il suffit de regarder la carte pour comprendre pourquoi ils portent ce nom. C’est la première fois que je vais vraiment aux Etats-Unis et ça ressemble à ce que j’imaginais, en tout cas à une certaine vision qu’on nous en donne en particulier à la télé et dans certains films.

Ithaca falls

Le campus de Cornell est magnifique. N’ayant jamais vu d’autres campus américains, je ne peux pas comparer, mais par rapport à tous les endroits glauques que j’ai pu voir appeler « campus » dans ma vie, il n’y a même pas de comparaison. Il s’étale grassement sur une hauteur de la ville, avec des grandes pelouses et des immenses bâtiments d’un peu tous les styles (mais il y en a quand même beaucoup dans le style médiévalisant-flamboyant, je ne sais pas comment on dit) qui alternent avec des petits pavillons coquets. Il y a plein d’écureuils partout, il paraît que c’est un peu l’équivalent de nos pigeons donc eux doivent trouver cela dégueulasse, mais pour ma part, en bonne européenne, je les ai trouvés plutôt mignons. Le campus est traversé au Nord par un espèce de grand ravin au fond duquel coule une rivière qui tombe en cascade vers la ville. On peu aller au pied de la cascade, c’est très joli.

Campus de Cornell

La ville quand à elle, c’est un petit centre qui ressemble à n’importe quel petit centre ville de province de chez nous (sauf que ici tout est ouvert le dimanche). Quand on vient du campus on emprunte des rues très calmes et toutes droites avec des pavillons en bois clair, tous différents mais tous un peu pareils, et ils ont des écureuils qui courent dans le jardin, des citrouilles sous l’auvent et parfois un drapeau américain accroché contre la porte d’entrée. Toutes ces maisons silencieuses, avec le soleil et le chant des grillons (ou je ne sais quels insectes suspects du Nouveau Monde), ça avait un côté à la fois calme et inquiétant – mais j’ai peut-être trop regardé Virgin suicides. Je ne saurais pas vous dire si je suis tombée par chance sur la rue la plus typique du coin, où si tout est comme cela, mais c’était une expérience.

J’ai arrêté là mes explorations, parce qu’il fallait aussi que je récupère du décalage horaire. Mais si un jour je devais revenir par ici, j’essayerais de bénéficier d’une voiture pour aller un peu plus loin, par exemple aux chutes de Taughannock.

Malheureusement je ne peux pas vous mettre de photos pour l’instant, ayant oublié un de mes éléments essentiels de la panoplie du parfait geek en voyage, mais je les rajouterai en rentrant.

Encore en vadrouille

IPRES est une des grandes conférences internationales annuelles dans le domaine de la préservation du numérique. Elle a lieu cette année à Cornell University, Ithaca, les 9 et 10 octobre 2006… la semaine prochaine quoi.

C’est plus loin que Göttingen mais j’ai quand même la chance d’y aller ! Je vous ferai des comptes-rendus réguliers si j’ai le temps.

Bienvenue à Cornell

Mise à jour :

Juste avant de commencer à bloguer le contenu de la conférence, je voudrais préciser quelques points. Il n’y a rien de pire que de bloguer une conférence en balançant ses notes en ligne directement, c’est indigeste au possible. Donc comme je suis sympa je vais faire des synthèses, et un seul billet par session. J’essayerai de les faire dans l’ordre et au fur et à mesure, mais il faudra être patient. En outre je ne synthétiserai que ce qui m’a intéressé (désolée pour les autres).

Par ailleurs, les présentations sont en anglais et je synthétise en français, donc je suis désolée si je prends quelques libertés avec les contenus originaux. De la même façon je n’hésiterai pas à donner mon avis, sinon ça sert à quoi d’avoir un blog, franchement.

Pérenniser le document numérique

C’est le premier bouquin en français entièrement consacré à ce sujet :

Pérenniser le document numérique. Séminaire INRIA, 2-6 octobre 2006, Amboise. Ouvrage coordonné par Lisette Calderan, Bernard Hidoine et Jacques Millet. ADBS, 2006.

Epigraphie

Back to the future

J’en ai à peine cru mes yeux en lisant cet article dans Dlib : Repository Librarian and the Next Crusade – The Search for a Common Standard for Digital Repository Metadata. Ecrit par des gens du LANL, il défend une théorie époustouflante : MARCXML serait le meilleur format de métadonnées possible pour des entrepôts numériques…

C’est très étonnant car comme ils le disent eux mêmes :

Au début, MARC et MARCXML étaient perçus comme trop bibliocentriques et trop rigides. L’équipe était également préoccupée par la viabilité et le manque de popularité de ce format dans la communauté. (…) Le grand nombre de combinaisons d’étiquettes/indicateurs/sous-champs pouvaient suggérer que la complexité de ce standard serait problématique.

Ensuite ils mettent leur priorité sur 3 fonctionnalités du format : granularité, transparence, extensibilité. Là encore, on se sent assez loin de MARC et même de MARCXML. Mais c’est là que l’effet pervers des tableaux de comparaison de fonctionnalités fait son office et montre qu’on peut leur faire dire tout ce que l’on veut.

En comparant MARCXML à ONIX et PRISM (rapidement écartés) et également Dublin Core et MODS, en se limitant à des métadonnées descriptives et aux sujets les plus complexes, on réussit à "prouver" que MARCXML est meilleur que tous ses petits copains.

D’où la conclusion :

Utilisé dans le monde entier et supporté par de nombreux outils, MARC est omniprésent dans la communauté des bibliothèques (…)

Et d’autres vérités du même acabit. Nous voici en plein retour vers le futur : le format de métadonnées le plus prometteur pour l’avenir serait un format particulièrement vieilli, compliqué, rigide, non lisible par des humains (sauf s’ils ont suivi des cours de bibliothéconomie auquel cas on peut se demander s’ils sont vraiment toujours humains ;-) et limité à la communauté des bibliothèques. Et extensible pourvu qu’on tolère d’en arriver à ça :

 administration metadata

Cela me fait hurler… Amis spécialistes de XML, du Web sémantique et des métadonnées, je vous en prie, dîtes-moi ce que vous en pensez : serais-je déjà encore en retard (ou en avance) sur mon temps ?

Retour

Me voici de retour !

Comme je n’ai pas l’intention de raconter ici mes vacances en Grèce, je vous recommande si jamais cela vous intéresse d’aller lire nos réflexions intelligentes sur les petites cases.

Ensuite vous pourrez subir l’inévitable diaporama des vacances, qui commence ici :

Arrivée à l'Acropole

et se trouve également . Enfin quand même cela pourrait être notable de remarquer que j’ai bel et bien cueilli des figues.

Puis retour à la normale ;-)

PS : ah oui et j’oubliais, j’ai créé un groupe sur les figues dans Flickr, n’hésitez pas à contribuer, j’accepterai un peu tout : figues, figuiers, choses à la figue, photos de plats et recettes…