IPRES : préserver les revues numériques

Parmi tous les objets numériques à préserver, les revues scientifiques ont sans doute été les premières à apparaître comme à la fois menacées et importantes, et à faire l’objet d’une véritable action de préservation. Aujourd’hui on peut en voir les résultats, assez aboutis. Dans cette session, nous avons pu observer trois modèles très différents. Les intervenants étaient :

Ecureuil

1. Modèle centralisé

Ce modèle est glorieusement représenté par Portico, une organisation à but non lucratif qui émane de JSTOR.
Pour synthétiser leur façon de procéder, ils font entrer les revues (uniquement peer-reviewed) de leurs partenaires éditeurs dans une archive en vue de les préserver sur le long terme. Si un problème survient (par ex., une faillite de l’éditeur), la revue devient accessible aux bibliothèques partenaires (lire : abonnées).
D’un point de vue technique, ils travaillent sur les "masters", donc les fichiers source et non la version communiquée au public. Ils ne préservent donc que le contenu, pas l’aspect. Par ailleurs, dès que l’objet entre dans l’archive, il est immédiatement migré vers un format ouvert.
Evidemment les éditeurs payent pour ce service, et les bibliothèques aussi. Heureusement, Portico répond oui à toutes les recommandations identifiées par le CLIR dans ce rapport sur la préservation des revues électroniques.

2. Modèle décentralisé

C’est à peu près tout le contraire que fait LOCKSS : une infrastructure distribuée en open source basée sur du P2P. L’idée est que chaque bibliothèque installe une "LOCKSS box" (gratuitement et garanti moins de deux heures d’installation) et commence à harvester des revues, exacement comme elle le ferait pour de simples pages Web. Si les revues sont payantes, un accord avec l’éditeur est nécessaire, mais LOCKSS permet de gérer aussi les revues en open access.
Le principe de la collecte de pages Web, qui est utilisé, permet de conserver l’aspect ("look & feel") des revues ; aucune migration n’est prévue sauf si elle est nécessaire pour la consultation. Par contre il y a une méthode de surveillance des trains de bits.
Les boîtes LOCKSS sont ensuite reliées entre elles et répliquées de façon à avoir l’information à plusieurs endroits, et donc toujours disponible.

3. Modèle bibliothéconomique

Enfin une troisième voie : celle de la KB qui, s’étant sentie particulièrement investie de cette mission que personne d’autre ne semblait vouloir assumer, décide de créer e-Depot. Il s’agit de faire rentrer les revues, grâce à un accord avec les éditeurs, dans une archive OAIS basée sur la suite logicielle DIAS d’IBM. Cette archive n’est par ailleurs pas spécialement dédiée aux revues, elle peut manger tous types de documents numériques.

Tous 3 s’intéressent uniquement à la préservation et pas à l’accès. Ca leur permet d’évacuer temporairement les problèmes de droits ! Si un problème survient, et qu’il faut donner accès, ils envisagent que d’autres infrastructures pourront prendre le relai, notamment si la charge est importante.