Le dernier n° de RLG Diginews est quasiment entièrement consacré à la préservation du numérique.
On y trouve notamment un retour d’expérience très intéressant concernant le sauvetage des "vieilles" données numériques détenues par les chercheurs de Cornell. Le "File Format and Media Migration Pilot Service" est un service de sauvetage à la demande de données numériques, qui a tourné pendant deux ans. Les individus apportaient leurs données (sur les supports qu’ils avaient) et l’équipe se chargeait de les faire migrer.
Une des conclusions intéressantes de l’étude est que finalement, les supports (disquettes, cartouches etc.) étaient en bon état, mais ce qui manquait le plus cruellement, c’était la documentation des plateformes et des logiciels qui avaient servi à créer les données.
A noter également, plus on attend, plus c’est difficile de récupérer les données.
Enfin, une conclusion vraiment surprenante : on ne peut pas faire confiance aux individus pour archiver leurs données, il vaut mieux les déposer dans un institutional repository. Incroyable, non !
Toujours dans la même revue, et toujours en provenance de Cornell, on trouve ensuite une évaluation de 5 outils de migrations de formats et d’extraction de métadonnées :
- le Digital Asset Preservation Tool d’IBM (open source), une sorte d’outil d’émulation
- le LuraDocument PDF Compressor Desktop v.4 (qui génère du PDF/A)
- le TOM (Typed Object Model) Conversion Service, un outil de migration en Java qui dispose d’une version test en ligne
- le National Library of New Zealand (NLNZ) Metadata Extraction Tool, un outil open source en java qui analyse les formats et extrait les métadonnées
- et enfin, un autre analyseur de format : TrID File Identifier.