72 heures chrono

Parce que rien ne vaut un retour aux sources

Ces événements se déroulent mardi entre 21h30 et 0h50.

M. Christian Paul – Rappel au Règlement. Cet après-midi, à quelques heures de l’ouverture de ce débat, les lobbies ont pris possession de l’Assemblée nationale (…) Il était remis à chacun des parlementaires qui le souhaitait une carte prépayée de 9,99 €, donnant droit à télécharger gratuitement une dizaine de morceaux de musique…

M. Le ministre de la Culture présente le projet de Loi.
La discussion que nous entamons ce soir était très attendue. Oui, je n’hésite pas à le dire, c’est un débat historique.

M. Le ministre présente l’amendement qui définit la méthode de « réponse graduée » qui permettra de sortir les 8 million d’internautes qui téléchargent de l’illégalité.

M. Christian Vanneste, rapporteur de la commission des lois – Le texte qui nous est proposé aujourd’hui est un texte modeste
M. Le rapporteur présente le projet de Loi.

M. Frédéric Dutoit (PCF) présente une exception d’irrecevabilité. Elle n’est pas adoptée.

M. Christian Paul (PS) présente une question préalable.
Ce projet de loi est devenu le drapeau d’une croisade répressive que nous jugeons injuste, moyenâgeuse et inefficace. (…) avec le baladeur que j’ai ici, je ne peux rien télécharger sur les plateformes qui sont venues tout à l’heure à l’Assemblée ! Des milliers de Français vont acheter des baladeurs pour Noël. Savent-ils que ce projet de loi les transforme, potentiellement, en délinquants ?

M. le Ministre de la Culture perd son sang-froid : C’est faux ! C’est scandaleux ! (…) C’est lamentable ! Minable !

Les débats deviennent amusants. La question préalable n’est pas adoptée.

Ces événements se déroulent mercredi entre 16h20 et 20h15.

Les discussions reprennent sur le projet dans son ensemble.
Où il est question de la réponse graduée (devenue « riposte graduée » pour l’oppposition), de la licence globale obligatoire, du peer to peer, du piratage, des DRM, de l’interopérabilité, de la gratuité, des logiciels libres.

Le PS dépose une motion de renvoi en commission. Elle n’est pas adoptée.

Ces événements se déroulent mercredi entre 21h50 et 1h00.

Discussion de l’article premier.
Patrick Bloche (PS) présente un rappel au règlement : Vraiment, nous légiférons dans les pires conditions…
Mme Christine Boutin (UMP) introduit la licence globale optionnelle.
Discussion et rejet des amendements concernant la copie privée.
Discussion des amendements 153 et 154 concernant la licence globale optionnelle. Les amendements sont adoptés.
Discussion des amendements concernant l’enseignement et la recherche, les bibliothèques et les musées, les archives.
M. le Ministre – (…)le projet de loi répond en partie à votre préoccupation, puisqu’il prévoit une exception au profit des services chargés du dépôt légal. La directive précise qu’il est opportun de promouvoir des contrats spécifiques avec ces établissements pour leur permettre de réaliser leur mission de diffusion.Le principe de gratuité appliqué à tout usage dans l’enseignement ou la recherche laisserait penser que la création n’a pas de valeur.
Les amendements sont rejetés.
L’amendement 114 "vise à étendre l’exception (concernant les personnes handicapées) à tous les établissements ouverts au public tels que les bibliothèques, les services d’archives, les centres de documentation et les espaces culturels multimédia, en vue de mieux diffuser la politique culturelle de proximité." M. Le ministre demande à ce qu’on retire les archives, "leur vocation première étant d’assurer la conservation des œuvres plutôt que leur diffusion". L’amendement est adopté.

Ces événements se déroulent jeudi entre 16h15 et 19h20.

A la demande du Gouvernement, la discussion de l’article premier, des articles additionnels après l’article premier et avant l’article 2, ainsi que de l’article 2 est réservée.
Discussion.
Le PS fait un nouveau rappel au règlement.
Les articles 3 et 4 sont adoptés sans discussion.
Deux nouveaux rappels au règlement.
Où il est de nouveau question de licence globale, de DRM, de téléchargement, de Johnny Halliday, du Moyen-Age…
Plusieurs amendements sont adoptés, dont un qui interdit de placer des dispositifs anti-copie à l’insu des artistes.

Ces événements se déroulent jeudi entre 21h30 et 0h30.

La suite de la discussion ayant été reportée après Noël, une discussion large est ouverte.
Où il est question de courses de Noël, de Lawrence Lessig, du monopole de Microsoft, de la bibliothèque numérique européenne (M. le Ministre – Pourquoi nous sommes-nous mobilisés pour la bibliothèque numérique européenne ? Serait-ce pour céder aux sirènes du capitalisme mondial ? C’est tout simplement par souci d’équilibre, pour faire en sorte que nous ne soyons dépendants de personne pour permettre au plus grand nombre l’accès aux œuvres), du fair use, des DRM, des webradios, d’interopérabilité, de formats ouverts, de logiciels libres.
Les débats sont suspendus jusqu’au 17 janvier.

Fin de la saison 1.

Mon archivage aDORe

Je viens de découvrir, à travers Lorcan Dempsey et Peter Suber, un système (un software) d’archivage de documents numériques qui s’appelle aDORe et qui a l’air assez intéressant.

Le système repose sur l’archivage de paquets, en appréhendant ces paquets non pas de façon documentaire (un objet = un document) mais de façon pragmatique comme des trains de bits continus qu’on va ranger dans des boîtes. Cette approche est particulièrement utile quand on gère une archive qui reçoit des gros batch de 1.000 à 100.000 documents… Chaque batch est donc considéré comme un paquet. aDORe dissocie pour chacun de ces gros paquets les métadonnées, qui vont être enregistrées en continu sur une « cassette XML » nommée XMLtape, et les documents eux-mêmes qui sont encapsulés dans des fichiers ARC (le format de fichier de l’archivage du Web).

On peut stocker n’importe quel format de fichier dans un ARC, les différents fichiers étant séparés les uns des autres par des métadonnées textuelles et identifiés par une URI : c’est ce qu’on appelle les « ARC records ». ARC étant un format conçu pour contenir plein de fichiers dans une boîte, il atomise le problème de la granularité en le renvoyant aux métadonnées associées.

Les métadonnées associées sont enregistrées ici dans le format qui nous fait le plus plaisir pour gérer des objets complexes (METS, MPEG21 ou autre) et stockées dans la fameuse XMLtape, qui est aussi une sorte de capsule. Celle-ci peut contenir jusqu’à 1.000.000 de descriptions de documents.
Grâce à l’utilisation des formats de gestion des objets complexes, on a la possibilité d’utiliser ces métadonnées pour gérer la structure et la granularité des objets : ces métadonnées vont faire référence aux identifiants (URI) présents dans les fichiers ARC pour organiser les fichiers suivant leur structure logique.

A l’intérieur des ARC, on a donc des « ARC records », c’est à dire des enregistrements qui correspondent à un fichier numérique (au niveau de granularité le plus fin) et qui sont identifiés par une URI. Dans les métadonnées stockées sur la cassette XML, on se « raccroche » à ces URI grâce à un lien encodé suivant le protocole OpenURL.
Ensuite, on va créer pour chaque ARC un résolveur OpenURL, et pour chaque XMLtape un entrepôt OAI. Donc, on obtient finalement un stock de métadonnées en XML accédées via l’OAI, et un stock d’objets numériques accédés via un résolveur OpenURL.

Pour récapituler en s’appuyant sur le modèle OAIS :
La première opération compliquée est la constitution du SIP. On constitue les XMLtape et les ARC, mais avec le pré-requis que l’on dispose de métadonnées au format METS ou MPEG21, et que celles-ci contiennent des liens au format OpenURL (pas insurmontable, mais il faut y penser avant). A tous les niveaux, il faut aussi gérer l’attribution de plein d’identifiants uniques et pérennes dont on aura besoin pour l’accès.
L’avantage, c’est qu’une fois qu’on a fait cette opération, on ne touche plus à rien : le SIP, l’AIP et le DIP sont physiquement confondus. Cela suppose qu’on n’a pas d’opération à faire sur ces paquets (une migration de format par exemple) donc qu’on maîtrise bien le contenu, ou sinon il faut les re-verser intégralement (avec de nouvelles métadonnées, et de nouveaux identifiants).
En fait, l’AIP est un couple XMLtape/fichiers ARC qui lui correspondent, et le DIP est un couple métadonnées MPEG21 ou METS/objet numérique.
On dispose de tous les éléments qui permettent d’accéder au DIP, quelle que soit la granularité qui nous intéresse, ce qui semble être le principal atout de ce système. On peut lui brancher de façon modulaire n’importe quel système d’indexation et de visualisation, et en changer si nécessaire.

A première vue, je dirais que c’est un système qui doit bien marcher si vous archivez des choses qui sont déjà dans un format pérenne, qui ont une structure simple et identifiée, et qui ont déjà une URI ou un identifiant à chaque niveau de granularité. Les concepteurs mettent l’accent sur le côté fiable, dans une optique de préservation, du couple ARC/XMLtape, qui évite d’avoir à toucher aux fichiers : c’est très bien, sauf si on a besoin de toucher aux fichiers pour les conserver… une belle enveloppe ça ne sert à rien, si elle contient des trucs affreux.
Enfin, la flexibilité des conditions d’accès est quand même très séduisante.
Finalement, tout cela ressemble beaucoup aux infrastructures qu’on connaît pour l’archivage du Web, sauf qu’on y rajoute une couche de métadonnées de structure agrémentée d’OpenURL, pour en faire une architecture plus proche des besoins des bibliothèques numériques.

ADORe est un logiciel open source du Los Alamos National Laboratory.

NB : il est impossible d’y comprendre quoi que ce soit sans lire cet article. J’ai fait mon possible pour simplifier et synthétiser mais ce n’était pas très évident. Désolée.

Une nouvelle recette

Maintenant que j’ai à peu près goûté toutes les différentes sortes de confitures de figues que j’ai préparées à l’automne, je peux vous annoncer que j’ai testé une nouvelle recette vraiment performante dont voici la base :

  • Prendre 500g de figues fraîches, les couper en 4 dans un saladier
  • couvrir avec 250g de sucre
  • laisser reposer une nuit au frigo
  • le lendemain, séparer le jus et le faire cuire 10mn à feu vif
  • puis ajouter les fruits, baisser un peu le feu et cuire encore 10mn
  • c’est prêt !

L’avantage de cette recette, en plus du fait qu’elle est rapide, facile et pas trop sucrée, c’est qu’on peut faire de nombreuses variantes…
J’ai testé avec moitié figues et moitié mirabelles, c’est sublime (mais on sent moins le goût des figues que celui des mirabelles).
On peut ajouter pendant la phase de macération, soit des épices (canelle ou anis ou les deux), soit une gousse de vanille fendue en deux. A la vanille, c’est excellent aussi.
On peut ajouter au moment de la cuisson une dizaine de noix en petits morceaux. C’est très convaincant.
Enfin j’ai essayé avec du citron confit, mais c’était raté car j’ai laissé cuire trop longtemps et en plus j’avais mis trop de citron.

Nouveaux tests prévus l’année prochaine !

Just released : RDA

RDA sera peut-être le format de catalogage de demain. Basé sur les FRBR et les FRAR, RDA se donne les objectifs suivants :

  • Fournir un « framework » fiable et souple pour décrire à la fois le contenu et les aspects techniques de tous types de ressources et de documents
  • Etre compatible avec des principes, modèles et standards internationaux
  • Etre utilisable hors de la communauté des bibliothèques, et que des communautés variées puissent l’adapter à leurs besoins spécifiques.

Les descriptions ainsi constituées :

  • permettont de trouver, identifier, sélectionner et obtenir les ressources répondant aux besoins des utilisateurs
  • seront compatibles avec les descriptions en AACR2 présentes dans les catalogues existants
  • seront indépendantes des formats, supports ou systèmes utilisés pour stocker ou communiquer les données
  • seront facilement adaptables aux nouvelles structures de bases de données.

Vous remarquez, je fais un effort, je traduis.

Donc, les specs de ce nouveau format magique sont disponibles pour être commentées jusqu’en avril 2006 :

Je n’ai évidemment pas encore eu le temps de lire cet épais document, d’autant que Catalogablog vient juste de le signaler. Quelques observations au débotté tout de même :

  • le changement de nom semble présager d’un changement paradigmatique (??) dans la façon de concevoir les notices bibliographiques
  • les nombreuses références aux FRBR laissent à penser qu’il y aura expression de relations et donc qu’on va sortir des formats « plats » des bases de données
  • en même temps, ils ne parlent pas de RDF, on dirait que c’est tabou – ça l’est peut-être pour pas faire peur aux bibliothécaires
  • il s’agit d’un modèle qui s’intéresse aux concepts et pas aux formats d’expression des concepts – on fait enfin les choses dans l’ordre ?
  • c’est censé aider à mieux décrire les ressources numériques, ce qui me semble instinctivement être une drôle d’idée mais faut voir.

Je ferai un compte-rendu quand je l’aurai lu (espérons).

De la bouteille de Klein aux extra-terrestres

Il y a quelques temps, j’ai découvert la 4e dimension : celle de la bouteille de Klein. Je précise que j’étais arrivée là via le noeud de Moebius d’Olivier. Pour paraphraser l’article de Wikipedia, il s’agit d’imaginer un mouvement de la surface qui serait impossible dans notre dimension, lui permettant de s’interpénétrer elle-même.

Poursuivant ma quête de la 4e dimension, j’ai atterri sur des sites scientifiques qui m’ont révélé une nouvelle dimension des interfaces de bibliothèques numériques… D’abord ici où vous pouvez manipuler la bouteille de Klein avec la souris, puis … Ce deuxième site présente des modèles de cinématique, c’est-à-dire des machines qui sont faites juste pour fonctionner. On peut, pour certaines, les voir à l’oeuvre et même les manipuler avec la souris, aussi.

Dans le genre original, vous pouvez aussi visiter une bibliothèque numérique un peu particulière, consacrée aux cynlindres enregistrés, les premiers supports sonores du siècles dernier. On peut les écouter et les copier (oui, ils sont dans le domaine public, et le site lui-même est en Creative Commons).

N’oubliez pas, pour terminer cette promenade scientifico-étrange, de changer votre logiciel de grid si vous participez au SETI project : ce projet de recherche d’une intelligence extra-terrestre entre dans une nouvelle phase.

Confiture de « pff j’ai pas eu le temps de bloguer cette semaine »

J’ai lu un article très intéressant d’Alain Giffard sur les bibliothèques numériques en général et celle de Google en particulier.

Des gens ont parlé d’identifiants pérennes : sur catalogablog et chez Lorcan Dempsey.

Ca a bougé côté DLF : au sujet du DLF Framework qui a pour objectif de modéliser l’activité des bibliothèques si je comprends ce qu’en dit Lorcan, avec la publication des présentations d’une conférence intitulée Managing Digital Assets, et aussi avec la publication d’un document à réviser sur l’utilisation de MODS pour le patrimoine (via Digitization Blog celui-là).

Ca a bougé côté OCLC : avec la publication du rapport annuel 2005, et celle d’un autre rapport intitulé Perceptions of Libraries and Information Resources, sur les usages et les pratiques, et qui s’inscrit en continuité du 2003 OCLC Environmental Scan: Pattern Recognition vraiment à lire si vous ne l’aviez pas fait à l’époque.

Moi, pendant ce temps, j’étais occupée à aller au ciné, faire une conférence, et rencontrer des vrais gens dans la vraie vie. C’était bien aussi.

Vercingétorix

Hier soir, en zappant sur les chaînes improbables du câble, on est tombés sur un documentaire de France 5 sur Vercingétorix. Deux choses à dire le concernant…

D’abord, c’était un excellent documentaire. Il ne se contentait pas de retracer le mythe vecingétorixien, mais il abordait la façon dont ce mythe s’est imposé, avec toute une iconographie, à l’époque de Napoléon III (en gros) : le message à transmettre au XIXe siècle à travers l’orgueil du vaincu plus noble que le vainqueur, puis l’utilisation de cette image par Pétain pendant la 2e guerre mondiale, etc. Parmi les grandes images qui découlent d’une iconographie gravée de type "Epinal" ou des manuels scolaires de cette époque comme le Tour de France de deux enfants, on trouve la statue érigée à Alise-Ste-Reine, site présumé d’Alésia (cf. photo).

Deuxième merveille de ce documentaire, juste avant qu’il commence est diffusée une courte annonce indiquant "ce programme peut être librement enregistré et diffusé en classe, education.france5.fr". Aussitôt je bondis : comment, des reportages libres de droits pour l’enseignement ! Mais c’est formidable !
Donc je me jette (enfin, le lendemain) sur mon PC pour chercher plus d’informations sur la politique de libération de droits de France 5. En fait, la liste des programmes concernés par cette initiative est même assez longue.

Aujourd’hui, France 5 négocie des droits pour les enseignants, à charge pour eux de glisser une cassette dans leur magnétoscope pour enregistrer le programme. Mais demain, peut-être seront-ils obligés par la loi, comme les webradios, de mettre en place des DRM hors de prix pour garantir cette liberté.

Qu’est-ce que le modèle OAIS ?

L’OAIS est un modèle conceptuel pour l’archivage de documents (numériques en particulier). Cela signifie qu’il constitue une référence décrivant dans les grandes lignes les fonctions, les responsabilités et l’organisation d’un système qui voudrait préserver de l’information, en particulier des données numériques, sur le long terme. Le long terme est défini comme suffisamment long pour être soumis à l’impact des évolutions technologiques, c’est à dire, pour ce qui concerne le document numérique, très court en fait.
L’OAIS a été défini au départ dans le domaine aérospatial, par le CCSDS qui est l’organisme de normalisation de ce domaine. Aujourd’hui il est très largement adopté au-delà de cette communauté et il a été reçu comme norme par l’ISO sous le numéro 14721.

Que fait / ne fait pas l’OAIS ?

Ce que fait l’OAIS :

  • il donne une terminologie fiable et unique pour manipuler tous les concepts liés à la préservation des données numériques
  • il fait le tour de toutes les questions à se poser au moment de mettre en place un système de préservation
  • il décrit les composantes d’un tel système au niveau de l’organisation interne et externe

Ce qu’il ne fait pas :

  • il ne donne pas de formats, schémas, règles ou techniques pour préserver les documents numériques
  • il ne décrit pas les applications informatiques et techniques à mettre en œuvre, ni logicielles, ni matérielles
  • il ne donne pas de méthodologie concrète de réalisation d’un tel système (cahier des charges, workbook ou autre).

Les grands principes du modèle peuvent être décrits par un schéma simple (mais également par un schéma compliqué si on veut ;-) cf. ci-dessus (cliquer sur l’image pour agrandir). En gros, le modèle est conçu comme une boîte dans laquelle on manipule des paquets. Cette boîte a un ou plusieurs rôles ou missions, et elle interagit avec les producteurs des données en amont, les administrateurs du système, et la communauté d’utilisateurs en aval.

Les paquets

Le modèle OAIS repose sur l’idée que l’information constitue des paquets, et que ces paquets ne sont pas les mêmes suivant qu’on est en train de produire l’information, d’essayer de la conserver, ou de la communiquer à un utilisateur. On a donc trois sortes de paquets :

  • les paquets de versement (SIP) préparés par les producteurs à destination de l’archive
  • les paquets d’archivage (AIP) transformés par l’archive à partir du SIP dans une forme plus facile à conserver dans le temps
  • les paquets de diffusion (DIP) transformés par l’archive à partir de l’AIP dans une forme plus facile à communiquer notamment sur le réseau.

Dans chaque paquet, à chaque stade, on va trouver des fichiers informatiques qui correspondent à l’objet ou au document qu’on veut conserver, et des informations sur ce document c’est à dire des métadonnées. Je ne vais pas rentrer dans le détail, mais la façon de constituer les paquets, y compris et surtout le genre de métadonnées dont on a besoin pour que ça ait une chance de fonctionner, sont très bien décrits dans le modèle.

Les missions d’une archive OAIS

Le but de la mise en place d’une archive OAIS est d’avoir une instance, cette archive, qui va endosser la responsabilité de la préservation à long terme des documents qu’on lui confie en vue de les communiquer à une communauté définie d’utilisateurs. Il y a plusieurs idées importantes ici :

  • la préservation se fait en vue de la communication
  • l’archive cible une communauté d’utilisateurs et s’efforce de répondre aux besoins de cette communauté.

Si on prend l’exemple d’une bibliothèque, la communauté n’est pas la même pour une BU que pour une bibliothèque publique, vous savez cela aussi bien que moi. Donc les services ne seront pas les mêmes non plus.
L’idée de responsabilité est très forte dans le modèle ; à tout moment l’archive doit savoir prouver qu’elle a bien fait son travail – surtout si elle échoue, j’imagine.
Cette responsabilité inclut les relations avec les producteurs : il s’agit de négocier des accords concernant les versements, en particulier les clauses techniques (l’archive et le producteur définissent ensemble à quoi doit ressembler le SIP). Cela inclut aussi le fait d’obtenir de la part du producteur tous les droits nécessaires à la manipulation des documents, en particulier les droits de propriété intellectuelle.
L’archive garantit aussi qu’elle fournira à sa communauté d’utilisateurs des documents compréhensibles, disponibles, et qu’elle mettra en œuvre tout ce qui est en son pouvoir pour préserver les documents dans le temps : c’est une sorte de contrat entre l’archive et sa communauté d’utilisateurs.

L’organisation

Le modèle OAIS va ensuite définir l’organisation de l’archive, c’est à dire comment elle doit s’y prendre pour gérer ses paquets sans rien oublier. Pour cela, on définit des entités organisationnelles et la façon dont elles s’articulent entre elles. Pour prendre un exemple, il y a une entité « entrées » dont le rôle est de recevoir les paquets SIP et de les transformer en paquets AIP ; cette entité est en relation avec l’entité « stockage » à qui elle confie les AIP. Elle a aussi d’autres rôles comme envoyer un accusé de réception au producteur pour certifier qu’elle a bien pris en charge son paquet, ce qui transfère la responsabilité du paquet du producteur vers l’archive.
Je ne vais pas détailler mais tout est un peu sur ce modèle. Les différentes entités sont :

  • les entrées
  • le stockage
  • la gestion des données (en fait, des métadonnées)
  • l’administration qui pilote le tout
  • la planification de la préservation qui prend en charge les actions de veille technologique pour décider des opérations à mettre en œuvre
  • et enfin, l’accès.

Chacune de ces entités a ses rôles, ses fonctions, et doit communiquer avec les autres sous la forme de flux de données. En réalité, tout cela est conceptuel, cela veut dire que dans la mise en œuvre réelle, on n’est pas obligé d’avoir des gens ou des services qui travaillent spécifiquement sur une et une seule de ces entités. Mais toutes les fonctions et les interactions doivent exister.

Migrations, émulations

Ensuite, le modèle OAIS aborde les différentes méthodes qui peuvent être utilisées plus concrètement pour pérenniser l’information. Il y en principalement deux sortes : la migration et l’émulation.
La migration consiste à prendre un AIP et à le transformer en autre chose. Il y a plusieurs sortes de migrations possibles en fonction du type de problème rencontré : par exemple, si on a un support qui se dégrade mais que le document enregistré dessus ne pose pas de problème, on procède à un simple renouvellement (rafraîchissement de support) ou on passe à un support plus récent (duplication). C’est le type de migration qui a le moins d’impact sur l’accès à l’AIP. Par contre, si c’est le format du document ou les logiciels associés qui posent problème, on aura des migrations plus musclées qui modifient la structure même de l’AIP et rendent nécessaire la gestion de versions d’AIP.
Dans l’émulation, on ne touche pas à l’AIP mais on s’efforce de conserver ou reproduire les conditions d’accès au document, de la manière la plus proche possible de ce qu’étaient les conditions de consultation à l’origine. C’est le mode qu’on utilise de préférence pour les documents dans des formats propriétaires et les documents qui ont des comportements très spécifiques, comme les jeux vidéos par exemple.

Et après ?

Maintenant qu’on sait tout cela, et qu’on a acquis la vision d’ensemble des problématiques de conservation des données numériques, ainsi qu’un début de solution pour mettre en œuvre un système d’archivage, yapuka… définir quel sera le stockage, quels seront les formats acceptés dans les paquets, les formats de métadonnées utilisés, les relations avec les producteurs, les services d’accès et de recherche, définir et acquérir ou développer des logiciels qui remplissent toutes ces fonctions, et surveiller de très près son archive, une fois qu’elle est bien remplie, pour s’assurer que les migrations et les émulations sont effectuées à temps. Car dans le domaine numérique, toute conservation est nécessairement préventive : quand on s’aperçoit qu’un document a été altéré, il est généralement trop tard pour faire quoi que ce soit.
Le modèle OAIS ne donne pas de clefs pour mettre tout ceci en œuvre et c’est sans doute la principale difficulté : comment passer de l’abstraction à l’application. En attendant qu’on nous propose des logiciels de type « MyOAIS » clef en main, il est probable qu’on devra s’en remettre, le plus souvent, à des archives centralisées ou à des tiers archiveurs privés. Ces derniers, pour prouver que le modèle OAIS n’est pas pour eux qu’une belle parole, devront sans doute obtenir un niveau de certification officiel et international. C’est pour demain.

Source : le modèle OAIS en français.

PS : Les documents protégés par des DRM ne pourront être, ni migrés, ni émulés. La loi interdisant (prochainement) de créer des logiciels qui retirent ces protections techniques, ainsi que des logiciels qui les ignorent ou les contournent, aucune solution ne pourra être apportée à leur conservation au-delà de la durée de vie de leur support ou de leur environnement matériel et logiciel. Si leurs producteurs ne font pas l’effort de confier à une archive OAIS une version débloquée et documentée (un SIP, quoi), ils seront perdus à jamais. Dommage, quand même.

Numérisation en Europe : cadrage

Un peu de lecture rapidement : deux documents de cadrage des initiatives de numérisation en Europe viennent d’être publiés.

Le premier nous vient du JISC et il porte sur la coordination d’une initiative nationale au Royaume-Uni : 2005 Digitization Report, pdf, 38p.

Le second nous vient du projet Minerva, donc au niveau de l’Europe. Il fait la liste des actions à entreprendre et en particulier celles qui peuvent être menées immédiatement : Plan d’action dynamique pour la coordination dans l’U.E. de la numérisation du contenu culturel et scientifique.