Histoire et Internet

Je me suis trouvée l’autre jour à cette journée d’étude organisée par la BDIC sur le thème "Classification et histoire". La deuxième journée a commencé par une intervention brillante de Philippe Rygiel dont je ne ferai pas le résumé ici de peur de trahir ses idées… Mais il abordait la question d’Internet utilisé comme source de l’histoire, ainsi que de l’impact d’Internet et de l’informatique d’une manière plus générale sur l’histoire et l’écriture de l’histoire.

Bref, il a cité entre autres ce site : Atlas interactif de l’immigration en France qui est une initative très intéressante. A partir d’une base qui réunit des données sur l’immigration en 1931 et 1936, il permet à l’internaute de choisir ses paramètres pour construire sa propre carte de l’immigration. On peut par exemple demander l’immigration des hommes belges en 1936 et la proportion de belges par rapport aux autres étrangers dans chaque département ;-)

Au passage, je signale que dans la revue de la BDIC Matériaux pour l’histoire de notre temps il y a un numéro spécial sur l’utilisation d’Internet comme source par les historiens (avec un article de Rygiel justement).

Parmi les conclusions de son intervention, Rygiel soulignait que l’histoire savante est presque absente du Web, et qu’en tout cas les historiens qui s’expriment dans les forums ou les listes de discussion ne proposent quasiment jamais de débats ni de textes. Il y voyait une difficulté d’appropriation du média mais aussi, peut-être, la conséquence d’un enjeu de pouvoir, en particulier si le Web devait s’affirmer pour l’historien comme un espace d’expression "libre" hors de son institution. Ca m’a fait penser aux blogs

Alors, qui sont les gentils ?

On avait Google print, puis la bibliothèque numérique européenne. Tout à coup débarque un troisième larron et il devient de plus en plus difficile de s’y retrouver : qui a raison, qui a tort ? Qui sont les gentils et qui sont les méchants ? J’espère ici démystifier un peu cette surenchère autour des bibliothèques numériques en proposant une approche chronologique en même temps qu’un décorticage stratégique.

Google print ou l’approche médiatique

« Nous vous proposons d’utiliser nos ressources et nos compétences parce que nous voulons votre bien » : tel pourrait être le mot d’ordre de Google Print si ce n’était pas déjà « notre mission est d’organiser l’information du monde ». De coup médiatique en coup médiatique, Google propulse son projet de numérisation – au milieu de bien d’autres projets dont je ne parlerai pas ici. Analysons simplement l’offre de Google print.
D’abord, un projet Google print éditeur (GPPP) qui fait du bruit mais n’a rien de nouveau, l’idée ayant été lancée par Amazon avec un peu moins de verve, mais annoncée dans le NY Times dès le 21 juin 2003 pour un lancement à l’automne 2003. Rappelons que GPPP a été annoncé en octobre 2004 et lancé officiellement (avec une interface spécifique) en mai 2005. GPPP n’invente donc rien, pas même l’objectif : faire vendre, en faisant des liens depuis le texte cherchable des ouvrages vers des librairies en ligne.
Un peu plus tard (décembre 2004) Google print s’élargit avec le Google Print Library Project, GPLP de son petit nom, et provoque la polémique que l’on saiten France à partir de janvier, mais aussi tout un tas de réaction de l’autre côté de l’Atlantique, bibliothécaires dubitatifs et éditeurs réticents.
Ce qu’on peut dire sur ce projet, c’est que dès le départ, il essaye de faire vibrer la corde sensible en offrant de numériser gratuitement des masses de livres. C’est l’utopie de la reproduction universelle, décrit par F. Barbier dans le BBF (pardon, mais maintenant on ne fait plus de liens, on cite à l’ancienne, débrouillez-vous avec ça : Barbier, Frédéric, « Patrimoine, production, reproduction », BBF, 2004, n° 5, p. 11-20) – je cite pour vous simplifier quand même la vie :

D’une manière générale, l’expert, donc le bibliothécaire, devra être sensible aux utopies de la reproduction : l’utopie de la reproduction universelle (tous les textes seraient transposés sur un nouveau support), alors que les processus de translittération qui se sont déjà produits au cours de l’histoire ont toujours montré qu’ils s’accompagnaient de pertes plus ou moins considérables. L’utopie, aussi, de la reproduction « transparente » – laquelle rejoint, dans une certaine mesure, l’utopie de l’information « transparente ».

Donc finalement on est dans le domaine de l’utopie, et pas dans celui d’une bibliothèque numérique, Google print ne s’étant jamais assimilé de lui-même à une « digital library ». Mais le résultat est là : on peut chercher des livres dans Google (pas les consulter, ce qui prouve bien qu’on n’est pas dans une bibliothèque numérique).

Open Content Alliance ou l’approche pragmatique.

Voici maintenant qu’on nous annonce que Yahoo s’y met à son tour, avec un projet intitulé OCA. Si on creuse un peu, on trouve derrière ce projet non pas Yahoo, mais Brewster Khale et son Internet Archive. Brewster ne s’y était pas trompé sur la possibilité d’utiliser Google print comme tremplin. En farfouillant dans les archives des press release d’Internet Archive, on observe des remous vers décembre 2004 (comme par hasard) : un projet de numérisation de livres avec l’Université de Toronto qui utilise un « cool new page turning robot » (tiens tiens, ne serait-ce pas ce truc révolutionnaire qu’on a vu passer dans le Monde?) et un projet de open access text archive probablement lié d’une façon ou d’une autre au fameux million book project dont personne ne parle.
La clef est là : personne n’en parle. Or, rien n’appâte tant les médias que de voir deux titans se battre pour un lopin de gloire. L’idée d’associer Yahoo est donc excellente pour l’image du projet. En outre, OCA a laissé le temps de se décanter à l’opération Google, juste le temps nécessaire pour repérer ses principales erreurs et les éviter. OCA se proclame donc respectueux des droits d’auteurs, ce qui peut étonner quand on sait qu’Internet Archive est un des inventeurs de l’opt-out si décrié dans le projet Google print :

If the author or publisher of some part of the Archive does not want his or her work in our Collections, then we may remove that portion of the Collections without notice.(Vu ici).

Par ailleurs, OCA met l’accent sur l’accès ouvert en utilisant quelques mots-clef – catalogue, métadonnées, OAI, RSS, PDF – susceptibles d’amadouer les bibliothécaires pour être accepté dans le panthéon des bibliothèques numériques.
Le résultat : un joli site Web mais pas grand-chose de concret pour l’instant, il faut attendre de voir si le pragmatisme de ce projet, présent également dans la sélection des partenaires, lui permettra d’être à la pointe.

La bibliothèque numérique européenne ou l’approche méthodique

Entre les deux, on trouve l’initiative européenne. Un Comité de pilotage, une consultation, des appels à projet : autant de procédures qui paraissent lourdes et interminables, en tout cas, qui n’ont ni l’insouciance de Google print, ni le pragmatisme de OCA. Mais cette troisième initiative se donne pour objectif de travailler en profondeur, susciter des bonnes pratiques dans les bibliothèques elles-mêmes, avec une vision méthodique des moyens pour les faire entrer dans le numérique. Pour prendre un exemple, elle est la seule à se soucier de la préservation à long terme des documents numériques. Il s’agit donc de faire avancer le métier et cela ne peut se faire en un jour. On essaye de susciter une dynamique de réflexion et d’action sur le long terme, qui sera sans doute plus longue à démarrer que les deux projets précédents, mais qui permettra aux bibliothèques d’évoluer à leur rythme et avec leurs moyens (humains et financiers).
Le résultat : on le verra plus tard. Dans un an, deux ans, dix ans ? Son objectif n’est pas d’être immédiat mais d’être profondément enraciné dans les pratiques bibliothéconomiques.

Conclusion

Chacun de ces trois projets a sa dynamique et aussi ses défauts. Chacun pourrait être contesté s’il était tout seul, en situation de monopole. La bonne nouvelle, c’est que ces trois projets existent. Ils garantissent que les ressources de demain sur le Web seront réparties, diversifiées, nombreuses et adaptées à des publics différents. Et ça, c’est une excellente nouvelle.

A lire

Aujourd’hui, un peu de lecture…

D’abord cet article dans ArXiv, via Catalogablog, dans lequel est fait le lien entre l’OAI et l’OAIS (ce qui risque de semer encore de la confusion ; pour éclaircir le sujet c’est par ici). Cet article sera présenté à PV 2005.

Ensuite le dernier numéro de First Monday dans lequel on notera en particulier un article de Karen Coyle sur les métadonnées de gestion des droits.

Un petit dernier via ResourceShelf : un article sur les bibliothèques numériques destinées aux enfants, et en particulier l’interface d’ICDL dont je vantais les mérites tantôt.

Et vous, qu’en pensez-vous ?

La commission européenne nous demande notre avis sur le sujet épineux (et brûlant) des bibliothèques numériques. Elle nous propose plusieurs textes ainsi que le contexte qui a suscité ce déploiement d’énergie.

On a donc une communication datée du 30 septembre 2005 et un document de travail (uniquement en anglais) à commenter suivant cette grille d’analyse avant le 20 janvier 2006. Deux séries de questions concernent d’une part la numérisation et l’accessibilité des contenus, et d’autre part la préservation des documents numériques.

La contribution est ouverte à tous, aux organisations publiques et privées, et les commentaires seront publiés.

A vos plumes !

Merci à PluriTAL.