Chaîne

Aussi étonnant que ça puisse paraître, pour une fois ma carapace bibliothéconomique ne m’a pas protégée et je me trouve prise dans une chaîne de blogueurs que m’envoie les z’ed.

la règle du jeu est la suivante :

  • 1. Allez dans vos archives
  • 2. Retrouvez la 23e note ou celle proche de ce chiffre
  • 3. Retrouvez la 5e phrase.
  • 4. Affichez le texte de la phrase ainsi que les instructions
  • 5. Demandez à 5 personnes d’en faire autant.

Je me suis pliée au jeu et voici le résultat :

Et puis tant qu’on y est, ça me rappelle une aventure encore plus antédiluvienne, il y a deux mois avec cette affaire de projet Ocean , une grande histoire de numérisation entre Google et la bibliothèque de l’Université de Stanford, dont on a plus jamais entendu parler depuis.

Ben oui, croyez-en vos oreilles (euh vos yeux) ou pas, c’était en avril 2004 et j’étais déjà obnubilée par les projets de numérisation de Google ;-) Ce qui me confirme que je commence à tourner en rond dans ce blog et que j’ai bien besoin d’un peu de repos.

Je me demande bien à qui je vais pouvoir faire ce merveilleux cadeau, allez, si vous avez envie de jouer, Got, Zid, Thilas, Romain, et Olivier… par exemple…

Histoire et Internet

Je me suis trouvée l’autre jour à cette journée d’étude organisée par la BDIC sur le thème "Classification et histoire". La deuxième journée a commencé par une intervention brillante de Philippe Rygiel dont je ne ferai pas le résumé ici de peur de trahir ses idées… Mais il abordait la question d’Internet utilisé comme source de l’histoire, ainsi que de l’impact d’Internet et de l’informatique d’une manière plus générale sur l’histoire et l’écriture de l’histoire.

Bref, il a cité entre autres ce site : Atlas interactif de l’immigration en France qui est une initative très intéressante. A partir d’une base qui réunit des données sur l’immigration en 1931 et 1936, il permet à l’internaute de choisir ses paramètres pour construire sa propre carte de l’immigration. On peut par exemple demander l’immigration des hommes belges en 1936 et la proportion de belges par rapport aux autres étrangers dans chaque département ;-)

Au passage, je signale que dans la revue de la BDIC Matériaux pour l’histoire de notre temps il y a un numéro spécial sur l’utilisation d’Internet comme source par les historiens (avec un article de Rygiel justement).

Parmi les conclusions de son intervention, Rygiel soulignait que l’histoire savante est presque absente du Web, et qu’en tout cas les historiens qui s’expriment dans les forums ou les listes de discussion ne proposent quasiment jamais de débats ni de textes. Il y voyait une difficulté d’appropriation du média mais aussi, peut-être, la conséquence d’un enjeu de pouvoir, en particulier si le Web devait s’affirmer pour l’historien comme un espace d’expression "libre" hors de son institution. Ca m’a fait penser aux blogs

Alors, qui sont les gentils ?

On avait Google print, puis la bibliothèque numérique européenne. Tout à coup débarque un troisième larron et il devient de plus en plus difficile de s’y retrouver : qui a raison, qui a tort ? Qui sont les gentils et qui sont les méchants ? J’espère ici démystifier un peu cette surenchère autour des bibliothèques numériques en proposant une approche chronologique en même temps qu’un décorticage stratégique.

Google print ou l’approche médiatique

« Nous vous proposons d’utiliser nos ressources et nos compétences parce que nous voulons votre bien » : tel pourrait être le mot d’ordre de Google Print si ce n’était pas déjà « notre mission est d’organiser l’information du monde ». De coup médiatique en coup médiatique, Google propulse son projet de numérisation – au milieu de bien d’autres projets dont je ne parlerai pas ici. Analysons simplement l’offre de Google print.
D’abord, un projet Google print éditeur (GPPP) qui fait du bruit mais n’a rien de nouveau, l’idée ayant été lancée par Amazon avec un peu moins de verve, mais annoncée dans le NY Times dès le 21 juin 2003 pour un lancement à l’automne 2003. Rappelons que GPPP a été annoncé en octobre 2004 et lancé officiellement (avec une interface spécifique) en mai 2005. GPPP n’invente donc rien, pas même l’objectif : faire vendre, en faisant des liens depuis le texte cherchable des ouvrages vers des librairies en ligne.
Un peu plus tard (décembre 2004) Google print s’élargit avec le Google Print Library Project, GPLP de son petit nom, et provoque la polémique que l’on saiten France à partir de janvier, mais aussi tout un tas de réaction de l’autre côté de l’Atlantique, bibliothécaires dubitatifs et éditeurs réticents.
Ce qu’on peut dire sur ce projet, c’est que dès le départ, il essaye de faire vibrer la corde sensible en offrant de numériser gratuitement des masses de livres. C’est l’utopie de la reproduction universelle, décrit par F. Barbier dans le BBF (pardon, mais maintenant on ne fait plus de liens, on cite à l’ancienne, débrouillez-vous avec ça : Barbier, Frédéric, « Patrimoine, production, reproduction », BBF, 2004, n° 5, p. 11-20) – je cite pour vous simplifier quand même la vie :

D’une manière générale, l’expert, donc le bibliothécaire, devra être sensible aux utopies de la reproduction : l’utopie de la reproduction universelle (tous les textes seraient transposés sur un nouveau support), alors que les processus de translittération qui se sont déjà produits au cours de l’histoire ont toujours montré qu’ils s’accompagnaient de pertes plus ou moins considérables. L’utopie, aussi, de la reproduction « transparente » – laquelle rejoint, dans une certaine mesure, l’utopie de l’information « transparente ».

Donc finalement on est dans le domaine de l’utopie, et pas dans celui d’une bibliothèque numérique, Google print ne s’étant jamais assimilé de lui-même à une « digital library ». Mais le résultat est là : on peut chercher des livres dans Google (pas les consulter, ce qui prouve bien qu’on n’est pas dans une bibliothèque numérique).

Open Content Alliance ou l’approche pragmatique.

Voici maintenant qu’on nous annonce que Yahoo s’y met à son tour, avec un projet intitulé OCA. Si on creuse un peu, on trouve derrière ce projet non pas Yahoo, mais Brewster Khale et son Internet Archive. Brewster ne s’y était pas trompé sur la possibilité d’utiliser Google print comme tremplin. En farfouillant dans les archives des press release d’Internet Archive, on observe des remous vers décembre 2004 (comme par hasard) : un projet de numérisation de livres avec l’Université de Toronto qui utilise un « cool new page turning robot » (tiens tiens, ne serait-ce pas ce truc révolutionnaire qu’on a vu passer dans le Monde?) et un projet de open access text archive probablement lié d’une façon ou d’une autre au fameux million book project dont personne ne parle.
La clef est là : personne n’en parle. Or, rien n’appâte tant les médias que de voir deux titans se battre pour un lopin de gloire. L’idée d’associer Yahoo est donc excellente pour l’image du projet. En outre, OCA a laissé le temps de se décanter à l’opération Google, juste le temps nécessaire pour repérer ses principales erreurs et les éviter. OCA se proclame donc respectueux des droits d’auteurs, ce qui peut étonner quand on sait qu’Internet Archive est un des inventeurs de l’opt-out si décrié dans le projet Google print :

If the author or publisher of some part of the Archive does not want his or her work in our Collections, then we may remove that portion of the Collections without notice.(Vu ici).

Par ailleurs, OCA met l’accent sur l’accès ouvert en utilisant quelques mots-clef – catalogue, métadonnées, OAI, RSS, PDF – susceptibles d’amadouer les bibliothécaires pour être accepté dans le panthéon des bibliothèques numériques.
Le résultat : un joli site Web mais pas grand-chose de concret pour l’instant, il faut attendre de voir si le pragmatisme de ce projet, présent également dans la sélection des partenaires, lui permettra d’être à la pointe.

La bibliothèque numérique européenne ou l’approche méthodique

Entre les deux, on trouve l’initiative européenne. Un Comité de pilotage, une consultation, des appels à projet : autant de procédures qui paraissent lourdes et interminables, en tout cas, qui n’ont ni l’insouciance de Google print, ni le pragmatisme de OCA. Mais cette troisième initiative se donne pour objectif de travailler en profondeur, susciter des bonnes pratiques dans les bibliothèques elles-mêmes, avec une vision méthodique des moyens pour les faire entrer dans le numérique. Pour prendre un exemple, elle est la seule à se soucier de la préservation à long terme des documents numériques. Il s’agit donc de faire avancer le métier et cela ne peut se faire en un jour. On essaye de susciter une dynamique de réflexion et d’action sur le long terme, qui sera sans doute plus longue à démarrer que les deux projets précédents, mais qui permettra aux bibliothèques d’évoluer à leur rythme et avec leurs moyens (humains et financiers).
Le résultat : on le verra plus tard. Dans un an, deux ans, dix ans ? Son objectif n’est pas d’être immédiat mais d’être profondément enraciné dans les pratiques bibliothéconomiques.

Conclusion

Chacun de ces trois projets a sa dynamique et aussi ses défauts. Chacun pourrait être contesté s’il était tout seul, en situation de monopole. La bonne nouvelle, c’est que ces trois projets existent. Ils garantissent que les ressources de demain sur le Web seront réparties, diversifiées, nombreuses et adaptées à des publics différents. Et ça, c’est une excellente nouvelle.

A lire

Aujourd’hui, un peu de lecture…

D’abord cet article dans ArXiv, via Catalogablog, dans lequel est fait le lien entre l’OAI et l’OAIS (ce qui risque de semer encore de la confusion ; pour éclaircir le sujet c’est par ici). Cet article sera présenté à PV 2005.

Ensuite le dernier numéro de First Monday dans lequel on notera en particulier un article de Karen Coyle sur les métadonnées de gestion des droits.

Un petit dernier via ResourceShelf : un article sur les bibliothèques numériques destinées aux enfants, et en particulier l’interface d’ICDL dont je vantais les mérites tantôt.

Et vous, qu’en pensez-vous ?

La commission européenne nous demande notre avis sur le sujet épineux (et brûlant) des bibliothèques numériques. Elle nous propose plusieurs textes ainsi que le contexte qui a suscité ce déploiement d’énergie.

On a donc une communication datée du 30 septembre 2005 et un document de travail (uniquement en anglais) à commenter suivant cette grille d’analyse avant le 20 janvier 2006. Deux séries de questions concernent d’une part la numérisation et l’accessibilité des contenus, et d’autre part la préservation des documents numériques.

La contribution est ouverte à tous, aux organisations publiques et privées, et les commentaires seront publiés.

A vos plumes !

Merci à PluriTAL.

En 3D

En lisant cet article dans Libé, j’ai découvert ce site qui propose des reconstitutions en 3D de lieux historiques.

Vous pouvez voir les photos d’une villa romaine, d’un cirque romain ou même de latrines romaines.

Dans un autre genre, vous pouvez aussi découvrir la bibliothèque de Montaigne, mais vu comme ça ce n’est pas très pratique pour feuilleter les bouquins. Quelqu’un n’aurait-il pas eu l’idée de pister les exemplaires de la bibliothèque, annotés par Montaigne, pour les numériser et les relier à tout ça ? Je dis ça, c’est juste une idée.

Photo :le système de chauffage au sol de la villa romaine de Seviac, dans le Gers.

Les tomates ne sont pas juste des fruits

Voici un document qui utilise les fruits et les légumes pour expliquer la différence entre taxonomies, thésaurus, ontologies et ce genre de "choses". L’idée n’est pas mauvaise et on voit bien où l’auteur veut en venir.

J’en profite pour signaler un autre amusant document intitulé Fruit ou compétence ? capacité ou légume ?, dans lequel vous pourrez découvrir qu’un légume peut être un fruit, et qu’un fruit peut être un légume. Et en tout état de cause, une tomate peut être les deux, suivant la façon dont on la considère.

Enfin, sympathique détour par chez les architectes de l’information de Boxes and Arrows, où une petite biographie de Paul Otlet nous permettra de tout savoir sur l’invention de l’annotation collaborative des catalogues sur fiches avant le Web, ainsi que sur la CDU et la bibliothèque universelle.

Merci à Deakialli et à Librarian.net.

Jeu du figuier : quatrième manche

Voici la quatrième manche du jeu. Il s’agit toujours de reconnaître le lieu où pousse ce charmant figuier.

Je rappelle que la première manche a été remportée par le troll attitré de ce blog, et les deux suivantes par notre brillant ami castor. L’instant est décisif : le Castor va-t-il confirmer sa supériorité ? Le troll va-t-il tenter une remontée ? Un outsider va-t-il tenter un ex-aequo héroïque ?

A vous.

Ma Lorraine natale

Grâce aux bons soins de mon geek qui vient de passer son après-midi à bidouiller le routeur wifi, je vous écris de Metz où, comme vous pouvez le voir sur la photo, les figuiers ont un peu de mal quand même à s’acclimater. Pourtant le jardin de mon père est très bien entretenu.
Trop tard aussi pour les mirabelles.

Je fais un petit coucou à Laurel et à Vincent, et un special dédicace à Jean-François que je n’ai pas l’occasion d’aller saluer cette fois-ci (mais ce sera pour une prochaine).

Désolée pour ce billet, c’est sans doute le plus pathétique de toute l’histoire de ce blog, mais je pense que le retour aux sources m’est nuisible parfois… Bientôt je vais ouvrir un skyblog ;-)

Pratique

Vous l’avez peut-être remarqué, je ne suis pas très en forme cette semaine donc excusez-moi si les billets sont courts et mélangés.

Aujourd’hui, quelques trucs pratiques…

Le premier c’est une page de personnalisation de fil RSS pour obtenir les nouveautés de sa bibliothèque. On peut choisir par classe de la Dewey ou une autre classification plus générale, et on choisit les critères de tri des résultats ainsi que la fréquence d’actualisation.

Le second c’est Lookleap, un outil qui sert à générer des URL raccourcies pour citer une ressource. Il permet aussi d’annoter des pages Web et d’envoyer des mails préformattés avec un lien. Enfin, si on lui donne à manger un PDF, il en propose une version "cache" très propre en HTML. Un peu comme la transformation du PDF proposée par Google, mais en propre. C’est spécial pour les gens qui haïssent le PDF.

Le dernier est un manuel de numérisation édité électroniquement et accessible librement en ligne. L’ouvrage date de 2005 et on peut l’acheter 30$ sur Amazon (pour les gens qui arrivent pas à lire sur écran ;-) mais il faudra attendre le 30 novembre !