Ca presse

A signaler, un site lancé par le Northern New York Library Network qui propose l’accès à 13 titres de journaux numérisés sur des périodes variables allant de 1811 à 2002.
Il y a une recherche plein texte, qui porte apparemment sur la reconnaissance OCR (à première vue assez pertinente) du texte. La visualisation se fait en PDF noir et blanc.

On peut rapprocher cette info du gros "NDNP project" piloté par la Library of Congress, pour lequel on n’a pas vraiment encore de choses visibles, mais plein d’infos techniques et autres sur cette page. Tout ceci est très prometteur. Les fichiers seront diffusés en JPEG 2000 via un plug-in propriétaire, ça peut étonner mais il semble qu’ils n’aient pas vraiment le choix vu le type de numérisation et la qualité recherchée. Pour compenser ils ont prévu une sortie alternative en PDF.

Apparemment la numérisation de la presse est très dans l’air du temps, il faut croire. Il y a même une série de conférences organisées par OCLC sur ce sujet. La conférence aura lieu en août et elle est aussi co-sponsorisée par le Utah Digital Newspapers Project qu’on connaissait déjà. J’espère qu’ils mettront les papiers en ligne car je n’ai pas vraiment prévu de passer mes vacances en Oregon (plutôt dans ce coin là).

Merci à Digitization 101 pour les différentes infos. Ce billet est spécialement dédicacé à Elise si elle passe par ici…

Deux gros pavés dans la mare

Aujourd’hui, c’est la soirée spéciale préservation du document numérique, et j’ai l’honneur de vous annoncer la sortie de deux gros pavés, au format pdf, respectivement 237 et 138 pages.

Le premier c’est le rapport final du groupe PREMIS : un groupe OCLC/RLG qui avait pour objectif de définir les métadonnées nécessaires à la préservation des documents numériques. Et il y en a beaucoup !!! On peut aussi accéder aux différentes sections séparément.

Le second, c’est une première version de la traduction française du modèle OAIS. Pour mémoire, l’OAIS est un modèle informationnel et fonctionnel qui définit les différentes composantes d’un système global et ouvert de préservation de documents numériques, les actions à mener, et les interactions entre producteur, archiveur et utilisateur. Il est assez complexe et une partie de sa force réside dans la définition de l’ensemble de la terminologie relative au domaine de la gestion des documents numériques. Petite précision, cette traduction est une version en cours de normalisation.

Enfin un wiki bibliothéconomique

Les wikis, on commence à savoir ce que c’est, et parfois même à leur reconnaître un certain sérieux (quoique controversé) : cf l’expérience wikipedia qu’on ne présente plus.

Mais bon, nous, dans les bibliothèques, nous sommes des gens sérieux. Déjà, les blogs, on avait un peu de mal, mais alors les wikis : mon dieu, quelle horreur, des informations non validées et incontrôlables.

Et pourtant… C’est d’une logique presque évidente. Les gens utilisent les catalogues. Les gens font un certain travail en plus (non le catalogage n’est pas une fin en soi…). En plus les gens lisent les livres (contrairement aux bibliothécaires).Donc, ça serait quand même bien de laisser les gens s’exprimer, entre eux, surtout qu’ils n’attendent que ça. Sans intervenir, sans valider, juste leur donner la possibilité de le faire. Et pas avec des interfaces d’annotation collaborative gaz à tous les étages, juste avec un espace Web modifiable simplement et facilement. Un wiki, quoi.

J’ai envie de sabrer le champagne en lisant qu’un des très sérieux acteurs internationaux des bibliothèques, OCLC, se lance dans l’aventure wiki. L’idée: permettre aux utilisateurs de Worldcat, où qu’ils se trouvent, de faire des commentaires, ajouts, notes de lectures etc. en wiki et de les relier aux notices du métacatalogue. Il est même question de mettre du FRBR dans la sauce. Pour cela ils développent un logiciel : MetaWiki.

On en apprend plus sur le blog de Thom Hickey lui-même membre d’OCLC.

Alors, maintenant ça devient sérieux cette idée de wiki ?

Bibliothèque hybride

Bon pour une fois je ne parle pas de bibliothèque hybride analogique-numérique, mais d’un croisement entre une bibliothèque et un musée. A Rennes, la bibliothèque municipale qui devrait ouvrir ses portes en 2006 partage ses locaux avec le Musée de Bretagne et l’Espace des sciences. Des centaines de mètres carrés de lecture publique et patrimoniale, des milliers de mètres carrés d’expositions d’oeuvres de toutes sortes, un planétarium numérique, des salles de conférences, et même une cafétéria pour la « modique » somme de 100 millions d’euros. Voilà qui a peut-être une chance de damer le pion à ceux qui pensent que les bibliothèques ne sont plus, à l’âge de Google, que des « musées du livre »… Au fait, je ne vois pas ce qu’il y a de négatif là-dedans, moi.

Source le Monde.

Petit souci de validation

Un article paraît dans un journal. Bilan : 16 mort et une centaine de blessés. Une semaine plus tard, la rédaction s’excuse du manque de fiabilité de l’information diffusée. Oups.

Un type dépose quelques papiers dans une bibliothèque. Bilan : 20 millions d’exemplaires vendus dans le monde, un million en France.

On ne répétera jamais assez la nécessité de vérifier ses sources… de les citer… Et ça vaut aussi pour les"vraies" sources d’information et pas seulement les "knowledge blogs" sur lesquels on aimerait bien en savoir plus.

Ne dîtes plus « powerpoint »

C’est vrai, quoi, il ne faut pas dire "j’ai fait un powerpoint". A la limite, on fait un diaporama, et il y a d’autres outils pour en faire autant. En plus, je sais pas si vous avez remarqué, mais quand on le trimballe trop d’un ordinateur à un autre, le "powerpoint" peut parfois perdre une partie de son "power" (format fermé oblige).

Bref. Grâce à Librarian.net, on peut maintenant récupérer un petit "toolkit" pour faire des diaporamas en HTML. Très joli, intéropérable, imprimable, portable.

Je l’ai testé ; c’est sympa même s’il y a encore des adaptations à faire. Par contre il faut écrire codé comme on respire, pas forcément évident pour tout le monde. Et ça reste moins pratique pour les images.

A part ça, je m’en excuse d’avance mais je repars de nouveau jusqu’à la semaine prochaine. Après ça je ferai quelques efforts…

I’m back

Eh oui, je suis revenue !

J’ai fait une grosse réserve de soleil, de vent, de figuiers en fleurs (pour ceux qui n’auraient pas suivi, c’est que c’est expliqué), de figuiers en feuilles, de confiture de figues (datant de l’été dernier bien sûr), de vin de Banyuls, de mer, de vacances et de tout ce qu’il faut pour être heureux.

Les cartons sont aussi pas mal résorbés et je vais essayer de tenir ma promesse de revenir à plus de cohérence. Billet à suivre.

Pêle-mêle dans les cartons, 2

Toujours en plein déménagement, toujours dans les cartons. Voici ce que j’ai relevé d’intéressant dans mon aggrégateur ventru et débordant :

  • le 2005 special 301 report fait le point sur l’efficacité des droits de propriété intellectuelle dans 90 pays.
  • OAI une interview de la directrice d’OAIster et un témoignage sur la génération de métadonnées en Dublin Core avec un outil nommé My META Maker
  • un article dans Ariadne qui compare trois systèmes de gestion d’entrepôts de documents numériques : LOCKSS, EPrints et DSpace
  • des ressources sur la typographie et l’écriture sur le Web : ici et . J’ai bien apprécié ce site.
  • Dans le dernier Journal de l’IFLA il y a un article sur "Copyright Protection as Access Barrier for People who read differently" (p.52).

Bonne lecture et à dans quelques jours.

Fini de bricoler

Alors qu’aux tout débuts de la numérisation on évoluait dans un monde incertain d’expérimentation, d’apprentissage sur le tas, et de tâtonnements, aujourd’hui il n’est plus question de procéder de la sorte. La numérisation s’est stabilisée et normalisée, pour preuve ce document publié par l’organisme de normalisation américain (NISO) : A Framework of Guidance for Building Good Digital Collections. Le "good" annonce bien la couleur : il s’agit de recommandations pour construire des collections numériques de qualité.

Le document est organisé en 4 grands axes : les collections, les objets numériques, les métadonnées et les projets.

Parmi les principales problématiques soulevées, qui sont les points critiques de la construction de « bonnes » collections numériques, on notera la cohérence de la politique documentaire, la pérennité des objets et des métadonnées, les identifiants pérennes, l’intéropérabilité et l’accessibilité, la gestion des droits.

Un des points vraiment intéressants dans ce document c’est les tableaux qui récapitulent les « guidelines » disponibles sur les formats de numérisation et les formats de métadonnées.

Beaucoup de références, beaucoup de liens, un document qui fait le tour de la question, hautement recommandable. Merci à Digitization 101 (qui nous signale au passage qu’il s’agit d’une nouvelle version d’un document de 2001 et qu’on ignore quelles sont les différences. Ils feraient peut-être bien de suivre leurs propres conseils, chez NISO ;-)

Pêle-mêle dans les cartons

Comme vous avez pu le remarquer, je ne suis pas très disponible en ce moment : c’est les vacances, je déménage, dans mon nouvel appartement je n’ai qu’une connexion RTC… et en plus mon hébergeur a des soucis avec ses bases MySQL. Bref, je fais de mon mieux, mais on a l’impression que je délaisse un peu le Figoblog ces derniers temps. Et c’est pas faux.

Sur le principe du carton dans lequel on fourre pêle-mêle, dans l’urgence, tout ce qu’on veut emporter en se disant qu’on fera le tri plus tard, voici donc ce que je peux vous proposer :

  • naissance de Digital Medievalist, une revue d’histoire médiévale en open access (le pendant anglo-saxon de notre médiéviste et l’ordinateur je présume)
  • la TEI a maintenant son wiki, un cadre collaboratif pour annoncer, travailler, partager ses feuilles de styles… un peu vide pour l’instant mais qui sait
  • une webographie sur la couleur pour bien assortir son site Web, à compléter chez les z’ed et chez Lithium. (Pour l’heure c’est plutôt les couleurs de mon salon qui me préoccupent, mais ça peut peut-être marcher aussi ;-)

Je recommande aussi la lecture d’un article sur le rôle des DRM dans l’open access : vous savez, les DRM, ces affreux trucs qui empêchent de faire ce qu’on veut avec les documents. Alors, peuvent-ils avoir une utilité pour le libre accès ? Aussi étrange que ça puisse paraître, la réponse est bien sûr : oui ! Car gérer automatiquement des droits d’accès, ce n’est pas seulement prendre des mesures de protection techniques commerciales. Cela peut aussi être encoder en RDF une licence Creative Commons qui permet de dire aux machines du monde entier qu’on garantit le libre accès à ce qu’on écrit. Et par exemple, de rechercher ces contenus libres avec Yahoo.

Merci à Peter Scott et à Peter Suber. Durée estimée des cartons pêle-mêle : au moins jusqu’à la fin des vacances scolaires…