Ca presse

A signaler, un site lancé par le Northern New York Library Network qui propose l’accès à 13 titres de journaux numérisés sur des périodes variables allant de 1811 à 2002.
Il y a une recherche plein texte, qui porte apparemment sur la reconnaissance OCR (à première vue assez pertinente) du texte. La visualisation se fait en PDF noir et blanc.

On peut rapprocher cette info du gros "NDNP project" piloté par la Library of Congress, pour lequel on n’a pas vraiment encore de choses visibles, mais plein d’infos techniques et autres sur cette page. Tout ceci est très prometteur. Les fichiers seront diffusés en JPEG 2000 via un plug-in propriétaire, ça peut étonner mais il semble qu’ils n’aient pas vraiment le choix vu le type de numérisation et la qualité recherchée. Pour compenser ils ont prévu une sortie alternative en PDF.

Apparemment la numérisation de la presse est très dans l’air du temps, il faut croire. Il y a même une série de conférences organisées par OCLC sur ce sujet. La conférence aura lieu en août et elle est aussi co-sponsorisée par le Utah Digital Newspapers Project qu’on connaissait déjà. J’espère qu’ils mettront les papiers en ligne car je n’ai pas vraiment prévu de passer mes vacances en Oregon (plutôt dans ce coin là).

Merci à Digitization 101 pour les différentes infos. Ce billet est spécialement dédicacé à Elise si elle passe par ici…