Vrac sur la description des images

Le problème des documents non textuels (images, multimédia) est une des raisons de s’intéresser de près aux métadonnées. Pas de recherche « plein-texte », puisqu’il n’y a pas de texte ; il faut trouver un moyen de décrire.

Si on s’intéresse un peu aux schémas de métadonnées qui permettent de décrire des oeuvres (donc essentiellement des objets graphiques mais plutôt statiques, pas multimédia), on tombe sur CDWA, une norme du Getty, et son schéma XML CDWA Lite prévu pour être utilisé par exemple avec l’OAI.
CDWA prend aussi en compte le VRAcore, avec ses règles de catalogage ou CCO, où on retrouve l’idée de décrire des oeuvres et des images d’oeuvres.
Enfin le CRM est un peu à part, car il ne contente pas de dire comment décrire, il donne toute la modélisation nécéssaire sous forme d’une ontologie. J’en ai déjà parlé.

Côté multimédia, on a plutôt travaillé sur des standards de description automatisée des images, comme la norme MPEG-7. L’idée est de ne pas se contenter de décrire l’oeuvre mais de rentrer dans le contenu, comme on le ferait pour le texte. Sauf que les repères, au lieu d’être des mots, sont des entités temporelles, des formes, des prises de vue, etc.

Côté Web sémantique on n’est pas en reste sur cette idée de rentrer dans les images. Il existe par exemple une ontologie en OWL et RDF pour décrire une région d’une image. Il existe aussi une spec du W3C pour décrire et retrouver des photos avec RDF et HTTP. Et des outils pour encapsuler une description en RDF dans une image.

Pour ces trois derniers liens merci à mon geek, et à catalogablog principalement pour le reste.

La numérisation de la Licorne

Ce matin avec mon petit déjeuner, j’ai savouré un article passionnant qui raconte l’aventure de la numérisation des tapisseries de la Chasse à la Licorne du Cloister’s Museum de New York.

Tout commence en 1998 au moment où on décide de rénover la salle où les précieuses tapisseries sont présentées. On en profite pour les rappatrier au Metropolitan pour les restaurer. Lorsqu’on les retire de leur cadre, on s’aperçoit que le dos des tapisseries, jamais exposé donc parfaitement protégé, est le miroir du recto mais avec des couleurs chatoyantes. On décide alors de numériser les tapisseries, recto et verso.

Un mécanisme compliqué est mis en place pour photographier les tapisseries, mètre carré par mètre carré (si je ne m’abuse sur les conversions de système métrique), avec des recouvrements qui doivent permettre de reconstituer virtuellement l’image complète. Les tapisseries sont posées horizontalement, face vers le bas.

Résultat de l’opération : deux semaines de prises de vues, 200 CD de photographies en haute résolution, prises dans les meilleures conditions techniques possibles. Et pourtant, au moment de reconstituer les images, impossible de faire converger les recouvrements d’images. Les images sont trop nombreuses et trop lourdes, mais même en les dégradant, on n’arrive à rien de satisfaisant et l’équipe abandonne.

En 2003, deux mathématiciens spécialisés dans le traitement des images numériques ressortent les CD et se penchent à nouveau sur le problème. D’abord, ils pensent que les photos ont été mal prises ou modifiées. Puis ils en viennent à cette conclusion : les tapisseries de la Licorne, présentées verticalement pendant tant de siècles, et tout à coup placées à l’horizontale, ont changé de forme, se sont relaxées, ont respiré, se sont contracté. Les fibres ont tourné et bougé. Les tapisseries faites de laine, sont des objets en trois dimensions, liquides, vivants. Entre chaque prise de vue, ces imperceptibles mouvements du matériau ont faussé l’exactitude du cadrage et transformé ce qui devait être une simple opération de puzzle numérique en véritable cauchemar.

Je vous passe les détails de l’équation nécessaire pour rétablir l’uniformité des images numériques. La morale de cette belle histoire, c’est que l’oeuvre ne se laisse pas capturer si facilement sous forme de zéros et de uns. Elle se tord, résiste, et dans sa sublime inexactitude, elle vit.

Merci à Digitization 101.

Trucs à la figue

C’est authentique, encore à cette période de l’année, dans les magasins de primeurs les mieux fournis, on trouve encore quelques figues. On trouve bien des framboises et n’importe quoi d’autre, aussi. Enfin, c’est vrai : des figues. J’ai pas encore cédé à la tentation d’en acheter, de peur d’être déçue, mais si elles continuent à me faire de l’oeil, je pense que je vais céder.

Enfin sinon, pour compenser, ya toujours la confiture bien sûr, et tous les trucs à la figue dont je m’entoure…

  • crèmes, gels douches et eaux de toilette à la figue : dans tout bon magasin Séphora qui se respecte. Cette gamme « plaisir de figue » est excellente, elle sent vraiment la figue, en particulier l’eau de toilette qui est bien agréable
  • produits d’intérieurs à la figue, comme des bougies, des huiles de senteur, etc : il y en a une gamme chez Truffaut mais ça ne sent pas vraiment la figue, plutôt décevant
  • l’encens « sieste sous le figuier », un classique du genre, disponible chez Nature et Découverte.

Un autre jour je vous parlerai des aliments à base de figue qu’on peut consommer en toute saison.

La jolie figue verte de la photo vient d’un site d’images gratuites et libres assez fourni : Morgue File. Le nom ne fait très engageant en français mais c’est très vivant contrairement aux apparences…

La quête de l’image (suite)

J’ai attendu cela patiemment. La suite de l’article "Looking for good art" , de David Mattison, dont je parlais dans un ancien billet, a été mise en ligne.

Ces trois articles en libre accès constituent un must-read de la recherche d’images sur le Web.

Le premier explore les bases de données et les outils de références, publics ou privés.

Le second aborde les moteurs de recherche d’images par reconnaissance des formes et autres. Je ne résiste pas à citer, en la déformant soigneusement par suppression de son contexte, cette phrase de la conclusion :

"…accurate, valid, standardized, and detailed metadata is the key to the precision recall of online art images."

Le troisième fait le tour par pays des ressources de collections d’images nationales en ligne. Les bibliothèques françaises ne sont pas oubliées. A noter, un encart sur l’utilisation juridique de ces images, et des références bibliographiques.

Je note quand même des recoupements dans les liens proposés dans ces trois articles, chacun représentant plutôt une approche différente qu’une liste de ressources étanche par rapport aux autres. En gros, les trois approches sont

  • les types de ressources,
  • les types de recherche / d’indexation
  • les grandes collections publiques, par pays.

La quête de l’image

Chercher des images sur le Web peut être un casse-tête (à moins de faire une recherche bidon genre dis, Google, trouve-moi des images de figues).

Heureusement, des gens y travaillent pour nous.

Tous les historiens de l’image, les historiens de l’art (non ce n’est pas la même chose), les gens qui numérisent des images ou ont des fonds d’images dans leurs bibliotèques devraient lire cet article de David Mattison intitulé : Looking for Good Art: Web Resources and Image Databases, Part 1. Une incroyable, démentielle liste de ressources sur les images (en histoire de l’art, mais aussi les agences photos commerciales, etc). Oui, vous avez bien lu : "part 1", on se demande vraiment ce qu’il va pouvoir ajouter encore…

Plus anecdotique, un petit article en espagnol, s’adressant aux photographes, qui donnent quelques pistes sur la façon dont on lit les images.

Enfin dans un autre genre, pour les gens qui cherchent des images à utiliser pour le design de leur site Web, en particulier des images libres : Blue Vertigo est une mine. Merci à … NikO ENCORE !

Quelques ressources

C’est le retour de vacances, eh oui, toutes les bonnes choses ont une fin (vous en saurez plus à ce sujet bientôt). Reprenons doucement mais avec sérieux, par la présentation de quelques ressources d’intérêt.

Open Video Project est un répertoire de ressources vidéo libres de droits (ou à peu près) disponibles sur Internet. On peut visualiser des tas de petits films courts du début du 20e siècle, mais aussi des films "publics" américains comme ceux de la Nasa… Pour ceux qui, comme moi, sont trop jeunes pour avoir assisté aux premiers pas de l’homme sur la lune (fichier en Mpeg). Vu à la télé.

Pas encore de ressources, mais un intéressant projet, sur Open Audio books, un projet en forme de blog dont l’idée est d’appeler des bénévoles à lire des chapitres de livres libres de droits pour les diffuser librement sur Internet. En anglais, évidemment. Vu sur Library stuff.

Enfin, spécialement dédicacé à mes amis les historiens du livre, la bibliothèque de l’Université de Virginie diffuse de belles numérisations de livres français du 16e siècle : le site s’intitule Renaissance in print. Un site par ailleurs bien documenté, qui donne des exemples, des explications pédagogiques et des liens sur les différents types d’ouvrages (livres d’emblèmes, livres d’heures, etc.) Hélas pas encore traduit en français, mais ça pourrait venir.

Histoire du livre

Le début de mes pérégrinations estivales m’ayant entraînée vers le sud, j’y ai découvert quelques ressources qui pourraient intéresser les "techie historiens du livre" en admettant que cette catégorie existe.

Bibla Sacra est un site consacré aux Bibles publiées à l’époque moderne aux Pays-Bas. C’est en fait une "bibliographie électronique" qui vise à donner un maximum d’informations sur ces Bibles (jusqu’en 1553 pour l’instant). A noter, pas mal de valeur ajoutée pour l’histoire du livre et de belles images numérisées (notamment des gravures sur bois).

La Bayersiche Staatsbibliothek mettra en ligne en août son catalogue d’incunables, un catalogue très détaillé concernant plus de 10000 éditions, une référence.

Et maintenant, le Figoblog est en vacances, pas de blogging avant la semaine prochaine et peut-être au-delà !

Images libres

Petit cadeau du jour, Image*after : une base d’images gratuites que l’on peut utiliser librement pour un usage privé ou commercial.

On y trouve des photos en haute résolution de lieux, d’objets, d’animaux, etc., ainsi que des « textures » particulièrement intéressantes et bizarres. Ces ressources sont destinées à servir de matériau brut pour des traitements ultérieurs, et elles ont l’avantage d’être classées par thèmes.

Merci à Robin Good.

Mode image

Le mois de juin touche à sa fin, et un vent de vacances souffle sur la bibliothéconomie. Tout le monde se dépêche de finir ce qu’il a en cours, les blogs adoptent un rythme d’informations triviales, et même les listes de diffusion sérieuses s’animent avec ferveur sur des sujets existentiels du genre, quel bouquin vais-je lire sur la plage cet été (déserte ou pas, la plage, quelle différence…)

Je suis moi-même fortement absorbée par des activités plus ou moins extra-bibliothéconomiques, comme illustré ci-dessus, et tiens, au passage, je pourrais partager quelques idées à ce sujet…

  • pour ceux qui cherchent toutes sortes de liens vers toutes sortes d’images, une adresse que je dois à Niko enfin revenu après une trop longue absence
  • pour ceux qui s’intéressent à l’estampe, en particulier aux techniques, et seraient à la recherche d’informations simples dans un site joli, je suggère une ballade en Suisse
  • et enfin allez visiter TASI, la the ressource en matière d’images sur le Web, qu’il s’agisse de les numériser, d’en trouver, de créer des métadonnées ou que sais-je …

A part ça, j’envisage sérieusement de me lancer dans quelques projets d’envergure, du genre appeler mes amis, sortir de chez moi, retrouver une vie sociale, passer plus de temps avec ma petite, et même peut-être à terme partir en vacances. Aussi se pourrait-il que dans les prochains jours, le Figoblog adopte un rythme un peu moins soutenu, et se laisse plus aller à l’étude de la figue qu’à celle du catalogage des métadonnées exotiques.

Comme on dit… voilà l’été !