De l’accès (et autres questions)

Publié le 02/06/2004 par manuefig

Le CLIR publie un ouvrage collectif sur les tendances qui affectent les bibliothèques, et en particulier la manière dont elles donnent accès aux ressources qui intéressent les chercheurs.

Access in the future tense rassemble six articles, qui abordent en fait aussi bien le problème de la préservation de l’information que celui de l’accès proprement dit (mais comme on le sait, ces deux notions sont aussi indissociables qu’antinomiques pour les bibliothèques…)

L’ouvrage est disponible librement, en texte ou en PDF, et on peut aussi le commander en papier pour 20$.

Moins accessible hélas, le numéro 39 (4e volume, 2004) de Journal of Library Administration est un numéro spécial sur l’accès (plus précisément : Improved Access to Information: Portals, Content Selection, and Digital Information). Il semble que les heureux suscripteurs d’un abonnement à ce journal se régaleront d’articles orientés usagers et services. Les autres se contenteront d’enrichir leur bibliographie.

Enfin, les lecteurs d’Outils Froids ont eu la joie de plonger à l’intérieur de l’esprit des utilisateurs de moteurs de recherche pour y découvrir comment ceux-ci s’orientent dans les listes de résultats. Utile et à mettre en perspective avec nos propres interfaces de recherche : de telles études pourraient bien apporter un coup mortel au mythe de la liste de réponses parfaite, sans bruit ni silence.

Vers un PDF qui dure

Publié le 31/05/2004 par manuefig

Le PDF d’Adobe est un format de fichier qui permet d’enregistrer à la fois des informations textuelles et graphiques (un mélange de texte et d’image). Il est bien pratique pour conserver en format numérique la mise en page, donc l’intégrité visuelle, d’un document.

Bien que propriétaire (puisqu’il appartient à Adobe), le PDF est devenu un standard de fait. Sa popularité s’est encore accrue avec l’ouverture de ses spécifications : à présent, n’importe qui a le droit de créer des programmes capables de fabriquer ou de lire du PDF, ainsi que de proposer des variantes du format… incluant éventuellement des éléments propriétaires, éxécutables, et pas du tout intéropérables.

C’est pourquoi un groupe de travail s’est donné la tâche de créer une variante de PDF complètement intéropérable, indépendante des plateformes logicielles et matérielles, capable de stocker des métadonnées, et d’encapsuler les informations nécessaires à la lecture des couleurs ou des polices du document. Ce PDF propre à l’archivage se nommera avec justesse PDF/A.

La première version de ses spécifications est annoncée pour début 2005, et une version définitive à la fin de l’année.

Vu chez Marcus Zillman.

Mise à jour :

en savoir plus sur l’utilisation du PDF pour l’archivage (document au format PDF, chez Adobe)
en savoir plus sur l’utilisation des métadonnées en XML dans le format PDF : par Adobe et par Karl Dubost du W3C

Le figuier de Roscoff

Publié le 29/05/2004 par manuefig

Eh oui, il ya aussi des figuiers en Bretagne. Ils apprécient le climat océanique doux et régulier.

Le figuier de Roscoff a été planté vers 1610 et s’est épanoui librement dans le jardin du couvent des capucins de cette ville pendant plus de 300 ans. Son tronc a atteint une circonférence de 2,40m et ses branches, soutenues par 79 colonnes en fer, en bois ou en granit, couvraient 700m². Il produisait 500 kg de fruits par an.

Il a été abattu en 1987… ce qui prouve une fois de plus que les années 80, ça craint.

Plus d’infos et merci pour la photo : ici

Internet = poubelle ?

Publié le 28/05/2004 par manuefig

Hier soir, tandis que je préparais un nouveau stock de confiture de figues, j’ai allumé la télé. Ca ne m’arrive pas souvent, et en général, je le regrette. Ca n’a pas loupé.

Le sujet de l’émission : "Internet, dangers et délices". Soirée introduite par un film qui a au moins 5 ans sur la place de l’e-mail dans les relations humaines (bon, sympa, le film, je dis pas, toute midinette des années 90 qui a eu une histoire d’amour un tant soit peu geekesque a vécu ça, m’enfin…) Puis, le grand objectif de la soirée semblait être de montrer qu’Internet est un lieu de non droit, où des adolescents sacrifient leur jeunesse à l’autel des jeux en réseaux, se consacrant dans le meilleur des cas au téléchargement illégal de musique piratée, et au pire s’adonnant à des vices incontrôlables sur les sites pédophiles et pornographiques.

J’avoue que j’ai assez rapidement éteint. Mais tout de même, cela rappelle une réalité de la vie : non, les gens ne comprennent rien à Internet, au point de faire péter les plombs aux geeks qui travaillent pour eux. Non, dans le service public on ne peut pas dire aux internautes "vous devez disposer du plug-in Shockwave de Macromedia". Bref, non, on n’est pas sortis de l’auberge.

Il y en a qui pensent qu’Internet est en train de devenir un média de masse. Qu’il subit un nivellement par le bas au niveau de la télévision. Il y en a même qui pensent qu’Internet, c’est de la m****.

Mais bon, moi je continue à penser qu’il faut se battre pour que notre Internet à nous, il soit beau, grand, libre, intéressant, riche, accessible, trouvable et tout ce que vous voulez. Et au pire, il nous reste toujours la poudre verte et l’humour geek à deux balles pour survivre.

Merci à Got, à Marlène, à Niko et à tous ceux qui contribuent à faire d’Internet un monde meilleur.

Métadonnées sémantiques pour les interfaces

Publié le 27/05/2004 par manuefig

Traditionnellement, les métadonnées servent à décrire une ressource, à l’indexer, à la retrouver, à l’identifier, éventuellement à la conserver et la partager. Les métadonnées ont à première vue un rôle austère dont l’utilisateur final se soucie comme d’une guigne.

Heureusement, pour ceux qui trouveraient cette situation ennuyeuse, déjà-vue et même dépassée, il y a le Web sémantique, qui réinvente le concept de métadonnée et surtout ce qu’on peut faire avec, en proposant de les utiliser pour générer des interfaces de navigation.

Ainsi, sur les Boîtes et flèches, on apprend comment gérer des taxonomies (pour les bibliothéconomes, je précise que ce sont des sortes de thésaurus hiérarchiques) et utiliser les métadonnées qui en découlent pour concevoir intelligemment la navigation d’un site.

Infodesign nous fait cadeau sans manières d’un powerpoint (plein d’animations rigolotes) sur les métadonnées. Le diaporama commence sans grande fanfare mais ça vaut le coup d’aller au moins jusqu’à la vue 15 pour découvrir le concept des classifications à facettes.

Lesquelles sont aussi abordées dans un document intitulé Is there a role for traditional knowledge organization systems in the digital age ? et qui explique pourquoi l’indexation plein texte, c’est très bien mais ça ne fait pas tout. Et comment le modèle de la classification à facettes est une preuve que nos bonnes vieilles méthodes d’indexation bibliothéconomique s’appliquent assez naturellement à l’environnement informatique. Merci Catalogablog.

Ce n’était qu’un tout petit aperçu de l’océan d’idées à creuser dans ce domaine, pour cet été, pendant qu’il fera chaud et qu’on se réfugiera loin de la pollution et de la canicule… devant nos petits écrans. Spécialement dédicacé à mon geek bien sûr.

Bibliothèques, enseignement et numérique

Publié le 25/05/2004 par manuefig

Allez, ce soir, pour une fois, passons la porte de la bibliothèque, et intéressons-nous à ce qu’il y a au-delà des frontières de l’immense territoire de la documentation : l’enseignement.

Les learning objects sont des sortes d’unités minimales de support de cours version numérique. Pour apprendre comment et pourquoi en fabriquer, lire le guide à l’usage des auteurs de learning objects signalé par notre Robin des Bois de l’information.

Pour comprendre le rapport que cela peut avoir avec les bibliothèques, il faudra mesurer l’étendue du chemin à parcourir avant d’atteindre l’interopérabilité entre informations bibliothéconomiques et environnements pédagogiques (vu chez Peter Suber).

Mais là, hein, va falloir du courage.

Gestion des droits des documents numériques

Publié le 24/05/2004 par manuefig

La première question (ou au moins, une des premières) à se poser quand on met en ligne des documents, c’est sans doute celle des divers droits, de propriété intellectuelle ou autres, qui s’y rapportent. Aussitôt après vient la question des métadonnées qui expriment ces droits, comment les décrire, sous quelle forme, dans quels buts. Dans le domaine émergent du DRM , il est parfois difficile de s’y retrouver.

Heureusement, la Library of Congress présente : le rapport qui tombe à pic par Karen Coyle.

Ce document sur les Rights expression languages fait le comparatif entre quatre solutions qui permettent d’exprimer des droits en XML : Creative Commons, MPEG21, METS Rights et ODRL. Au passage, il montre les rapports entre ces différents schémas et les modèles open source ou des produits comme ceux d’Adobe.

Ce document pointe les questions à se poser avant de se lancer à corps perdu dans la description juridique : ces métadonnées seront-elles lues par des machines ou par des humains ? ont-elles un but informatif ou serviront-elles à contrôler l’accès aux documents grâce à des programmes ? agiront-elles au niveau de l’accès au document lui-même, ou au niveau des contraintes d’usage qui limitent l’utilisation du document une-fois celui-ci obtenu par l’usager ? quelle sera leur interaction avec le système plus global de fourniture de documents ?

Bon point de départ lorsqu’on s’intéresse aux métadonnées de gestion des droits, ce rapport donne de nombreuses clefs. Bien qu’il soit très technique, il amène à réfléchir sur les technologies qui viennent de plus en plus se placer entre le lecteur et le document, et peut aider les bibliothèques à se situer dans ce processus.

Tas de métas

Publié le 23/05/2004 par manuefig

NISO, l’association américaine de normalisation, a mis en ligne les présentations de la journée "Metadata Practices on the Cutting Edge", qui s’est tenue à Washington le 20 mai.

Au programme, un remarquable chapelet de métadonnées en tout genre : RSS, MODS, METS, MPEG-21, PDF-A, ONIX, DSpace… tout le monde est au rendez-vous. Les présentations sont en PowerPoint.

J’en profite pour glisser quelques autres ressources métadonniennes :

un article de présentation de METS dans Library Journal par Roy Tennant, qui rappelle l’intérêt de ce format standard pour les bibliothèques numériques en particulier et pour les bibliothèques en général
le Tutoriel sur la préservation des documents numériques proposé par Cornell (également disponible en version PDF imprimable, ha ha !)
des ressources sur les identifiants pérennes, plein de ressources puisqu’il y en a 5 pages en PDF, signalées par Diglet.
et enfin, en français dans le texte, un article du dernier BBF sur ONIX (en accès libre mais il faut passer par la page d’accueil pour s’identifier), qui malgré des positions erronées sur Dublin Core, donne une idée de ce qu’est ce format et de son intérêt pour les métiers de l’édition.

Et juste pour le plaisir de donner cette précision, si personne ne parle de Dublin Core, ce n’est pas parce que c’est un format pas intéressant : c’est parce que c’est un acquis !!!

Architecture de l’information : qu’est-ce que c’est ?

Publié le 21/05/2004 par manuefig

L’architecture de l’information est un domaine méconnu en France, et en particulier dans les bibliothèques. Pourtant, elle a des affinités certaines avec la bibliothéconomie, et la profession gagnerait à l’intégrer à ses réflexions en termes d’évolution du métier. C’est pourquoi j’ai décidé de m’attaquer une bonne fois à la définition de cette discipline étrange et de ce qu’elle peut nous apporter, à nous les techie librarians.

Définition

L’architecture de l’information a une double origine : un constat et une métaphore.

Un constat : avec le grossissement des sites Web, l’augmentation de la quantité d’information qu’ils contiennent, et la complexification des techniques, il est devenu clair que concevoir un site Web efficace échappe à la compétence des seuls techniciens ou graphistes. Un chaînon manquant apparaît, à l’intersection de la production de contenu (compétences éditoriales) et de la mise en oeuvre technique et graphique (compétences informatiques et design). Ce chaînon manquant, c’est l’architecte de l’information.

Une métaphore : celle du bâtiment bien sûr. S’il est possible de construire une maison sans faire appel à un architecte, dès qu’on s’attaque à un bâtiment important, une vue d’ensemble s’avère nécessaire ou pour le moins utile. L’architecte est aussi celui qui est à la fois capable de comprendre les besoins du commanditaire et les fonctions du bâtiment, et de savoir quelles techniques et quels matériaux pourront être utilisés pour la mise en oeuvre.

L’architecte de l’information est donc celui qui détient la vision globale du site Web. Cette vision globale doit avoir à la fois la qualité d’une vision extérieure, objective pour conserver sa globalité, et en même temps être proche des rouages internes de la production du site afin de bien comprendre les enjeux et de mettre en oeuvre une analyse réaliste.

Méthode

La base du travail de l’architecte de l’information est de comprendre les objectifs du site et le public visé, celui-ci pouvant être réparti en types d’utilisateurs qui pratiquent différents types d’usages. Le reste de l’analyse peut aisément être compris en filant la métaphore du bâtiment, car la conception des sites est fortement spatialisée.

la typologie et la classification des contenus revient à définir quels seront les espaces du bâtiment et quelles seront leurs fonctions
il faut ensuite réfléchir à la manière dont on circule entre ces espaces, et aux repères qu’on donne aux utilisateurs pour s’orienter : c’est la navigation dans le site Web et les outils de recherche d’information.

Enfin, l’architecte de l’information modélise tout ceci dans des maquettes fonctionnelles ou wireframes en anglais, dont l’objectif est de donner une vue d’ensemble graphique de la page et de la façon dont elle s’articule avec le reste du site. Cette maquette est une sorte de gabarit neutre sur lequel s’appliquera ensuite le graphisme.

Disciplines connexes

L’architecture de l’information est liée directement à d’autres disciplines aux noms barbares, telles que le design interactif, l’usabilité, la trouvabilité ou encore l’expérience utilisateur.

Cette dernière est intéressante parce que difficile à percevoir et surtout à quantifier. L’expérience utilisateur, c’est l’impression de se sentir bien quand on visite un site, ce qui est en partie une affaire de graphisme mais pas seulement. L’architecte de l’information réfléchit à enrichir l’expérience utilisateur, c’est-à-dire à essayer de tirer parti de ce que le média Web apporte de plus par rapport aux autres.

Quel rapport avec nous ?

Pour ceux qui se demandent encore le rapport avec les bibliothèques, je récapitule… L’architecture de l’information fait fortement appel à des compétences qui sont celles des bibliothécaires : classifier l’information, gérér des masses de ressources parfois hétérogènes, favoriser l’accès à l’information en fournissant des outils de recherche ou en aidant les lecteurs à s’orienter dans les collections. En retour, ce que l’architecture de l’information a à nous apporter, c’est son expérience des nouvelles technologies, sa conception spatiale de l’information, et surtout son côté très user-oriented, centré sur les besoins et les pratiques des usagers.

La réflexion déjà bien avancée chez les anglo-saxons a cet avantage de refléter un positionnement abouti de l’architecture de l’information au milieu d’un bouquet d’autres disciplines par rapport auxquelles on a parfois du mal à se situer. Dans la réfléxion sur le métier de bibliothécaire à l’heure du numérique, il est capital de savoir exactement où se situent nos compétences, et comment elles s’imbriquent avec celles des autres acteurs.

Ressources

Au risque de me répéter, je récapitule l’ensemble des ressources sur le sujet :

Livre

la bible de l’architecture de l’Information c’est l’ouvrage de Louis Rosenfeld et Peter Morville, Information architecture for the World Wide Web, le livre à l’ours polaire chez O’reilly, 2e édition en 2002 (en anglais)

Sites Web

le site de l’AIFIA (en anglais avec traduction française partielle)
Semantic Studio le site de Peter Morville
Kahn + Associates consultant en architecture de l’information, plein de schémas, de définitions utiles, et une liste de publications (en français et en anglais)

Blogs

Bloug le blog de Louis Rosenfeld (en anglais)
FredCavazza.net blog très riche avec plein de définitions et de ressources super utiles (en français)

Pain d’épices mi-figue mi-raisin

Publié le 20/05/2004 par manuefig

Parce qu’il n’y a pas que la confiture dans la vie…

Le plus dûr pour faire un bon pain d’épices est de se procurer les épices, surtout la cardamome et la badiane toutes deux en poudre (on les trouve plus facilement sous la forme solide).

Si vous y arrivez, voici une chouette recette.

Faire bouillir 20cl de lait avec un clou de girofle. Hors du feu, retirer le clou et faire fondre 300g de miel au moins dans le lait chaud (on peut mettre plus de miel, plus il y en a meilleur c’est, mais au-delà de 300g ça revient cher…)

Dans un grand saladier, mélanger 300g de farine, un sachet de levure chimique, et les épices à raison d’une petite cuiller à café chacune :

badiane (anis étoilé) en poudre
cardamome en poudre
cannelle
muscade en poudre
gingembre

Puis verser le lait-miel dans la farine-épices et mélanger avec une spatule en bois jusqu’à obtenir une pâte onctueuse.

On peut à partir de là ajouter toutes sortes de choses intéressantes à cette pâte. Pour ma part, je préconise une poignée de raisins secs et 100 ou 150g de figues sèches coupées en dés.

Beurrer un moule allongé, verser la pâte, faire cuire à four peu chaud (thermostat 5 maximum, 150°) pendant une bonne heure.

Le pain d’épices se déguste idéalement quelques jours plus tard, quand il est légèrement rassis. Il se conserve plusieurs jours ou même semaines à l’abri d’un sac plastique.

Figoblog

Un blog sur Internet, la bibliothéconomie et la confiture de figues

Archives d’Auteur: manuefig