Technology watch

Deux rapports de veille technologique parus presque en même temps sont à signaler.

Le premier, c’est le "Technology Watch Report 3" de Digicult (attention très gros PDF de plus de 100 pages). Ce rapport examine six technologies jugées esentielles dans les tendances actuelles : les logiciels open source, le traitement du langage naturel, la recherche d’informations, les systèmes de localisation (genre GPS), la visualisation des données, la robotique et la réalité virtuelle.

Au programme : des définitions, le replacement dans le contexte stratégique, les implications en particulier pour les domaines scientifiques et culturels, des explications techniques, des études de cas et des scénarios, des perspectives pour la mise en oeuvre et la faisabilité. Incontournable.

Le second intitulé The large-scale archival storage of digital objects, Technology Watch Report est signé par la British Library et est accessible sur le site du DPC(Digital preservation coalition). Beaucoup moins long mais aussi beaucoup plus spécialisé, il traite de la problématique de la mise en place d’un système d’archivage à long termes de documents numériques dans tous ses aspects : le stockage, l’obsolescence des techniques, les logiciels, les coûts…

Merci à Ten Thousand Years Blog et à Digitizationblog.

Nouvelle interface de visualisation par OCLC

OCLC vient de sortir une démo d’interface de visualisation pour accéder à des e-books. L’interface est développée par Antartica systems et vise les utilisateurs de FirstSearch.

J’ai testé un peu le truc, bien sûr il me manquait toujours l’étape finale d’accès à l’e-book puisque je n’avais pas les droits. J’avoue que tout ceci me laisse perplexe.

Une fois passée la première réjouissance de se ballader dans une navigation arborescente assez bien faite (y compris lorsqu’on s’intéresse à un truc totalement bizarre comme… je sais pas moi… la diplomatique contemporaine ;-), on se demande tout de même à quoi servent ces carrés de toutes les couleurs qui n’apportent pas grand chose.

Quelques hypothèses :

  • vous êtes un lecteur particulièrement docile et obéissant, et vous avez lu jusqu’à la dernière ligne le tutoriel par lequel on vous oblige à passer avant d’accéder à l’interface. Donc vous savez à quoi servent les carrés et les couleurs. Bravo. Pas moi (je l’ai lu seulement après).
  • pour l’expérience utilisateur. C’est plus joli des carrés verts clairs que des résultats noirs sur blanc. Ce qui reste à prouver.
  • pour connaître d’un seul coup d’oeil l’état de la collection. Là je vous renvoie au premier point. En outre, mon côté pervers m’incite à cliquer en priorité sur les plus petits carrés et ceux dont on ne voit pas l’intitulé…

En bref, pour moi cette expérience montre surtout que pour avoir un accès intéressant à une bibliothèque numérique, surtout quand on ne connaît pas au préalable son contenu, un bon système de navigation par listes ("browse" en anglais) est essentiel. Ce qui suppose aussi une classification des documents performante et éventuellement plusieurs classifcations complémentaires et interopérantes (on aboutit alors à la navigation à facettes). Par contre les carrés, c’est un peu superflu.

Merci à RessourceShelf

Changement de style

Pour occuper mes longues soirées d’hiver, j’ai décidé d’apprendre CSS… J’espère que le résultat vous plaît. J’en suis assez contente sauf le titre qui est devenu assez peu visible (si quelqu’un a parmi ses proches un super bon designer pour lui demander un petit conseil de ma part, ça serait gentil…)

Je remercie openweb, et mon geek (dont je suis loin de pouvoir me passer même si j’apprends de nouvelles choses ;-)

La feuille de style respecte les standards du W3C (enfin elle essaye), alors si vous faîtes partie des 35% (eh oui, seulement) qui vont trouver que ça a une drôle de tête, téléchargez Firefox

Figues et facettes

En lisant chez Outils froids ce billet sur la navigation multi-facettes, je me suis souvenue que j’avais deux trois petites choses en réserve sur ce sujet :

Qu’est-ce qu’une interface à facettes ? en fait, c’est simplement un moyen de naviguer dans une collection d’objets en rafinant de plus en plus sa requête ou en croisant des critères.

On peut en avoir une bonne idée sur le site Epicurious où il est question de recettes de cuisine. On part d’une liste d’aliments, de types de plats, d’occasions, de méthodes de préparation, etc. On choisit un critère, et ensuite on précise sa requête en fonction des choix disponibles – l’avantage étant sans aucun doute d’avoir à chaque étape une vue globale des choix effectivement disponibles.

Alors, est-ce vraiment utile ? Eh bien, si on cherche un plat pour les enfants qui se fait en automne au four avec du chocolat, c’est une méthode intéressante. Par contre, si on cherche n’importe quoi avec des figues dedans, l’utilisation du moteur de recherche reste indéniablement plus efficace.

Et quand même, 129 recettes avec des figues, ça mérite aussi d’être noté.

Les feuilles mortes se ramassent à la pelle

C’est très pénible d’être obligé de regarder son écran de travers tellement on a le nez bouché (ben oui, le fait de pencher la tête permet de déboucher au moins partiellement mais bonjour l’ergonomie du poste de travail). Donc vous ne m’en voudrez pas si je fais court et mélangé.

  • voici un truc avec plein de ressources sur l’expérience utilisateur. A première vue on dirait un blog mais non. Ca s’appelle DeyAlexander parce que le type s’appelle Alexander Dey, ce qui prouve que dans la vie avoir un nom qui jette c’est pratique, ça évite d’avoir à se creuser.
  • voici un autre truc très marrant, à première vue on dirait un wiki mais en fait non. On peut s’amuser beaucoup avec le javascript et en fait ce n’est qu’une page HTML statique. Enfin j’aime bien la navigation, c’est original.
  • Le dernier Journal of Digital Information a pour thème : "Digital Libraries and User Needs". On y trouve des articles intéressants sur la participation des utilisateurs au design (lire "à l’architecture de l’information") d’un site de bibliothèque numérique. En particulier, il y a un article sur un test utilisateurs concernant l’OAI.
  • On apprend que Yahoo rejoint Google dans le projet d’indexation de WorldCat – c’est le projet qui nous vaut le petit outil dont je parlais l’autre jour.

Bon j’arrête avec ma liste décousue. Je pense avoir à peu près éclusé tout ce que j’avais mis de côté ce week-end… Et merci au fait à : Infodesign, à Fred Cavazza et à Library Stuff J’espère que ça ira mieux demain, et je vous promets plein de trucs intéressants et de question existentielles avec des réflexions et même peut-être un effort rédactionnel qui sait.

Tout est affaire de qualité

Je me suis enfin décidée à aller visiter Opquast, un site sur les bonnes pratiques qualité pour les services en ligne.

Ben oui, je me disais, encore un truc de geeks… mais pas du tout. En fait, c’est un site très pratique qui récapitule tout ce qu’il faut faire ou ne pas faire avec son site Web… Ceci classé par type de site : service public, blog et autres.

Allez, essayez de passer le site de votre bibliothèque aux critères Opquast. Encore plus drole, essayez l’opac Web de votre SIGB…

Opquast est un site Tristan Nitot validated et OpenWeb validated, donc c’est forcément très super bien.

Toujours dans le domaine de la qualité, on trouve aussi quelques renseignements (mais à côté ça fait maigre figure) sur le site Cadre Qualité Bruxelles, ou quand l’Europe se mêle de la qualité des programmes culturels en ligne.

Enfin, le W3C a sorti aujourd’hui un nouveau draft de son document sur l’architecture du Web, où l’on trouve également des recommandations de bonnes pratiques.

Sans transition, puisqu’on en est à parler de qualité, je voudrais signaler Into the Blogosphere, un blog lié à l’initiative UThink qui publie des articles de chercheurs sur les blogs et la blogosphère. Originalité de la chose, ce blog fonctionne avec un système de peer-review élaboré pour la séléction des articles. Est-ce toujours un blog…

Catalogues et valeur ajoutée

Aller plus loin avec nos bons vieux catalogues et nos bonnes vieilles classifications, c’est possible. Voici encore deux projets qui le prouvent…

Catalog enrichment initative est un projet piloté par la Library of Congress dont l’objectif est de donner plus de visibilité aux documents hors ligne (aux livres, quoi). On peut se demander pourquoi nos catalogues de bibliothèques ne sont pas capable de fournir la même valeur ajoutée que, par exemple, Amazon. L’idée est d’enrichir nos notices bibliographiques superficielles et descriptives par des informations plus "profondes" telles que les tables des matières des ouvrages. On utiliserait des standards comme MODS, METS ou ONIX pour encapsuler les tables des matières dans les notices, notices qu’on partagerait ensuite dans la communauté bibliothéconomique internationale en utilisant l’OAI. Plus d’infos dans la colonne de Roy Tennant sur Library Journal.

Simile est un projet collaboratif, impliquant notamment le MIT et le W3C, dont l’objectif est d’améliorer l’intéropérabilité des métadonnées en utilisant le Web sémantique. Concrètement, il s’agit de créer des interfaces uniques pour accéder à des ressources hétérogènes, en utilisant RDF et les classifications à facettes pour y naviguer avec un taux élevé de serendipité (traduction peu heureuse mais y en a-t-il une autre…) On comprend bien les enjeux pour les bibliothèques et autres bases de documents numériques, grâce à ce powerpoint qui explique tout ça avec des petites îles, des ponts et de jolies copie d’écran. Très mignon et assez prometteur.

Merci à Catalogablog , deux fois.

De l’accès (et autres questions)

Le CLIR publie un ouvrage collectif sur les tendances qui affectent les bibliothèques, et en particulier la manière dont elles donnent accès aux ressources qui intéressent les chercheurs.

Access in the future tense rassemble six articles, qui abordent en fait aussi bien le problème de la préservation de l’information que celui de l’accès proprement dit (mais comme on le sait, ces deux notions sont aussi indissociables qu’antinomiques pour les bibliothèques…)

L’ouvrage est disponible librement, en texte ou en PDF, et on peut aussi le commander en papier pour 20$.

Moins accessible hélas, le numéro 39 (4e volume, 2004) de Journal of Library Administration est un numéro spécial sur l’accès (plus précisément : Improved Access to Information: Portals, Content Selection, and Digital Information). Il semble que les heureux suscripteurs d’un abonnement à ce journal se régaleront d’articles orientés usagers et services. Les autres se contenteront d’enrichir leur bibliographie.

Enfin, les lecteurs d’Outils Froids ont eu la joie de plonger à l’intérieur de l’esprit des utilisateurs de moteurs de recherche pour y découvrir comment ceux-ci s’orientent dans les listes de résultats. Utile et à mettre en perspective avec nos propres interfaces de recherche : de telles études pourraient bien apporter un coup mortel au mythe de la liste de réponses parfaite, sans bruit ni silence.

Métadonnées sémantiques pour les interfaces

Traditionnellement, les métadonnées servent à décrire une ressource, à l’indexer, à la retrouver, à l’identifier, éventuellement à la conserver et la partager. Les métadonnées ont à première vue un rôle austère dont l’utilisateur final se soucie comme d’une guigne.

Heureusement, pour ceux qui trouveraient cette situation ennuyeuse, déjà-vue et même dépassée, il y a le Web sémantique, qui réinvente le concept de métadonnée et surtout ce qu’on peut faire avec, en proposant de les utiliser pour générer des interfaces de navigation.

Ainsi, sur les Boîtes et flèches, on apprend comment gérer des taxonomies (pour les bibliothéconomes, je précise que ce sont des sortes de thésaurus hiérarchiques) et utiliser les métadonnées qui en découlent pour concevoir intelligemment la navigation d’un site.

Infodesign nous fait cadeau sans manières d’un powerpoint (plein d’animations rigolotes) sur les métadonnées. Le diaporama commence sans grande fanfare mais ça vaut le coup d’aller au moins jusqu’à la vue 15 pour découvrir le concept des classifications à facettes.

Lesquelles sont aussi abordées dans un document intitulé Is there a role for traditional knowledge organization systems in the digital age ? et qui explique pourquoi l’indexation plein texte, c’est très bien mais ça ne fait pas tout. Et comment le modèle de la classification à facettes est une preuve que nos bonnes vieilles méthodes d’indexation bibliothéconomique s’appliquent assez naturellement à l’environnement informatique. Merci Catalogablog.

Ce n’était qu’un tout petit aperçu de l’océan d’idées à creuser dans ce domaine, pour cet été, pendant qu’il fera chaud et qu’on se réfugiera loin de la pollution et de la canicule… devant nos petits écrans. Spécialement dédicacé à mon geek bien sûr.

Architecture de l’information : qu’est-ce que c’est ?

L’architecture de l’information est un domaine méconnu en France, et en particulier dans les bibliothèques. Pourtant, elle a des affinités certaines avec la bibliothéconomie, et la profession gagnerait à l’intégrer à ses réflexions en termes d’évolution du métier. C’est pourquoi j’ai décidé de m’attaquer une bonne fois à la définition de cette discipline étrange et de ce qu’elle peut nous apporter, à nous les techie librarians.

Définition

L’architecture de l’information a une double origine : un constat et une métaphore.

Un constat : avec le grossissement des sites Web, l’augmentation de la quantité d’information qu’ils contiennent, et la complexification des techniques, il est devenu clair que concevoir un site Web efficace échappe à la compétence des seuls techniciens ou graphistes. Un chaînon manquant apparaît, à l’intersection de la production de contenu (compétences éditoriales) et de la mise en oeuvre technique et graphique (compétences informatiques et design). Ce chaînon manquant, c’est l’architecte de l’information.

Une métaphore : celle du bâtiment bien sûr. S’il est possible de construire une maison sans faire appel à un architecte, dès qu’on s’attaque à un bâtiment important, une vue d’ensemble s’avère nécessaire ou pour le moins utile. L’architecte est aussi celui qui est à la fois capable de comprendre les besoins du commanditaire et les fonctions du bâtiment, et de savoir quelles techniques et quels matériaux pourront être utilisés pour la mise en oeuvre.

L’architecte de l’information est donc celui qui détient la vision globale du site Web. Cette vision globale doit avoir à la fois la qualité d’une vision extérieure, objective pour conserver sa globalité, et en même temps être proche des rouages internes de la production du site afin de bien comprendre les enjeux et de mettre en oeuvre une analyse réaliste.

Méthode

La base du travail de l’architecte de l’information est de comprendre les objectifs du site et le public visé, celui-ci pouvant être réparti en types d’utilisateurs qui pratiquent différents types d’usages. Le reste de l’analyse peut aisément être compris en filant la métaphore du bâtiment, car la conception des sites est fortement spatialisée.

  • la typologie et la classification des contenus revient à définir quels seront les espaces du bâtiment et quelles seront leurs fonctions
  • il faut ensuite réfléchir à la manière dont on circule entre ces espaces, et aux repères qu’on donne aux utilisateurs pour s’orienter : c’est la navigation dans le site Web et les outils de recherche d’information.

Enfin, l’architecte de l’information modélise tout ceci dans des maquettes fonctionnelles ou wireframes en anglais, dont l’objectif est de donner une vue d’ensemble graphique de la page et de la façon dont elle s’articule avec le reste du site. Cette maquette est une sorte de gabarit neutre sur lequel s’appliquera ensuite le graphisme.

Disciplines connexes

L’architecture de l’information est liée directement à d’autres disciplines aux noms barbares, telles que le design interactif, l’usabilité, la trouvabilité ou encore l’expérience utilisateur.

Cette dernière est intéressante parce que difficile à percevoir et surtout à quantifier. L’expérience utilisateur, c’est l’impression de se sentir bien quand on visite un site, ce qui est en partie une affaire de graphisme mais pas seulement. L’architecte de l’information réfléchit à enrichir l’expérience utilisateur, c’est-à-dire à essayer de tirer parti de ce que le média Web apporte de plus par rapport aux autres.

Quel rapport avec nous ?

Pour ceux qui se demandent encore le rapport avec les bibliothèques, je récapitule… L’architecture de l’information fait fortement appel à des compétences qui sont celles des bibliothécaires : classifier l’information, gérér des masses de ressources parfois hétérogènes, favoriser l’accès à l’information en fournissant des outils de recherche ou en aidant les lecteurs à s’orienter dans les collections. En retour, ce que l’architecture de l’information a à nous apporter, c’est son expérience des nouvelles technologies, sa conception spatiale de l’information, et surtout son côté très user-oriented, centré sur les besoins et les pratiques des usagers.

La réflexion déjà bien avancée chez les anglo-saxons a cet avantage de refléter un positionnement abouti de l’architecture de l’information au milieu d’un bouquet d’autres disciplines par rapport auxquelles on a parfois du mal à se situer. Dans la réfléxion sur le métier de bibliothécaire à l’heure du numérique, il est capital de savoir exactement où se situent nos compétences, et comment elles s’imbriquent avec celles des autres acteurs.

Ressources

Au risque de me répéter, je récapitule l’ensemble des ressources sur le sujet :

Livre

  • la bible de l’architecture de l’Information c’est l’ouvrage de Louis Rosenfeld et Peter Morville, Information architecture for the World Wide Web, le livre à l’ours polaire chez O’reilly, 2e édition en 2002 (en anglais)

Sites Web

Blogs

  • Bloug le blog de Louis Rosenfeld (en anglais)
  • FredCavazza.net blog très riche avec plein de définitions et de ressources super utiles (en français)