Le Figoblog nouveau est arrivé

Pour fêter en beauté le nouveau cru 2015, le Figoblog fait peau neuve.

Ça fait du bien (le design du site n’avait pas été rénové depuis 2008) mais surtout, mon très cher administrateur du site et moi-même avons décidé d’aller dans le sens de l’histoire. Nous abandonnons un système basé sur un logiciel open source et une exploitation internalisée (dans notre salon) pour aller vers une plateforme en SAAS (Software as a service).

Cette évolution va certes limiter un peu les fonctionnalités, mais elle permettra au Figoblog de bénéficier régulièrement et sans douleur des améliorations courantes de la plateforme et de son support. Par exemple, je devrais voir disparaître mes problèmes de spam et vous pourrez de nouveau mettre des commentaires (youpi !) Finis les thèmes mitonnés à la main avec notre plus beau Photoshop+CSS, là aussi je rentre dans le rang en adoptant l’un des nombreux thèmes librement disponibles.

Par ailleurs je quitte Drupal pour WordPress, non pas parce que je n’étais plus heureuse avec Drupal (et nous resterons bons amis) mais parce que les fonctionnalités de WordPress sont suffisantes pour mes besoins.

Bon, il y a juste un « léger » « petit » inconvénient : dans l’opération, toutes les URL des anciens billets vont être perdues. Pensez également à rafraîchir vos flux RSS. Je pense que la page 404 va être la plus visitée du site pendant un temps. Ah, les identifiants pérennes…

Publicités

UILLD : un satellite de l’IFLA

Me voici en direct de Singapour où j’ai assisté au 79e congrès de l’IFLA – il était temps que je me mette à bloguer car c’est le dernier jour ici ! Je ne ferai pas un compte-rendu exhaustif de ce congrès, mais je voudrais revenir sur quelques éléments liés à ma marotte habituelle : le Web sémantique.

Cette année, la section Information Technology dont je fais partie organisait une « rencontre satellite » sur un sujet particulièrement intéressant : les interfaces utilisateurs basées sur le Web de données en bibliothèque (User Interaction Based on Library Linked Data ou UILLD). En effet, après plusieurs années passées à se focaliser de manière principale sur la technologie d’une part, la publication des données d’autre part, il semblait important d’aborder la question du Linked Data du point de vue de ce qu’il apporte à l’utilisateur final.

La conférence durait toute une journée ; elle se déroulait dans la Jurong Regional Library de Singapour.
Un mot sur les satellites : c’est une véritable tradition de l’IFLA. Ils se déroulent avant ou après le congrès lui-même, durent une à deux journées et s’intéressent à un sujet en particulier parmi la pléthore des thèmes abordés par les différentes sections. Ces derniers temps il y en avait une bonne vingtaine autour de chaque congrès.
Parce qu’ils se focalisent sur un sujet précis et prennent le temps de le traiter en détail, je trouve que les satellites sont généralement plus intéressants que les sessions du congrès lui-même (en tout cas, c’était mon 2e satellite et cette impression que j’avais eue la première fois s’est vérifiée). Il n’est donc pas rare que des gens viennent uniquement pour assister à l’un de ces satellites et pas au congrès lui-même.

Pour en revenir à UILLD, je vais reprendre ici une citation tirée de la présentation de Martin Malmsten : vouloir « vendre » (au sens marketing du terme) l’idée de Web de données sans montrer d’interface, c’est un peu comme de vouloir vendre un fax alors que le papier n’aurait pas encore été inventé. Les interfaces ne sont peut-être pas au cœur du problème quand on parle de Web sémantique, mais au stade où nous en sommes, elles sont devenues absolument nécessaires pour démontrer à un public de non spécialistes, en particulier aux décideurs, l’intérêt de cette technologie.
C’est la raison pour laquelle il semblait vital d’organiser un événement focalisé sur ce sujet au sein de l’IFLA, parce que l’IFLA est justement un lieu où l’on touche beaucoup de professionnels de divers horizons et en particulier des cadres.

En ce qui concerne le contenu de cette rencontre, j’ai eu l’occasion de présenter l’interface du Centre Pompidou virtuel et Patrick Le Bœuf a évoqué le projet Opencat dont j’ai déjà parlé ici. Il semblerait qu’OpenCat ait bien évolué et je trouve que ce projet reste vital pour notre communauté, car il est le premier à démontrer l’utilisation des technologies du Web sémantique pour réaliser la même chose que ce qu’on faisait avec le catalogage partagé traditionnel, mais en mieux ;-)

Nous avons aussi pu voir des démonstrations d’interfaces réalisées par des personnes en dehors de notre communauté (développeurs, chercheurs) et qui utilisent des données de bibliothèque grâce à leur existence dans le Web de données : c’était le cas d’une application de visualisation pour terminaux mobiles (présentée par Bernhard Humm), ou d’un espace d’échanges de notes entre chercheurs (que nous a montré Ryan Shaw). Ils utilisent en particulier des données d’autorité pour servir de référentiels de personnes.
Ces expériences tendent à montrer que ces données n’auraient pas pu être utilisées (ou pas aussi facilement, ou l’idée ne leur serait pas venue) si elles n’avaient pas été présentes dans le Web de données. Plus encore, ils ont témoigné que les données de bibliothèques ont été choisies, après comparaison avec d’autres sources, pour leur qualité et leur précision ! C’est plutôt une bonne nouvelle.

Je suppose que les diverses présentations et articles complets seront mis en ligne prochainement. J’essayerai de penser à mettre à jour ce billet…

Je vais conclure en annonçant que l’année prochaine, nous organisons également un satellite sur le Web de données en bibliothèque. Il aura lieu à Paris, à la BnF, le 14 août. Plus d’infos à ce sujet bientôt.

En rouge et noir…

Comme cadeau de Noël, Figoblog s’offre (avec l’aide de Got) un nouveau look. Sortez un peu de votre agrégateur pour venir le voir ! Aucun rapport avec Jeanne Mas ou un quelconque revival année 80, j’avais juste envie de sobriété et de quelque chose de minimaliste, avec du noir pour économiser la planète ;-)

Joyeux Noël !!!

LC+FlickR : bilan d’une expérience 2.0

Vous vous souvenez, il y a quelques mois, la Library of Congress ouvrait un site sur Flickr pour permettre aux usagers de tagguer et commenter un fonds de 3000 photographies.

Quelques mois plus tard, l’équipe responsable du projet a (un peu discrètement) communiqué sur les résultats de l’expérience. On peut lire ce billet sur le blog Hanging Together de RLG, et sur Digitization 101 deux comptes-rendus de la conférence CIL 2008 : et .

Quelques idées intéressantes qu’on peut en retenir :
– le fait de positionner la contribution sur Flickr plutôt que sur le site de la bibliothèque permet de s’abstraire des questions déontologiques (inexactitudes, qualité des contributions…)
– ensuite, la LC a mis en place une démarche permettant de réinsérer dans leur propre catalogue les contributions les plus intéressantes : une activité chronophage…
– il ne faut pas non plus noyer les utilisateurs dans la masse : pour ne pas décourager les contributions, la LC n’ajoutait que 50 images par semaine, atteignant ainsi le taux de contribution optimal pour l’ensemble. Ceci dit à ce rythme là il faudrait 20 ans pour tout mettre sur Flickr…

Quelques chiffres : en 3 mois
– 100 notices du catalogue ont été enrichies à partir d’informations collectées sur Flickr (c’est pas beaucoup, non ?)
– la LC s’est fait 11000 « amis » dans Flickr
– 55000 tags ont été ajoutés (10 000 tags différents).

Visiblement, l’expérience a vraiment réussi à susciter une communauté, et pour cela le fait d’être sur Flickr n’a sans doute pas été indifférent (on pourrait se demander si il y aurait eu autant d' »amis » sur un site hébergé par la LC). La communauté a produit un résultat utile, certaines descriptions ou tags relevant de l’analyse voire de l’investigation, et d’autres de la description plus fine que ce qui était fourni par la LC au départ : dans les deux cas, à un niveau de détail qui n’aurait pas pu être atteint sans le recours à la communauté d’utilisateurs.

Plein d’exemples de visualisation

On peut facilement passer plusieurs heures à explorer le site Visual Complexity. Il référence près de 500 projets de visualisation d’information, classés par sujet avec des copies d’écran.

Ca va trucs assez old style comme ça :

Essai d'une Distribution Genealogique des Sciences et des Arts Principaux

à des trucs beaucoup plus futuristes, colorés et qui bougent dans tous les sens comme on les aime :

Visuwords: Online Graphical Dictionary

(Cliquez sur les images pour visiter les sites.)

J’ai particulièrement flashé sur celui-là, il ressemble assez à l’intérieur de mon cerveau au top de sa productivité bibliothéconomique ;-)

Merci au blog de l’EBSI.

La collection numérique dans l’espace

Un des gros problèmes avec le numérique, c’est l’absence totale de perception spatiale qu’on peut avoir en entrant dans la collection. Or nous autres êtres humains, nous avons besoin de nous représenter notre environnement, et le sens que nous utilisons le plus volontiers pour cela, c’est la  »vue ». Avoir une vue d’ensemble d’une collection numérique, ce n’est pas un gadget, c’est complètement essentiel pour permettre d’appréhender sa nature, son contenu, sa forme et son potentiel. Un formulaire de recherche est un outil pervers qui nous permet de voir l’arbre mais pas la forêt. Il contribue fortement à faire du catalogue un espace sans âme et d’une complexité décourageante.

La première possibilité pour rétablir la perception spatiale de la collection dans un univers numérique est d’utiliser la visualisation ou cartographie d’informations. Mais c’est très compliqué à mettre en place d’un point de vue fonctionnel à cause du manque d’habitude de manipulation de ces outils. Ils perturbent, ils dérangent et finalement quand on creuse un peu on tend à les vider de leur sens (comment on peut avoir cette idée-là et en quelques
séances de travail en arriver ?) Bref c’est pas mûr, et on ne sait même pas si les utilisateurs sont murs eux-mêmes, donc retour à la case départ.

Quand je cherche dans Yahoo et qu’il me répond qu’il y 442 000 figues sur le Web, même s’il m’est humainement et techniquement impossible de parcourir les 442 000 résultats j’ai une idée approximative de l’espace qu’occupent les figues dans le Web.
De façon approchante mais plus bibliothéconomique, on peut utiliser les classifications. Cela revient à montrer le nombre d’étagères de livres qu’il y a derrière une requête : non pas que nous espérions que les lecteurs soient capables de regarder chacun des « dos » qui se présentent à eux, mais cela peut leur permettre d’appréhender la collection. Plus celle-ci grossit, plus on s’approchera d’un phénomène semblable à celui des moteurs de recherche du Web : une indication approximative sur le nombre de livres qui se cachent derrière chaque entrée thématique.
Les classifications à facettes sont intéressantes parce qu’elles permettent de combiner des étagères ensembles pour obtenir un résultat plus petit, donc humainement perceptible. Mais sur de la numérisation de masse, même en combinant, on aura à la fin d’énormes étagères.
Non pas que ce soit un problème à mes yeux. Mais cela perturbe énormément certaines personnes de la profession, qui ne doivent pas être habituées à devoir faire le tri dans de grosses masses d’information.

Dans l’article sur l’arbre et la forêt que je citais au début, on nous propose un troisième outil : le text-mining. Le « clustering », la visualisation de relations sont des outils qui peuvent nous aider à avoir cette « perspective de haut niveau » sur la collection numérique.
Je ne résiste pas à l’envie de citer la partie de l’article qui dit qu’il vaut mieux être accompagné d’un professionnel de l’information pour s’engager sur la route du text-mining :
Information professionals are natural partners for text mining because of their existing skill sets. At the top of the list is their knowledge and experience with the “information highway” and their ability to place information tools in context. Furthermore, they are knowledgeable about available products and information-retrieval techniques. Good information professionals have a blend of analytical and creativity skills, are adept at problem solving, and excel at dealing with ambiguity. Finally, information professionals have developed excellent consultative and listening skills and the ability to adapt and try different approaches to problems.
Ca devrait faire plaisir à mon geek.

A la fin de l’article, il y a un encadré pour les bibliothécaires avec le jargon à prendre en main pour se mettre à niveau en text-mining : chers lecteurs, si vous y voyez des mots nouveaux, c’est que vous pouvez encore creuser pour explorer la mine.

Presse U.S.

La Library of Congress a mis en ligne le site Chronicling America consacré aux journaux anciens.

C’est le fruit d’un projet qu’on suit depuis un moment, le NDNP (National digital newspaper program) – à ne pas confondre bien évidemment avec le NDIIPP qui, lui, porte sur la conservation numérique.

Le « plus » : bien sûr on peut chercher en plein texte dans ces journaux, mais surtout le visualiseur est carrément bluffant.

Le « moins » : cette espèce de granularité à la page. Evidemment avec la presse ça simplifie la vie, je suis bien placée pour le savoir, mais ça fait un peu bâclé.

Merci à 10KY blog.

28% de taggeurs

D’après ce rapport du Pew Internet Project sur le tagging, 28% des internautes américains auraient déjà utilisé les "tags" pour caractériser des ressources.

Le profil de ces taggeurs ? plutôt jeunes (moins de 40 ans), hommes et femmes, blancs et noirs… leur principal point commun c’est d’être des « early adopters », amateurs éclairés de technologies nouvelles.

Le rapport contient une interview intéressante dans laquelle sont discutés l’avenir du tagging, ses avantages et ses inconvénients.

Tout cela c’est bien joli, mais aujourd’hui, à mon avis en France on est très loin des 28% en question. La plupart des sites qui proposent des interfaces de tagging, comme del.icio.us ou flickr, n’ont pas encore traduit leurs interfaces en français et ne sont adoptés que par une frange très restreinte des internautes : des blogueurs, des geeks et autres internautes 2.0…
Alors si une bibliothèque veut lancer un tel service, elle se heurte à un mur d’incompréhension général : à quoi ça sert, quelle différence avec le bon vieux « panier » de mon SIGB préféré, etc.

Si on veut que les « tags » entrent dans les bibliothèques en France, il va donc falloir, à mon avis…

  • trouver une traduction valable pour « tag » : en français c’est affreusement connoté, on imagine tous ces jeunes des banlieues avec leurs bombes de peinture
  • mobiliser les utilisateurs : et en priorité ceux qui ont une pratique du web 2.0, donc les jeunes
  • prouver la valeur du service par une adoption massive et la réalisation d’entreprises d’indexation qui auraient été manifestement impossibles autrement.

Alors, est-ce jouable ? l’avenir nous le dira… peut-être…

SL, ma Deuxième Vie

Pas mal de gens en France commencent à parler de Second Life ; si vous n’en avez jamais entendu parler regardez ici, si vous vous demandez à quoi ça sert regardez .

Bon, moi, n’y tenant plus et préférant juger par moi-même, j’y suis allée.

Info Island I main library

Ca, c’est le coeur d’Info Island, l’île des bibliothèques (enfin, une des îles…) : la "main library". Il y a un reference desk mais je n’ai jamais vu personne y tenir permanence (peut-être à cause des heures improbables auxquelles je me connecte par rapport au "Second Life Time").
Enfin, cette rotonde est le bon endroit pour rencontrer des gens. La dernière fois, j’ai recontré des bibliothécaires très sympas qui m’ont fait visiter et depuis j’ai une petite étiquette « librarian friend » au-dessus de mon nom ! C’est comme dans la vraie vie : on se croise, on discute, on se promène ensemble. Sauf que des fois les bibliothécaires s’envolent ou se téléportent, ce qui peut destabiliser.

Health info Island main Library

Ca, c’est la main library de Health info Island, les bibliothèques médicales. Je l’ai choisie comme exemple des services que les bibliothèques peuvent offrir dans Second Life : on peut interroger Pubmed ou Google, écouter des podcasts médicaux, découvrir des infos par sites web ou écrans interposés, et rencontrer un reference librarian à certaines heures.
C’est carrément immense.

Info Island Sci_fi library

Ca c’est la bibliothèque de science-fictions d’Info Island. Elle a pour originalité d’être suspendue, le seul moyen d’y entrer est de s’y téléporter. On y trouve pas seulement des PC mais aussi des livres : en fait des liens vers des sites Web.
Comme beaucoup d’endroits dans Second Life, cela vaut le détour et on peut s’y assoir au coin du feu pour regarder la mer. Il ne reste qu’une seule question : à quoi bon s’assoir au coin du feu dans un logiciel ?

En bref, est-ce qu’on peut dire de Second Life que c’est…

  • un réseau social ? oui, on y recontre des gens, on y rejoint des groupes, on discute, on crée des choses ensemble
  • un jeu ? non, il n’y a pas de but, il n’y a rien à gagner
  • un monde ? oui, on peut s’asseoir au coin du feu… et il y a tant et tant à découvrir, j’avoue ne plus savoir par quel bout le prendre. On peut dépenser pas mal d’argent aussi.
  • une "expérience" ergonomique ? non, à part le fait de voler, ce n’est pas une expérience, et surtout d’un point de vue bibliothéconomique, c’est assez décevant : pas d’expérience de lecture (enfin, je n’en ai pas trouvé pour l’instant), et on trouve surtout des liens vers des sites Web (donc vers l’extérieur de SL)
  • un espace publicitaire ? oui incontestablement, un des premiers trucs qu’on apprend c’est à lire les panneaux publicitaires et il y en a un paquet
  • du Web 2.0 ? ah ah, bonne question à condition de savoir ce qu’est le Web 2.0 !!! en tant que tel pour moi c’est trop "insulaire" pour être du Web 2.0 mais l’emballage de blogs, wikis et groupes flickr qu’il y a autour, lui, est 2.0. Le fait que les bibliothèques y soient est peut-être "bibliothèque 2.0".

Bon je me suis bien amusée, mais si j’avais des copains pour se balader avec moi ce serait encore mieux ;-)

Visualisation de collection numérique

Bungee View est un prototype en java pour butiner des collections numériques. Il montre comment on peut utiliser les données structurées pour trouver de l’information.

A mon avis, ce genre d’outil présente toujours le même défaut : entre un niveau de complexité trop élevé pour la prise en main, et un aspect un peu « gadget » qui donne envie de cliquer partout, l’utilité documentaire reste à prouver.

Merci Resourceshelf.