Un an en un billet

Ah ah, vous pensiez que le Figoblog était mort. Vous m’avez croisée lors d’une conférence et entendu parler de « feu mon blog ». Vous pensiez que le seul moyen d’être encore au courant de mes faits et gestes était de vous abonner à mon compte twitter. Mais non ! Je m’étais donné un an pour déclarer pour de bon sa mort clinique, et le voici qui sursaute, à l’approche de l’IFLA. Bon sang un an déjà, et ce n’est pas comme s’il ne s’était rien passé. Je vous propose de revivre cette année en accéléré en un billet…

17 août 2011. Lors du congrès de l’IFLA à San Juan, Puerto Rico, se réunit pour la première fois le nouveau groupe d’intérêt de l’IFLA sur le Web sémantique (SWSIG). Une centaine de personnes ont assisté à ce qui fut l’acte de naissance de ce groupe (sa fondation ayant été ratifiée officiellement par l’IFLA quelques mois plus tard, ce qui lui a permis d’être doté d’une page web bien à lui). Au programme de cette réunion, une présentation du rapport final du LLD XG (voir ci-dessous), un rapport d’avancement sur les activités de normalisation de l’IFLA dans le domaine, et une série de courtes présentations montée quasiment au débotté avec les personnes présentes (voir les diapos en ligne). Ce fut une session très réussie.

18 août 2011. D’ailleurs il ne faut pas croire que je me suis arrêtée de bloguer, lors de ce congrès de l’IFLA 2011. Simplement je l’ai fait sur un autre blog, celui du CFI.

8 septembre 2011. Dans le cadre du « meetup web sémantique », rencontre dans la salle Piazza du Centre Pompidou sur le thème « Patrimoine et Web de données » à l’occasion duquel j’ai pu parler du projet qui a occupé mes jours, mes nuits, mes week-ends depuis un an (comment ça j’exagère ??) à savoir le Centre Pompidou virtuel. Plus d’infos à ce sujet un peu plus loin. En tout cas grâce à l’IRI et à son polemic tweet, vous pouvez revivre ce moment en vidéo ici.

21 septembre 2011. Je suis à La Haye pour la conférence DC2011. Le vendredi, dans une mémorable keynote (ben oui je suis contente, c’était ma première !) j’ai parlé de ratatouille, mis le feu à la BBC et raconté des contes pour enfants à un auditoire mal réveillé mais ravi.

12 octobre 2011. Je suis à la foire du livre de Francfort, cette fois pour présenter le Centre Pompidou virtuel à l’association internationale des éditeurs de musées. Un événement qui ne semble pas avoir laissé de traces en ligne.

25 octobre 2011. Publication officielle du rapport final du Library Linked Data Incubator Group du W3C (plus connu sous le petit nom de « LLD XG ») : enfin le terme d’une année de travail très intense !
Le rapport se compose en fait de 3 documents :
– le rapport final ;
– une première annexe qui liste les vocabulaires et données déjà disponibles ;
– une seconde annexe qui reprend et synthétise les cas d’utilisation réunis par le groupe pour élaborer son rapport.
Le rapport final est en cours de traduction en français.

29-30 novembre 2011. J’ai failli aller à Hambourg pour assister à SWIB mais en fait non. Consolation en vidéo ici : 29/11 et 30/11.

8 décembre 2011. L’ADBS et l’EBD organisent une journée d’étude intitulée « L’accès à l’information dans tous ses états ». Devinez ce que j’y présente… oui, le Centre Pompidou Virtuel (eh toi là au fond qui bâille ! je t’ai vu !)

14 décembre 2011. J’ai failli aller à Madrid pour participer à une rencontre sur le Linked Data organisée par la Bibliothèque nationale d’Espagne pour présenter son projet datos.bne.es mais je suis retenue à Paris par d’autres obligations. On trouve le compte-rendu de cette rencontre narrée sur le blog Open bibliography and Open Bibliographic Data.

13 janvier 2012. Un petit saut à l’INHA pour la journée d’étude « Signes et balises : L’édition numérique en histoire de l’art, réalisations, projets, enjeux ». C’est marrant comme ce genre d’événements ne laissent pas de traces en ligne.

13 mars 2012. L’hiver a été long, mais pas improductif : on a pu assister à plusieurs des intéressantes conférences des séminaires de l’IRI : celui sur l’éditorialisation, et celui sur la muséographie. Et voici que j’y suis invitée pour présenter…. devinez quoi… (j’espère que vous aimez le comique de répétition). En vidéo ici (je vous laisse chercher pour retrouver les autres vidéos !)

19-20 avril 2012. Je suis invitée à Aix pour deux passionnantes journées sur le thème de l’Open Data culturel, organisée par l’AGCCPF-PACA (inutile d’essayer de m’extorquer la résolution du sigle). Ah, Aix-en-Provence, sa météo clémente, le charme de ses rues médiévales… (je préfère ne pas dire de quoi je parlais ;-) Yannick Vernet explique en détail sa démarche sur le c-blog.

2 mai 2012. Je participe à la conférence SemWeb.pro où je répète infatigablement la même chose. Mais cette fois devant un parterre de geeks, ça change. Et puis ça contribue à la présence d’une représentation féminine au sein des intervenants, il y en a besoin.

4 mai 2012. OCLC annonce la mise à disposition public de VIAF sous licence ouverte. Le fichier peut être téléchargé en RDF ou dans d’autres formats moins connus comme MARC21, depuis l’adresse http://viaf.org/viaf/data/. Les biblio-geeks font des bonds.

22 mai 2012. Il y aura une vie après MARC21. En tout cas, la Library of Congress y travaille… avec Zepheira, elle élabore un modèle qui devrait permettre de lancer la grande discussion que nous attendons tous sur la transition des formats MARC vers le Web de données.

20 juin 2012. Worldcat est publié en Linked Data. Ah en fait non, ils ont juste mis du Schema.org dans les pages. Déjà pas mal, vous me direz. Plus d’info chez Richard Wallis, célèbre évangéliste du biblio-web-sémantique qui a quitté Talis pour rejoindre OCLC en avril.

21 juin 2012. Invitée à ouvrir la 2e journée du colloque « Patrimoine et humanités numériques » organisé par Paris 8, je fais preuve d’un incroyable sursaut d’originalité et décide de parler de réintermédiation numérique par les données. Pour ceux que ça intrigue, j’ai écrit un beau texte qui devrait être mis en ligne quelque part (patience…)

29 juin 2012. Retour à la BnF le temps d’une journée : la fameuse journée annuelle BnF/Afnor qui s’intéresse cette année au livre numérique. Je modère une table ronde sur les métadonnées. Tout est révélé ici.

En juillet, j’ai pris quelques vacances (en partie consacrées à la rédaction de mon intervention pour le séminaire INRIA du mois d’octobre sur le Web sémantique) avant de repartir pour une nouvelle année sur les chapeaux de roue. Toutes mes excuses à tous les gens qui m’ont invitée quelque part et à qui j’ai dit non parce que j’étais déjà trop occupée. Vous voyez que je n’ai pas menti. Pour un commentaire en temps réel des événements à venir, rendez-vous sur twitter

En direct de l’IFLA

Il faut que je songe a remplir mes devoir de blogueuse IFLA (fonction attestée par le ruban bleu que je porte sur mon badge) et ne pas céder à la facilité en me contentant de réflexions en moins de 140 caractères…

Le congrès a commencé comme à son habitude intensément, avec les réunions des comités permanents samedi matin, le caucus des francophones samedi soir, la session d’ouverture et les premières sessions thématiques dès dimanche. Pas de week-end pour les congressistes ! (pas de jour ferié non plus, cela va sans dire).

Le programme est très intéressant cette année et on regrette de ne pas pouvoir se dédoubler pour assister à plusieurs sessions à la fois. Heureusement, grâce au fil Twitter #wlic2011 qui est assez bien alimenté, on peut avoir une idée de ce que se passe dans les autres salles.

Ainsi le Web sémantique est à l’honneur et il a été abordé hier dans deux sessions qui se déroulaient en parallèle : la session des bibliothèques d’art, avec une présentation sur VIAF et celle de la section de Catalogage avec le projet polymath, un projet sur les autorités en Linked Data dont j’avais entendu parler parce qu’ils ont présenté un use case au LLD XG. Dans cette 2e, il semblerait que la question de l’avenir de MARC (ou son absence en l’occurrence ;-) ait été évoquée. Elle le sera encore dans d’autres sessions.

En parallèle encore, le FAIFE (Committee on Freedom of Access to Information and Freedom of Expression) organisait une session intitulée « how to fix the world », oui, rien que ça ! ou il a été question (d’après le flux Twitter) notamment des émeutes en Egypte et des libertés individuelles.

Ce matin, après avoir écouté la session plénière ou il était question de propriété intellectuelle, je me suis rendue a la réunion du Namespace task group. Ce groupe, pour l’instant plus ou moins informel, réunit plusieurs sections et groupes de l’IFLA pour coordonner la publication des standards bibliographiques sous forme de vocabulaires RDF.
Cela faisait longtemps que le groupe ne s’était pas réuni (je me demande même si ce n’était pas la première fois… On avait surtout travaillé par mail par le passé) et c’était tout à fait passionnant. Parmi les sujets abordés, nous avons évoqué le problème de la traduction des labels dans des langues autres que l’anglais, les liens entre vocabulaires, le dédoublonnage des notices…
Les activités de ce groupe seront liées à celle du groupe d’intérêt spécialisé sur le Web sémantique, le SWSIG, que je réunis mercredi matin à 9:30 (si des congressistes me lisent : surtout n’hésitez pas à y assister, même par simple curiosité !)

A suivre…

Ma valise pour l’IFLA

Bon alors… départ pour l’IFLA la semaine prochaine… qu’est-ce que je vais mettre dans ma valise ?

1, Mon article sur Convergence et interopérabilité : l’apport du Web de données pour la session de la la section Classification et Indexation. Que j’ai écrit en français, pour une fois… Faudrait peut-être que je fournisse la traduction, d’ailleurs, oups, ne serais-je pas un peu en retard ?
Tiens, en tout cas, il va y avoir des choses intéressantes dans cette session : comment skosifier votre bibliothèque, un service japonais pour le Web sémantique, et l’indexation par le Web à la Bibliothèque du Congrès.

2. Le rapport final du LLD XG, dont nous allons présenter les résultats lors de la première réunion du nouveau groupe « Web sémantique et bibliothèques » que j’anime.
Le rapport en question n’est pas tout à fait fini, on y travaille encore… Et d’ailleurs ce n’est pas tout ! Il y a deux livrables complémentaires : l’un qui liste les données et vocabulaires disponibles, l’autre qui synthétise notre collecte de use cases.

3. Le texte fondateur du groupe d’intérêt spécialisé que j’évoquais plus haut, le SW SIG. C’est qu’il va falloir réfléchir à ce qu’on va faire dans ce groupe pendant les deux ou trois ans à venir… Ce sera le but de la réunion du groupe : une réunion ouverte, à laquelle tout le monde peut venir.

4. Les documents des autres groupes auxquels je participe :
– le comité permanent de la section Information Technology,
– le Namespaces task group qui travaille sur la publication des vocabulaires de l’IFLA (dont la FRBR family),
– l’ISBD XML group qui (comme son nom ne l’indique pas) finalise en ce moment une version de l’ISBD en RDF, version qui a déjà été utilisée par la British Library dans la version Linked Data de leur bibliographie nationale, publiée récemment.

5. Le programme de toutes les intéressantes sessions de la conférence auxquelles je vais pouvoir assister : sur le dépôt légal numérique, la formation pour la gestion des collections numériques, etc.

6. Mon ordinateur portable. Mon blog. Mon Facebook. Mon Twitter, avec le hashtag #wlic2011.

7. Mon maillot de bain :-) quand même…

Sem Web Pro

Ces deux derniers jours, j’ai participé à la conférence Semweb.Pro. L’objectif de cette première édition était, je crois, de montrer qu’il existe une communauté professionnelle et des applications industrielles pour le Web sémantique en France. Et l’objectif a, je crois, été atteint !

Environ 130 personnes étaient présentes entre les deux journées : la conférence proprement dite le 1er jour, et les tutoriels le 2e jour. Quelques impressions à chaud…

J’ai beaucoup apprécié l’ouverture d’Ivan Herman, qui a fait le point sur les travaux en cours dans le domaine du Web sémantique au W3C, de la nouvelle version de SPARQL aux travaux qui vont démarrer sur « RDF next steps », en passant par les évolutions de RDFa. Bon c’est vrai, dès le matin à 9h, les requêtes SPARQL direct c’était un peu sévère ;-) mais au moins ça annonçait la couleur.

Ensuite, nous avons assisté à 4 présentations de produits qui permettent de publier des données en RDF : EMFtriple, CubicWeb, Semsoft et Asterid. Personnellement, cette partie de la conférence m’a moins emballée, mais je pense que c’est juste parce que ça ne correspondait pas à mes centres d’intérêt à ce moment-là.

L’après-midi la parole était aux producteurs, avec une table ronde sur l’ouverture des données publiques (à laquelle j’ai participé), et la présentation de la BBC (j’adore toujours autant leurs réalisations, c’est vraiment excellent).
Enfin quelques réalisations intéressantes : SemWebVid pour annoter des vidéos automatiquement, les explications d’Antidot sur l’utilisation des technos du Web sémantique dans un moteur de recherche, et Datao pour les interfaces graphiques.
Ça s’est terminé avec des « lightning talks » auxquels je n’ai malheureusement pas pu assister.

Deuxième jour, les tutoriels : c’était dur, il fallait choisir ;-) mais je dois dire que tous ceux auxquels j’ai assisté étaient de grande qualité. Grâce à Got je n’ai plus peur de RDFa… et je salue tout particulièrement le travail de l’équipe Datalift, je pense que leurs diapos feront date dans le monde du Web de données français.

Pour finir, je tire mon chapeau aux organisateurs de la conférence pour la logistique, les salles, le café, les croissants, le wifi, le fil twitter, le déjeuner au self du coin, tout ! Et ce qui était surtout agréable c’était de voir réunie toute la communauté et de partager ces deux jours avec tout plein de gens passionnants. J’espère qu’on remettra ça l’année prochaine !

IFLA 2010 – Suite et fin

Les deux dernières journées de l’IFLA, samedi et dimanche, ont été riches en ce qui me concerne, car le dimanche matin se déroulait la session « Libraries and the semantic Web », que j’ai contribué à organiser, et l’après-midi la session « Development of systems for long-term storage and preservation of library collections » dans laquelle je présentais un article.

Samedi, mis à part une courte (et extrêmement agréable) rencontre avec quelques membres du LLD XG, j’ai consacré la plupart de mon énergie à finir de préparer la journée du lendemain, ce qui incluait la modération de la session du matin, la préparation des différentes copies de mon article pour la traduction simultanée, etc.

La session « Libraries and the Semantic Web », bien que se déroulant un dimanche 15 août à partir de 8h30 (!), a attiré environ 250 personnes, dont la plupart ne dormaient même pas !
Nous avons eu droit à une ouverture riche et éclairante par Richard Wallis, suivie par 6 présentations toutes pertinentes et de haute qualité dont vous retrouverez les textes sur le site de l’IFLA et les présentations sur Slideshare. La session a aussi été assez bien couverte sur twitter (#ifla2010) y compris par votre serviteuse qui twittait depuis la tribune ;-)

La session de l’après midi, consacrée à la préservation numérique, s’est très bien passée aussi. Il y avait environ 120 personnes, ce qui n’est pas mal du tout pour la dernière session de la conférence. Les autres présentations portaient sur le système e-Depot de la KB, et sur Hathi trust. La défection d’un des intervenants a été habilement compensée au pied levé, grâce au brio des animatrices de la session, par une intéressante discussion avec la salle permettant de faire un peu le tour des initiatives en cours.

Et puis c’était la fin : la session de clôture, avec ses récompenses, ses remerciements… et pas son annonce du lieu d’un futur congrès, puisque le lieu du congrès de 2013 ne sera annoncé que l’année prochaine.
Mystère donc !

… Rendez-vous l’année prochaine à Puerto Rico ?

IFLA 2010 – Au jour le jour (3)

La 3e journée de l’IFLA, hier vendredi, a commencé en beauté avec la plénière de Hans Rosling. Il nous a invité à revisiter nos idées reçues sur la répartition du monde entre pays développés et en voie de développement. Sa présentation est disponible sur Vimeo ; je ne peux pas vous dire si ce sera aussi décoiffant qu’en vrai, mais je peux vous garantir que nous avons passé un très bon moment. Vous pouvez également visiter le site Gapminder (nommé d’après la mention sur les quais du métro londonien, « Mind the Gap ») où vous retrouverez ses graphiques de statistiques animées, les vidéos de ses présentations à TED, etc.

Ensuite, en ce qui me concerne, j’ai aligné les réunions des « standing committee » / comités permanents des différentes sections dont les activités m’intéressent.
Ces dernières années, dans l’espoir de réduire la durée du congrès et par là son coût, l’IFLA a décidé de rendre optionnelle la deuxième réunion des comités permanents des sections. En pratique, les sections ont besoin de cette deuxième réunion. Déjà qu’on ne se voit qu’une fois par an, cela ne paraît pas excessif de faire le point une fois au début et une fois à la fin de la semaine, ne serait-ce que pour partager le résultat des travaux qui se sont tenus dans les groupes de travail entre temps. La conséquence c’est que cette deuxième réunion n’apparaît pas dans le programme, et qu’elle se déroule en parallèle des conférences.

Bref. Petit aperçu interne de ce qui se passe dans ces réunions.
Les sections, je crois que je l’ai déjà dit, ont un président (chair) et un secrétaire qui animent la réunion. Les membres (élus) de la section siègent à la table, et les observateurs s’installent en retrait (certaines sections, c’est le cas de la section IT, invitent les observateurs à leur table, ce qui n’est possible évidemment que si on est relativement peu nombreux – impossible donc dans une section comme Catalogage).

La réunion commence généralement par un tour de table ou chacun se présente.
Ensuite, les sujets abordés incluent le rapport des sous-groupes ou groupes de travail, le rapport du trésorier sur le budget de la section, la mise à jour (annuelle en principe) du « strategic plan » de la session, et d’autres sujets administratifs.

Ainsi l’année prochaine sera une année d’élections ; sujet qui a été abordé dans la plupart des réunions auxquelles j’ai assisté. Les élections touchent tous les niveaux de l’IFLA, à savoir de bas en haut :
– les membres des sections : si vous voulez devenir membre d’une section, vous devez demander à votre institution (qui doit être membre de l’IFLA) de proposer votre candidature. Les membres sont élus pour 4 ans en deux fois (par exemple, dans l’IT section, certains membres ont été élus pour 2007-2011, et d’autres pour 2009-2013 ; de cette façon tous les membres ne risquent pas de changer en même temps.) Ce processus aura lieu vers le mois d’octobre ; les nouveaux membres siègeront pour la 1e fois à Puerto Rico l’année prochaine.
– les officiers des sections : le président, le secrétaire, le trésorier et le responsable de l’information (qui s’occupe notamment de la Newsletter de la section). Ils doivent être membres de la section et sont élus dans leurs fonctions pour 2 ans. Ils bénéficient d’une formation spécifique, assurée par l’IFLA pendant le congrès.
– les responsables des divisions : l’IFLA a été réorganisée l’année dernière et compte maintenant 5 grandes divisions qui regroupent les sections. Les divisions ont chacune un président qui siège de droit au comité professionnel et au governing board.
– Le comité professionnel et le governing board sont les groupes qui pilotent l’IFLA. Le governing board compte, en plus des membres de droits (les présidents des divisions, le président du comité professionnel, etc.), dix membres directement élus parmi les membres des sections. Le président du comité professionnel est aussi élu. Toutes ces fonctions sont concernées par les élections de l’année prochaine.
– Enfin, le (ou la) président(e) de l’IFLA : il est élu pour 2 ans, mais en décalage 2 ans avant son terme (c’est un peu compliqué). Il prend alors le titre de « president-elect » en attendant que le président précédent termine son terme. Actuellement Ellen Tise est présidente, et Ingrid Parent est « president-elect ». Donc l’année prochaine, Ingrid Parent sera présidente, et un nouveau président-elect sera élu.
Je sais, c’est horriblement compliqué ; mais enfin, il m’a fallu deux ans pour recoller tout cela ensemble, donc j’ai pensé que ça pouvait être utile si je partageais. Il faut savoir qu’on peut très bien vivre à l’IFLA en n’ayant qu’une connaissance minimale de tous ces processus (si on n’est pas officier). Les gens se soucient donc assez peu de vous l’expliquer quand vous débarquez.

Pour en finir avec les comités permanents des sections, un des sujets qui les occupe est la préparation des conférences de l’année suivante, et éventuellement l’organisation des conférences satellites.
Chaque section a en principe un créneau de 2h dans la conférence, mais elles peuvent se grouper et ainsi démultiplier leur temps (comme nous l’avons fait cette année avec la session « Libraries and Semantic Web »).
A Puerto-Rico en 2011, il y aura un satellite sur RDA organisé en collaboration avec le JSC. De notre côté, nous aimerions organiser un événement sur le Web sémantique en 2012 (le congrès aura lieu à Helsinki). Du travail en perspective !

Après tout ça, nous avions bien mérité le délicieux dîner informel de la section IT, que nous avons pris dans un restaurant suédois sur Kungsportavenyn, et la soirée dansante (un autre événement très fameux de l’IFLA : quand les bibliothécaires se mettent à danser…) qui nous a gardés en mouvement jusque tard dans la nuit.

IFLA 2010 – Au jour le jour (2)

Mercredi, après avoir dansé sur ABBA à la session d’ouverture (mais je souhaiterais aussi saluer la performance des deux autres artistes, un guitariste et une chanteuse, qui étaient vraiment époustouflants) nous avons dégusté un déjeuner à base de pommes de terres et de saumon fumé, offert par la présidente. Les sessions de conférence ont ensuite démarré, mais seulement jusqu’à 16h, où nous attendait un nouvel événement : l’ouverture de l’exposition et des stands.

Une nouvelle occasion de boire un verre, et de retrouver (entre autre) les collègues de l’ABES, que j’en profite pour saluer ici. J’ai fait une belle collection de reproches quant à mon manque d’assiduité sur Figoblog, alors, saisie de remords, je me suis dépêchée de m’enregistrer parmi les blogueurs officiels de l’IFLA, ce qui m’a permis d’obtenir un joli ruban bleu pour décorer mon badge.

J’ai également profité d’un peu de temps libre pour visiter la Bibliothèque publique de la ville. C’est un endroit extrêmement agréable, avec plein de fauteuils ikéa et de places confortables pour travailler, une offre de livres dans de nombreuses langues, et des animations variées. On profitait aussi des échos du festival qui a une scène juste en bas sur Götaplatsen.

Le lendemain, deuxième jour de la Conférence, j’ai assisté à la présentation par OCLC de leur nouveau service « Webscale Management System », un service de gestion de bibliothèque « dans les nuages ». Très intéressant, mais c’est encore un travail en cours, qui n’existe que sous forme de pilote aux Etats-Unis pour l’instant.

Juste après cela, le petit sous-groupe de travail sur le Web sémantique que j’anime au sein de la section IT s’est réuni pour discuter de ses actions pour les années à venir. Ces actions incluent la proposition de créer une structure légère, de type groupe d’intérêt spécialisé (SIG), sur cette question au sein de l’IFLA, question qu’il faut maintenant poser aux autres sections intéressées : Cataloguing, Classification and Indexing, et Knowledge Management. Nous avons aussi beaucoup discuté de la convergence des travaux au sein de l’IFLA avec ceux du LLD XG au W3C.

L’après-midi, je me suis immergée dans les questions de catalogage, avec la session de la conférence organisée par la section Catalogage, et la deuxième réunion du groupe ISBD/XML.
A la session, nous avons entendu parler entre autres de FRBRoo et d’identifiants, et de VIAF (de façon impromptue). Mes notes sont sur Twitter ;-)
Dans le groupe ISBD/XML, nous sommes entrés dans d’intéressantes questions de modélisation, incluant en particulier la difficile question de la représentation des « aggregated statements », et celle des référentiels. A nouveau, des discussions seront à lancer avec le LLD XG et elles promettent d’être intéressantes.

La soirée s’est terminée, en ce qui me concerne, à la réception OCLC, l’un des événements mondains les plus courus de l’IFLA. Il faut dire qu’on y mange très bien, qu’on y boit à volonté, que cela se passe généralement dans un lieu exceptionnel (en l’occurrence, le musée des beaux-arts de Göteborg), et que les gens d’OCLC sont toujours aimables, souriants, accueillants… Bref, un plaisir.

IFLA 2010 – c’est parti !

C’est ce matin que s’ouvre officiellement le 76e congrès international des bibliothèques, connu sous le petit nom de WLIC ou congrès de l’IFLA.

Nous sommes à Göteborg en Suède, et pour certains, l’IFLA a déjà commencé : il y a ceux qui font partie des entités officielles de l’IFLA (le Governing Board, les Divisions, et le comité professionnel) qui ont commencé leurs réunions lundi, ceux qui ont profité de l’IFLA pour organiser des réunions internationales sur autre chose, et ceux qui étaient à Stockholm ou dans les îles…

Je fais partie de la deuxième catégorie, puisque j’ai eu la chance d’assister lundi à une réunion sur VIAF, le projet de fichier d’autorité international virtuel. Il a été questions entre autres sujets de l’exposition des données de VIAF dans le linked data, et de l’avenir du projet.

Hier avaient lieu les réunions des « standing committee », les comités permanents des sections. Ils rassemblent les membres de chaque section (qui sont élus pour 3 ans) sous l’égide du président de section (« chair ») et du secrétaire. Les réunions des comités sont aussi ouvertes aux observateurs.
Pour ma part, je suis membre de la section « Information Technology » depuis l’année dernière, au sein de laquelle j’anime un petit sous-groupe qui s’intéresse aux questions de Web sémantique et Web de données. Un sujet qui reste à l’honneur cette année (à suivre) et pour les années à venir (à suivre encore plus).

Le soir se sont tenues les réunions par pays ou langues, dites « caucus » : évidemment j’ai assisté au caucus des francophones, une bonne occasion de retrouver les collègues français mais aussi canadiens, africains, etc.

Pour certains, le travail a commencé sur les chapeaux de roue : ainsi le groupe ISBD/XML qui se réunissait à 8h (oui, 8h !) ce matin. L’avenir appartient en effet à ceux qui se lèvent tôt, car ce groupe a également choisi comme principale orientation la recherche de la convergence avec les technologies du Web sémantique. Ils avaient décidé l’an dernier de « sauter » l’étape XML et de travailler sur l’expression de l’ISBD en RDF. Ces travaux se poursuivent actuellement.

La session d’ouverture du congrès, qui commence à l’heure où j’écris, est un moment très formel et officiel où nous sommes accueillis par le pays qui organise le congrès et la présidente de l’IFLA. Il ne faut pas oublier que le congrès de l’IFLA, c’est plus de 3000 personnes qui convergent vers la ville d’accueil : c’est énorme pour une petite ville comme Göteborg, qui (pour notre plaisir) organise aussi justement cette semaine un festival culturel. Cela fait aussi beaucoup de bibliothécaires dans les rues ;-)

Vous pouvez suivre l’actualité du congrès en temps réel sur Twitter, avec le tag #IFLA2010, et sur le site « interactif » (une nouveauté de l’IFLA cette année) http://2010.ifla.org.

IPRES 2009 (2) – les processus et l’Humain

Un deuxième thème récurrent de la conférence IPRES (après « la valeur et le temps ») c’est l’approche organisationnelle et humaine de la préservation numérique.

J’avoue que je suis arrivée à IPRES avec une attention particulière pour ce sujet, dans la mesure où je présentais moi-même un article, rédigé avec Louise Fauduet, sur les problématiques organisationnelles et humaines du numérique. Le programme m’avait laissé à penser que cet aspect serait peut traité mais en réalité, il était assez omniprésent. Ça prouve, semble-t-il, que « moving into the maintream » n’était pas seulement un vœu pieu pour le titre de la conférence, mais une réalité des actions menées par les uns et les autres.

La question des organisations a été en particulier traitée à travers celle des réseaux et de la constitution d’archives distribuées, et ce en particulier dans la présentation de Martha Anderson de la Library of Congress, et au cours du Panel qui a suivi.
Martha a présenté les résultats d’une étude réalisée par IBM pour le NDIIPP. Elle nous a montré différents modèles de réseaux d’organisations, avec un pilotage plus ou moins fort, et ce qu’ils impliquent en termes d’efforts et de coûts. Le panel portait sur la mise en place de Private LOCKSS Networks.
J’ai bien aimé la réflexion sur le passage à l’échelle de la collaboration. C’est un peu comme la commission européenne… quand on est peu nombreux on arrive à fonctionner de façon informelle, mais si on veut s’étendre et accueillir de nouveaux membres, il faut passer par une phase de formalisation des stratégies, de la politique, de la gouvernance, et aussi des méthodes d’accompagnement et de formation.
Les effets de seuil existent aussi bien sur le plan technique, quand on passe de quelques centaines de GigaOctets à plusieurs dizaines ou centaines de Téra, que sur le plan organisationnel et humain. Cela implique aussi la mise en place d’outils appropriés comme les « micro-services » de la California Digital Library ou le système proposé par Chronopolis.

L’analyse des processus et la mise en place d’outils comme des guides de bonnes pratiques pour fluidifier les processus jouent un rôle essentiel dans cette formalisation.

Il existe des initiatives telles que les travaux réalisés par le réseau allemand Nestor sur la négociation du versement (« Into the archive »), ou les résultats du projet européen Planets. Toutefois on peut se demander, et la question a été posée en ces termes, qui fait réellement de la planification de la préservation aujourd’hui… Les différentes enquêtes réalisées dans le cadre de projets européens (et je dis, différentes, à dessein car il y en a eu plusieurs, souvent apparemment redondantes…) montrent encore pas mal d’incertitudes sur les actions à prendre, les stratégies à adopter, les normes à recommander.

Le lendemain d’IPRES, j’ai assisté à la journée « Active solutions » organisée par le consortium IIPC pour l’archivage du Web, et je dois avouer que j’ai été impressionnée par le degré de maturité de cette communauté sur toutes ces questions.
Leur approche des questions techniques (comme le format WARC) est résolument pilotée par une vision de long terme qui intègre les problématiques de planification de la préservation dès le début de la chaîne. L’après-midi était consacré aux questions d’organisation et de processus.
Cette journée m’a donné à penser que les « web-archivistes », une fois qu’ils auront résolu leurs (enôôôrmes) problèmes techniques, auront tellement d’avance qu’ils seront capables d’absorber tous les problèmes de préservation numérique des bibliothèques, enfin d’en réduire l’onde de choc, un peu comme un gros air-bag. Plus que jamais, préserver la mémoire du Web m’est apparu non pas comme un défi un peu fou, mais comme une action organisée, qui a du sens dans la perspective de l’histoire et des collections.
Une grande bouffée d’espoir donc ;-)

IPRES 2009 (1) – La valeur et le Temps

La conférence IPRES 2009, dédiée à la conservation numérique, vient de se terminer. Elle était cette année accueillie par l’Université de Californie – San Francisco et organisée par la California Digital Library.

Je m’épate moi-même quand je vois la complétude avec laquelle j’avais couvert l’événement en 2006, à Cornell… Aujourd’hui, une bonne partie de mon énergie est passée sur Twitter, où la conférence était couverte en direct par plusieurs personnes (tag #ipres09). Pour ceux qui dorment la nuit, vous pouvez aussi consulter le blog de Chris Rusbridge, qui a couvert en temps réel une bonne partie des sessions, à raison d’un billet par présentation.

Pour ma part, je vais me contenter d’une synthèse assez générale.
IPRES est résolument devenu un événement incontournable pour les bibliothécaires qui gèrent des collections numériques. Cette année le thème « moving into the mainstream » laissait supposer une certaine maturité du sujet et des questionnements liés à la mise en production de la préservation numérique.

Je dois dire que j’ai été frappée par le fait qu’il existe dans la communauté un besoin assez fort de justifier l’intérêt et la valeur de l’activité, et d’articuler les temporalités de la préservation numérique – c’est-à-dire, le passé (ce qu’on essaye de conserver), le présent (ce qu’on sait qu’on voudrait conserver, ce qui est utile à nos utilisateurs actuels) et le futur (les attentes inconnues des futurs utilisateurs à l’égard d’une collection inconnue).
Démontrer la valeur est essentiel dans un contexte où la préoccupation concernant les coûts est omniprésente. Il s’agit donc d’évaluer les coûts et le retour sur investissement, et en particulier la « soutenabilité », donc pas seulement les coûts de départ, mais aussi les coûts continus qui sont nécessaires pour pérenniser l’activité une fois qu’elle a démarré.

La première « keynote » posait la question des archives privées des entreprises, et de leur intérêt public. Qu’advient-il des archives numériques d’une compagnie qui disparaît, et ce dans un monde où les compagnies tendent à disparaître de plus en plus vite ou fréquemment… L’exemple de Brobeck Closed Archive montre le type de « sauvetage » qu’on peut envisager si on intervient au moment où la société est mise en faillite.
Ensuite nous avons assisté à un panel sur les coûts et la soutenabilité, animé par des gens qui étaient impliqués dans le Blue Ribbon Task Force. Plusieurs d’entre eux ont argumenté sur le fait qu’il faut prouver la valeur de l’activité de préservation numérique au regard de l’accès et des utilisateurs actuels, pas futurs. Ainsi pour convaincre, il ne faut pas dire aux gens qu’on va les aider à préserver leur données, il faut leur dire qu’on va les aider à faire leur travail. Mais ce n’est pas évident pour tous les types de collections numériques (penser aux archives du Web…) : on ne peut pas toujours se baser sur la loi de l’offre et de la demande en supposant que ceux qui offrent (les gens qui préservent) et ceux qui demandent (les usagers) sont les mêmes, ou que les premiers connaissent effectivement les besoins des seconds. C’est un problème qu’on connaît bien en bibliothèque.

Les deux autres sessions plénières, l’une consacrée à l’archivage des mondes virtuels, l’autre aux données ouvertes de la recherche, posaient aussi la question de la valeur et du temps.
J’ai bien aimé ces deux présentations, car elles étaient très ancrées dans la réalité du Web d’aujourd’hui, posant la question de la construction de la mémoire du Web, non pas en termes de publications au sens traditionnel, mais en terme de processus, d’humain, et « d’histoire ».
Ainsi pour garder la mémoire des mondes virtuels comme second life, savoir reproduire le fonctionnement du logiciel n’est pas très utile. Ce qu’il faut, c’est être en mesure de conserver le « contexte »de ce qui se passe dans ces mondes, c’est à dire des traces de ce que les gens y vivent et de ce qu’ils en retiennent : des copies d’écran, des billets de blog, des films etc.
Mais au fait : on ne préserve pas le Monde lui-même, seulement des documents qui le décrivent… préserver les mondes virtuels m’a fait l’effet d’une utopie d’historien un peu folle.
En ce qui concerne les données de la recherche, on retombe sur l’enjeu de gérer dans la même temporalité l’ouverture des données et leur préservation. C’est le but du projet Data-pass. Il faut gérer dans un même « mouvement » l’ouverture des données, la confidentialité et les autres questions juridiques, et la problématique de réutilisation des données, le tout dans une perspective de pérenniser les données de la recherche. Quand on parle des « données », cela signifie, pas seulement à travers les vues limitées qu’on en a dans les publications (comme les articles) des chercheurs, mais aussi en rendant possible la réutilisation des données source et la création de nouvelles connaissances.

Finalement, toutes ces réflexions montraient un certain réalisme, parfois un peu désabusé, face à la préservation numérique. On voudrait bien pouvoir conserver tout, pour toujours, mais on n’en a pas les moyens, il va donc falloir choisir. On se pose aussi des questions sur ce que cela nous coûtera de ne pas faire de préservation numérique. Avec le numérique, le nouveau sens de « pour toujours » c’est « pour 10 ans ». Et il ne faut pas avoir honte de faire de la préservation très basique, au niveau du train de bits, car c’est déjà mieux que rien.
Dernière idée qui me semble importante à retenir sur ce thème : la valeur réside dans les contenus et dans l’humain, pas dans la technologie. C’est toujours utile de le rappeler.