SWIB12

J’ai eu la chance d’assister la semaine dernière à la quatrième édition de la conférence SWIB (pour Semantic Web in Bibliotheken). Renommée en « SWIL » (pour Semantic Web in Libraries) cette conférence à l’origine tout à fait allemande est devenue complètement internationale, c’est-à-dire que toutes les communications se font maintenant en anglais.

Vous pouvez retrouver en ligne les diapos et également les vidéos des interventions, dont la mienne qui était la « keynote » du 2e jour.

Globalement, cette conférence reste très technique et réunit principalement des acteurs du web sémantique en bibliothèque qui ont véritablement les mains dans le cambouis ; mais on trouvait dans le public et même parmi les intervenants des « vrais » bibliothécaires qui ne sont pas des développeurs (dont moi !) La conférence a d’ailleurs commencé par une première demi-journée de tutoriels.

Fait intéressant, les bibliothèques semblent avoir maintenant dépassé le stade des questionnements de base sur l’intérêt de la chose, la publication des données bibliographiques étant devenue un fait pratiquement naturel. La plupart des interventions allaient donc au-delà, abordant par exemple l’élargissement de l’ouverture des données de bibliothèques à d’autres types de données comme les données de circulation, d’exemplaire, ou encore les jeux de données de la recherche. Les questionnements pratiques vont aussi au-delà, abordant des problématiques comme la provenance et la confiance, la gestion des alignements, ou encore la mise à jour des flux de données.

A suivre l’année prochaine à Hambourg !

IFLA 2012 (suite) – Quelques questions existentielles sur le Linked Data

Pour clore cette série de billets sur mon voyage à l’IFLA, je voulais revenir sur quelques idées fortes qui se sont avérées récurrentes quand il a été question de Web sémantique et de Linked Data.

Le premier point portait sur les licences et de l’open data. Ce sujet avait été inscrit à l’agenda de la session des bibliothèques nationales, et il a surgi également lors de nos deux événements sur le Web sémantique (la table ronde OCLC et la session du SWSIG). On commence à voir les « gros » se poser réellement la question pour une partie de leurs données de l’ouverture complète, sans la moindre contrainte, façon CC0 : la British Library, la Deutsche Nationalbibliothek, la BnF. De même, OCLC a récemment ouvert les données de WorldCat en Schema.org sous licence ouverte. Les données sont fournies dans les pages en RDFa, mais on peut aussi télécharger un « dump » (gros fichier avec plein de données dedans) partiel contenant 1,2 millions de ressources. Ce choix de licence montre qu’OCLC reste attaché au principe de la citation de la source, allant jusqu’à fournir des guidelines sur la meilleure façon de citer ses sources s’agissant de données. Je trouve ce document très intéressant en ceci qu’il aborde les différents cas possibles, depuis l’attribution sous la forme d’une mention globale (genre, « ce site/service/article utilise des données de Worldcat sous licence ODC-by ») jusqu’au simple fait d’utiliser les URIs de WorldCat dans le jeu de données, qui est considéré comme une forme d’attribution en soi ! L’intermédiaire entre les deux consiste à ajouter dans la description de son dataset un triplet avec un « DC:source » vers WorldCat. On pourra lire avec grand bénéfice quelques commentaires sur la stratégie d’OCLC sur le blog CC. Bien que je sois globalement d’accord, je les trouve un peu sévères sur les guidelines et la question de leur applicabilité dans le contexte du Linked Data. Il me semble au contraire que le fait de considérer la simple utilisation des URI comme une forme d’attribution contribue à intégrer juridiquement le principe qui est au cœur du Linked Data (« follow your nose », naviguer dans les données en suivant les liens). Et justement, cela fait plusieurs années qu’on proclame, nous les Linked Data évangélistes, que vos données – même réutilisées – ramèneront toujours de la valeur et de la visibilité à votre institution ne serait-ce qu’à travers les URI. C’est donc réconfortant de lire cela dans les guidelines d’OCLC… Sans vouloir m’étendre davantage sur OCLC, je trouve pour finir que ces quelques pas qu’ils font en direction du Linked Open Data sont significatifs d’une tendance beaucoup plus importante : le modèle économique de la vente des données, c’est fini. Et tous les acteurs qui reposaient là-dessus uniquement vont devoir se creuser la cervelle pour trouver autre chose. Quant à ceux, comme les bibliothèques nationales, qui y voyaient un sympathique à-côté fournissant quelques petits revenus quand même, ils vont pouvoir libérer leurs données avec la conscience tout à fait tranquille… bonne nouvelle non ? (A lire absolument pour se détendre sur le sujet : pourquoi les bibliothèques ne sont pas en open data, par Mace Ojala sur Cyc4libs.) Une fois les données ouvertes, c’est bien joli mais on aimerait bien pouvoir savoir qui va les utiliser et comment. Et là c’est le trou noir, le black out. Les données libérées sont désespérément muettes quant à leur usage, tout au plus dispose-t-on de logs sur un serveur qui semblent témoigner d’une activité, mais laquelle… Or la communauté ayant maintenant bien intégré l’idée que nous ne pouvons pas aller plus loin sans démontrer la valeur ajoutée de l’open/linked data en termes de réutilisations, cette question est devenue cruciale. C’était d’ailleurs le sujet de ma keynote à DC2011. A l’époque c’était presque révolutionnaire, et j’avais lancé ce slogan : « we need to stop citing the BBC », parce qu’il me semblait impensable que nous puissions tenir encore plusieurs années sans avoir un autre exemple digne de ce nom à présenter. Quand je dis « digne de ce nom », ce n’est pas que les autres applications sont indignes, mais je voulais parler d’exemples démontrant l’usage des données du Linked Data en production, et pas seulement de manière expérimentale, cet usage étant assorti d’une vraie réflexion et d’un discours sur ce que cela apporte à l’institution. Quand on discute avec les collègues de la BBC (on peut aussi lire leur use case sur le site du W3C) ils expliquent que l’approche Linked Data est complètement intégrée à la conception de leur système d’information, dont une partie est considérée comme « externalisée » sur le Web (en gros, ils corrigent les notices de Wikipédia au lieu d’éditorialiser leur propre site) et dont la clef de voûte réside dans l’attribution des URI qui permettent d’unifier le système. En fait, ils ont eu avant la lettre cette vision du Linked Enterprise Data (minute copinage : vous trouverez une très bonne explication du LED en français ici), c’est-à-dire l’utilisation des principes et des technologies du Linked Data à l’intérieur du système d’information pour unifier les données entre les différentes applications. C’est d’ailleurs cet aspect que j’ai choisi d’approfondir quand j’ai présenté le Centre Pompidou virtuel pendant la table ronde OCLC (comme quoi je ne raconte pas toujours la même chose !) J’ai comparé le principe à celui d’un intranet, qui utilise les technologies du Web mais au bénéfice interne de l’institution, sans parler de publication. Eh bien là c’est la même chose, une première étape où on fait en quelque sorte du Linked Data en interne – avant, je l’espère, d’envisager d’ouvrir les données. Ainsi, le premier argument pour convaincre une institution de faire du Linked Data pourrait être la perspective d’améliorer les processus internes. Mais si on parle d’open data, il faut aussi être capable de démontrer la valeur ajoutée de l’ouverture, en terme de réutilisation. Martin Malmsten suggérait de partir d’un principe simple : contribuez ce qui est unique chez vous, et bénéficiez de l’ensemble. A mon avis, il reste cependant nécessaire de démontrer *comment* on bénéficie de l’ensemble, et pour cela il nous faut connaître les utilisateurs du service et les cas d’usage. D’où la question : comment faire pour connaître les utilisateurs de nos données ouvertes ? On a failli repartir tous avec des tee-shirts « if you build it, they will come ; if you break it, they will complain » (l’idée étant de casser le service pour que les utilisateurs se manifestent ;-) Mais plus sérieusement, l’approche proposée par Neil Wilson (BL) m’a semblé très sensée : c’est à nous de construire la communauté, en contribuant éventuellement dans un premier temps à la mise en place de services tiers, pour montrer l’exemple. Enfin, le troisième défi souligné par mes camarades de la British Library et de la bibliothèque royale de Suède est celui de la mise à jour des données. Il est aussi lié au point précédent, en ceci qu’on constate que les consommateurs actuels de Linked Data ont tendance à faire porter leur préférence sur un dump plutôt que d’utiliser les données liées en temps réel, pour diverses raisons notamment techniques sur lesquelles je ne vais pas m’étendre ici. Au temps pour le graphe global : ce qu’on utilise aujourd’hui en réalité, c’est bien souvent une photographie des données à un instant T, et suivant la fréquence de mise à jour du dump source et de l’application cliente, la fraîcheur du service est inégale. Du coup, côté OCLC et Libris, on privilégie une approche où la version RDF de chaque notice fait partie intégrante du service, dans un esprit très Linked Data. Ils voudraient inciter leurs utilisateurs à utiliser directement ces données plutôt que des dumps qui vont se périmer très vite. Côté British Library et BnF, on rafraîchit tous les mois, et on voudrait passer à un rythme hebdomadaire. Et moi, je suis bien placée pour savoir que rafraîchir quotidiennement est un défi, mais que dans certains cas c’est aussi une nécessité. Donc, on voudrait que notre Linked Data soit plus intégré aux processus de production des données, et pas seulement en bout de chaîne (cf. ce que je disais plus haut sur le LED). On voudrait des applications qui « suivent leur flair » (follow your nose, donc) en temps réel au lieu d’avaler des gros fichiers une fois de temps en temps. Et enfin, on voudrait un processus de notification qui permette aux consommateurs de données de savoir quand un dataset ou une ressource a été mis à jour (c’est là que Martin s’est mis à parler d’Atom et de PubSubHubbub, le protocole au nom marrant). Cette problématique renvoie à la question de la provenance, sur laquelle travaille le DCMI, en lien avec le W3C qui avait fait un groupe d’incubation sur le sujet. Mais ce n’est pas tout ; dans le Linked Data on exprime les triplets sous la forme d’un document, un fichier qui contient les données sous une forme RDF/XML ou autre. La question est donc de savoir comment utiliser ce document pour transmettre aussi des informations de notifications concernant les mises à jour. Mince, je m’étais dit que j’allais faire un petit billet pas trop long et voilà le résultat… En tout cas, nous allons aborder tous ces sujets, Got et moi, dans notre présentation au séminaire INRIA en octobre. Pour ceux qui n’ont pas pu s’inscrire, les actes seront publiés, en français dans le texte. Ces questions seront également au cœur de la présentation que je vais faire en keynote de la 2e journée de la conférence SWIB 2012, à Cologne, le 27 et 28 novembre prochains (je me permets de l’annoncer en avant-première, le programme devrait être publié très prochainement). Alors venez nombreux ! Commentaires bienvenus par mail, sur Twitter @figoblog et sur Facebook pour ceux qui y sont.

IFLA 2012 et le Web sémantique

Comme vous le savez, je suis gravement monomaniaque et la seule chose qui m’intéresse à l’IFLA c’est les communications qui portent sur le Web sémantique, le Linked Data ou autre chose du même genre. Heureusement il y en a plein. Voici un petit raccourci à travers les papiers à lire sur le sujet (sans garantie de leur qualité ou de leur contenu, je n’ai pas encore eu le temps de tout regarder ni même d’assister aux présentations…).

Dimanche, au sein de la session sur les moments inspirés du catalogage, il y a eu la présentation du projet Pode et de problématiques liées aux données de data.bnf.fr.

Lundi dans la session Unimarc, une présentation intitulée « Linked data for libraries » par des gens de l’université de Portsmouth. Dans la même session il y a eu aussi une courte présentation du Bibliographic Framework Initiative par la Library of Congress, mais il n’y a pas de document en ligne et je tiens de Sally Mc Callum elle-même que tout est sur le site web.

Pas dans le programme officiel mais intéressant tout de même, il y avait aussi lundi une table ronde organisée par OCLC, à laquelle j’ai participé, sur le Linked Data. Vous pouvez retrouver les présentations ici.

Mardi la session de la section Classification & Indexing, bien sûr un des lieux importants pour parler Web sémantique à l’IFLA. On peut y découvrir les très intéressants projets de recherche menés par différentes équipes finlandaises dans le domaine du Web sémantique appliqué aux technologies de bibliothèque.

Mercredi il y avait la sessions sur l’open data dans les bibliothèques nationales que l’IFLA avait eu la bonne idée de programmer pile en même temps que celle du Semantic Web SIG (on peut pas leur en vouloir, c’est toujours comme ça, il y a plein de choses en parallèle… mais quand même c’était rageant). Même si les aspects techniques n’étaient pas au cœur de cette session, au moins 3 des 4 interventions (bibliothèques nationales allemande, française et écossaise) évoquent le Linked Data même si ce n’est pas forcément au cœur du sujet.

Toujours mercredi donc la session de mon groupe, le SWSIG. Il n’y a presque rien dans le programme mais j’ai posté des choses sur le site du groupe et j’y mettrai bientôt les diapos de la session. J’ai aussi créé un hashtag sur twitter, #SWSIG, que je vous encourage à utiliser toute l’année pour me signaler des sujets d’intérêt pour le groupe.

Jeudi c’est peut-être un peu plus épisodique, mais lors de la session du tout nouveau IFLA Committee on Standards, il a été question à plusieurs reprises du IFLA Namespaces task group.
Un mot sur ce groupe qui n’a pas d’existence suffisamment officielle à l’IFLA (c’est un groupe de travail rattaché pour l’instant à la section Classification) pour apparaître dans le programme. Il s’est réuni lundi matin, et son objectif est d’accompagner les groupes qui publient des standards de l’IFLA pour le Web sémantique (notamment les versions des FRBR et autres FR** et de l’ISBD qui sont disponibles dans l’Open metadata registry). En ce moment ce groupe travaille notamment sur des guidelines pour la traduction des labels en différentes langues. L’articulation de ce groupe qui est en fait très transverse à plusieurs sections avec l’IFLA Committee on Standards est aussi un sujet brûlant. En tout cas je note que ce groupe suscite un intérêt croissant. On n’était que quelques pelés autour d’une table en 2009. Cette année, il y avait plus de 30 personnes à la réunion du groupe (dont 2/3 d’observateurs).
On retrouve toutes les infos sur l’IFLA Committee on Standards ici.

Dans la session Libraries for the Law on retrouve une intervention de la bibliothèque du Congrès du Chili dont nous avons eu un résumé pendant le SWSIG.

Et enfin, c’est la session des bibliographies nationales où on retrouve les français et les allemands qui visiblement ont bloqué sur les data :-)

Il est à noter que grâce au gros boulot fait par l’AIFBD et les volontaires, la plupart de ces communications ont été traduites en français. Ceux que ça intéresse peuvent encore candidater pour les rares qui ne l’ont pas été !

Sinon j’en ai peut-être loupé quelques-unes dont le titre n’était pas suffisamment explicite pour que je détecte le Linked Data dedans. N’hésitez pas à me les signaler sur Twitter ou par mail (j’ai fermé les commentaires du blog à cause du spam, c’était intolérable) et je les rajouterai.

IFLA 2012 – Comment rédiger un top tweet

Comme vous le savez, plus les réseaux sociaux sont sociaux, plus ils deviennent un outil de marketing destiné en fait à vous vendre quelque chose – fut-ce la popularité individuelle de leurs utilisateurs. Dans ce monde de biblio-geeks qu’est l’IFLA, où la moitié de la population se déplace en permanence avec un œil rivé à son smartphone, son iPad, son mini-PC ou son portable, Twitter est un véritable canal d’information à part entière, en parallèle de la conférence mais aussi de sa sociabilité, sur lequel les gens échangent des informations, des blagues, des astuces, des photos, et bien d’autres choses.

Moi qui suis grande débutante dans le domaine du community management (mais je suis à bonne école ;-) j’étais toute fière hier de voir que le réseau social fétiche des conférenciers poussait obstinément en haut de liste, sur le hashtag #WLIC2012, une de mes créations. J’avais rédigé *le* top tweet.

(Pour les débutants, le hashtag c’est un peu comme une vedette matière, mais en moins long.)

Donc voici ma recette infaillible pour rédiger un top tweet.

1) Il ne faut surtout pas louper les temps de sociabilité IRL (ça veut dire « in real life », par opposition à ce qui se passe sur le réseau et qui, comme chacun sait, n’est ni réel ni vivant) qui donnent d’infinies possibilités de trouver de bonnes idées de top tweet. Par exemple, samedi soir, je me suis rendue au caucus francophone, rassemblement qui n’a pas vraiment d’autre utilité que d’en être un, puis au « moment de convivialité » offert par la ville de Lyon pour célébrer sa candidature pour le congrès de 2014 (nous serions tellement heureux si Lyon était choisie, tout ça.) C’est là que j’ai rencontré Jean-Christophe, que je remercie au passage pour l’opportunité de ce top tweet.

2) Votre top tweet doit toucher à ce que les gens ont de plus viscéral, afin que tout le monde se sente concerné. Par exemple la nourriture, ou l’accès internet, qui sont les deux seules choses sans lesquelles un bibliothécaire ne peut survivre à l’IFLA. Il sera prêt à faire la queue pendant des heures pour obtenir la première, surtout si elle est gratuite. Et il sera infiniment reconnaissant à celui qui lui fournit le second, surtout si c’est gratuit. Pour autant, une fois qu’on a récupéré les codes d’accès, fait-on vraiment attention à l’identité de ce bienfaiteur omniprésent ? Visiblement non puisqu’il m’avait fallu cette rencontre IRL pour réaliser que notre fournisseur d’accès wifi cette année était français, ouvert et éditeur numérique. Trois qualités éminemment twittables.

3) Une fois que vous avez trouvé un bon sujet pour votre top tweet, la forme a aussi son importance, afin que les gens retwittent directement votre tweet au lieu de diffuser la même information en la rédigeant à leur propre sauce (vous ne pourriez même pas les attaquer pour contrefaçon, en moins de 140 caractères c’est trop compliqué). Votre tweet doit être rédigé de telle façon que les gens le reprennent tel quel. Il doit être parfait. Pour cela :
– rédigez votre tweet dans la langue la plus couramment parlée à l’IFLA (désolée pour mes amis francophones)
– interpelez directement votre lecteur en commençant par une accroche du type « le saviez-vous ? »
– utilisez des abréviations, mais pas trop, pour faire juste un peu geek mais pas adolescent boutonneux, et surtout pour garder votre tweet en-dessous de 130 caractères. Vous allez me dire oui mais Twitter autorise 140 caractères ? Visez 130, quand les gens vous retwittent ils doivent aussi ajouter votre pseudo twitter, il faut leur laisser la place…
– votre tweet doit contenir rien que l’info utile et toute l’info utile (liens, etc.) Chaque mot compte.

4) Votre tweet est prêt, vous n’avez plus qu’à ouvrir la cage et le laisser s’envoler. Pour cela, choisissez un moment clé, par exemple tôt le matin, quand vous arrivez frais et pimpant le premier au Centre des Congrès pour assister aux improbables réunions administratives qui précèdent la cérémonie d’ouverture. Ainsi votre tweet aura toute la journée devant lui pour grandir, grossir, se répandre et devenir top.

5) Dernier conseil : vous ne savez jamais lequel de vos tweets va effectivement devenir un top tweet. Alors tweetez abondamment !

Mais au fait, à quoi ça sert de rédiger un top tweet ? Eh bien, à force d’être repris, favorité (quelques néologismes ne tuent pas s’agissant de technologies) et retwitté, votre tweet va se retrouver épinglé pendant quelques heures tout en haut de la liste « top » de votre conférence, faisant fi du temps qui passe, ce qui n’est pas rien sur les réseaux sociaux. Par la loi bien connue de la valeur, plus il sera retwitté, plus il sera visible, et donc plus il sera retwitté, entrant ainsi dans un cercle vertueux. Outre que votre égo démesuré s’en trouvera flatté, vous deviendrez pour une journée l’un des blogueurs visibles de la conférence, et ceux qui n’avaient aucune idée que vous existiez vous découvriront (appréciable quand on se trouve dans une conférence de 4000 personnes. Eh oui on ne peut pas discuter avec tout le monde IRL.) Évidemment, si en plus vous avez dit un truc intelligent, ce truc sera entendu par un maximum de gens, ce qui est appréciable aussi.

Mais bon, moi j’espère surtout que les collègues de Open Edition me paieront un pot sur leur stand ;-)

IFLA 2012 – plongée dans l’organisation

Cela fait maintenant 4 ans que je participe à l’IFLA, et sans oser me comparer aux routard(e)s qui ont fait Moscou, Pékin et Durban, je dois dire que cette année je commence à savourer la familiarité des rituels qui se répètent : réunions des comités permanents, caucus des francophones, cérémonie d’ouverture… L’IFLA c’est un peu comme de se retrouver une semaine par an chez soi partout dans le monde. Bref, je vous renvoie à Göteborg pour une explication des premières étapes du congrès et des rouages de l’IFLA.

Je pense qu’il y a trois catégories de gens qui apprécient l’IFLA : les hypersociaux qui savourent le bain de foule, les travailleurs qui élaborent courageusement des normes en suant 20h par jour dans des salles sans fenêtre pendant une semaine, et les gens qui éprouvent une fascination morbide pour le développement endémique de l’organisation en soi.
Vous l’aurez compris, je fais partie de la troisième catégorie. La première année à Milan, j’avais été très déçue de découvrir que la « Newcomer session », session des nouveaux, relevait davantage d’un événement social destiné à propager le mantra de l’IFLA comme lieu de bonheur que d’un endroit où l’on découvrait les rouages de cette incroyable institution internationale. À force de creuser, à Göteborg j’avais commencé à comprendre comment la machine fonctionnait.

Puis j’ai trouvé mes semblables : on les appelle « IFLA officers », et sans eux rien ne pourrait fonctionner. Ils ont accepté la responsabilité d’être élus président, secrétaire ou chargé de communication d’une section. Ils assistent à des sessions où il est question de budget, de rédaction de plans stratégiques et d’élections. Ils connaissent les membres du Governing Board et du Professional Committee par leur nom et savent même à quoi servent ces organes. Ils remplissent des formulaires dans les temps tout au long de l’année pour que le congrès puisse avoir lieu.

Mon statut de « convenor » du groupe d’intérêt spécialisé Semantic Web (SWSIG) m’a permis de me joindre aux officiers de l’IFLA pour le Leadership Brief et le Division Leadership forum de la division III (Library services) et de plonger plus avant dans les méandres de cette passionnante institution. Pour ceux qui comme moi aiment savoir comment ça marche, et pas seulement profiter du résultat, les deux sessions de formation des officiers (« officiers training session » – mardi à 13:45 et mercredi à 11h45) sont ouvertes aux curieux et aux vocations.

Un an en un billet

Ah ah, vous pensiez que le Figoblog était mort. Vous m’avez croisée lors d’une conférence et entendu parler de « feu mon blog ». Vous pensiez que le seul moyen d’être encore au courant de mes faits et gestes était de vous abonner à mon compte twitter. Mais non ! Je m’étais donné un an pour déclarer pour de bon sa mort clinique, et le voici qui sursaute, à l’approche de l’IFLA. Bon sang un an déjà, et ce n’est pas comme s’il ne s’était rien passé. Je vous propose de revivre cette année en accéléré en un billet…

17 août 2011. Lors du congrès de l’IFLA à San Juan, Puerto Rico, se réunit pour la première fois le nouveau groupe d’intérêt de l’IFLA sur le Web sémantique (SWSIG). Une centaine de personnes ont assisté à ce qui fut l’acte de naissance de ce groupe (sa fondation ayant été ratifiée officiellement par l’IFLA quelques mois plus tard, ce qui lui a permis d’être doté d’une page web bien à lui). Au programme de cette réunion, une présentation du rapport final du LLD XG (voir ci-dessous), un rapport d’avancement sur les activités de normalisation de l’IFLA dans le domaine, et une série de courtes présentations montée quasiment au débotté avec les personnes présentes (voir les diapos en ligne). Ce fut une session très réussie.

18 août 2011. D’ailleurs il ne faut pas croire que je me suis arrêtée de bloguer, lors de ce congrès de l’IFLA 2011. Simplement je l’ai fait sur un autre blog, celui du CFI.

8 septembre 2011. Dans le cadre du « meetup web sémantique », rencontre dans la salle Piazza du Centre Pompidou sur le thème « Patrimoine et Web de données » à l’occasion duquel j’ai pu parler du projet qui a occupé mes jours, mes nuits, mes week-ends depuis un an (comment ça j’exagère ??) à savoir le Centre Pompidou virtuel. Plus d’infos à ce sujet un peu plus loin. En tout cas grâce à l’IRI et à son polemic tweet, vous pouvez revivre ce moment en vidéo ici.

21 septembre 2011. Je suis à La Haye pour la conférence DC2011. Le vendredi, dans une mémorable keynote (ben oui je suis contente, c’était ma première !) j’ai parlé de ratatouille, mis le feu à la BBC et raconté des contes pour enfants à un auditoire mal réveillé mais ravi.

12 octobre 2011. Je suis à la foire du livre de Francfort, cette fois pour présenter le Centre Pompidou virtuel à l’association internationale des éditeurs de musées. Un événement qui ne semble pas avoir laissé de traces en ligne.

25 octobre 2011. Publication officielle du rapport final du Library Linked Data Incubator Group du W3C (plus connu sous le petit nom de « LLD XG ») : enfin le terme d’une année de travail très intense !
Le rapport se compose en fait de 3 documents :
– le rapport final ;
– une première annexe qui liste les vocabulaires et données déjà disponibles ;
– une seconde annexe qui reprend et synthétise les cas d’utilisation réunis par le groupe pour élaborer son rapport.
Le rapport final est en cours de traduction en français.

29-30 novembre 2011. J’ai failli aller à Hambourg pour assister à SWIB mais en fait non. Consolation en vidéo ici : 29/11 et 30/11.

8 décembre 2011. L’ADBS et l’EBD organisent une journée d’étude intitulée « L’accès à l’information dans tous ses états ». Devinez ce que j’y présente… oui, le Centre Pompidou Virtuel (eh toi là au fond qui bâille ! je t’ai vu !)

14 décembre 2011. J’ai failli aller à Madrid pour participer à une rencontre sur le Linked Data organisée par la Bibliothèque nationale d’Espagne pour présenter son projet datos.bne.es mais je suis retenue à Paris par d’autres obligations. On trouve le compte-rendu de cette rencontre narrée sur le blog Open bibliography and Open Bibliographic Data.

13 janvier 2012. Un petit saut à l’INHA pour la journée d’étude « Signes et balises : L’édition numérique en histoire de l’art, réalisations, projets, enjeux ». C’est marrant comme ce genre d’événements ne laissent pas de traces en ligne.

13 mars 2012. L’hiver a été long, mais pas improductif : on a pu assister à plusieurs des intéressantes conférences des séminaires de l’IRI : celui sur l’éditorialisation, et celui sur la muséographie. Et voici que j’y suis invitée pour présenter…. devinez quoi… (j’espère que vous aimez le comique de répétition). En vidéo ici (je vous laisse chercher pour retrouver les autres vidéos !)

19-20 avril 2012. Je suis invitée à Aix pour deux passionnantes journées sur le thème de l’Open Data culturel, organisée par l’AGCCPF-PACA (inutile d’essayer de m’extorquer la résolution du sigle). Ah, Aix-en-Provence, sa météo clémente, le charme de ses rues médiévales… (je préfère ne pas dire de quoi je parlais ;-) Yannick Vernet explique en détail sa démarche sur le c-blog.

2 mai 2012. Je participe à la conférence SemWeb.pro où je répète infatigablement la même chose. Mais cette fois devant un parterre de geeks, ça change. Et puis ça contribue à la présence d’une représentation féminine au sein des intervenants, il y en a besoin.

4 mai 2012. OCLC annonce la mise à disposition public de VIAF sous licence ouverte. Le fichier peut être téléchargé en RDF ou dans d’autres formats moins connus comme MARC21, depuis l’adresse http://viaf.org/viaf/data/. Les biblio-geeks font des bonds.

22 mai 2012. Il y aura une vie après MARC21. En tout cas, la Library of Congress y travaille… avec Zepheira, elle élabore un modèle qui devrait permettre de lancer la grande discussion que nous attendons tous sur la transition des formats MARC vers le Web de données.

20 juin 2012. Worldcat est publié en Linked Data. Ah en fait non, ils ont juste mis du Schema.org dans les pages. Déjà pas mal, vous me direz. Plus d’info chez Richard Wallis, célèbre évangéliste du biblio-web-sémantique qui a quitté Talis pour rejoindre OCLC en avril.

21 juin 2012. Invitée à ouvrir la 2e journée du colloque « Patrimoine et humanités numériques » organisé par Paris 8, je fais preuve d’un incroyable sursaut d’originalité et décide de parler de réintermédiation numérique par les données. Pour ceux que ça intrigue, j’ai écrit un beau texte qui devrait être mis en ligne quelque part (patience…)

29 juin 2012. Retour à la BnF le temps d’une journée : la fameuse journée annuelle BnF/Afnor qui s’intéresse cette année au livre numérique. Je modère une table ronde sur les métadonnées. Tout est révélé ici.

En juillet, j’ai pris quelques vacances (en partie consacrées à la rédaction de mon intervention pour le séminaire INRIA du mois d’octobre sur le Web sémantique) avant de repartir pour une nouvelle année sur les chapeaux de roue. Toutes mes excuses à tous les gens qui m’ont invitée quelque part et à qui j’ai dit non parce que j’étais déjà trop occupée. Vous voyez que je n’ai pas menti. Pour un commentaire en temps réel des événements à venir, rendez-vous sur twitter

En direct de l’IFLA

Il faut que je songe a remplir mes devoir de blogueuse IFLA (fonction attestée par le ruban bleu que je porte sur mon badge) et ne pas céder à la facilité en me contentant de réflexions en moins de 140 caractères…

Le congrès a commencé comme à son habitude intensément, avec les réunions des comités permanents samedi matin, le caucus des francophones samedi soir, la session d’ouverture et les premières sessions thématiques dès dimanche. Pas de week-end pour les congressistes ! (pas de jour ferié non plus, cela va sans dire).

Le programme est très intéressant cette année et on regrette de ne pas pouvoir se dédoubler pour assister à plusieurs sessions à la fois. Heureusement, grâce au fil Twitter #wlic2011 qui est assez bien alimenté, on peut avoir une idée de ce que se passe dans les autres salles.

Ainsi le Web sémantique est à l’honneur et il a été abordé hier dans deux sessions qui se déroulaient en parallèle : la session des bibliothèques d’art, avec une présentation sur VIAF et celle de la section de Catalogage avec le projet polymath, un projet sur les autorités en Linked Data dont j’avais entendu parler parce qu’ils ont présenté un use case au LLD XG. Dans cette 2e, il semblerait que la question de l’avenir de MARC (ou son absence en l’occurrence ;-) ait été évoquée. Elle le sera encore dans d’autres sessions.

En parallèle encore, le FAIFE (Committee on Freedom of Access to Information and Freedom of Expression) organisait une session intitulée « how to fix the world », oui, rien que ça ! ou il a été question (d’après le flux Twitter) notamment des émeutes en Egypte et des libertés individuelles.

Ce matin, après avoir écouté la session plénière ou il était question de propriété intellectuelle, je me suis rendue a la réunion du Namespace task group. Ce groupe, pour l’instant plus ou moins informel, réunit plusieurs sections et groupes de l’IFLA pour coordonner la publication des standards bibliographiques sous forme de vocabulaires RDF.
Cela faisait longtemps que le groupe ne s’était pas réuni (je me demande même si ce n’était pas la première fois… On avait surtout travaillé par mail par le passé) et c’était tout à fait passionnant. Parmi les sujets abordés, nous avons évoqué le problème de la traduction des labels dans des langues autres que l’anglais, les liens entre vocabulaires, le dédoublonnage des notices…
Les activités de ce groupe seront liées à celle du groupe d’intérêt spécialisé sur le Web sémantique, le SWSIG, que je réunis mercredi matin à 9:30 (si des congressistes me lisent : surtout n’hésitez pas à y assister, même par simple curiosité !)

A suivre…

Ma valise pour l’IFLA

Bon alors… départ pour l’IFLA la semaine prochaine… qu’est-ce que je vais mettre dans ma valise ?

1, Mon article sur Convergence et interopérabilité : l’apport du Web de données pour la session de la la section Classification et Indexation. Que j’ai écrit en français, pour une fois… Faudrait peut-être que je fournisse la traduction, d’ailleurs, oups, ne serais-je pas un peu en retard ?
Tiens, en tout cas, il va y avoir des choses intéressantes dans cette session : comment skosifier votre bibliothèque, un service japonais pour le Web sémantique, et l’indexation par le Web à la Bibliothèque du Congrès.

2. Le rapport final du LLD XG, dont nous allons présenter les résultats lors de la première réunion du nouveau groupe « Web sémantique et bibliothèques » que j’anime.
Le rapport en question n’est pas tout à fait fini, on y travaille encore… Et d’ailleurs ce n’est pas tout ! Il y a deux livrables complémentaires : l’un qui liste les données et vocabulaires disponibles, l’autre qui synthétise notre collecte de use cases.

3. Le texte fondateur du groupe d’intérêt spécialisé que j’évoquais plus haut, le SW SIG. C’est qu’il va falloir réfléchir à ce qu’on va faire dans ce groupe pendant les deux ou trois ans à venir… Ce sera le but de la réunion du groupe : une réunion ouverte, à laquelle tout le monde peut venir.

4. Les documents des autres groupes auxquels je participe :
– le comité permanent de la section Information Technology,
– le Namespaces task group qui travaille sur la publication des vocabulaires de l’IFLA (dont la FRBR family),
– l’ISBD XML group qui (comme son nom ne l’indique pas) finalise en ce moment une version de l’ISBD en RDF, version qui a déjà été utilisée par la British Library dans la version Linked Data de leur bibliographie nationale, publiée récemment.

5. Le programme de toutes les intéressantes sessions de la conférence auxquelles je vais pouvoir assister : sur le dépôt légal numérique, la formation pour la gestion des collections numériques, etc.

6. Mon ordinateur portable. Mon blog. Mon Facebook. Mon Twitter, avec le hashtag #wlic2011.

7. Mon maillot de bain :-) quand même…

Sem Web Pro

Ces deux derniers jours, j’ai participé à la conférence Semweb.Pro. L’objectif de cette première édition était, je crois, de montrer qu’il existe une communauté professionnelle et des applications industrielles pour le Web sémantique en France. Et l’objectif a, je crois, été atteint !

Environ 130 personnes étaient présentes entre les deux journées : la conférence proprement dite le 1er jour, et les tutoriels le 2e jour. Quelques impressions à chaud…

J’ai beaucoup apprécié l’ouverture d’Ivan Herman, qui a fait le point sur les travaux en cours dans le domaine du Web sémantique au W3C, de la nouvelle version de SPARQL aux travaux qui vont démarrer sur « RDF next steps », en passant par les évolutions de RDFa. Bon c’est vrai, dès le matin à 9h, les requêtes SPARQL direct c’était un peu sévère ;-) mais au moins ça annonçait la couleur.

Ensuite, nous avons assisté à 4 présentations de produits qui permettent de publier des données en RDF : EMFtriple, CubicWeb, Semsoft et Asterid. Personnellement, cette partie de la conférence m’a moins emballée, mais je pense que c’est juste parce que ça ne correspondait pas à mes centres d’intérêt à ce moment-là.

L’après-midi la parole était aux producteurs, avec une table ronde sur l’ouverture des données publiques (à laquelle j’ai participé), et la présentation de la BBC (j’adore toujours autant leurs réalisations, c’est vraiment excellent).
Enfin quelques réalisations intéressantes : SemWebVid pour annoter des vidéos automatiquement, les explications d’Antidot sur l’utilisation des technos du Web sémantique dans un moteur de recherche, et Datao pour les interfaces graphiques.
Ça s’est terminé avec des « lightning talks » auxquels je n’ai malheureusement pas pu assister.

Deuxième jour, les tutoriels : c’était dur, il fallait choisir ;-) mais je dois dire que tous ceux auxquels j’ai assisté étaient de grande qualité. Grâce à Got je n’ai plus peur de RDFa… et je salue tout particulièrement le travail de l’équipe Datalift, je pense que leurs diapos feront date dans le monde du Web de données français.

Pour finir, je tire mon chapeau aux organisateurs de la conférence pour la logistique, les salles, le café, les croissants, le wifi, le fil twitter, le déjeuner au self du coin, tout ! Et ce qui était surtout agréable c’était de voir réunie toute la communauté et de partager ces deux jours avec tout plein de gens passionnants. J’espère qu’on remettra ça l’année prochaine !

IFLA 2010 – Suite et fin

Les deux dernières journées de l’IFLA, samedi et dimanche, ont été riches en ce qui me concerne, car le dimanche matin se déroulait la session « Libraries and the semantic Web », que j’ai contribué à organiser, et l’après-midi la session « Development of systems for long-term storage and preservation of library collections » dans laquelle je présentais un article.

Samedi, mis à part une courte (et extrêmement agréable) rencontre avec quelques membres du LLD XG, j’ai consacré la plupart de mon énergie à finir de préparer la journée du lendemain, ce qui incluait la modération de la session du matin, la préparation des différentes copies de mon article pour la traduction simultanée, etc.

La session « Libraries and the Semantic Web », bien que se déroulant un dimanche 15 août à partir de 8h30 (!), a attiré environ 250 personnes, dont la plupart ne dormaient même pas !
Nous avons eu droit à une ouverture riche et éclairante par Richard Wallis, suivie par 6 présentations toutes pertinentes et de haute qualité dont vous retrouverez les textes sur le site de l’IFLA et les présentations sur Slideshare. La session a aussi été assez bien couverte sur twitter (#ifla2010) y compris par votre serviteuse qui twittait depuis la tribune ;-)

La session de l’après midi, consacrée à la préservation numérique, s’est très bien passée aussi. Il y avait environ 120 personnes, ce qui n’est pas mal du tout pour la dernière session de la conférence. Les autres présentations portaient sur le système e-Depot de la KB, et sur Hathi trust. La défection d’un des intervenants a été habilement compensée au pied levé, grâce au brio des animatrices de la session, par une intéressante discussion avec la salle permettant de faire un peu le tour des initiatives en cours.

Et puis c’était la fin : la session de clôture, avec ses récompenses, ses remerciements… et pas son annonce du lieu d’un futur congrès, puisque le lieu du congrès de 2013 ne sera annoncé que l’année prochaine.
Mystère donc !

… Rendez-vous l’année prochaine à Puerto Rico ?