UILLD : un satellite de l’IFLA

Me voici en direct de Singapour où j’ai assisté au 79e congrès de l’IFLA – il était temps que je me mette à bloguer car c’est le dernier jour ici ! Je ne ferai pas un compte-rendu exhaustif de ce congrès, mais je voudrais revenir sur quelques éléments liés à ma marotte habituelle : le Web sémantique.

Cette année, la section Information Technology dont je fais partie organisait une « rencontre satellite » sur un sujet particulièrement intéressant : les interfaces utilisateurs basées sur le Web de données en bibliothèque (User Interaction Based on Library Linked Data ou UILLD). En effet, après plusieurs années passées à se focaliser de manière principale sur la technologie d’une part, la publication des données d’autre part, il semblait important d’aborder la question du Linked Data du point de vue de ce qu’il apporte à l’utilisateur final.

La conférence durait toute une journée ; elle se déroulait dans la Jurong Regional Library de Singapour.
Un mot sur les satellites : c’est une véritable tradition de l’IFLA. Ils se déroulent avant ou après le congrès lui-même, durent une à deux journées et s’intéressent à un sujet en particulier parmi la pléthore des thèmes abordés par les différentes sections. Ces derniers temps il y en avait une bonne vingtaine autour de chaque congrès.
Parce qu’ils se focalisent sur un sujet précis et prennent le temps de le traiter en détail, je trouve que les satellites sont généralement plus intéressants que les sessions du congrès lui-même (en tout cas, c’était mon 2e satellite et cette impression que j’avais eue la première fois s’est vérifiée). Il n’est donc pas rare que des gens viennent uniquement pour assister à l’un de ces satellites et pas au congrès lui-même.

Pour en revenir à UILLD, je vais reprendre ici une citation tirée de la présentation de Martin Malmsten : vouloir « vendre » (au sens marketing du terme) l’idée de Web de données sans montrer d’interface, c’est un peu comme de vouloir vendre un fax alors que le papier n’aurait pas encore été inventé. Les interfaces ne sont peut-être pas au cœur du problème quand on parle de Web sémantique, mais au stade où nous en sommes, elles sont devenues absolument nécessaires pour démontrer à un public de non spécialistes, en particulier aux décideurs, l’intérêt de cette technologie.
C’est la raison pour laquelle il semblait vital d’organiser un événement focalisé sur ce sujet au sein de l’IFLA, parce que l’IFLA est justement un lieu où l’on touche beaucoup de professionnels de divers horizons et en particulier des cadres.

En ce qui concerne le contenu de cette rencontre, j’ai eu l’occasion de présenter l’interface du Centre Pompidou virtuel et Patrick Le Bœuf a évoqué le projet Opencat dont j’ai déjà parlé ici. Il semblerait qu’OpenCat ait bien évolué et je trouve que ce projet reste vital pour notre communauté, car il est le premier à démontrer l’utilisation des technologies du Web sémantique pour réaliser la même chose que ce qu’on faisait avec le catalogage partagé traditionnel, mais en mieux ;-)

Nous avons aussi pu voir des démonstrations d’interfaces réalisées par des personnes en dehors de notre communauté (développeurs, chercheurs) et qui utilisent des données de bibliothèque grâce à leur existence dans le Web de données : c’était le cas d’une application de visualisation pour terminaux mobiles (présentée par Bernhard Humm), ou d’un espace d’échanges de notes entre chercheurs (que nous a montré Ryan Shaw). Ils utilisent en particulier des données d’autorité pour servir de référentiels de personnes.
Ces expériences tendent à montrer que ces données n’auraient pas pu être utilisées (ou pas aussi facilement, ou l’idée ne leur serait pas venue) si elles n’avaient pas été présentes dans le Web de données. Plus encore, ils ont témoigné que les données de bibliothèques ont été choisies, après comparaison avec d’autres sources, pour leur qualité et leur précision ! C’est plutôt une bonne nouvelle.

Je suppose que les diverses présentations et articles complets seront mis en ligne prochainement. J’essayerai de penser à mettre à jour ce billet…

Je vais conclure en annonçant que l’année prochaine, nous organisons également un satellite sur le Web de données en bibliothèque. Il aura lieu à Paris, à la BnF, le 14 août. Plus d’infos à ce sujet bientôt.

Web sémantique, FRBR et RDA en tournée dans toute la France

Depuis quelques mois, bien que tenue à l’écart de l’évolution des normes de catalogage par d’autres activités, j’ai eu la chance de participer au tour de France entrepris par quelques collègues sous l’égide du CNFPT pour présenter « les catalogues au défi du Web ». Nancy, Montpellier, Dunkerque, Angers, plus deux journées sur un thème similaire organisées à Reims et Strasbourg par Médial et une excursion aux journées RNBM à Marseille : on peut dire qu’on a sacrément bourlingué.

Au programme, parmi les sujets évoqués, on a parlé du projet OpenCat réalisé par la BnF et la médiathèque de Fresnes, qui ont construit un OPAC (interface d’accès de catalogue) en ligne en s’appuyant sur data.bnf.fr et d’autres données du Linked Data (le prototype est maintenant consultable en ligne).
On a discuté des nouvelles règles du Sudoc qui visent à mieux préparer la FRBRisation et le passage à RDA, ou encore de la FRBRisation des thèses.
On a abordé Bibframe, l’initiative pragmatique (trop pragmatique ?) des américains pour faire évoluer les formats MARC. On a parlé du rapport du comité stratégique bibliographique sur l’avenir des catalogues en France, et des actions menées par le groupe EURIG pour faire évoluer RDA vers un code de catalogage vraiment international et pas seulement anglo-saxon.

Bref, autant dire qu’il y a trop de sujets intéressants et d’évolutions passionnantes pour tout faire tenir en un seul billet. Et puis c’est vrai que si j’ai continué à travailler d’arrache-pied sur le Web sémantique (avec un projet de livre en préparation !) je me suis un peu éloignée de ces sujets plus strictement bibliothéconomiques et je ne me sens pas vraiment très à la page pour en parler.

Pour ceux qui auraient raté ces rencontres passionnantes, sachez qu’une session de rattrapage est organisée par le CNFPT le 19 novembre prochain à Paris. Je serai là encore au rendez-vous, pour introduire le propos en expliquant ce que change le Web…

SWIB12

J’ai eu la chance d’assister la semaine dernière à la quatrième édition de la conférence SWIB (pour Semantic Web in Bibliotheken). Renommée en « SWIL » (pour Semantic Web in Libraries) cette conférence à l’origine tout à fait allemande est devenue complètement internationale, c’est-à-dire que toutes les communications se font maintenant en anglais.

Vous pouvez retrouver en ligne les diapos et également les vidéos des interventions, dont la mienne qui était la « keynote » du 2e jour.

Globalement, cette conférence reste très technique et réunit principalement des acteurs du web sémantique en bibliothèque qui ont véritablement les mains dans le cambouis ; mais on trouvait dans le public et même parmi les intervenants des « vrais » bibliothécaires qui ne sont pas des développeurs (dont moi !) La conférence a d’ailleurs commencé par une première demi-journée de tutoriels.

Fait intéressant, les bibliothèques semblent avoir maintenant dépassé le stade des questionnements de base sur l’intérêt de la chose, la publication des données bibliographiques étant devenue un fait pratiquement naturel. La plupart des interventions allaient donc au-delà, abordant par exemple l’élargissement de l’ouverture des données de bibliothèques à d’autres types de données comme les données de circulation, d’exemplaire, ou encore les jeux de données de la recherche. Les questionnements pratiques vont aussi au-delà, abordant des problématiques comme la provenance et la confiance, la gestion des alignements, ou encore la mise à jour des flux de données.

A suivre l’année prochaine à Hambourg !

CPV en orbite

Cela faisait un moment (en fait, un an et demi) que j’attendais ça : nous avons enfin lancé le Centre Pompidou Virtuel. On va pouvoir arrêter de l’appeler comme ça et parler simplement du nouveau site du Centre Pompidou.



Comme tous les sites Web, il n’est pas parfait, il va devoir encore beaucoup évoluer, nous avons encore plein de projets (heureusement, sinon je serais en plein baby blues…) mais c’est quand même un grand moment de bonheur !

Bien sûr ma communauté d’intérêt favorite, informée de l’événement sur Twitter, s’est jetée sur le nouveau joujou à la recherche du RDF… et en est revenue toute dépitée. Oui, c’est vrai, le Web sémantique est au cœur de la machine mais on ne le diffuse pas pour l’instant. Comme je l’expliquais à l’IFLA cet été, nous n’avons pas fait du Linked OPEN Data mais du Linked ENTERPRISE Data. C’est à dire que nous avons appliqué les technologies du Web sémantique à nos propres données afin de construire notre propre service.

C’est quand même du Web sémantique, du vrai de vrai, et notre site est véritablement construit dessus, en production. J’ai eu l’occasion d’expliquer tout ça, avec l’aide de Got qui a présenté quelques projets complémentaires, lors du séminaire IST de l’INRIA en début de semaine. (C’était vraiment bien, si vous n’avez pas pu y assister, je vous recommande le livre).

Est-ce que cela signifie qu’on va en rester là ? Pas du tout.
La première étape sera de rendre le RDF plus visible en intégrant des métadonnées (probablement du Schema.org) dans les pages HTML. Comme cela, on exploitera la richesse des informations disponibles tout en les rendant accessibles à d’autres et en améliorant notre stratégie de référencement.
La deuxième étape sera de développer des mécanismes permettant à d’autres de réutiliser nos données, et d’y associer la licence ouverte qui va bien. Je l’ai dit plusieurs fois dans des conférences, c’est une suite logique, et cela s’inscrit complètement dans l’ADN du projet qui est par nature ouvert.
Mais avant d’y arriver, il va falloir traverser en louvoyant deux couches d’astéroïdes.

La première est liée au statut des contenus : en tant qu’œuvres du XXe et XXIe siècles, ils sont pour la plus grande partie encore protégés par les droits de propriété intellectuelle.
À ma connaissance, l’ampleur du chantier de collecte d’autorisations que nous avons entrepris est sans précédent (nous ne pouvons nous réfugier ni derrière le domaine public avec une barrière temporelle ni derrière le fair use anglo-saxon).
Ce sont souvent des négociations et des explications avec des personnes qui ne sont pas familières avec la technologie et qu’il faut rassurer sur notre démarche. On veut construire le site avec eux, pas contre eux, et cela nécessite d’avancer pas à pas.
Aujourd’hui, le fait que les contenus peuvent être protégés même si les data sont libres est un discours qu’on a même du mal à expliquer à des professionnels de l’information, alors avec les ayants droit cela risque d’être un long chemin semé d’embûches.

La deuxième difficulté tient à la nature de l’institution et de son activité. Moi qui viens des bibliothèques, je suis imprégnée jusqu’à la moelle d’une culture de l’échange de données qui est pour nous une évidence. Dans les musées, j’ai l’impression qu’il faut commencer par démontrer la valeur ajoutée de la démarche, et aussi rassurer, sur le plan institutionnel, sur le fait que l’institution ne va pas se trouver dépouillée de ses ressources propres si elle ouvre ses données.
La démarche de faire du site du Centre Pompidou un immense centre de ressources offrant gratuitement l’accès à tous les contenus numériques n’était déjà pas une évidence et a représenté plusieurs années de travail. Nous travaillons quotidiennement à réconcilier cette approche « documentaire » perçue comme un ovni avec les besoins de visibilité concrets et immédiats de nos collègues dans les autres services.
L’idée que ce centre de ressources doit être ouvert sur l’écosystème du Web, interagir avec d’autres jeux de données, les enrichir et s’en enrichir à son tour est pour moi une évidence, mais institutionnellement cela a besoin d’être approfondi, expliqué et démontré. C’est un de mes chantiers pour les mois à venir.

IFLA 2012 (suite) – Quelques questions existentielles sur le Linked Data

Pour clore cette série de billets sur mon voyage à l’IFLA, je voulais revenir sur quelques idées fortes qui se sont avérées récurrentes quand il a été question de Web sémantique et de Linked Data.

Le premier point portait sur les licences et de l’open data. Ce sujet avait été inscrit à l’agenda de la session des bibliothèques nationales, et il a surgi également lors de nos deux événements sur le Web sémantique (la table ronde OCLC et la session du SWSIG). On commence à voir les « gros » se poser réellement la question pour une partie de leurs données de l’ouverture complète, sans la moindre contrainte, façon CC0 : la British Library, la Deutsche Nationalbibliothek, la BnF. De même, OCLC a récemment ouvert les données de WorldCat en Schema.org sous licence ouverte. Les données sont fournies dans les pages en RDFa, mais on peut aussi télécharger un « dump » (gros fichier avec plein de données dedans) partiel contenant 1,2 millions de ressources. Ce choix de licence montre qu’OCLC reste attaché au principe de la citation de la source, allant jusqu’à fournir des guidelines sur la meilleure façon de citer ses sources s’agissant de données. Je trouve ce document très intéressant en ceci qu’il aborde les différents cas possibles, depuis l’attribution sous la forme d’une mention globale (genre, « ce site/service/article utilise des données de Worldcat sous licence ODC-by ») jusqu’au simple fait d’utiliser les URIs de WorldCat dans le jeu de données, qui est considéré comme une forme d’attribution en soi ! L’intermédiaire entre les deux consiste à ajouter dans la description de son dataset un triplet avec un « DC:source » vers WorldCat. On pourra lire avec grand bénéfice quelques commentaires sur la stratégie d’OCLC sur le blog CC. Bien que je sois globalement d’accord, je les trouve un peu sévères sur les guidelines et la question de leur applicabilité dans le contexte du Linked Data. Il me semble au contraire que le fait de considérer la simple utilisation des URI comme une forme d’attribution contribue à intégrer juridiquement le principe qui est au cœur du Linked Data (« follow your nose », naviguer dans les données en suivant les liens). Et justement, cela fait plusieurs années qu’on proclame, nous les Linked Data évangélistes, que vos données – même réutilisées – ramèneront toujours de la valeur et de la visibilité à votre institution ne serait-ce qu’à travers les URI. C’est donc réconfortant de lire cela dans les guidelines d’OCLC… Sans vouloir m’étendre davantage sur OCLC, je trouve pour finir que ces quelques pas qu’ils font en direction du Linked Open Data sont significatifs d’une tendance beaucoup plus importante : le modèle économique de la vente des données, c’est fini. Et tous les acteurs qui reposaient là-dessus uniquement vont devoir se creuser la cervelle pour trouver autre chose. Quant à ceux, comme les bibliothèques nationales, qui y voyaient un sympathique à-côté fournissant quelques petits revenus quand même, ils vont pouvoir libérer leurs données avec la conscience tout à fait tranquille… bonne nouvelle non ? (A lire absolument pour se détendre sur le sujet : pourquoi les bibliothèques ne sont pas en open data, par Mace Ojala sur Cyc4libs.) Une fois les données ouvertes, c’est bien joli mais on aimerait bien pouvoir savoir qui va les utiliser et comment. Et là c’est le trou noir, le black out. Les données libérées sont désespérément muettes quant à leur usage, tout au plus dispose-t-on de logs sur un serveur qui semblent témoigner d’une activité, mais laquelle… Or la communauté ayant maintenant bien intégré l’idée que nous ne pouvons pas aller plus loin sans démontrer la valeur ajoutée de l’open/linked data en termes de réutilisations, cette question est devenue cruciale. C’était d’ailleurs le sujet de ma keynote à DC2011. A l’époque c’était presque révolutionnaire, et j’avais lancé ce slogan : « we need to stop citing the BBC », parce qu’il me semblait impensable que nous puissions tenir encore plusieurs années sans avoir un autre exemple digne de ce nom à présenter. Quand je dis « digne de ce nom », ce n’est pas que les autres applications sont indignes, mais je voulais parler d’exemples démontrant l’usage des données du Linked Data en production, et pas seulement de manière expérimentale, cet usage étant assorti d’une vraie réflexion et d’un discours sur ce que cela apporte à l’institution. Quand on discute avec les collègues de la BBC (on peut aussi lire leur use case sur le site du W3C) ils expliquent que l’approche Linked Data est complètement intégrée à la conception de leur système d’information, dont une partie est considérée comme « externalisée » sur le Web (en gros, ils corrigent les notices de Wikipédia au lieu d’éditorialiser leur propre site) et dont la clef de voûte réside dans l’attribution des URI qui permettent d’unifier le système. En fait, ils ont eu avant la lettre cette vision du Linked Enterprise Data (minute copinage : vous trouverez une très bonne explication du LED en français ici), c’est-à-dire l’utilisation des principes et des technologies du Linked Data à l’intérieur du système d’information pour unifier les données entre les différentes applications. C’est d’ailleurs cet aspect que j’ai choisi d’approfondir quand j’ai présenté le Centre Pompidou virtuel pendant la table ronde OCLC (comme quoi je ne raconte pas toujours la même chose !) J’ai comparé le principe à celui d’un intranet, qui utilise les technologies du Web mais au bénéfice interne de l’institution, sans parler de publication. Eh bien là c’est la même chose, une première étape où on fait en quelque sorte du Linked Data en interne – avant, je l’espère, d’envisager d’ouvrir les données. Ainsi, le premier argument pour convaincre une institution de faire du Linked Data pourrait être la perspective d’améliorer les processus internes. Mais si on parle d’open data, il faut aussi être capable de démontrer la valeur ajoutée de l’ouverture, en terme de réutilisation. Martin Malmsten suggérait de partir d’un principe simple : contribuez ce qui est unique chez vous, et bénéficiez de l’ensemble. A mon avis, il reste cependant nécessaire de démontrer *comment* on bénéficie de l’ensemble, et pour cela il nous faut connaître les utilisateurs du service et les cas d’usage. D’où la question : comment faire pour connaître les utilisateurs de nos données ouvertes ? On a failli repartir tous avec des tee-shirts « if you build it, they will come ; if you break it, they will complain » (l’idée étant de casser le service pour que les utilisateurs se manifestent ;-) Mais plus sérieusement, l’approche proposée par Neil Wilson (BL) m’a semblé très sensée : c’est à nous de construire la communauté, en contribuant éventuellement dans un premier temps à la mise en place de services tiers, pour montrer l’exemple. Enfin, le troisième défi souligné par mes camarades de la British Library et de la bibliothèque royale de Suède est celui de la mise à jour des données. Il est aussi lié au point précédent, en ceci qu’on constate que les consommateurs actuels de Linked Data ont tendance à faire porter leur préférence sur un dump plutôt que d’utiliser les données liées en temps réel, pour diverses raisons notamment techniques sur lesquelles je ne vais pas m’étendre ici. Au temps pour le graphe global : ce qu’on utilise aujourd’hui en réalité, c’est bien souvent une photographie des données à un instant T, et suivant la fréquence de mise à jour du dump source et de l’application cliente, la fraîcheur du service est inégale. Du coup, côté OCLC et Libris, on privilégie une approche où la version RDF de chaque notice fait partie intégrante du service, dans un esprit très Linked Data. Ils voudraient inciter leurs utilisateurs à utiliser directement ces données plutôt que des dumps qui vont se périmer très vite. Côté British Library et BnF, on rafraîchit tous les mois, et on voudrait passer à un rythme hebdomadaire. Et moi, je suis bien placée pour savoir que rafraîchir quotidiennement est un défi, mais que dans certains cas c’est aussi une nécessité. Donc, on voudrait que notre Linked Data soit plus intégré aux processus de production des données, et pas seulement en bout de chaîne (cf. ce que je disais plus haut sur le LED). On voudrait des applications qui « suivent leur flair » (follow your nose, donc) en temps réel au lieu d’avaler des gros fichiers une fois de temps en temps. Et enfin, on voudrait un processus de notification qui permette aux consommateurs de données de savoir quand un dataset ou une ressource a été mis à jour (c’est là que Martin s’est mis à parler d’Atom et de PubSubHubbub, le protocole au nom marrant). Cette problématique renvoie à la question de la provenance, sur laquelle travaille le DCMI, en lien avec le W3C qui avait fait un groupe d’incubation sur le sujet. Mais ce n’est pas tout ; dans le Linked Data on exprime les triplets sous la forme d’un document, un fichier qui contient les données sous une forme RDF/XML ou autre. La question est donc de savoir comment utiliser ce document pour transmettre aussi des informations de notifications concernant les mises à jour. Mince, je m’étais dit que j’allais faire un petit billet pas trop long et voilà le résultat… En tout cas, nous allons aborder tous ces sujets, Got et moi, dans notre présentation au séminaire INRIA en octobre. Pour ceux qui n’ont pas pu s’inscrire, les actes seront publiés, en français dans le texte. Ces questions seront également au cœur de la présentation que je vais faire en keynote de la 2e journée de la conférence SWIB 2012, à Cologne, le 27 et 28 novembre prochains (je me permets de l’annoncer en avant-première, le programme devrait être publié très prochainement). Alors venez nombreux ! Commentaires bienvenus par mail, sur Twitter @figoblog et sur Facebook pour ceux qui y sont.

IFLA 2012 et le Web sémantique

Comme vous le savez, je suis gravement monomaniaque et la seule chose qui m’intéresse à l’IFLA c’est les communications qui portent sur le Web sémantique, le Linked Data ou autre chose du même genre. Heureusement il y en a plein. Voici un petit raccourci à travers les papiers à lire sur le sujet (sans garantie de leur qualité ou de leur contenu, je n’ai pas encore eu le temps de tout regarder ni même d’assister aux présentations…).

Dimanche, au sein de la session sur les moments inspirés du catalogage, il y a eu la présentation du projet Pode et de problématiques liées aux données de data.bnf.fr.

Lundi dans la session Unimarc, une présentation intitulée « Linked data for libraries » par des gens de l’université de Portsmouth. Dans la même session il y a eu aussi une courte présentation du Bibliographic Framework Initiative par la Library of Congress, mais il n’y a pas de document en ligne et je tiens de Sally Mc Callum elle-même que tout est sur le site web.

Pas dans le programme officiel mais intéressant tout de même, il y avait aussi lundi une table ronde organisée par OCLC, à laquelle j’ai participé, sur le Linked Data. Vous pouvez retrouver les présentations ici.

Mardi la session de la section Classification & Indexing, bien sûr un des lieux importants pour parler Web sémantique à l’IFLA. On peut y découvrir les très intéressants projets de recherche menés par différentes équipes finlandaises dans le domaine du Web sémantique appliqué aux technologies de bibliothèque.

Mercredi il y avait la sessions sur l’open data dans les bibliothèques nationales que l’IFLA avait eu la bonne idée de programmer pile en même temps que celle du Semantic Web SIG (on peut pas leur en vouloir, c’est toujours comme ça, il y a plein de choses en parallèle… mais quand même c’était rageant). Même si les aspects techniques n’étaient pas au cœur de cette session, au moins 3 des 4 interventions (bibliothèques nationales allemande, française et écossaise) évoquent le Linked Data même si ce n’est pas forcément au cœur du sujet.

Toujours mercredi donc la session de mon groupe, le SWSIG. Il n’y a presque rien dans le programme mais j’ai posté des choses sur le site du groupe et j’y mettrai bientôt les diapos de la session. J’ai aussi créé un hashtag sur twitter, #SWSIG, que je vous encourage à utiliser toute l’année pour me signaler des sujets d’intérêt pour le groupe.

Jeudi c’est peut-être un peu plus épisodique, mais lors de la session du tout nouveau IFLA Committee on Standards, il a été question à plusieurs reprises du IFLA Namespaces task group.
Un mot sur ce groupe qui n’a pas d’existence suffisamment officielle à l’IFLA (c’est un groupe de travail rattaché pour l’instant à la section Classification) pour apparaître dans le programme. Il s’est réuni lundi matin, et son objectif est d’accompagner les groupes qui publient des standards de l’IFLA pour le Web sémantique (notamment les versions des FRBR et autres FR** et de l’ISBD qui sont disponibles dans l’Open metadata registry). En ce moment ce groupe travaille notamment sur des guidelines pour la traduction des labels en différentes langues. L’articulation de ce groupe qui est en fait très transverse à plusieurs sections avec l’IFLA Committee on Standards est aussi un sujet brûlant. En tout cas je note que ce groupe suscite un intérêt croissant. On n’était que quelques pelés autour d’une table en 2009. Cette année, il y avait plus de 30 personnes à la réunion du groupe (dont 2/3 d’observateurs).
On retrouve toutes les infos sur l’IFLA Committee on Standards ici.

Dans la session Libraries for the Law on retrouve une intervention de la bibliothèque du Congrès du Chili dont nous avons eu un résumé pendant le SWSIG.

Et enfin, c’est la session des bibliographies nationales où on retrouve les français et les allemands qui visiblement ont bloqué sur les data :-)

Il est à noter que grâce au gros boulot fait par l’AIFBD et les volontaires, la plupart de ces communications ont été traduites en français. Ceux que ça intéresse peuvent encore candidater pour les rares qui ne l’ont pas été !

Sinon j’en ai peut-être loupé quelques-unes dont le titre n’était pas suffisamment explicite pour que je détecte le Linked Data dedans. N’hésitez pas à me les signaler sur Twitter ou par mail (j’ai fermé les commentaires du blog à cause du spam, c’était intolérable) et je les rajouterai.

Un an en un billet

Ah ah, vous pensiez que le Figoblog était mort. Vous m’avez croisée lors d’une conférence et entendu parler de « feu mon blog ». Vous pensiez que le seul moyen d’être encore au courant de mes faits et gestes était de vous abonner à mon compte twitter. Mais non ! Je m’étais donné un an pour déclarer pour de bon sa mort clinique, et le voici qui sursaute, à l’approche de l’IFLA. Bon sang un an déjà, et ce n’est pas comme s’il ne s’était rien passé. Je vous propose de revivre cette année en accéléré en un billet…

17 août 2011. Lors du congrès de l’IFLA à San Juan, Puerto Rico, se réunit pour la première fois le nouveau groupe d’intérêt de l’IFLA sur le Web sémantique (SWSIG). Une centaine de personnes ont assisté à ce qui fut l’acte de naissance de ce groupe (sa fondation ayant été ratifiée officiellement par l’IFLA quelques mois plus tard, ce qui lui a permis d’être doté d’une page web bien à lui). Au programme de cette réunion, une présentation du rapport final du LLD XG (voir ci-dessous), un rapport d’avancement sur les activités de normalisation de l’IFLA dans le domaine, et une série de courtes présentations montée quasiment au débotté avec les personnes présentes (voir les diapos en ligne). Ce fut une session très réussie.

18 août 2011. D’ailleurs il ne faut pas croire que je me suis arrêtée de bloguer, lors de ce congrès de l’IFLA 2011. Simplement je l’ai fait sur un autre blog, celui du CFI.

8 septembre 2011. Dans le cadre du « meetup web sémantique », rencontre dans la salle Piazza du Centre Pompidou sur le thème « Patrimoine et Web de données » à l’occasion duquel j’ai pu parler du projet qui a occupé mes jours, mes nuits, mes week-ends depuis un an (comment ça j’exagère ??) à savoir le Centre Pompidou virtuel. Plus d’infos à ce sujet un peu plus loin. En tout cas grâce à l’IRI et à son polemic tweet, vous pouvez revivre ce moment en vidéo ici.

21 septembre 2011. Je suis à La Haye pour la conférence DC2011. Le vendredi, dans une mémorable keynote (ben oui je suis contente, c’était ma première !) j’ai parlé de ratatouille, mis le feu à la BBC et raconté des contes pour enfants à un auditoire mal réveillé mais ravi.

12 octobre 2011. Je suis à la foire du livre de Francfort, cette fois pour présenter le Centre Pompidou virtuel à l’association internationale des éditeurs de musées. Un événement qui ne semble pas avoir laissé de traces en ligne.

25 octobre 2011. Publication officielle du rapport final du Library Linked Data Incubator Group du W3C (plus connu sous le petit nom de « LLD XG ») : enfin le terme d’une année de travail très intense !
Le rapport se compose en fait de 3 documents :
– le rapport final ;
– une première annexe qui liste les vocabulaires et données déjà disponibles ;
– une seconde annexe qui reprend et synthétise les cas d’utilisation réunis par le groupe pour élaborer son rapport.
Le rapport final est en cours de traduction en français.

29-30 novembre 2011. J’ai failli aller à Hambourg pour assister à SWIB mais en fait non. Consolation en vidéo ici : 29/11 et 30/11.

8 décembre 2011. L’ADBS et l’EBD organisent une journée d’étude intitulée « L’accès à l’information dans tous ses états ». Devinez ce que j’y présente… oui, le Centre Pompidou Virtuel (eh toi là au fond qui bâille ! je t’ai vu !)

14 décembre 2011. J’ai failli aller à Madrid pour participer à une rencontre sur le Linked Data organisée par la Bibliothèque nationale d’Espagne pour présenter son projet datos.bne.es mais je suis retenue à Paris par d’autres obligations. On trouve le compte-rendu de cette rencontre narrée sur le blog Open bibliography and Open Bibliographic Data.

13 janvier 2012. Un petit saut à l’INHA pour la journée d’étude « Signes et balises : L’édition numérique en histoire de l’art, réalisations, projets, enjeux ». C’est marrant comme ce genre d’événements ne laissent pas de traces en ligne.

13 mars 2012. L’hiver a été long, mais pas improductif : on a pu assister à plusieurs des intéressantes conférences des séminaires de l’IRI : celui sur l’éditorialisation, et celui sur la muséographie. Et voici que j’y suis invitée pour présenter…. devinez quoi… (j’espère que vous aimez le comique de répétition). En vidéo ici (je vous laisse chercher pour retrouver les autres vidéos !)

19-20 avril 2012. Je suis invitée à Aix pour deux passionnantes journées sur le thème de l’Open Data culturel, organisée par l’AGCCPF-PACA (inutile d’essayer de m’extorquer la résolution du sigle). Ah, Aix-en-Provence, sa météo clémente, le charme de ses rues médiévales… (je préfère ne pas dire de quoi je parlais ;-) Yannick Vernet explique en détail sa démarche sur le c-blog.

2 mai 2012. Je participe à la conférence SemWeb.pro où je répète infatigablement la même chose. Mais cette fois devant un parterre de geeks, ça change. Et puis ça contribue à la présence d’une représentation féminine au sein des intervenants, il y en a besoin.

4 mai 2012. OCLC annonce la mise à disposition public de VIAF sous licence ouverte. Le fichier peut être téléchargé en RDF ou dans d’autres formats moins connus comme MARC21, depuis l’adresse http://viaf.org/viaf/data/. Les biblio-geeks font des bonds.

22 mai 2012. Il y aura une vie après MARC21. En tout cas, la Library of Congress y travaille… avec Zepheira, elle élabore un modèle qui devrait permettre de lancer la grande discussion que nous attendons tous sur la transition des formats MARC vers le Web de données.

20 juin 2012. Worldcat est publié en Linked Data. Ah en fait non, ils ont juste mis du Schema.org dans les pages. Déjà pas mal, vous me direz. Plus d’info chez Richard Wallis, célèbre évangéliste du biblio-web-sémantique qui a quitté Talis pour rejoindre OCLC en avril.

21 juin 2012. Invitée à ouvrir la 2e journée du colloque « Patrimoine et humanités numériques » organisé par Paris 8, je fais preuve d’un incroyable sursaut d’originalité et décide de parler de réintermédiation numérique par les données. Pour ceux que ça intrigue, j’ai écrit un beau texte qui devrait être mis en ligne quelque part (patience…)

29 juin 2012. Retour à la BnF le temps d’une journée : la fameuse journée annuelle BnF/Afnor qui s’intéresse cette année au livre numérique. Je modère une table ronde sur les métadonnées. Tout est révélé ici.

En juillet, j’ai pris quelques vacances (en partie consacrées à la rédaction de mon intervention pour le séminaire INRIA du mois d’octobre sur le Web sémantique) avant de repartir pour une nouvelle année sur les chapeaux de roue. Toutes mes excuses à tous les gens qui m’ont invitée quelque part et à qui j’ai dit non parce que j’étais déjà trop occupée. Vous voyez que je n’ai pas menti. Pour un commentaire en temps réel des événements à venir, rendez-vous sur twitter

En direct de l’IFLA

Il faut que je songe a remplir mes devoir de blogueuse IFLA (fonction attestée par le ruban bleu que je porte sur mon badge) et ne pas céder à la facilité en me contentant de réflexions en moins de 140 caractères…

Le congrès a commencé comme à son habitude intensément, avec les réunions des comités permanents samedi matin, le caucus des francophones samedi soir, la session d’ouverture et les premières sessions thématiques dès dimanche. Pas de week-end pour les congressistes ! (pas de jour ferié non plus, cela va sans dire).

Le programme est très intéressant cette année et on regrette de ne pas pouvoir se dédoubler pour assister à plusieurs sessions à la fois. Heureusement, grâce au fil Twitter #wlic2011 qui est assez bien alimenté, on peut avoir une idée de ce que se passe dans les autres salles.

Ainsi le Web sémantique est à l’honneur et il a été abordé hier dans deux sessions qui se déroulaient en parallèle : la session des bibliothèques d’art, avec une présentation sur VIAF et celle de la section de Catalogage avec le projet polymath, un projet sur les autorités en Linked Data dont j’avais entendu parler parce qu’ils ont présenté un use case au LLD XG. Dans cette 2e, il semblerait que la question de l’avenir de MARC (ou son absence en l’occurrence ;-) ait été évoquée. Elle le sera encore dans d’autres sessions.

En parallèle encore, le FAIFE (Committee on Freedom of Access to Information and Freedom of Expression) organisait une session intitulée « how to fix the world », oui, rien que ça ! ou il a été question (d’après le flux Twitter) notamment des émeutes en Egypte et des libertés individuelles.

Ce matin, après avoir écouté la session plénière ou il était question de propriété intellectuelle, je me suis rendue a la réunion du Namespace task group. Ce groupe, pour l’instant plus ou moins informel, réunit plusieurs sections et groupes de l’IFLA pour coordonner la publication des standards bibliographiques sous forme de vocabulaires RDF.
Cela faisait longtemps que le groupe ne s’était pas réuni (je me demande même si ce n’était pas la première fois… On avait surtout travaillé par mail par le passé) et c’était tout à fait passionnant. Parmi les sujets abordés, nous avons évoqué le problème de la traduction des labels dans des langues autres que l’anglais, les liens entre vocabulaires, le dédoublonnage des notices…
Les activités de ce groupe seront liées à celle du groupe d’intérêt spécialisé sur le Web sémantique, le SWSIG, que je réunis mercredi matin à 9:30 (si des congressistes me lisent : surtout n’hésitez pas à y assister, même par simple curiosité !)

A suivre…

Ma valise pour l’IFLA

Bon alors… départ pour l’IFLA la semaine prochaine… qu’est-ce que je vais mettre dans ma valise ?

1, Mon article sur Convergence et interopérabilité : l’apport du Web de données pour la session de la la section Classification et Indexation. Que j’ai écrit en français, pour une fois… Faudrait peut-être que je fournisse la traduction, d’ailleurs, oups, ne serais-je pas un peu en retard ?
Tiens, en tout cas, il va y avoir des choses intéressantes dans cette session : comment skosifier votre bibliothèque, un service japonais pour le Web sémantique, et l’indexation par le Web à la Bibliothèque du Congrès.

2. Le rapport final du LLD XG, dont nous allons présenter les résultats lors de la première réunion du nouveau groupe « Web sémantique et bibliothèques » que j’anime.
Le rapport en question n’est pas tout à fait fini, on y travaille encore… Et d’ailleurs ce n’est pas tout ! Il y a deux livrables complémentaires : l’un qui liste les données et vocabulaires disponibles, l’autre qui synthétise notre collecte de use cases.

3. Le texte fondateur du groupe d’intérêt spécialisé que j’évoquais plus haut, le SW SIG. C’est qu’il va falloir réfléchir à ce qu’on va faire dans ce groupe pendant les deux ou trois ans à venir… Ce sera le but de la réunion du groupe : une réunion ouverte, à laquelle tout le monde peut venir.

4. Les documents des autres groupes auxquels je participe :
– le comité permanent de la section Information Technology,
– le Namespaces task group qui travaille sur la publication des vocabulaires de l’IFLA (dont la FRBR family),
– l’ISBD XML group qui (comme son nom ne l’indique pas) finalise en ce moment une version de l’ISBD en RDF, version qui a déjà été utilisée par la British Library dans la version Linked Data de leur bibliographie nationale, publiée récemment.

5. Le programme de toutes les intéressantes sessions de la conférence auxquelles je vais pouvoir assister : sur le dépôt légal numérique, la formation pour la gestion des collections numériques, etc.

6. Mon ordinateur portable. Mon blog. Mon Facebook. Mon Twitter, avec le hashtag #wlic2011.

7. Mon maillot de bain :-) quand même…

Appel à commentaires

En cette période estivale, l’activité dans votre bibliothèque se ralentit… Vous avez peur de vous ennuyer…

Si vous n’êtes pas encore partis en vacances, à vos stylos ! Il vous reste encore une semaine pour poster des commentaires sur le brouillon du rapport final du groupe W3C Library Linked Data, le LLD XG.

Pour faciliter les choses, nous avons posté l’intégralité du rapport sur un blog où vous pouvez très facilement ajouter des commentaires. Après quelques hoquets, il est maintenant tout à fait opérationnel.

C’est par ici.

La contribution de tous est essentielle pour que ce rapport soit utile à la communauté et trouve son public. Alors surtout, n’hésitez pas.

Bon été !