Recherche : bilan personnel 2023

Quitter la conservation pour aller sur un poste d’enseignant-chercheur, cela implique de consacrer une partie de son temps à la recherche et ses activités connexes : conférences et publications. 2023 a été ma première année complète en la matière ; dans un esprit « science ouverte », voici donc le bilan de mes activités de recherche l’année passée (ça me sera surtout utile quand on me demandera d’en rendre compte :-)

Mes sujets et projets de recherche

Dans la continuité de ma thèse, mon champ de recherche porte sur la patrimonialisation du numérique et plus spécifiquement, le processus qui conduit à l’émergence de nouveaux objets patrimoniaux reflétant la culture numérique, ainsi que l’évolution des institutions patrimoniales en matière de gestion de leurs collections numérisées ou nées-numériques. C’est un sujet qui ouvre pas mal de pistes, et j’ai donc décidé de concentrer mon effort sur deux pôles principaux : les archives du web d’une part, et l’intelligence artificielle dans les institutions patrimoniales d’autre part.

L’année 2023 a ainsi été marquée par la fin du projet ResPaDon, dans lequel je suis restée engagée après mon départ de la BnF, et qui nous a occupés avec l’organisation d’une journée d’étude professionnelle conclusive et du colloque international de fin de projet. J’ai par ailleurs poursuivi mon implication dans AI4LAM où j’ai assuré une deuxième année de co-présidence du secrétariat avec Neil Fitzgerald. Cette deuxième activité m’a valu pas mal d’invitations à divers événements.

Sinon, j’ai passé une bonne partie de l’année à travailler sur le manuscrit d’un livre qui devrait paraître en 2024 aux éditions de l’École des chartes, et qui reprend en partie le mémoire de mon doctorat sur travaux (enrichi, élargi et pas mal réécrit). Ce qui ne m’a pas empêchée d’écrire quand même quelques articles !

Bilan complet ci-dessous.

Conférences, journées d’études, colloques…

L’année 2023 a été riche en événements, au-delà des temps forts qu’ont été les rencontres que j’ai contribué à organiser, à savoir le colloque ResPaDon « Le web : source et archive » en avril à Lille et la conférence annuelle de la communauté AI4LAM à Vancouver. J’ai aussi été impliquée dans les comités scientifiques de la journée d’études des doctorants du Centre Jean-Mabillon et de celle de l’ADEMEC sur l’open data. J’ai eu pas mal d’occasions d’animer ou participer à des tables rondes en lien direct avec mes activités (dans ResPaDon, dans AI4LAM ou encore dans le master TNAH). Mais c’est aussi une année où je me suis autorisée à passer une tête pour le plaisir, virtuellement ou pas, dans des conférences où je n’avais pas de présentation à faire ni de table ronde à animer… Par exemple le super webinaire du C2DH sur les usages pédagogiques de Chat-GPT (enregistrement disponible), la journée d’études NumFem2023 du CIS (Le numérique comme méthodes et terrains. Perspectives féministes), un atelier sur le Linked Art adossé à EuropeanaTech et un autre organisé par le SCAI sur l’utilisation de l’IA dans les sciences du patrimoine. Et tout ça était vraiment passionnant !

Je liste ci-dessous les événements dans lesquels je suis intervenue, en commençant par celles qui ont donné ou donneront lieu à des publications :

Voici maintenant les conférences où j’ai fait des présentations sans publication (parfois avec captation vidéo néanmoins) :

Et pour finir, les contributions à des tables rondes ou des présentations plus informelles :

Publications

Sinon, un enseignant-chercheur, ça publie ;-) Et ça tombe bien, c’est une activité que j’apprécie particulièrement. Alors si je prévois surtout d’en récolter les fruits en 2024 avec mon livre, voici quand même un bilan plutôt positif pour cette année :

  • J’ai publié dans la revue Balisages de l’ENSSIB (n°6) un article scientifique intitulé « Trente ans de numérique à la BnF. Devenir d’une utopie. » Lui aussi est essentiellement tiré de mon mémoire de doctorat, mais la partie méthodologique est toute neuve.
  • J’ai eu le privilège d’être invitée à préfacer l’ouvrage de Véronique Mesguich, Les bibliothèques face au monde des données (Presses de l’ENSSIB, 2023). Une très bonne entrée en matière pour tous les professionnels qui s’interrogent sur ces questions, et y trouveront une vision panoramique de la situation actuelle.
  • J’ai également contribué au très riche numéro de Culture et Recherche sur la science ouverte paru cette année (n°144, printemps-été 2023) en rédigeant un très court article sur les données FAIR, illustré d’un sketchnote maison que j’ai le plaisir de vous offrir ici en CC-BY-NC comme tous les contenus de ce blog ;-)

Blog qui n’était pas en reste puisque cette année j’ai publié 3 billets (waouh -_-) :

Si j’arrive à tenir mes bonnes résolutions, l’année prochaine je ne compterai pas tous les billets dans les publications parce qu’il y en aura trop ! On prend les paris ?

What is a lab ?

Mes pérégrinations autour du projet Corpus continuent (pour ceux qui n’auraient pas suivi les épisodes précédents, ils se trouvent ici et ). Les 13 et 14 septembre derniers, j’ai ainsi participé à une rencontre à la British Library sur le thème : « Building Library Labs« . Organisé par l’équipe du British Library Labs, ce séminaire a réuni plusieurs dizaines de bibliothécaires et chercheurs pour des ateliers de réflexion sur ce qu’est un « Lab » en particulier dans les bibliothèques nationales, à quoi ça sert, comment on le fait tourner et ce qu’on y fait.

Je serais bien en peine de résumer en détail les discussions très riches qui ont eu lieu lors de cette journée, mais parce qu’un joli dessin vaut mieux qu’un rapport de 150 pages (ou pas, enfin je vous laisse juger…) j’ai tenter de sketchnoter ce qui me semblait le plus important à retenir.

Pour transcrire tout ça en quelques mots : j’ai trouvé qu’il ressortait de ces journées une forme de consensus à la fois autour de l’approche proposée, de ses objectifs et de la définition de ce que peut être un « Lab » dans une bibliothèque nationale. En gros, toutes ces institutions investissent depuis 10 ans ou plus dans la constitution de collections numériques massives, et souhaitent à présenter développer des usages nouveaux de ces collections, en s’appuyant sur les possibilités ouvertes par l’outil informatique (genre TDM mais pas seulement).

Les bibliothèques nationales sont un peu différentes des bibliothèques universitaires : elles ne bénéficient pas toujours d’un bassin de population cible attribué (chercheurs et étudiants), mais par contre elles ont ces masses de données, plus ou moins accessibles, plus ou moins bien documentées, qui ne demandent qu’à rencontrer des usagers. Du coup, le public cible des « labs » n’est pas seulement composé de chercheurs, mais aussi d’artistes, d’entreprises, de développeurs, d’archivistes… et surtout, surtout, des bibliothécaires eux-mêmes : les collègues sont les premiers bénéficiaires du Lab.

Les composantes essentielles des Labs sont les données, qu’on cherche à diffuser de la manière la plus efficace possible, en les documentant et les assortissant d’exemples concrets. Le fait de proposer un site web comme point d’accès à tout cela est une première étape, voire dans certains cas un but en soi. Certains ont un lieu physique, d’autres non, mais tous organisent des événements, de différentes natures, essentiels pour faire communauté.

Une autre caractéristique majeure des Labs réside dans leur dimension expérimentale. Différents dispositifs, qu’il s’agisse d’appels à projets, de hackathons ou autres, conduisent à la création, en coopération entre bibliothécaires et chercheurs, de réalisations qui ne sont pas forcément vouées à durer. On s’autorise l’échec et on multiplie les outils et les compétences diverses pour réussir ces expérimentations sans avoir la pression des longs projets exigeants dont on a davantage l’habitude dans nos institutions.

Plusieurs bibliothèques pilotes en la matière, notamment la British Library et la KB aux Pays-Bas, ont raconté le « voyage » qui les a conduits où ils sont aujourd’hui. On a voyagé sur les routes de Grande-Bretagne avec le premier « roadshow » de nos collègues anglais, ri avec le créateur du premier et très basique site web de la bibliothèque néerlandaise. Et ensuite, on a tenté de mettre en commun nos approches dans un Google Doc gargantuesque qui devrait être transformé en livre dans les mois à venir. Vous pourrez aussi retrouver les vidéos sur la chaîne Youtube du BL Labs prochainement.

Côté BnF, le rapport d’Eleonora Moiraghi sur les besoins des usagers du futur service d’exploration des données propose des pistes de réflexion convergentes avec ces approches. Le carnet de recherche de la BnF relate les différents ateliers organisés dans le cadre du projet Corpus. Et le site API et données propose déjà une vue d’ensemble des données disponibles et des moyens d’y accéder.

Ma folle semaine embarquée dans la recherche

Je ne sais pas trop ce qui s’est passé avec mon agenda, j’ai dû avoir un bug dans la gestion des invitations, mais par un curieux hasard, faisant suite à ma présentation à Berlin en août, je me suis retrouvée à vivre une semaine presque entière immergée dans la problématique de la relation entre bibliothèques et chercheurs, abordée sous  différents angles. J’ai donc en gros raconté cinq fois la même chose en huit jours, ce dont je m’excuse auprès des collègues qui auraient assisté à plusieurs sessions, mais je crois que vous n’êtes pas très nombreux grâce au miracle de la géographie et à celui des silos institutionnels.

Tout a commencé vendredi 13 octobre à Francfort où, à l’occasion de la Foire du livre qui avait la France pour invité d’honneur, le CRL a organisé un symposium sur le thème « New Directions for Libraries, Scholars, and Partnerships: an International Symposium« . Rassemblant des bibliothécaires, surtout américains mais aussi originaires du monde entier, spécialisés dans les études de l’aire géographique romane, le symposium s’intéressait à l’évolution des services que les bibliothèques offrent aux chercheurs. Le terme de service, ici, n’est pas anodin : on évolue vers une logique moins centrée sur les collections et plus tournée vers les divers besoins que les chercheurs expriment : outils, méthodes, accompagnement, expertise, mais aussi numérisation et constitution de corpus numériques, négociation de licences d’accès à des ressources numériques, plans de gestion de données, etc. Le programme faisait une large place à divers exemples de projets mobilisant des technologies numériques et la session de posters était aussi remarquablement riche dans ce domaine.

Sautant dans un train tardif, je suis vite rentrée à Paris pour participer le samedi à la journée d’étude organisée par l’ADEMEC à l’Ecole des chartes, sur le thème « Humanités numériques et données patrimoniales : publics, réseaux, pratiques ». Je ne peux que souligner l’extraordinaire qualité de cette journée qui a été abondamment twittée et dont vous retrouverez le Storify ici et les captations vidéos là. J’en retiendrai tout particulièrement l’intervention conclusive de Paul Bertrand, qui a invité les institutions patrimoniales à inventer une critique externe de la donnée, permettant de la contextualiser et de la qualifier afin qu’elle devienne un objet d’étude et d’analyse maîtrisable et maîtrisé.

Retour à la maison le lundi pour un atelier ouvert que nous organisions avec des collègues du projet Corpus (special thanks to Jean-Philippe et Eleonora) et avec les chercheurs de l’équipe Giranium du CELSA, qui est notre équipe « compagnon » sur le projet cette année. L’atelier avait pour thème « Décrire, transcrire et diffuser un corpus documentaire hétérogène : méthode, formats, outils » et a permis à des équipes de chercheurs issues de différentes disciplines et travaillant sur des périodes  chronologiques parfois lointaines d’échanger sur leurs méthodes de travail communes dans le monde numérique. Nous vous préparons un petit billet de blog pour synthétiser tout cela, à suivre sur le carnet de recherche de la BnF [edit : c’est en ligne !].

Hop hop, je saute à nouveau dans le train pour me rendre à Lille, où se déroule la journée d’études de l’ADBU : « Les bibliothécaires, acteurs de la recherche« . On retrouve nos collègues allemands et hollandais avec leur préoccupation de développer, dans les bibliothèques universitaires, des « services support aux chercheurs » qui vont de l’accompagnement dans l’étape de l’appel à projets jusqu’à la préservation des données de la recherche. Et en France, beaucoup de choses aussi : des bibliothèques qui publient des revues en open access, qui accompagnent les chercheurs dans la constitution des corpus et la qualification des données, qui animent des communautés ou encore produisent des études bibliométriques.

Pendant ce temps, à Paris, le colloque « Humanités numériques et Sciences du texte« , organisé par le DIM Sciences du texte et connaissances nouvelles, avait déjà commencé. Forcément, je n’y étais pas, je n’ai pas encore le don d’ubiquité, mais je les ai rejoints le vendredi pour la dernière journée. En regardant le programme, on perçoit le message que les organisateurs ont tenté de faire passer : l’idée des humanités numériques comme une communauté de pratiques transdiciplinaire, s’exprimant à travers une grande diversité de méthodes et de problématiques. J’ai été entre autres ravie d’entendre Dominique Cardon expliquer en live les théories que j’avais lues avec beaucoup d’intérêt dans son ouvrage À quoi rêvent les algorithmes. Il faudrait que je revienne dessus dans un autre billet parce que là, ce serait un peu long.

Au final, qu’est-ce que je retire à chaud de cette folle semaine ? D’abord, l’évidente actualité de la question des humanités numériques à la fois dans la profession et chez les chercheurs qui sont nos partenaires naturels. Je ne suis pas très fan de ce terme mais j’avoue que pour moi, quelque chose de cohérent commence enfin à se dessiner. Vue de ma fenêtre à la BnF, cette chose peut se résumer de la manière suivante : le concept du « data librarian » tel qu’on l’annonce depuis plusieurs années dans la profession commence à être identifié par les chercheurs comme une ressource. Il y a encore du travail mais petit à petit, notre image change et on est de plus en plus perçus dans notre rôle de « passeurs » autour des collections numériques, parce qu’on connaît leur contenu, leur format, les outils qui permettent de les exploiter, les métadonnées qui permettent de les contextualiser et le retour d’expérience des autres chercheurs avec lesquels on a déjà travaillé. Comment s’empare-t-on de ce rôle de passeurs ? Il y a plusieurs formes : accompagnement, partenariat, service, plateforme, laboratoire… les modalités sont encore à inventer, ce qui nous promet quelques années passionnantes pour le futur.

Disclaimer : il semblerait que quelqu’un qui me connaît bien ait profité de l’un de ces événements pour enrichir ma biographie d’un élément non validé. Alors pour ceux qui se posent la question, non je ne me lance pas dans la rédaction d’une thèse ! Par contre, on m’a parlé récemment d’un dispositif de doctorat sur travaux qui m’intéresse bien et pourrait déboucher sur quelque chose. À suivre…