J’ai entendu il y a peu l’assertion suivante : le mauvais chercheur est celui qui sait ce qu’il va trouver. Or, dans le domaine du numérique, il est de plus en plus difficile de chercher au hasard : si on traduit cela en termes bibliothéconomiques, on pourrait se demander s’il faut savoir ce qu’on cherche pour avoir une chance de le trouver.
Dans la vénérable institution où j’ai été formée, on m’a appris à ne jurer que par le dépouillement systématique, et que seuls les cancres rédigent leur bibliographie en interrogeant les catalogues de bibliothèque par sujet. Avec l’expérience, j’ai appris à nuancer largement cette façon de penser, mais je continue de croire que dans certains cas, le dépouillement est la seule approche possible, non seulement dans les archives, mais aussi dans les bibliothèques. Parfois, c’est "l’âme de fonds" qui prime, même s’il ne s’agit pas d’un fonds à proprement parler : la collection, la façon dont elle s’est constituée, et son organisation sont les meilleurs atouts pour trouver les documents.
Les collections de manuscrits, dans les bibliothèques, sont de bons exemples. Les catalogues de manuscrits de la BnF (dont on peut consulter une version numérique ici) présentent une organisation systématique qui reflète l’entrée des documents dans la collection et qui est compliquée à appréhender. Si je vous parle des manuscrits français n° 20065-22884, cela n’est pas très évocateur. Pourtant, le catalogue qui les décrit est essentiel pour l’histoire du livre, car ces volumes contiennent les privilèges de librairie de l’époque moderne. Pour savoir cela, seules trois méthodes sont possibles : soit dépouiller systématiquement les catalogues de manuscrits de la BnF (bon courage !), soit dépouiller les index et les tables de ces catalogues, soit glaner cette information chez un autre historien (tâche qui sera peut-être facilitée désormais grâce au Figoblog et à Google ;-).
Un autre exemple, encore plus parlant, est celui de la recherche d’images. Dans un ouvrage récemment publié par le Getty sous le titre Introduction to Art Image Access (librement accessible en ligne), on peut lire d’intéressantes idées sur la façon dont on créée et on utilise les accès sujet quand on catalogue des images. Suivant la définition de l’historien de l’art Panofsky (Essais d’iconologie : thèmes humanistes dans l’art de la Renaissance, Paris : Gallimard, 1967) il y a trois niveaux possibles de description, qui sont, du plus objectif au plus subjectif :
- la description : par exemple, une femme avec un bébé dans les bras
- l’identification : par exemple, une Vierge à l’Enfant
- l’interprétation : par exemple… ben non justement.
On ne peut pas prévoir toutes les interprétations possibles d’une image, même en faisant un gros effort pour se mettre à la place du chercheur. Ces interprétations sont innombrables, et elles peuvent changer dans le temps.
Alors, comment faire pour que les bons chercheurs n’en viennent pas à se distinguer par leur capacité à imaginer un maximum de mots-clef différents, plutôt que par leur travail ?
Pour moi, la solution se décline en trois :
- inventer des interfaces pratiques qui permettent de parcourir, de butiner l’ensemble de la collection, ou au moins des ensembles significatifs, de préférence sous forme numérisée, sinon sous forme de descriptions bibliographiques
- indexer les notices en plein texte (donc s’affranchir de la syntaxe pour la présentation des descripteurs) et s’appuyer sur des thésaurus modélisés pour le Web sous forme d’ontologies avec des relations
- et enfin, laisser l’interprétation aux chercheurs eux-mêmes en leur donnant la possibilité de rattacher leur propre analyse (subjective) de l’image à celle (objective) que fournit la bibliothèque.
Tout ceci nous permet également de contourner le problème de la masse, qui interdit le plus souvent un catalogage détaillé à la pièce. L’enjeu est de trouver un équilibre entre classification, indexation et participation… et de numériser, bien sûr.
Merci à Ten Thousand Years Blog.
Une liste des ouvrages libres de droit (avant 1865) en Google Print j’ai trouvé. On doit avoir un « proxy US » pour voir livres 1865-1923. Voir aussi: http://wiki.netbib.de/coma/GooglePrint
Mémoires de Michel de Marolles, abbé de Villeloin, 1755
Baluze: Histoire des capitulaires des rois françois, 1779
Mémoires secrets pour servir a l’histoire de la dernière année du règne de Louis XVI, 1797
Dumas: Histoire de la Vie Politique Et Privée de Louis-Philippe (aus Harvard)
Le Gouvernement de Louis XIV: Ou, La Cour, L’administration, Les Finances Et Le Commerce
Choix de Mazarinades (aus Harvard)
Oeuvres complètes de Mathurin Régnier
Tristan Le Voyageur: Ou La France Au XIVe Siècle
Histoire de France: Depuis Pharamond Jusqu’à la Vingt-cinquième Année
Histoire du Bouddha Sakya Mouni
Droz: Histoire du règne de Louis XVI
Histoire de la Commune de Montpellier
Histoire des grands Capitaines de la France
La Revolte Du Conte de Warwick Contre Le Roi Edward IV
Les manuscrits françois de la Bibliothèque du roi
Mémoires von Henriette Louise von Waldner Oberkirch
Mémoires historiques et militaires sur Carnot
Mémoires sur la dernière guerre de Catalogne
Réfutations des mémoires du maréchal Marmont, duc de Raguse
Annales françaises: depuis le commencement du règne de Louis XVI
Annales dramatiques: ou, Dictionnaire général
Réimpression de l’ancien Moniteur: depuis la réunion des États-généraux
Histoire physique, civile et morale de Paris
Chronicque de la traïson et mort de Richart Deux roy Dengleterre
Chronique de la Pucelle: ou, Chronique de Cousinot
Histoire de la politique extérieure du gouvernement français, 1830-1848