Bon, je ne reviendrai pas sur cette annonce qu’on a vu mille fois depuis hier : Google a lancé un projet en partenariat avec des bibliothèques américaines, notamment Harvard et Stanford, pour numériser leurs livres.
Je voudrais juste soulever quelques réflexions et questions, glanées de ça de là sur le Web et ailleurs, concernant cet étonnant projet.
La question des droits d’auteur. Les gens des métiers du livre, en entandant cette annonce, s’inquiètent aussitôt du respect de leurs droits quant à la diffusion de ces livres sur le Web. Pas d’inquiétude : Google se contente de les indexer et de les chercher, mais on ne pourra en voir que de petites portions, voire rien du tout. En ce qui me concerne, mon inquiétude est contraire. Google est un acteur commercial et il se protège de la complexité des droits d’auteurs par une politique restrictive, soit. Mais ces fonds appartiennent à des bibliothèques ; ils sont publics ; elles auraient pu choisir de les mettre en libre accès sur le Web. La délégation de la numérisation change le modèle naturel de communication sur le Web des bibliothèques, et ça m’inquiète.
La délégation. Justement, à propos de la délégation, Hubert a raison de se demander quelles seront les modalités de cette délégation. Qu’une bibliothèque accepte lorsqu’on lui offre sur un plateau l’utopie de la reproduction absolue, je peux le comprendre. Mais il faudrait encore qu’elle ne se retrouve pas ensuite, comme c’est parfois le cas aujourd’hui avec les microfilms, obligée de payer pour disposer de ses propres collections.
Le côté obscur de la force. Ce côté obscur, ce n’est pas seulement la situation de monopole, mais aussi le manque de transparence. Le Web est un espace de chaos et la méthode de Google est sans doute la meilleure pour l’appréhender. Mais indexer pêle-mêle en plein texte des millions de livres, c’est vouloir appliquer le chaos à un matériau par nature structuré. C’est aussi nier les "épaules des géants" revendiquées par GoogleScholar, et le travail fait par les bibliothèques numériques pour essayer de donner à leurs lecteurs des contenus plus structurés, plus accessibles, plus fonctionnels. La transparence, c’est aussi garantir au lecteur l’origine de ce qu’il consulte, lui offrir la traçabilité, le contexte, et la fidélité à l’original qui n’est possible qu’avec le mode image. Numériser, ce n’est pas éditer : numériser impose de respecter l’histoire du matériau, parce qu’elle fait partie de sa compréhension de manière intrinsèque. Je suis curieuse de savoir ce que Google répondra à cela.
Le chaos et la science. Je ne vois pas comment les chercheurs pourront se passer de cette transparence et de cette mise en contexte. Je ne vois pas non plus comment la méthode du chaos peut entrer en adéquation avec un monde scientifique de plus en plus spécialisé. Quand la sérendipité augmente, la précision diminue. Et puis, finalement, la recherche plein-texte sans la consultation, c’est comme de donner les clefs des magasins à un lecteur, puis lui interdire d’allumer la lumière.
Le débat est ouvert.