L’information n’est pas connaissance

Quand on fait une recherche dans Google.com, en la faisant précéder par exemple du mot "books", on se voit maintenant proposer l’accès à des références issues de google print, une à trois en général.
Si on clique sur la référence en question, on arrive sur une page de consultation d’un livre, avec au centre, la page où se trouvent les mots cherchés, surlignés en jaune, avec la possibilité d’avancer ou de reculer de trois pages. A gauche, on voit la couverture du bouquin et quelques liens qui permettent de relancer une recherche dans l’ouvrage ou d’aller sur Amazon et dans quelques autres librairies.

Google’s mission is to organize the world’s information

(la mission de google est d’organiser l’information du monde) nous dit-on sur la page de présentation de Google print. Et c’est bien de cela qu’il s’agit, en effet.
Cette recherche plein texte, lancée sur des pages et des pages de livres numérisés, nous permet de faire sortir du lot au maximum trois résultats, quelle que soit la requête. La consultation des mots trouvés donne accès à un ensemble qui fait au maximum six pages.
Somme-toute, qu’a-t-on obtenu par cette requête ? Dans le meilleur des cas, l’information que ces mots figurent dans un ouvrage que vous pouvez par ailleurs acheter. Je vous souhaite de ne pas vous intéresser aux figues (figs) car Google choisira pour vous, au hasard (???), trois livres qui contiennent selon toute vraisemblance des illustrations (figures, abrégé "figs"…)

Il faut relire Borgès et sa fameuse Bibliothèque de Babel, composée de livres tous identiques (410 pages, quarante lignes par page) qui constituent toutes les combinaisons possibles de caractères des 25 alphabets connus. Cette bibliothèque qui contient virtuellement tous les livres possibles, et parmi eux, probablement, le catalogue de la bibliothèque, les hommes cherchent à la comprendre et à y découvrir les phrases qui ont un sens, car

pour une ligne raisonnable, pour un renseignement exact, il y a des lieues et des lieues de cacophonies insensées, de galimatias et d’incohérences.

La bibliothèque de Babel, elle est « éclairée, solitaire, infinie, parfaitement immobile, armée de volumes précieux, inutile, incorruptible, secrète ». Destinée à survivre à la fin de l’humanité, elle brille par son immensité, sa perfection, et son absurdité.

Tout ça pour dire qu’une bibliothèque (qu’elle soit numérique ou non) n’est pas seulement un lieu où on entasse de l’information pour lancer des recherches dessus. Les deux outils essentiels de la bibliothéconomie, que sont la politique documentaire et la classification, permettent de mettre chaque ouvrage dans un contexte particulier. Dans une bibliothèque, un livre ne peut pas être compris s’il est isolé. Par exemple, la présence de Mein Kampf n’a pas le même sens dans la bibliothèque municipale de Vitrolles au rayon "société" que dans une bibliothèque spécialisée dans l’histoire du XXe siècle au rayon "idéologies" (l’exemple est un peu extrême, et bien sûr fictif, mais assez parlant).
La mise en contexte des ouvrages, dans une bibliothèque, est donc essentielle. Cela signifie que l’on ne s’intéresse pas à un livre parce qu’il contient certains mots, mais parce qu’il contient des idées, une argumentation, une analyse, et parce que cette analyse s’articule avec d’autres livres, qui la coroborrent, la contredisent, l’analysent à son tour.

La mission des bibliothèques n’est pas d’organiser l’information, elle est d’organiser la connaissance : celle qui est produite par les auteurs. Et l’organisation de la connaissance permet de donner du sens à la collection, qui elle-même génère à son tour, par l’intermédiaire des chercheurs qui l’utilisent, de la connaissance.

Je terminerai par une citation de T.S. Eliot (Choruses from the Rock, 1934) :

Where is the wisdom we have lost in knowledge?

Where is the knowledge we have lost in information?

Où est passée la sagesse que nous avons perdue dans la connaissance ? Où est passée la connaissance que nous avons perdue dans l’information ?
L’Internet de demain sera-t-il la bibliothèque de Babel ?

Mise à jour :

Vous avez vu ça, chez Libé ils sont d’accord avec moi :

3 réflexions sur “L’information n’est pas connaissance

  1. En réponse combinée aux 603 et 594 :
    Prélable : Si ma femme pose pour moi, portraitiste du dimanche, en un sens, je peins ma femme, et, en un autre sens, je peux peindre : la mère de mes enfants, la fille de ma belle-mère, la maîtresse de mon voisin, l’Eternel féminin, la contingence du monde ou encore la mélancolie…
    Là où je veux en venir : quand on numérise un bouquin, en un sens, c’est forcément un exemplaire singulier(item) qu’on numérise. Mais, en un autre sens, ce peut être aussi la manifestation (édition), l’expression (le texte) voire l’oeuvre. Par exemple, Gallica numérise en général les manifestations. Google entend numériser les expressions. Et Ammazon.com numérise les deux (ce qui montre qu’il n’y a pas toujours dilemme). Dans le cas d’un manuscrit, on numérise l’item (et le reste, expression et manif, par surcroît). Dans le cas des brouillons d’un texte (genèse), il faut essayer de numériser l’oeuvre (numériser l’oeuvre, est-ce seulement numériser l’ensemble de ses expressions ? pas sûr). C’est aussi le cas pour les traditions orales.
    Voilà au moins quatre cibles possibles pour l’opération de numérisation. La pertinence de la cible retenue dépend de l’oeuvre en question, mais surtout des objectifs et des utilisateurs.
    Je comprends l’argument selon lequel le mode image (ie, pour moi, la numérisation des manifestations) fournit un contexte. Pour ma part, n’étant ni historien ni relativiste (ni historiciste pour être précis et cuistre un peu plus encore), je suis en manque d’expressions (de textes) et non de manifestations. Je consulte des bouquins, non pas pour imaginer ou déduire son environnement historique, mais en tirer un peu de profit conceptuel ou esthétique. Certes, la connaissance du contexte permet souvent d’augmenter ce petit profit, mais, à moins de devenir historien de l’imprimé, ce n’est pas l’édition en mode image qui va m’y aider, mais un autre texte, un commentaire, une préface, un apparat critique (bref une autre expression, à numérise aussi siouplaît).
    Bilan en forme d’inquiétude : ce n’est quand même pas pour les historiens qu’on thésaurise du patrimoine ? pas seulement ? (variante nz : ce n’est quand même pas que pour les anthropologues blancs qu’on conserve des traces maories…?)

  2. Voilà bien longtemps que je m’étais promis de répondre à ce billet.
    Je suis bien d’accord avec toi sur le lien entre information et connaissance, mais il est, à mon avis, nécessaire de créer des liens plus riches entre les informations (notamment grâce aux métadonnées, mais aussi au travers d’ontologies correctement structurées et instanciées) pour faire émerger des connaissances plus précises : la masse d’information et sa connection fait émerger la connaissance. La difficulté reste évidemment de trouver le juste milieu entre imprécision et surcharge d’information…
    Et je pense que c’est là que se trouve la limite des bibliothèques physiques : la contextualisation des ouvrages y est trop limitée. Si l’on reprend ton exemple sur Mein Kampf, la connaissance se situe à mon avis dans la corrélation d’informations beaucoup plus nombreuses que sa catégorisation : c’est un ouvrage idéologique, certes, mais il parait intéressant de connaitre les liens qu’il a avec le IIIeme Reich, la 2nde Guerre Mondiale, les camps de concentration, etc. C’est ce qui rend cet ouvrage si notable (et non pas anodin).
    Bref, longue vie aux technologies de l’information et à l’utilisation qu’en feront (et font déjà) les bibliothécaires. Et qui sait, peut-être qu’un jour Google me sortira-t-il la manière de choisir les figues sur l’arbre (vive les heuristiques) pour réussir au mieux la recette de confiture qu’il me donne en résultat…

Les commentaires sont fermés.