Petite histoire des classifications

Pour être plus précise, je m’intéresse à trois classifications en particulier : la Dewey, la CDU et la Classification Colon.

En 1876, Melvil Dewey propose la première version de sa classification connue sous le nom de classification décimale de Dewey (CDD ou en anglais DDC). Tout le monde la connaît donc je ne reviendrai pas sur ses principes. Révisée 22 fois, elle est encore très largement utilisée aujourd’hui. Pourquoi ? Essentiellement parce qu’elle est pratique, le cheval de bataille de Melvil étant la simplicité (pour la petite histoire, il s’intéressait aussi à la simplification de l’orthographe – un précurseur du langage SMS…) et son but, donner un moyen de ranger les livres. La Dewey est aujourd’hui jalousement administrée par l’OCLC.
La Dewey est une classification hiérarchique, ce qui n’est pas révolutionnaire même à l’époque ; ce qui est nouveau c’est la notation c’est à dire le fait d’utiliser des décimales pour représenter les différentes classes et sous-classes. Si on augmente le nombre de chiffres, on avance dans la précision de l’indexation. Néanmoins, une utilisation logique dans un but de rangement voudrait qu’on applique la Dewey de manière simple (ce qui n’est pas toujours possible, en fait).

En 1905, les belges Paul Otlet et Henri Lafontaine proposent une première version d’une classification adaptée à partir de celle de Dewey, qu’ils ont conçue dans un objectif modeste : faire un catalogue sur fiches de tous les ouvrages publiés depuis l’invention de l’imprimerie, y compris les articles, la littérature grise et les brevets. Une utopie qui a de beaux jours devant elle, puisqu’on la retrouve aujourd’hui dans les portails documentaires et chez certains moteurs de recherche qui se targuent d’organiser l’information du monde. Le Manuel du répertoire bibliographique universel qui résulte de leur projet est donc, à l’origine, assez proche de la Dewey.
C’est dans sa deuxième édition, entre 1927 et 1933, que cette classification prend le nom de Classification décimale Universelle ou CDU (toujours autant de modestie). Et qu’elle marque sa différence en utilisant, à la place des enchaînements numériques simples de la Dewey, deux nouveaux types de combinaison des éléments : l’extension (barre oblique) et la relation (deux points). L’extension signifie qu’on comprend toutes les notions comprises entre les deux éléments séparés par la barre oblique. Le signe de relation au contraire introduit un rapport entre les deux notions qu’il sépare.
On aboutit à un système complexe qui permet de mieux décrire le contenu des documents, surtout dans un contexte de bibliothèque spécialisée où l’on a la possibilité d’utiliser des classes spécifiques et très détaillées, décrites séparément.

C’est en 1924 qu’un bibliothécaire indien, Ranganathan, qui était aussi mathématicien, essaye de dépasser cette notion de classification décimale hiérarchique en proposant un nouveau concept : les classifications à facettes.
Pour faire très court, on a des facettes principales qui correspondent à des concepts de base. Pour décrire un document, le concept choisi est ensuite décliné en 5 facettes :

  • la Personnalité : l’objet principal du document
  • l’Energie : l’opération subie par l’objet (on pourrait parler d’action)
  • la Matière : une substance ou une propriété
  • l’eSpace : couverture géographique
  • le Temps : la période chronologique.

L’enchaînement de ces facettes est dit : PMEST. On a ainsi des grands concepts (l’Agriculture, la Médecine) qui se déclinent chacun en listes prédéterminées d’objets, d’actions, et de propriétés. L’espace et le temps sont communs à tous les concepts. De nouveaux concepts peuvent être ajoutés, ce qui limite l’obsolescence de la classification.
Le faît d’enchaîner les propriétés toujours dans le même ordre permet d’aboutir à une notation homogène qu’on va utiliser pour ranger les livres. La notation utilise en outre des lettres, des chiffres, des caractères grecs et différents signes de ponctuation, qui lui donnent son nom de Classification Colon.

Que peut-on retenir de ce rapide résumé ?
Tout d’abord, on observe que toute classification se constitue d’une organisation de la connaissance, et d’une notation de cette organisation. Pour rapprocher cela de notre jargon actuel, on a un modèle, et un format pour représenter le modèle.
Plus le modèle est simple, plus il est efficace pour remplir son but premier : la "mise en espace", ranger des livres. Dans un but pratique (le libre accès) on va donc privilégier un modèle médiocre avec une notation simple à un modèle performant avec une notation complexe. La tendance à utiliser les classifications et leurs notations pour décrire précisément et complètement le contenu d’un livre ont cependant conduit, surtout en Europe, à adopter les notations plus complexes en sacrifiant parfois le côté pratique et la mise en espace.
La classification à facettes de Ranganathan invente un concept original avec le système des facettes : des facettes principales pour se placer dans le contexte d’un concept, puis les facettes PMEST pour détailler ce concept. Mais c’est l’obligation d’avoir une notation fixe, pour permettre la mise en espace, qui bloque Ranganathan au final dans un modèle et une notation tout aussi complexes que la CDU, et même pires.
Plus tard, d’autres outils deviennent disponibles pour l’indexation du sujet des documents : les thésaurus. Ceux-ci sont hiérarchiques, comme les classifications décimales, mais leur seul but est l’indexation et ils se débarrassent de la contrainte de la mise en espace.

J’espère déduire de tout ça quelques idées intéressantes sur les ontologies, les taxonomies et les classifications à facettes.

Pour une fois, j’ai pris mes sources dans des vrais livres en papier : la 21e édition abbrégée de la Dewey en français par Annie Bethery (la 22e vient de sortir, mais je ne l’avais pas sous la main), la 6e édition de la CDU, et cet article un peu daté mais intéressant.

Pêle-mêle dans les cartons

Comme vous avez pu le remarquer, je ne suis pas très disponible en ce moment : c’est les vacances, je déménage, dans mon nouvel appartement je n’ai qu’une connexion RTC… et en plus mon hébergeur a des soucis avec ses bases MySQL. Bref, je fais de mon mieux, mais on a l’impression que je délaisse un peu le Figoblog ces derniers temps. Et c’est pas faux.

Sur le principe du carton dans lequel on fourre pêle-mêle, dans l’urgence, tout ce qu’on veut emporter en se disant qu’on fera le tri plus tard, voici donc ce que je peux vous proposer :

  • naissance de Digital Medievalist, une revue d’histoire médiévale en open access (le pendant anglo-saxon de notre médiéviste et l’ordinateur je présume)
  • la TEI a maintenant son wiki, un cadre collaboratif pour annoncer, travailler, partager ses feuilles de styles… un peu vide pour l’instant mais qui sait
  • une webographie sur la couleur pour bien assortir son site Web, à compléter chez les z’ed et chez Lithium. (Pour l’heure c’est plutôt les couleurs de mon salon qui me préoccupent, mais ça peut peut-être marcher aussi ;-)

Je recommande aussi la lecture d’un article sur le rôle des DRM dans l’open access : vous savez, les DRM, ces affreux trucs qui empêchent de faire ce qu’on veut avec les documents. Alors, peuvent-ils avoir une utilité pour le libre accès ? Aussi étrange que ça puisse paraître, la réponse est bien sûr : oui ! Car gérer automatiquement des droits d’accès, ce n’est pas seulement prendre des mesures de protection techniques commerciales. Cela peut aussi être encoder en RDF une licence Creative Commons qui permet de dire aux machines du monde entier qu’on garantit le libre accès à ce qu’on écrit. Et par exemple, de rechercher ces contenus libres avec Yahoo.

Merci à Peter Scott et à Peter Suber. Durée estimée des cartons pêle-mêle : au moins jusqu’à la fin des vacances scolaires…

Histoire libre

Should Historical Scholarship Be Free? Tel est le titre d’un article que l’on peut lire sur le site de l’Association des historiens américains. Comme on peut l’imaginer, il s’agit de débattre de l’opportunité et de la faisabilité d’appliquer les concepts de l’open access, bien connu en sciences dites dures, aux sciences historiques.

L’auteur de l’article brosse un panorama général accessible pour des gens qui n’auraient (presque) jamais entendu parler de l’Open access. Il termine par une liste de possibilités, incluant celle de faire participer les bibliothèques.

J’ai commencé par me dire, ah mon dieu, encore quelqu’un qui pense que les bibliothèques devraient faire de l’édition. Que nenni : les auteurs sont bien placés pour savoir à qui ils veulent confier leur travail pour le publier (à des éditeurs bien sûr). L’idée est donc tout autre : proposer aux bibliothèques de participer, à la fois financièrement (à la place de payer des abonnements), et par un effort d’archivage pérenne, à la conservation et la diffusion des journaux électroniques. Et en échange de ce service, les offrir en libre accès.

Evidemment, les bibliothécaires savent aussi faire du signalement, comme le montre cette page sur le site de l’Amercian Libraries Association, consacrée à l’histoire médiévale.

Merci à Open Access News et à ResourceShelf.

Un peu d’histoire

Que ferait-on aujourd’hui sans le Web, on se le demande. Ca fait bizarre de se dire qu’en si peu de temps, il a pris une telle importance dans notre vie aussi bien personnelle que professionnelle.

Et pourtant, il y avait bien un univers "en ligne" avant le Web et même avant l’Internet, et les bibliothécaires en faisaient partie. On retrouve dans Searcher une série de témoignages à travers 8 articles intitulés : Online before the Internet. Ce qui nous rappelle un temps où "être en ligne", c’était interroger Medline avec Dialog (j’ai encore appris ça à l’enssib ce qui prouve peut-être que je ne suis pas aussi jeune que j’en ai l’air ;-) et même avant Dialog (c’est loin).

Et puis naquit le Web, et il fallut bien trouver un moyen de savoir ce qu’il y avait dedans. C’est ce que nous relate cette petite histoire des moteurs de recherche, depuis l’avant-robots en 1990 jusqu’à la naissance de Google en 1998. Eh oui, c’était hier…

Merci à ResourceShelf et à Totem.

La photo : toujours Tolède, dans le cloître du monastère San Juan de los Reyes.

Histoire du livre

Le début de mes pérégrinations estivales m’ayant entraînée vers le sud, j’y ai découvert quelques ressources qui pourraient intéresser les "techie historiens du livre" en admettant que cette catégorie existe.

Bibla Sacra est un site consacré aux Bibles publiées à l’époque moderne aux Pays-Bas. C’est en fait une "bibliographie électronique" qui vise à donner un maximum d’informations sur ces Bibles (jusqu’en 1553 pour l’instant). A noter, pas mal de valeur ajoutée pour l’histoire du livre et de belles images numérisées (notamment des gravures sur bois).

La Bayersiche Staatsbibliothek mettra en ligne en août son catalogue d’incunables, un catalogue très détaillé concernant plus de 10000 éditions, une référence.

Et maintenant, le Figoblog est en vacances, pas de blogging avant la semaine prochaine et peut-être au-delà !