Edition électronique de textes

J’ai vu passer sur Catalogablog et DigitizationBlog une info sur le site Electronic Textual Editing du TEI consortium, et bien que je ne sache pas trop quoi faire de cette info, j’ai décidé de la ranger ici.

En fait, si j’ai bien compris, il s’agit d’un livre en préparation qui regroupe des articles sur l’utilisation de la TEI. Comme ces gens-là font les choses bien, ils ont préparé le livre en TEI et ils ont mis les articles en ligne.

Ca a l’air intéressant, il y a diverses choses médiévalisantes qui devraient faire plaisir à mon geek s’il ne les connaît pas encore, et aussi des choses sur la façon d’utiliser la TEI : par exemple un article sur les niveaux de transcription qui s’intéresse à la "profondeur" du balisage.

Si vous voulez en savoir plus sur la TEI, vous pouvez rendre visite à Blogokat. Si vous voulez savoir à quoi peut servir la TEI en bibliothèque – où s’arrête la numérisation, où commence l’édition – lisez ça.

Contrôle qualité pour l’EAD

Si vous produisez des descriptions en EAD, vous pouvez être intéressés par le nouvel outil proposé par RLG : le EAD Report Card. Cet outil se donne pour objectif de vérifier la qualité des fichers EAD, avec pour critère la conformance avec les recommandations de RLG : EAD best practice guidelines.

Ces guidelines, émises en 2002, avaient pour objectif d’améliorer l’interopérabilité des descriptions en EAD par la désignation d’un "coeur" (core data elements) qui permette de définir un niveau basique d’uniformité entre les différentes applications possibles de la DTD.

L’outil proposé par RLG permet de vérifier la conformité avec ces recommandations à deux niveaux : seulement les éméments obligatoires, ou tous les éléments. Il s’utilise en ligne mais une version téléchargeable, capable de traiter des gros fichiers, est prévue.

Spécifier la qualité des spécifications de qualité

C’est bon de savoir dans les pires moments de la vie que le W3C est là, qu’il pense à nous et qu’il s’occupe de spécifier des normes belles, ouvertes, accessibles à tous et de qualité.

Le W3C pense même à donner des spécifications pour savoir comment faire de bonnes spécifications : c’est le QA Framework: Specification Guidelines.

Les gens qui font des normes et des standards ont intérêt à feuilleter ce document. C’est Karl qui le dit.

Et on a jusqu’au 28 janvier pour lui dire ce qu’on en pense.

Geeks et normalisation

Comme les bibliothécaires, les geeks (au moins certains) aiment bien les normes. Seulement, ils ont un peu plus de mal à les faire passer à leur communauté.

Premièrement, parce qu’au lieu de s’appeler "normes" (genre : faites ça, sinon z’êtes morts), souvent elles s’intitulent "recommandations" (genre : faites comme vous voulez, mais comme ça c’est mieux.)

Deuxièmement, parce qu’elles n’ont pas, comme les normes bibliothéconomiques, un public qui pense a priori que les normes sont indispensables à la vie et qu’agir en défi des normes, c’est être la risée de ses collègues. Elles ont un public qui a du mal à cerner ce qu’elles sont, et à quoi elles servent.

Enfin, les normes des geeks ne font pas la joie des acteurs commerciaux de ce milieu (probablement parce qu’elles n’ont pas cette étonnante faculté de se démultiplier à l’infini pour empêcher l’intéropérabilité). En effet, l’intéropérabilité, ça n’aide pas à fidéliser le client (demandez ce qu’il en pense à votre fournisseur de SIGB).

Tout ceci est un tableau très, trop vite brossé, un peu caricatural sans doute. Pour plus de précision, suivre les réflexions de Karl : il s’est promis de répondre à 16 questions qu’on lui a posées sur le sujet, par 16 billets au thème tous plus passionnants les uns que les autres. Au programme entre autres, est-ce que les normes c’est la vraie vie, les normes sont-elles parfaites, etc.

Retrouvez toute la documentation des geeks sur Mandragor, et merci à Niko pour ce dernier lien.

Blogs et validation

Je suis tombée un peu par hasard sur le site d’un certain Joe Clark : Weblogs & ISSN. Son but dans la vie (du moins sur ce site) est de militer pour que les blogs puissent obtenir des ISSN.

Dans son plaidoyer sur la compatibilité entre blogs et numéros ISSN, il hésite entre couvrir les bibliothécaires de fleurs, et leur jeter la pierre pour leur manque de connaissance des blogs et leur mépris à l’égard du Web :

librarians seem to think reading Web sites about Weblogs is beneath them…

Très bien, mais au fait, un ISSN pour un blog, pour quoi faire ? En fait, la clef du problème semble être la validation de l’information :

With an ISSN, your Weblog indisputably qualifies as a serial or periodical, putting you in the same category as Stern and the New Yorker (and Hustler, of course).

Pour ma part, je ne suis pas certaine qu’un numéro puisse m’aider à convaincre les gens de la qualité extraordinaire de ma recette de confiture de figues.

Modèles conceptuels : à quoi ça sert ?

Modéliser les métadonnées, décrire d’une manière abstraite et conceptuelle un cadre dégagé des contraintes des formats et des langages pour créer la description universelle, tel est le défi un peu fou que se sont lancé, aux antipodes l’un de l’autre, les FRBR et le RDF. Les unes émanent de l’IFLA, l’autre du W3C, c’est dire si leur raison d’être est différente, liée pour les unes à la famille Marc, pour l’autre à XML.

Mais en fait, rien ne nous empêche de décrire une ressource Web suivant le modèle des FRBR. Et rien ne nous interdit d’utiliser RDF pour encoder les métadonnées d’un livre.

Alors, ces modèles conceptuels de métadonnées, concrètement, quand va-t-on les utiliser, et à quoi vont-ils nous servir ? Voici deux exemples d’outils-démo qui peuvent nous aider à en avoir une idée :

  • Fictionfinder est un outil créé par OCLC pour naviguer dans des notices de fiction. On peut y suivre les différentes manifestations d’un récit, les traductions d’une oeuvre ou encore les apparitions d’un personnage dans différents romans.
  • Sesame est une base de données d’interrogation de métadonnées en RDF basée sur un logiciel open source. La démo museum donne une idée de la modélisation en RDF de ressources muséographiques signalées sur Internet, et de la manière d’y naviguer en suivant les métadonnées en RDF. Tout en testant les différents langages d’interrogation existants.

Et pour ceux qui se sentent vraiment trop perdus dans la jungle souterraine des modèles et formats de métadonnées, un conseil : prenez le métro !!!