IFLA (2) – La valeur des données

Comme dans toute conférence internationale, la valeur ajoutée de l’IFLA se situe souvent autant dans les conversations informelles, à la terrasse des cafés, que dans les conférences elles-mêmes.

Parmi les différents points abordés aussi bien de façon formelle qu’informelle, au cours de la conférence satellite à Florence et des premières rencontres qui ont eu lieu dans le cadre du congrès de l’IFLA lui-même, Je vais être obligée de choisir bien arbitrairement ceux que je vais développer, parmi bien d’autres sujets tout aussi intéressants.

Le premier que je vous propose dans cette série concerne la valeur des données.

L’une des questions qui se posent lorsqu’on parle de linked data, ou même simplement d’open data, c’est la question de la valeur. Souvent posée en termes de popriété juridique (licensing), elle témoigne d’une crainte, diagnostiquée comme étant celle des décideurs, que les données soient « volées », « aspirées », ou autrement indument exploitées.
L’analyse généralement partagée ici, plutôt à un niveau perçu comme opérationnel ou technique, est qu’il faut dépasser cette vision héritée du monde des biens physiques et ouvrir les données, faciliter leur réutilisation, aussi bien techniquement que juridiquement. Je parle ici des données produites par la bibliothèque, pas des contenus qui pourraient être couverts par des droits de propriété intellectuelle. Mais en ce qui concerne les contenus, existe également la préoccupation que ce qui est dans le domaine public reste dans le domaine public, et ne fasse pas l’objet d’une nouvelle protection, par les institutions, à l’occasion de la numérisation. Je ne développerai pas davantage sur ce point, et vous renvoie à S.i.lex qui couvre remarquablement tous ces sujets.

Personnellement, ce qui m’intéresse davantage, c’est une approche complémentaire qui consiste à dire qu’un véritable changement de paradigme est nécessaire et qu’il doit porter non seulement sur l’ouverture des données, mais aussi sur la façon de mesurer leur valeur. Les indicateurs portant sur les collections (nombre d’items…) et sur les utilisateurs (nombre de visites/lecteurs) devraient être remplacés par des indicateurs qualitatifs et quantitatifs permettant de mesurer la valeur des données ouvertes : nombre de réutilisations dans différents contextes, nombre de liens, etc.
Cette question de la valeur (et du changement de paradigme) est abordée dans la communication sur l’API d’Europeana que j’ai traduite en français.

Puisqu’on parle de valeur, il se trouve que justement j’ai assisté ce matin à la session sur les statistiques dans laquelle je présentais un article sur les archives du Web (très largement rédigé par Gildas Illien). Dans cette session il était justement question d’évaluation et différentes méthodes et cas d’utilisation ont été présentées.
J’ai été assez frappée notamment par le projet NUMERIC, un projet européen présenté par Roswitha Poll, qui porte sur l’évaluation de la numérisation au niveau européen. C’est surtout la méthodologie qui m’intéresse ici.
L’évaluation continue par des indicateurs fournis régulièrement (type nombre de documents / notices / lecteurs etc.) n’est pas la seule méthode d’évaluation. Lorsqu’on essaye de couvrir un territoire ou une activité qui est au-delà des frontières d’une institution, l’évaluation par questionnaire peut être plus pertinente. Elle permet de réunir des informations sur les pratiques de diverses institutions, de les recouper et de donner une image à un niveau global (national ou européen) de l’impact d’une activité. Evidemment cette image n’est pas continue dans le temps, elle constitue une vision à un moment donné, et elle porte souvent sur un échantillon, plus ou moins représentatif, de données. Mais cela reste une approche essentielle qui permet de toucher du doigt certaines réalités ordinairement difficile à saisir.
C’est probablement ce type d’évaluations et d’indicateurs qui nous seraient utiles pour mesurer l’impact national et international des données ouvertes et leur valeur d’usage.

2 réactions sur “IFLA (2) – La valeur des données”

Geoff dit :

26/08/2009 à 03:55

Le problème avec le web, c’est que ca va tellement vite, que l’étude réalisée aujourd’hui, est déjà obscolète demain. On ne peut pas prevoir l’éfficacité d’une communication, et c’est la principale crainte des clients. casino en ligne
hubertguillaud dit :

27/08/2009 à 05:10

Oui, Manue. Reste que l’ouverture des données, ne va pas de soit pour les gens comme pour les institutions. Et ce ne sont pas seulement des questions de droits ou de vie privée (centrales), mais aussi des questions de conception (politique ?) et de valeurs (des données elles-mêmes) comme tu le dis bien. Si les données sont le capital de demain comme l’explique O’Reilly, il sera difficile de dire qu’il faut les libérer…

La difficulté réside certainement dans le fait de montrer qu’il n’y aura pas de données marchandes s’il n’y a pas de données non-marchandes. Il y a aussi des questions à poser aux systèmes socio-techniques mis en places, qui génèrent de la données privées alors qu’elles pourraient être publiques. Je pense qu’il serait vraiment nécessaire de fouiller plus avant ces questions de libération de données et les blocages que cela induit.

Les commentaires sont fermés.

Figoblog

Un blog sur Internet, la bibliothéconomie et la confiture de figues

IFLA (2) – La valeur des données

2 réactions sur “IFLA (2) – La valeur des données”