"HCR" pourrait vouloir dire "human character recognition", eh oui, je vous présente aujourd'hui un projet révolutionnaire qui permet de faire de la reconnaissance automatique de caractères en utilisant... des gens.
Le projet reCAPTCHA est tout à fait emblématique du pragmatisme à l'américaine qui caractérise des projets comme Internet Archive. Il part d'un genre de syllogisme :
- quand on numérise, on a du mal avec l'OCR parce que certains mots ne peuvent être reconnus que par des humains
- sur le web, on utilise des mots qui ne peuvent être reconnus que par des humains pour faire barrage aux robots
- on n'a qu'à utiliser les mêmes humains pour reconnaître les deux types de mots !
Donc voilà, on va proposer aux blogs et autres sites de ce genre d'utiliser comme antispam un captcha à deux mots : le premier, connu par l'ordinateur, permet de faire barrage aux robots, et le second est un mot extrait de la numérisation d'IA qu'on n'arrive pas à océriser. Si plusieurs utilisateurs "numérisent" le même mot, celui-ci est validé dans IA.
Amis blogueurs qui avez des problèmes de spam de commentaires (ce n'est pas mon cas parce que je suis sous Lodel, mais bon, ça va peut-être changer, enfin bref), faites une bonne action : utilisez un captcha reCaptcha. C'est gratuit, c'est un web service, c'est accessible et en plus, ça génère de la

