Perdue dans le bruit médiatique, peu d’observateurs ont relevé cette étonnante annonce effectuée par deux membres de la fondation Wikipedia, Aaron Halfaker et Dario Taraborelli, deux chercheurs qui se sont posé la question de la fiabilité du contenu Wikipedia, dont on sait qu’il peut être mis à jour par n’importe quel contributeur, sans que l’on puisse garantir la qualité de ce chacun exploite pour savoir comment cuisiner un homard Thermidor ou déterminer la différence qu’il y a entre la relativité restreinte et la relativité générale d’Einstein.

L’objectif d’ORES (Objective Revision Evaluation Service), que propose la fondation Wikipedia, est de fournir des moyens automatiques pour valider et « scorer » les contenus de l’encyclopédie universelle, voire de statuer sur leur qualité. Ce système qui est disponible sous forme de Web Services, que tout le monde peut intégrer dans une application, est plus précisément destiné aux fournisseurs de contenus qui pourront s’assurer que leur production n’est pas dégradée par des modifications intempestives, volontaires ou non.

Il faut savoir que Wikipedia, qui est maintenant une institution mondiale, est modifié plus de 500.000 fois par jour et ne peut donc pas être contrôlé autrement que par les éditeurs, qui devront « jeter un coup d’œil » de temps en temps, pour s’assurer que leurs contenus ne sont pas été travestis.

Sachant que de plus en plus Wikipedia apparaît comme un moyen de communication pertinent, au même titre que Facebook par exemple.  Une encyclopédie où les fournisseurs et prestataires, mais aussi les scientifiques et autres historiens « postent » la description de leurs produits et ouvrages. Et qui ont donc besoin de garantie quant à leur pérennité.

Un outil d’intelligence artificielle

Selon ses concepteurs, ORES est un pur produit d’intelligence artificielle, dont le but de qualifier en permanence un contenu édité.

Ce n’est cependant pas la première fois que de telles dispositions sont proposées aux éditeurs, pour les wikipedians anglophones par exemple, qui ont pu exploiter des outils tels que Huggle et STiki et ceci depuis longtemps, mais avec des succès divers, dans la mesure où ces outils avaient un peu tendance à rejeter systématiquement tout ce qui était nouveau dans le paysage. Avec comme conséquence de décourager les bonnes volontés de ces contributeurs, qui n’avaient plus envie de travailler dans le vide. Au point qu’entre 2007 et 2015, les contributions ont été divisées par 2, sans espoir d’amélioration.

Le « travail » d’ORES va consister à évaluer la probabilité pour qu’une révision soit acceptable ou non et il est capable selon ses promoteur, de distinguer les erreurs non intentionnelles (après tout on a le droit de confondre les physiciens Lorentz et Dirac et de penser que le d’alembertien est un fromage au lait cru), des actes de vandalismes véritables.

Pour arriver à distinguer ces anomalies, Halfaker et Taraborelli ont capitalisé sur les travaux de plusieurs milliers d’éditeurs Wikipedia, à qui ils ont demandé d’établir une sorte de cartographie des indices qui leur permettent de détecter ces fameuses anomalies. Constituant ainsi une sorte de base de connaissance qu’ORES a apprise, dans un process de « learning machine », pour être capable ensuite de faire le travail tout seul.

ORES est capable d’effectuer une introspection sur une révision en 50 ms, si la référence a déjà été auditée et en 100 ms, si ce n’est pas le cas. Et les chercheurs ont précisé qu’ils avaient déjà effectué près de 50 millions d‘analyses dans tous les domaines. Sachant qu’ORES est capable de « s’exprimer » en 14 langues différentes, dont bien entendu les plus répandues.

Chaque analyse étant retournée au demandeur sous la forme d’un fichier JavaScript JSON.

Côté pratique, la fondation Wikipedia a fait en sorte que l’insertion d’un appel au moteur d’analyse d’Halfaker et Taraborelli puisse se faire le plus simplement du monde. Et il suffit effectivement de quelques lignes de codes à insérer dans une application de création et de contrôle de révisions, pour que le moteur IA d’évaluation soit appelé et remplisse son rôle.

ORES n’en est cependant qu’à ses débuts. Le projet ne fait que commencer et ses acteurs demandent de l’aide pour qu’ils puissent le finaliser et devienne un véritable outil industriel d’analyse. N’oublions pas que l’on est dans le monde de l’Open Source.

En tout cas l’initiative est intéressante, beaucoup plus compréhensive que les précédentes tentatives, qui pourrait bien redonner de l’énergie aux contributeurs. C’est tout le mal qu’on leur souhaite. Et nous allons suivre sa progression de très près.