Il y a quelques semaines, les chercheurs du MIT ont annoncé avoir développé un nouveau modèle d’intelligence artificielle, appelée AI2, capable de prédire, détecter et arrêter 85% des cyber-attaques, avec une grande fiabilité. Waouh…

En fait, les chercheurs du CSAIL (Computer Science and Artificial  Intelligence Laboratory) ont travaillé avec une startup spécialisée dans le « machine-learning », PatternEx, pour mettre au point une technique de défense contre ce type d’attaques.

Son secret c’est d’avaler des milliards de lignes de fichiers logs, enregistrés chaque jour et de détecter dans ces « Big Data », des comportements bizarres, anormaux ou franchement délictueux.

En plus de ce modèle de « machine-learning », les chercheurs du MIT et PatternEx, ont ajouté une composante humaine, qu’ils ont appelée l’ « Analyst Intuition ».

AI2 fonctionne en fait par itération. Dans la mesure où chaque jour après avoir recueilli des milliards de données de logs, soumises au modèle de « machine-learning », le système soumet ses conclusions aux experts, qui distinguent les évènements qu’ils estiment être des attaques, de celles qui ne le sont pas. Les conclusions ainsi corrigées étant ajoutées au moteur de connaissances pour les travaux du lendemain.

En réalité tout est là et l’idée est effectivement excellente d’avoir su marier la capacité de la machine d’analyser des volumes considérables de données, avec l’intelligence humaine. La première fait le plus gros du travail, pendant que le second apporte son intelligence cognitive à son interprétation.

Ce que confirme Nitesh Chawla, professeur d’informatique à l’université Notre Dame, qui estime que le modèle du MIT et de PatternEx, peut être raffiné, sinon en quelques heures, du moins en quelques itérations.

Nous ne voyons dans ce « montage » qu’un seul inconvénient, celui de la passivité. Car pour être pertinent, le modèle de « machine-learning » doit déjà avoir été informé de cas réels, à travers les fichiers logs. De sorte qu’il ne sera pas efficace contre des attaques de type « zero-day », qui justement n’ont pas de parades, vu qu’elles n’ont pas été détectées. Inconvénient que n’auront pas les systèmes fondés sur l’analyse comportementale, qui cherchent à stopper la dérive liée à une cyber-attaque, avant que les dégâts deviennent importants.

L’idéal serait peut-être de marier les 2 : « machine-learning » et analyse comportementale.

Ceux qui seraient intéressés par le modèle du MIT et qui sont à l’aise avec les mathématiques, pourront toujours consulter le PDF que l’équipe de chercheurs a publiée : « AI2 : Training a big data machine to defend ».