“End-to-End Active Learning for Computer Security Experts” – AICS workshop

Dans un modèle de détection supervisé, l’acquisition de données annotées est une préoccupation essentielle. Pour répondre à ces besoins spécifiques, cet article propose ILAB, un système d’apprentissage actif complet et adapté aux besoins des experts en sécurité, présenté au workshop AICS (Artificial Intelligence for Computer Security).

Publié le 02 Février 2018 Mis à jour le 02 Février 2018

L’acquisition de données annotées est une difficulté à surmonter pour entraîner un modèle de détection supervisé.  Annoter un jeu de données est particulièrement coûteux dans le domaine de la sécurité informatique comme des connaissances expert sont nécessaires. Des travaux de recherche reposent sur de l’apprentissage actif pour réduire l’effort nécessaire pour annoter de gros jeux de données, mais ces travaux assimilent souvent les annotateurs à de simples oracles fournissant la vérité terrain.

La plupart des publications dans ce domaine négligent l’expérience utilisateur alors que l’apprentissage actif est une procédure interactive. Dans cet article, nous présentons ILAB, un système d’apprentissage actif complet adapté aux besoins des experts en sécurité. Nous avons conçu la stratégie d’apprentissage actif en même temps que l’interface utilisateur pour réduire efficacement l’effort d’annotation. Nos expériences utilisateurs montrent qu’ILAB est un système d’annotations efficace pouvant être déployé par des experts en sécurité dans des projets d’annotations. Nous fournissons une implémentation open source d’ILAB pour permettre à des experts en sécurité d’annoter leurs propres jeux de données.

Cet article a été présenté au workshop AICS (Artificial Intelligence for Computer Security), qui se tenait à  La Nouvelle-Orléans le 2 février 2018. Il  complète les travaux publiés précédemment à l’occasion de RAID 2017.