Definition

Ignorance artificielle

Dans la détection d’anomalies comportementales sur le réseau (network behavior anomaly detection, NBAD), l'ignorance artificielle est la pratique stratégique qui consiste à ignorer les données bruitées dans les fichiers journaux.

Un gestionnaire de réseau qui décide d'utiliser l'ignorance artificielle doit d'abord créer une base de référence pour les activités de journalisation normales. Une fois les paramètres définis, le logiciel peut être programmé pour envoyer au gestionnaire une alerte lorsqu'une activité devient anormale.

L'ignorance artificielle est utilisée lors de la première étape de la procédure permettant d'identifier, de mesurer, de surveiller et de produire des rapports, qui est une pratique courante de gestion des risques, en concentrant l'attention sur les valeurs extrêmes des points de données et en ignorant les points de données situés dans des limites acceptables. On attribue généralement le concept d'utilisation de filtres « ignorer ça » à Marcus Ranum, précurseur en matière de sécurité de l'information (Infosec).

Outre qu'elle facilite l'identification des anomalies dans le comportement d'un réseau, la pratique stratégique consistant à faire abstraction des informations de routine peut être utile dans d'autres situations exigeant l'analyse en temps quasi réel ou réel de jeux de données importants (Big Data). Les applications pratiques sont par exemple l'identification d'anomalies dans les emails (filtres antispams), l'identification des anomalies dans les transactions financières en ligne et hors ligne (usurpation d'identité et prévention des fraudes), la surveillance des performances des appareils intelligents (analytique de l'IoT) et le perfectionnement des modèles prédictifs.

Dans les domaines de l'apprentissage automatique et profond, le terme ignorance artificielle est de plus en plus utilisé pour décrire les modèles prédictifs qui échouent. Les causes de l'ignorance artificielle dans l'intelligence artificielle (IA) sont notamment la mauvaise qualité des données, une compréhension insuffisante du problème de l'entreprise, les jeux de validation mal structurés, des distorsions élevées (sous-apprentissage) ou des variances élevées (surapprentissage).

Cette définition a été mise à jour en mars 2019

Pour approfondir sur Outils décisionnels et analytiques

Close