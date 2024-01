Ces dernières années, les entreprises ont intégré les nouvelles technologies d’IA dans leurs processus opérationnels, en commençant par les modèles de machine learning. Elles débutent désormais l’intégration d’outils d’IA générative tels que ChatGPT. Bien qu’elle offre de nombreux avantages commerciaux, l’IA élargit la surface d’attaque des organisations.

De fait, les cyberattaquants cherchent constamment des moyens d’infiltrer les environnements informatiques cibles, et les outils alimentés par l’intelligence artificielle peuvent devenir un autre point d’entrée à exploiter. Les stratégies de sécurité de l’IA sont essentielles pour protéger les données de l’entreprise contre les accès non autorisés.

L’approche MLSecOps est un cadre qui réunit le contrôle des opérations du cycle de vie des modèles et les préoccupations en matière de sécurité, dans le but d’atténuer les risques que les systèmes IA/ML peuvent faire peser sur une organisation. Ce framework se concentre sur la sécurisation des données utilisées pour développer et entraîner les modèles ML, sur l’atténuation des attaques adverses et sur la garantie que les modèles développés respectent les politiques de conformité réglementaire.

Cependant, leur adoption introduit également des risques à différents niveaux, notamment pendant les phases de développement et de déploiement. Les risques les plus significatifs sont les suivants :

Les 5 piliers de la sécurité dans l’approche MLSecOps

1. Lutte contre les vulnérabilités dans la chaîne d’approvisionnement

Comme n’importe quelle chaîne d’approvisionnement logicielle, celle utilisée pour entraîner ou déployer des modèles d’IA est dépendante de multiples composants :

Des librairies logicielles et des composants matériels de fournisseurs externes.

Des services d’hébergement tiers.

Des services réseau spécifiques pour faire le lien entre le modèle et l’application qui l’utilisent.

Ce sont des points d’entrée qu’il faut surveiller. C’est d’autant plus important que les autorités se montrent de plus en plus alertes en la matière.

Les États-Unis ont été les premiers à s’attaquer aux aspects sécuritaires de la chaîne d’approvisionnement en logiciels. En 2021, l’administration Biden a publié le décret 14028, qui impose à toutes les organisations des secteurs public et privé de remédier aux failles de sécurité de leur chaîne d’approvisionnement. En Europe, des initiatives similaires sont soit en place, soit en cours d’élaboration.

2. Vérification de la provenance des modèles

La provenance du modèle concerne le suivi de l’historique d’un système de ML au cours de son entraînement, de ses tests, de son déploiement, de sa surveillance et de son utilisation. La provenance du modèle aide les auditeurs de sécurité à identifier les personnes ou les entités qui ont apporté des modifications spécifiques au modèle, la nature de ces modifications et le moment où elles ont eu lieu.

Voici quelques éléments attendus :

Les sources de données utilisées pour entraîner le modèle de ML.

Les modifications apportées aux algorithmes de ML.

Les informations concernant les modèles réentraînés, y compris la date de réentraînement, les nouvelles données d’entraînement et les sources de ces données.

L’utilisation du modèle de ML au fil du temps.

La provenance des modèles est essentielle pour se conformer aux diverses réglementations de conformité en matière de protection des données, telles que le RGPD dans l’Union européenne, l’HIPAA et le CCPA aux États-Unis et les réglementations spécifiques à l’industrie telles que les normes de paiement (PCI DSS, BCBS 239, etc.) et bientôt l’AI Act.

3. Gouvernance, analyse des risques et conformité

Les cadres de gouvernance, de risque et de conformité (GRC) sont utilisés au sein des organisations pour répondre aux réglementations imposées par le gouvernement et l’industrie. Pour les systèmes de ML, la GRC couvre plusieurs éléments du MLSecOps, avec pour objectif principal de garantir que les organisations utilisent les outils d’IA de manière responsable et éthique.

Par exemple, lors du développement d’un système ML, les entreprises devraient tenir une liste de tous les composants utilisés dans le développement, y compris les jeux de données, les algorithmes et les frameworks. Cette liste est désormais connue sous le nom de « machine learning bill of materials » (MLBoM), un inventaire cousin du SBOM (Software Bill Of Materials). À l’instar d’une nomenclature logicielle pour les projets de développement de logiciels, les MLBoM documentent tous les composants et services utilisés pour créer des outils d’IA et leurs modèles de ML sous-jacents.

4. IA de confiance

L’IA de confiance traite des aspects éthiques de l’utilisation des outils d’IA pour différents cas d’usage. Ils sont de plus en plus utilisés par des entreprises ou des organisations publiques pour accomplir des tâches critiques. Il est de plus en plus nécessaire de s’assurer que les outils d’IA et leurs modèles ML sous-jacents donnent des réponses éthiques et ne sont pas biaisés par des caractéristiques telles que la race, le sexe, l’âge, la religion, l’éthique ou la nationalité.

L’une des méthodes permettant de vérifier l’équité des systèmes d’IA consiste à imposer dès la conception du modèle des moyens d’expliquer les résultats. Par exemple, si un utilisateur demande à un outil d’IA générative de lui recommander le meilleur pays à visiter en été, le modèle doit justifier sa réponse. Cette explication aide les humains à comprendre quels facteurs ont influencé la décision.

5. Attaques par exemples contradictoires

L’apprentissage automatique antagoniste s’intéresse à la façon dont les utilisateurs peuvent exploiter les systèmes d’IA de diverses manières pour mener des actions malveillantes. Il existe quatre types d’attaques par exemples contradictoires :

Empoisonnement . Les attaquants injectent des données malveillantes dans les jeux de données d’entraînement du modèle, ce qui les amène à produire des réponses incorrectes.

. Les attaquants injectent des données malveillantes dans les jeux de données d’entraînement du modèle, ce qui les amène à produire des réponses incorrectes. Évasion. Cette attaque se produit une fois que le modèle de ML a fini de s’entraîner. Elle consiste à envoyer des messages spécialement conçus au système de ML pour obtenir des réponses incorrectes. Par exemple, certains prompts permettaient au lancement de ChatGPT de lui faire générer des contenus insultants ou proscrits.

Cette attaque se produit une fois que le modèle de ML a fini de s’entraîner. Elle consiste à envoyer des messages spécialement conçus au système de ML pour obtenir des réponses incorrectes. Par exemple, certains prompts permettaient au lancement de ChatGPT de lui faire générer des contenus insultants ou proscrits. Inférence. Il s’agit d’effectuer une rétro-ingénierie du modèle de ML afin de révéler les données utilisées pour entraîner le modèle, qui peuvent contenir des informations très sensibles.

Il s’agit d’effectuer une rétro-ingénierie du modèle de ML afin de révéler les données utilisées pour entraîner le modèle, qui peuvent contenir des informations très sensibles. Extraction. Dans cette attaque, les attaquants tentent d’extraire ou de reproduire soit l’intégralité du modèle de ML, soit uniquement les données utilisées pour l’entraîner.

Une partie de ces techniques sont exploitées par les membres des « red teams » afin de prévenir les dérives des modèles et les usages malveillants.