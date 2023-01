Cette « nouveauté » au sein de la CNIL était dans les cartons depuis près de deux ans, mais elle résonne particulièrement avec l’effervescence autour de ChatGPT. En juillet 2021, la Commission nationale de l’informatique et des libertés, tout comme ses homologues européens, avait accueilli d’un bon œil la future réglementation européenne sur l’intelligence artificielle.

Il est déjà prévu que le service d’intelligence artificielle porte assistance dans « l’instruction de plaintes et l’adoption de mesures correctrices » quand des « manquements » aux réglementations françaises et européennes concerneront l’utilisation de systèmes d’IA.

La CNIL prévoit que le SIA tiendra un « rôle transverse » en son sein. Il sera amené à collaborer avec la direction en charge de l’accompagnement juridique pour produire des référentiels et des recommandations à la demande du gouvernement ou afin de diffuser cette connaissance auprès des acteurs privés et publics.

Le service d’intelligence artificielle de la CNIL devra favoriser la compréhension des systèmes d’IA en interne, mais aussi auprès du grand public et des professionnels. Il aura pour rôle de renforcer son expertise « dans la connaissance et la prévention des risques pour la vie privée liées à la mise en œuvre de ces systèmes ».

La création du service de l’intelligence artificielle (SIA) n’engendre sans doute pas une véritable transformation, mais réaffirme la position de la Commission. Le service réunira cinq personnes, des « juristes et des ingénieurs spécialisés ». Le SIA sera placé sous l’autorité de la direction des technologies et de l’innovation, incarnée par Bertrand Pailhès, ancien coordonnateur de la stratégie d’intelligence artificielle au sein de la DINSIC.

Une autre interrogation pour Yann Bilissor concerne la compatibilité de la future réglementation européenne avec l’actuel règlement général sur la protection des données (RGPD ). « Le nouveau texte demande de journaliser les données en entrée et en sortie d’un système d’intelligence artificielle », explique-t-il. « Imaginons que les données en entrée sont des photographies de visages à partir desquelles un algorithme de vision par ordinateur détecte des anomalies de peau (acnés, psoriasis, eczéma, etc.) afin de proposer un traitement adapté », expose-t-il. « En soi, l’usage semble peu sensible, mais au regard du RGPD, nous n’avons pas forcément le droit de conserver ces photos qui sont des données personnelles. Comment conserver les données en entrée sans enfreindre le RGPD ? », s’interroge-t-il.

Or les textes actuellement disponibles présentent des « zones d’ombre », observe le CTO, qui se réfère lui-même à l’avis du cabinet d’avocats Smalt, un partenaire de Cellenza. « Nous nous appuyons sur les solutions d’un fournisseur cloud pour aider nos clients à développer des projets d’IA. Cependant, le niveau de responsabilisation entre le fournisseur et l’intégrateur n’est pas encore clairement défini dans les textes. Pour l’heure, nous pouvons être perçus comme fournisseur de services d’IA », constate Yann Bilissor.

Lors de la fameuse table ronde, le directeur des technologies et de l’innovation de la CNIL anticipait également l’adresse aux fournisseurs de solutions et les discussions avec les « acteurs » concernés. « La notion d’acteurs introduite par la réglementation européenne sur l’IA concerne les fournisseurs, les distributeurs, les importateurs, ou encore les utilisateurs », interprète Yann Bilissor, CTO Data & IA chez Cellenza, un cabinet de conseil IT expert des technologies Microsoft. « Les utilisateurs ne sont pas des usagers, mais des clients directs ou indirects des fournisseurs de technologie tels Microsoft, Google ou AWS ».

Des « travaux » pour guider les acteurs privés et publics

C’est justement pour répondre à ce type d’organisation que la CNIL lance en parallèle de la création du SIA des travaux concernant « les bases de données d’apprentissage », plus communément appelées jeux de données d’entraînement. La Commission nationale de l’informatique et des libertés affirme avoir reçu des demandes d’éclaircissement de la part des entreprises. Elle veut « promouvoir les bonnes pratiques au titre des exigences du RGPD » et préparer le terrain au regard de la future réglementation européenne.

Ces travaux concernent l’entraînement des systèmes de machine learning et de deep learning qui nécessite la collecte de données en provenance « de tous types de sources ». La CNIL veut conseiller les acteurs privés et publics sur la constitution des jeux d’entraînement, sur les phases de développement et les usages des modèles d’IA. Elle publiera au cours de l’année 2023 des outils pour rassembler les données et des fiches pratiques « pour répondre aux situations les plus courantes ». Toutefois, l’autorité n’a pas encore lancé de chantiers concernant la diffusion et la réutilisation des jeux de données ainsi que des modèles d’IA. Il s’agit pourtant d’un des cas d’usage les plus répandus en entreprise et dans les laboratoires de recherche. Ces questions « feront l’objet de travaux séparés », promet la CNIL.