Charte Ethique et Big Data : l’Alliance Big Data veut garantir la traçabilité des données

Un groupement d’industriels et d’universitaires du monde de la donnée a rédigé une charte qui permet de s’engager sur la qualité et la traçabilité des données. Les entreprises signataires offrent une garantie à l’ensemble de la chaîne de valeur sur la pérennité des données pour leur exploitation.

L’Alliance Big Data, un mouvement co-créé en 2013 par l’Aproged (l’association des professionnels de la maîtrise et de la valorisation des contenus) et le pôle de compétitivité Cap Digital, ont annoncé la création d’une

charte éthique et Big Data dont la vocation est de proposer un cadre sur lequel les entreprises peuvent s’appuyer lors de la mise en place de projets liés à l’usage de données. Cette charte, présentée lors du forum GFII le 30 mai dernier, représente la deuxième étape de cet ensemble d’acteurs réunis au sein de l’Alliance Big Data. A l’origine, ce mouvement, raconte Marie-Odile Charaudeau, déléguée générale de l’Aproged, a pour objectif de créer une structure représentative du secteur afin de proposer au marché une vision unique du Big Data, de créer une communauté autour des usages et surtout «de créer une cohérence pour éviter le buzz marketing et confirmer que cela correspond bien à une réalité». Outre l’Aproged (pour les contenants et les outils) et Cap Digital, (pour l’innovation et le business), l’Alliance Big Data réunit ainsi le groupement français de l’industrie de l’information (GFII) qui représente les contenus, l’association des professionnels de l’information et de la documentation (ADBS) pour les utilisateurs et enfin l’Association pour le traitement automatique des langues (Atala) qui ajoute à cette équation le monde académique de la recherche. Capgemini s’y est également associé et finance partiellement le projet. Il s’agit ici de mettre en avant «une représentativité tant dans les fonctions que dans les approches» du Big Data, souligne Marie-Odile Charaudeau. Un portail sert aujourd’hui de point de référence pour fédérer la communauté ainsi que les connaissances et favoriser le partage entre les membres. Car en matière de Big Data, la chaîne de valeur est en effet très longue.

Un cycle de vie de la donnée transparent Cette charte vient ainsi logiquement s’inscrire dans ce projet. Composé de 4 chapitres, ce document est d’abord né des expériences de l’Aproged et de Cap Digital, accumulées lors de précédents projets, avant qu’un groupe de travail soit monté avec l’AFCP et Atala. Cette charte éthique «fournit une trame de description des corpus de données et sert de mémorandum des points à décrire lorsque l'on met à disposition des données, que ce soit à usage commercial ou académique, payant ou gratuit», indique ainsi l’Alliance. En gros, en devenant signataires, les entreprises offrent une garantie en matière de sourcing, d’usage, de rémunération - si les données y sont associées. Une façon de rassurer les acteurs qui pourraient faire usage de ces données en garantissant, presque de façon contractuelle, leur transparence et leur niveau d’éthique. En clair : proposer une traçabilité de la donnée, dans sa création, son échange, sa diffusion et sa ré-utilisation. Dans le détail, cette charte invite les entreprises à définir les données ainsi que leur nature, d’en connaître les sources, son processus de fabrication (données consolidées ? données primaires ? enrichissement ?), les contributeurs aux données, les outils utilisés, les processus de validation, la propriété intellectuelle associée et les licences ou encore si ces données sont liées à des réglementations spécifiques. Bref tout «pour informer le porteur de projet sur les questions qu’il doit se poser», explique Charles Huot, président du comité éditorial du portail de l’Alliance Big Data (et en charge du développement corporate chez l’éditeur Temis - enrichissement sémantique). Elle invite en somme à décrire le cycle de vie de la donnée livrée, avant, pendant et après sa constitution. «Cette charte constitue un premier pas d’information», poursuit-il, précisant qu’elle est appelée à évoluer afin de prendre en compte les spécificités métiers de chaque entreprise. Elle cible toutes les entreprises manipulant de la donnée, qu’elle soit du monde du logiciel ou technique, ainsi que du monde des services qui exploitent ces données, explique-t-il enfin.

Pour approfondir sur Big Data et Data lake

Close