Definition

Gouvernance des données

La gouvernance des données (GD, ou data governance – DG – en anglais) consiste en la gestion globale de la disponibilité, de l'exploitabilité, de l'intégrité et de la sécurité des données utilisées dans une entreprise.

Un programme robuste de gouvernance des données comprend un conseil ou un organe de gouvernance, un ensemble défini de procédures et un plan pour mettre ces dernières à exécution.

Pour l'entreprise, les avantages de la gouvernance tiennent à ce qu'elle garantit l'homogénéité et la fiabilité des données. Cet aspect est essentiel, car de plus en plus d'organisations s'appuient sur les données pour prendre des décisions métier, optimiser leurs opérations, créer des produits et des services, et améliorer leur rentabilité.

Mise en oeuvre de la gouvernance des données

La mise en oeuvre d'une infrastructure de gouvernance des données commence par la définition des propriétaires ou des dépositaires du capital de données de l'entreprise. Ce rôle est appelé « intendance des données » (ou data stewardship en anglais).

Il s'agit de définir des processus régissant efficacement le stockage, l'archivage et la sauvegarde des données, ainsi que leur protection contre les incidents, le vol ou les attaques. Un ensemble de normes et de procédures doit être élaboré pour définir le mode d'exploitation des données par un personnel autorisé. En outre, des contrôles et des procédures d'audit doivent être mis en place pour garantir une conformité continue tant avec les politiques de données internes qu'avec les réglementations gouvernementales. Ils garantissent également que les données sont exploitées de manière homogène dans les diverses applications d'entreprise.

Une fois qu'une stratégie globale est définie et que les propriétaires et dépositaires des données sont identifiés, des équipes chargées de la gouvernance sont souvent constituées pour mettre en oeuvre les politiques et procédures de traitement des données. Ces équipes se composent de responsables métier, d'administrateurs des données et d'employés opérationnels, ainsi que d'utilisateurs spécialistes des domaines de données qui leur incombent au sein de l'entreprise. Le Data Governance Institute, la DAMA (DAta Management Association) et la Data Governance Professionals Organization comptent parmi les associations qui se consacrent à la promotion de bonnes pratiques en matière de gouvernance des données.

 Les piliers de la gouvernance des données.
Les piliers de la gouvernance des données.

C'est souvent dans les premières phases que la mise en place d'une gouvernance des données peut s'avérer la plus difficile. En effet, cette période révèle que les différentes parties de l'entreprise ont des vues divergentes des entités de données clés, notamment les clients ou les produits ; et ces divergences doivent être résolues dans le cadre du processus de gouvernance. Dans la mesure où la gouvernance des données peut imposer certaines contraintes en matière de manipulation des données, elle risque de susciter la controverse dans l'entreprise.

Intendance des données (data stewardship)

L'intendant des données (data steward) a pour caractéristique essentielle d'être responsable de différents segments des données. L'objectif principal d'une gouvernance de ce type consiste à garantir la qualité des données en termes de précision, d'accessibilité, d'homogénéité, d'exhaustivité et d'actualité.

Des équipes d'intendants (data stewards) sont généralement constituées pour guider la mise en oeuvre de la gouvernance des données. Ces équipes peuvent compter des administrateurs de bases de données, des analystes métier et des personnels métier qui connaissent bien certains aspects des données au sein de l'entreprise. Les data stewards travaillent avec des personnes qui interviennent tout au long du cycle de vie des données, de façon à garantir que l'usage des données soit conforme aux politiques de gouvernance de l'entreprise.

Qualité des données (data quality)

La qualité des données est à l'origine de la plupart des activités de gouvernance des données. La précision, l'exhaustivité et l'homogénéité des sources de données sont les piliers essentiels d'initiatives réussies.

Egalement appelée nettoyage des données, l'épuration des données (data scrubbing) concourt également à assurer la qualité des données ; en effet, il identifie, met en corrélation et supprime les doublons de points de données identiques. L'épuration des données gère les différentes manières dont, par exemple, un même produit ou un même client peut être décrit. Editeurs de données, outils d'exploration (data mining), de différenciation et de corrélation des données, ou encore systèmes de gestion des versions, des workflows et des projets, autant de types de logiciels qui permettent d'améliorer la qualité des données.

Gestion des données de référence (master data management, MDM)

La gouvernance concerne pratiquement tous les aspects de la gestion des données. Toutefois, un domaine est particulièrement lié aux processus de gouvernance : la gestion des données de référence, ou MDM (Master Data Management). Cette discipline établit une référence maître qui garantit un usage homogène des données au sein de grandes organisations.

Des référentiels de métadonnées, qui renferment des « données sur les données », sont souvent utilisés pour établir des données de référence transversales dans le cadre de programmes MDM. Les données relatives aux produits et aux clients constituent un axe majeur des systèmes MDM. A l'instar de la gouvernance des données en général, les projets de gestion des données de référence peuvent, eux aussi, prêter à controverse au sein des entreprises. En effet, différents groupes produits ou branches d'une même entreprise avanceront probablement des points de vue divergents sur la présentation optimale des données.

Le champ d'action de la gestion des données de référence s'est étendu à mesure que l'informatique d'entreprise a commencé à intégrer davantage de données extérieures, souvent collectées via le web ou le cloud. Une grande partie de ces données n'est pas structurée et diffère par nature des données relationnelles structurées sur lesquelles était fondée la MDM. C'est l'une des raisons pour lesquelles certains outils MDM ont commencé à utiliser des magasins de données graphiques permettant de décrire des corrélations plus complexes entre les données. La poursuite des avancées dans le Big Data, ainsi que l'évolution générale vers une organisation moins hiérarchisée de l'entreprise ont conduit à accentuer la recherche d'approches flexibles de la gouvernance, privilégiant des mises en œuvre incrémentielles par rapport à des projets de type « big bang » ou en cascade.

Cas d'utilisation de la gouvernance des données (data governance use cases)

La gouvernance des données constitue un paramètre particulièrement important dans de nombreux domaines : fusions et acquisitions, gestion de processus métier, modernisation des systèmes hérités, conformité réglementaire et financière, gestion du risque de crédit, solutions analytiques, applications d'informatique décisionnelle, entrepôts et lacs de données.

A mesure que se développe l'exploitation des données et qu'émergent de nouvelles technologies, les applications de la gouvernance des données se multiplient. Avec la forte médiatisation de nombreuses atteintes aux données, la sécurité est devenue une composante essentielle de la gouvernance des données. Les exigences en la matière ont également conduit à inclure des audits sur la protection et la confidentialité des données dans les programmes de gouvernance. Le Règlement général sur la protection des données (RGPD), directive de l'Union européenne relative à la protection des informations, constitue un cas d'utilisation de la gouvernance des données.

Cette définition a été mise à jour en septembre 2019

Pour approfondir sur Base de données

Close