Definition

Data warehouse (entrepôt de données)

Un entrepôt de données est un référentiel centralisé qui accueille toutes les données que les différents systèmes métier d'une entreprise collectent. Ce référentiel peut être physique ou logique.

Les entrepôts de données mettent l'accent sur la capture de données issues de sources diversifiées à toutes fins utiles d'accès et d'analyse. En revanche, leur concept initial ne tient pas compte du point de vue de l'utilisateur final qui, lui, est susceptible d'avoir besoin d'un accès à des bases de données spécialisées, parfois locales. Cette dernière situation correspond davantage à un Datamart.

L'entrepôt de données autorise deux approches verticales : ascendante et descendante.

La première approche - ascendante - ventile les magasins de données constitutifs de l'entrepôt auprès de groupes d'utilisateurs spécifiques, et ce une fois l'entrepôt de données créé dans son intégralité.

La seconde approche - descendante - commence par construire les magasins de données, puis les combine au sein d'un unique entrepôt de données.

En général, l'entrepôt de données est hébergé sur le serveur mainframe de l'entreprise, mais il l'est de plus en plus dans le Cloud.

Les données issues de différentes sources, notamment d'applications de traitement transactionnel en ligne (OLTP, OnLine Transaction Processing), sont extraites sélectivement afin d'être exploitées par des applications analytiques et les requêtes des utilisateurs.

Le terme d'entrepôt de données a été créé par William H. Inmon, connu comme le « père du Data Warehouse ». William Inmon décrit ce dernier comme un ensemble intégré, non-volatile, variable dans le temps, et orienté sur des thèmes, de données qui viennent soutenir le processus décisionnel de la direction de l'entreprise.

Cette définition a été mise à jour en août 2015

Pour approfondir sur Datawarehouse

Close