L’Information Management
La
Business Intelligence a été le premier domaine à considérer
l’intégration de données comme une problématique en tant que telle,
nécessitant des outils adaptés. Il a ainsi donné naissance aux ETL,
outils d’extraction, de transformation et de transport de l’information
par lots. Une fois réglés les problèmes d’interopérabilité et de
transport des données d’un contenant à un autre, on s’est intéressé au
contenu proprement dit et sont apparues les solutions de profiling et
de gestion de la qualité des données.
On a appris par la suite
que non seulement ces environnements étaient utiles, voire
indispensables aux projets de Business Intelligence, mais qu’ils
contribuaient plus largement à la gestion de l’information dans
l’entreprise : le Master Data Management s’attache à gérer les
référentiels clients, fournisseurs, employés, produits, etc. On cherche
aussi à déplacer les données dans le cadre de projets de migration ou
pour synchroniser les applications transactionnelles en mode
juste-à-temps (ce que l’on appelle parfois Transactional Data
Management). De son côté, l’Enterprise Information Integration (EII)
vise à faire apparaître les données comme homogènes et fédérées dans
une unique base de données homogène alors qu’elles restent en réalité
physiquement éparpillées. Enfin, l’Enterprise Content Integration
cherche à extraire la structure des données initialement non
structurées pour mieux les gérer, les archiver ou les rendre
accessibles.
L’ensemble de ces options a donné naissance à une
nouvelle discipline, appelée Information Management ou Enterprise
Information Management. Il s’agit finalement de gérer de manière plus
rigoureuse et industrielle ce que les entreprises géraient tant bien
que mal depuis plusieurs années, sans toutefois y avoir consacré des
organisations, des processus et des outils dédiés.
L’Open Source
a, sur le principe, une carte intéressante à jouer dans ce domaine :
dans le domaine de l’intégration de données, il est en effet souvent
difficile, en phase projet, de justifier l’achat de licences pour un
logiciel dont le retour sur investissement viendra avec le temps,
lorsqu’il s’agira de maintenir les systèmes en place et de faire en
sorte que l’évolution d’une application n’en impacte pas des dizaines.
Plus qu’en concurrence frontale des solutions propriétaires haut de
gamme, l’Open Source a ainsi l’opportunité de se positionner en
alternative au développement spécifique.
Les solutions Open
Source du marché en matière d’Information Management se sont
intéressées principalement au marché le plus mature, celui de l’ETL.
Deux acteurs se distinguent : Pentaho, avec l’ETL Kettle, ainsi que
Talend, une des jeunes pousses françaises les plus en vue, qui propose
sa solution de manière indépendante mais l’intègre aussi dans les
suites de Jaspersoft et de SPAGO BI. Déjà, Talend élargit sa
couverture en intégrant le profiling et la qualité de données.
Il
faudra sans doute aussi compter sur un nouvel arrivant de poids : en
Mai, cette année, Sun a annoncé le projet Mural. Positionné sur le
Master Data Management, le projet promet toutefois une couverture
fonctionnelle très large sur la base de cinq sous projets : le premier
vise la gestion des master data, le second l’ETL, le troisième la
qualité de données, le quatrième l’EII, le cinquième la migration de
données.
Téléchargez cet article au format PDF

















