arthead - stock.adobe.com

Ingestion de données : Qlik s’empare d’Upsolver

Avec Upsolver, l’éditeur américain d’origine suédoise s’équipe à l’ère du (quasi) temps réel et de la prévalence des formats de tables open source.

Qlik a annoncé mardi l’acquisition d’Upsolver. Les conditions financières de l’achat n’ont pas été divulguées.

Upsolver est un éditeur fondé en 2014 et installé à Palo Alto. Il a levé au total 42 millions de dollars en quatre tours de table. La startup a fait sa renommée en développant une version modifiée de Debezium qui ne nécessite pas d’utiliser le controversé Kafka Connect.

Debezium est une plateforme open source consacrée à la capture de changement de données (Change Data Capture ou CDC). Qui plus est, l’interface d’Upsolver permet de créer des pipelines d’ingestion en no-code et en low-code.

Qlik gagne surtout de nouvelles capacités d’ingestion de données en quasi-temps réel et d’optimisation pour le format de stockage de tables open source Apache Iceberg.

Cette technologie représente pour les entreprises un atout majeur. En sus de diverses capacités favorisant la gouvernance et l’analyse des données, le format doit faciliter la portabilité des données entre les plateformes de différents éditeurs.

Alors que leurs lakehouses n’ont pas été conçues à l’origine pour cela, les entreprises multiplient les usages impliquant l’analyse de données à peine produites.

En outre, les entreprises ont besoin de gros volumes de données, structurées ou non, et les data lakehouses permettent aux utilisateurs de stocker et de combiner tous les types de données en un seul endroit.

Streaming et portabilité des données

Avant l’acquisition d’Upsolver, Qlik proposait déjà des fonctionnalités de streaming en temps réel et des connecteurs pour les entrepôts de données compatibles avec Iceberg. Selon David Menninger, analyste chez Ventana Research, une filiale d’ISG, l’acquisition d’Upsolver permet non seulement d’améliorer ces fonctionnalités, mais aussi d’offrir aux clients des capacités qui gagnent en popularité.

« L’élan derrière les formats de table ouverts et Apache Iceberg, en particulier, est significatif [parce que les formats de table ouverts] permettent l’interopérabilité et l’évolutivité », rappelle-t-il. Et de citer l’acquisition de Tabular par Databricks en juin 2024 comme preuve supplémentaire de la pertinence d’Iceberg. Pour rappel, Databricks développe un autre format de tables open source : Delta.

« La mise à l’échelle est importante en ce qui concerne les données en flux continu en temps réel, car les sources associées produisent généralement de très grandes quantités de données », poursuit David Menninger.

En 2023, Qlik a finalisé l’acquisition de Talend. Les équipes et les logiciels de l’éditeur français ont été intégrés dans l’offre de Qlik au cours de l’année dernière.

Le lancement de Talend Cloud par Qlik en juillet 2024 visait à fournir aux clients une plateforme d’intégration de données complète, leur permettant de développer des fondations de données fiables pour l’analytique et l’IA. Upsolver complète ce tableau.

« En termes simples, l’acquisition d’Upsolver fait de Qlik un acteur plus fort dans les domaines du streaming de données en temps réel et des lakehouse », considère Mike Leone, analyste chez Enterprise Strategy Group, un cabinet d’analyse d’Informa TechTarget [également propriétaire du MagIT].

Selon Qlik, l’acquisition d’Upsolver offre les avantages suivants :

  • L’ingestion de données en provenance de sources de streaming, comme Apache Kafka et Kinesis.
  • L’apport d’une « plateforme unifiée pour ingérer, transformer, gérer, optimiser » des données dans des lakehouses compatibles avec Iceberg.
  • La compatibilité avec les plateformes Snowflake, Databricks et Athena.

Des clients à la recherche de solutions pour compresser les coûts

L’impulsion pour l’achat est venue, en partie, du retour d’information des clients, selon Drew Clarke, directeur général de l’unité commerciale « Data Business » chez Qlik.

« Les clients adoptent de plus en plus des formats de table ouverts tels qu’Iceberg pour réduire la dépendance vis-à-vis des fournisseurs et améliorer l’élasticité et ils ont demandé des solutions qui simplifient ces architectures complexes tout en optimisant les coûts et les performances », avance-t-il. Selon Upsolver, son optimiseur permettrait d’accélérer jusqu’à cinq fois les requêtes analytiques, tout en réduisant les coûts de stockage en appliquant diverses techniques de compression.

Et à Drew Clarke d’ajouter que l’éditeur s’en est également remis aux tendances identifiées par les analystes.

« Les optimisations d’Apache Iceberg et l’intégration du streaming [d’Upsolver] permettront à Qlik de mieux se positionner dans le domaine des lakehouses open source. »
Mike LeoneAnalyste, Enterprise Strategy Group

« Qlik améliore les capacités d’interopérabilité de sa plateforme, ce qui en fait un choix de plus en plus pertinent pour les entreprises qui privilégient l’ouverture et la flexibilité dans leurs stratégies de données », confirme Mike Leone.

« Les optimisations d’Apache Iceberg et l’intégration du streaming [d’Upsolver] permettront à Qlik de mieux se positionner dans le domaine des lakehouses open source », considère-t-il.

Ce faisant, Qlik resterait compétitif par rapport à ses pairs tels qu’IBM, Microsoft, Oracle, SAP et Tableau.

« Il est difficile de se différencier sur un marché aussi mature », affirme Mike Leone. « L’offre de Qlik est certainement compétitive par rapport à ces autres entreprises, et son indexation associative – son principal facteur de différenciation – permet aux utilisateurs d’effectuer facilement des requêtes à partir de différents types de critères ».

L’interopérabilité d’abord, l’IA attendra un peu

À l’avenir, selon Drew Clarke, Qlik renforcera cette interopérabilité entre les plateformes de gestion de données.

Quid de l’IA ? Elle est forcément inscrite au calendrier, mais arrive au second plan.

« Nous investissons dans l’IA agentique pour offrir une automatisation intelligente et simplifier les flux de travail, afin d’aider les entreprises à obtenir de meilleurs résultats avec moins de complexité », annonce Drew Clarke.

L’éditeur a dévoilé son premier assistant IA en juin 2024 dans le but de simplifier l’utilisation de sa plateforme et de permettre aux utilisateurs d’obtenir plus facilement des informations et de prendre des décisions. Selon David Menninger, il sera important de trouver de nouvelles façons de simplifier l’analyse avec l’IA.

« L’écosystème est en train d’apprendre comment tirer parti de l’IA et de l’IA générative dans le traitement de données et l’analyse », note David Menninger. « Il sera intéressant de voir comment Qlik et d’autres utilisent l’IA pour simplifier l’accès à l’analytique, plus perspicace et plus étroitement liée à la prise d’action sur les indicateurs identifiés ».

Pour approfondir sur Middleware et intégration de données