shyshka - Fotolia

Incorta adapte sa plateforme analytique aux lacs de données dans le cloud

Il n’est pas toujours facile de rassembler des jeux de données disparates dans des lacs de données pour les analyser. Incorta tente de le faire avec la mise à jour 4.6 de sa plateforme analytique.

L’éditeur spécialisé dans l’analyse des données Incorta a déployé la mise à jour 4.6 de sa plateforme qui apporte de nouvelles capacités pour la gestion de données dans les data lakes.

Les entreprises considèrent les lacs de données dans le cloud comme des architectures de plus en plus communes pour stocker et gérer leurs données. Elles les adoptent principalement à des fins analytiques. De plus, un data lake cloud permet de réaliser des économies importantes quand il sert à stocker de gros volumes de données.

Fondée en 2013 à San Mateo (Californie), Incorta cherche à profiter de cette tendance en améliorant la prise en charge des data lakes au sein de sa plateforme d’analytique unifiée.

La société a dévoilé la nouvelle version de son produit le 6 février 2020, mais la plateforme bénéficie de la mise à jour depuis le 28 janvier. L’éditeur qui a levé 72 millions de dollars depuis sa création voulait que ses clients l’utilisent avant de la présenter publiquement.

Alors qu’il peut être considéré comme un éditeur spécialisé dans l’analytique, Matt Aslett, analyste chez 451 research considère qu’Incorta cible un marché plus large.

« Chez 451 Research, nous considérons Incorta comme un excellent exemple de ce que nous appelons une plateforme d’intelligence d’entreprise [EIP] parce que sa plateforme combine l’ingestion et l’intégration de données, la gestion de base de données et des fonctionnalités analytiques », déclare Matt Aslett.

Des géants comme Microsoft et Oracle suivent la même direction en proposant une EIP, selon l’analyste. Cependant, Incarta « se différencie des autres éditeurs de data management et d’analytique en se concentrant sur l’analyse en temps réel grâce à son moteur de cartographie directe de données, qui permet de réaliser des jointures en temps réel sur les données ingérées », assure-t-il.

« En ce qui concerne la nouvelle fonctionnalité d’Incorta 4.6, la possibilité d’accéder aux données dans les services de stockage dans le cloud élargit encore le marché adressable de l’éditeur et positionne idéalement sa plateforme d’analyse des données unifiées, pour qu’elle s’interface avec plusieurs plateformes de traitements de données et les services de fournisseurs cloud », juge Matt Aslett.

La cartographie directe des données accélère les requêtes 

La vision fondatrice de l’entreprise était de créer une expérience de données unifiée, dans laquelle les utilisateurs pourraient facilement se connecter aux sources et ensuite obtenir des réponses à partir de ces données, explique Matthew Halliday, cofondateur et vice-président des produits chez Incorta.

L’un des principaux défis dans la connexion des données pour qu’elles soient utiles à l’analytique est souvent la performance. L’éditeur gère cette problématique avec une fonctionnalité connue sous le nom de Direct Data Mapping.

Le Direct Data Mapping doit remplacer plusieurs processus de structuration des données dans une base de données pour décider de la manière d’exécuter une requête. « En adoptant une approche linéaire plus optimisée, les jeux de données comportant un grand nombre de tables peuvent toujours être interrogés rapidement », considère Matthew Halliday.

Incorta 4.6, une mise à jour dédiée aux lacs de données dans le cloud

Dans le détail, la principale nouveauté de la mise à jour de la plateforme d’Incorta est le support amélioré des data lakes cloud dont Azure Data Lake (ADLS Gen2) de Microsoft et Amazon S3 d’AWS.

À titre d’exemple, Matthew Halliday affirme que si un utilisateur souhaite porter ses données en provenance de Salesforce dans Incorta, il peut désormais les transférer sur ADLS Gen2 grâce à une interface basée sur un assistant, qui charge les données sans qu’il soit nécessaire de pousser du code personnalisé. La plateforme Incorta 4.6 gérera désormais également les mises à jour incrémentielles pour s’assurer que les données dans le data lake reflètent les informations disponibles à un instant T dans la source originale en provenance de Salesforce.

Il était déjà possible de le faire dans la version précédente de la plateforme, mais le processus était manuel et plus complexe.

Les lacs de données dans le cloud ne remplacent pas les SGBD transactionnelles, mais certains clients d’Incorta les utilisent comme des formes de bases de données orientées objet qui peuvent être directement requêtées. Ces data lakes sont également utilisés en lieu et place d’entrepôts de données en raison de la facilité avec laquelle ils peuvent connecter les informations avec Incorta, selon le co-fondateur et vice-président chargé des produits.

Matthew Halliday affirme qu’Incorta continuera à améliorer les performances de l’ingestion et de la recherche de données. L’éditeur veut également optimiser l’expérience utilisateur et les flux de données.

Pour approfondir sur Big Data et Data lake

Close