122 Résultats pour:data lake

  • Trié par: 

Delta Lake ou comment Databricks veut garantir la qualité des données des data lakes

Par Cyrille Chausson 06 mai 2019

L’outil prend le nom de Delta Lake sous une licence Apache et entend apporter un niveau standard de qualité aux données des data lakes. Lire la suite

Plateformes Big Data et Data Lake : en tête des déploiements dans les entreprises françaises en 2019

Par Cyrille Chausson 11 mars 2019

Alors que s’ouvre Big Data Paris ce jour, l’étude Priorités IT 2019 réalisée par TechTarget / LeMagIT montre une volonté forte des entreprises françaises d’investir et de déployer des solutions Big Data , des Data ... Lire la suite

Gouvernance et data lake : quelles sont les difficultés rencontrées par les entreprises

Par Anne Marie Smith, Ph.D. 22 nov. 2018

La mise en place d’une gouvernance de données à un data lake reste compliquée. Cette capacité à déstructurer complique la mise en place de politiques et de gestion précises des données. Pourtant, la gouvernance ... Lire la suite

Saagie : du data lake-as-a-service à la gouvernance des données pour servir les métiers

Par Cyrille Chausson 12 déc. 2018

La startup compte désormais piloter les data lakes des entreprises en y adjoignant des outils de gouvernance des données afin de cibler des usages métiers. Saagie a bénéficié d’un accompagnement de Capgemini via ... Lire la suite

S3 contre HDFS : que choisir pour son data lake

Par George Lawton 30 nov. 2018

Un lac de données bâti sur S3 rationalise l'analyse des données, mais présente des limites pour ceux qui veulent aller au-delà de l'écosystème du groupe. Lire la suite

Entrepôt de données, Data Lake, Data Mart, ODS : que choisir ?

Par Bridget Botelho 09 août 2018

Il existe de nombreuses façons de stocker des données en volume, mais choisir la bonne technologie est une épreuve de force. Comment savoir si un entrepôt de données, un lac de données ou un data mart convient ? ... Lire la suite

7 étapes pour créer son data lake

Par David Loshin 07 mars 2018

Peupler un cluster Hadoop de données qui ne sont ni organisées ni gérées correctement risque de nuire à vos projets analytiques. Voici 7 étapes clé qui vous permettrons de mieux utiliser les données de votre data ... Lire la suite

Indexima arme son concept de Data Hub avec son format open source K-Store

Par Cyrille Chausson 18 févr. 2019

La société qui voulait accélérer les data lakes avec ses hyper-indexes a ouvert son format K-Store à la communauté open source pour en faire émerger un écosystème et garantir aux utilisateurs d’Indexima l’... Lire la suite

L’IA en tête des priorités des Chief Data Officer français en 2019

Par Alain Clapaud 01 févr. 2019

Signe des temps, le Club Data & Analytics devient le Club CDO. La fonction de Chief Data Officer est désormais commune dans les grandes entreprises. Après les chantiers RGPD de 2018, ceux-ci se tournent résolument ... Lire la suite

In-Memory : Gridgain se prépare pour le marché français

Par Cyrille Chausson 03 janv. 2019

La société affûte sa stratégie de conquête commerciale pour séduire les entreprises françaises, déçues par les data lakes. Objectif : agiter l’argument des performances du In-Memory. Lire la suite