Big Data et Data lake
-
Actualités
13 juin 2025
Databricks veut assurer sa place à la table des directions métier
Databricks tente d’arrondir les angles de sa plateforme lakehouse afin de s’assurer l’adhésion des métiers. Une intention qui se reflète dans la feuille de route par une simplification des outils, des interfaces et une plus grande maîtrise de la gouvernance de données par les organisations. Lire la suite
-
Actualités
13 juin 2025
Databricks aiguise ses outils de migration, d’ingestion et de transformation de données
Lors de sa conférence annuelle Data+AI Summit, Databricks a présenté ses fonctionnalités censées simplifier la migration et l’ingestion de données vers sa plateforme. Malgré les paillettes de l’IA, les entrepôts de données et l’analytique sont au centre de son activité. Lire la suite
- 12 Bonnes Raisons de Choisir HPE GreenLake for Private Cloud Business Edition –Livre Blanc
- Une Informatique Flexible Pour Les Fournisseurs De Services Agiles –eBook
- Le Facteur Humain 2025 –Etude
-
Dans ce numéro:
- Anssi : des cyberattaques qui en feraient oublier les défauts de sécurisation
- Comment choisir un EDR ?
- Contourner l’EDR ? Miser sur des objets connectés non supervisés
-
Actualités
25 nov. 2019
IoT : SIG déploie une offre de maintenance propulsée par GE et ServiceMax
SIG, un spécialiste suisse de l’emballage et du carton qui vend des machines connectées aux entreprises de l’industrie agroalimentaire, déploie un service de maintenance IoT opéré à distance en collaboration avec GE Digital. Lire la suite
-
Projet IT
22 nov. 2019
Le football anglais la joue cloud et analytique pour se moderniser
Le sélectionneur anglais, Gareth Southgate, a expliqué lors de la conférence Google Cloud Next comment la Football Association utilise le Big Data et les outils collaboratifs cloud pour changer sa culture et améliorer la performance de ses joueurs sur le terrain. Lire la suite
-
Conseil
19 nov. 2019
Bien comprendre les services Data Lake et Data Warehouse d'AWS
Apprenez à distinguer les services data lake et data warehouse d’AWS et assimilez leur fonctionnement. Lire la suite
-
Conseil
15 nov. 2019
Intelligence Artificielle : cinq conseils pour bien choisir ses premiers cas d’usage
Sept experts partagent leurs expériences pour bien choisir ses projets d’exploration des algorithmes et bien démarrer dans l’IA. Lire la suite
-
Actualités
15 nov. 2019
Azure Synapse Analytics : Microsoft veut unifier analytique et machine learning dans le cloud
Le nouveau service analytique de Microsoft Azure entend fournir aux utilisateurs des fonctionnalités unifiées de BI et de machine learning dans le cloud à partir de sources variées de données en provenance de data warehouses et de data lakes. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Conseil
12 nov. 2019
Cloudera vs AWS EMR : quelle distribution Hadoop choisir pour vos projets Big Data
Les entreprises qui ont besoin d’une plateforme Big Data doivent généralement sonder eux-mêmes le marché pour choisir un fournisseur. La complémentarité des services AWS est indéniable, mais la solution de Cloudera est-elle un meilleur choix ? Lire la suite
-
Conseil
06 nov. 2019
Les principales distributions Hadoop sur le marché
Voici les principales distributions Hadoop sur le marché et un ensemble d'éléments pour choisir celle qui convient le mieux aux pratiques analytiques en entreprise. Lire la suite
-
Actualités
05 nov. 2019
Gartner Symposium 2019 : Comment l’IA va envahir le monde
A l’heure d’établir leurs prédictions pour 2020 à l’occasion du Gartner Symposium européen, les analystes Gartner se sont concentrés sur deux tendances fortes : comment l’IA va s’immiscer un peu partout, et comment l’IT va continuer de changer la vie des gens et des organisations avec beaucoup d’IA dedans. Lire la suite
-
Actualités
04 nov. 2019
Gartner Symposium 2019 : la DSI équilibriste de la transformation digitale
Les responsables IT doivent s’attendre à négocier quelques virages dans les mois à venir, à en croire Gartner. Le cabinet d’analystes estime que « l’accélération digitale » n’est pas terminée et que la DSI doit plus que jamais chercher l’équilibre entre des injonctions parfois contraires. Et toujours chercher à s’imposer comme le cœur de la transformation numérique. Lire la suite
-
Actualités
29 oct. 2019
SAS Analytics : expérience client, IA et machine learning au programme
SAS apparaît bien décidé à ne pas passer à côté du virage de l'intelligence artificielle. Celle-ci devrait jouer un rôle clé dans le décisionnel et, en particulier, dans les relations avec les clients, aux côtés d'autres technologies émergentes et ce malgré de nombreux défis. Lire la suite
-
Actualités
24 oct. 2019
Open Model Manager : SAS se tourne vers l’open source
Annoncé en grande pompe par SAS, à l’occasion de la conférence Analytics Experience 2019 qui s’est tenue à Milan du 21 au 23 octobre, SAS Open Model Manager sera lancé au mois de novembre. Lire la suite
-
Actualités
18 oct. 2019
Databricks veut améliorer le suivi des pipelines de Machine Learning avec MLflow
Lors de l’événement Spark+AI Summit à Amsterdam, Databricks a présenté les nouvelles fonctionnalités de sa plateforme open source MLflow. Model registry permet d’organiser plus facilement les pipelines ML et de partager les informations entre Data Engineers et Data Scientists. Lire la suite
-
Actualités
16 oct. 2019
Sans surprise, le projet Delta Lake de Databricks va rejoindre la fondation Linux
En toute logique, DataBricks a annoncé que le projet Delta Lake rejoint la fondation Linux. La société à l’origine de Spark veut favoriser l’adoption de sa couche de stockage qui fiabilise les data lakes. Lire la suite
-
Actualités
16 oct. 2019
Alteryx met les voiles sur l’automatisation du Machine Learning
Lors de son évènement européen, l’éditeur américain a annoncé la bêta d’un outil pour aider les métiers à se lancer dans les algorithmes. Mais Alteryx ne néglige pas la Data Prep, qui reste un de ses atouts clefs, y compris pour ses nouvelles promesses dans le Machine Learning. Lire la suite
-
Actualités
14 oct. 2019
BI : Alteryx rachète Feature Labs pour automatiser la préparation des algorithmes
La startup du MIT qu'a rachetée Alteryx est spécialiste du « feature engineering ». Elle détermine les variables d'entrées pertinentes pour un algorithme en fonction des données. Une manifestation de plus de l'arrivée de « l'Intelligence Augmentée » chez les gros de la BI. Lire la suite
-
Actualités
11 oct. 2019
L’entreprise intelligente de SAP, un concept aux contours flous
Qu’est-ce que le concept d’entreprise intelligente signifie réellement ? Si le terme de SAP vous trouble, vous n’êtes pas seul. Voilà ce qu’en disent les experts et pourquoi il semble important. Lire la suite
-
Actualités
08 oct. 2019
Snowflake Summit 2019 sous le signe du partage des données
La conférence de la startup, qui se tenait la semaine dernière à Londres, a permis d’en savoir plus sur les nouveautés de l’entrepôt de données « as a service », son futur et certains de ses clients tels qu’Oney Data, filiale d’Auchan spécialisée dans l’analyse de données. Lire la suite
-
Actualités
04 oct. 2019
Cloudera ouvre les voies du multicloud à ses clients
Cloudera a lancé à la fin du mois de septembre sa plateforme Big Data combinant ses technologies et celles d’Hortonworks dans le cloud AWS. Le support du multicloud est d’ores et déjà annoncé. Lire la suite
par- Craig Stedman, Editor at Large
- Gaétan Raoul, LeMagIT
-
Actualités
01 oct. 2019
Tibco porte Orchestra sur le cloud
Londres (Tibco Now 2019) : la solution de gestion de métadonnées EBX, mise au point à l’origine par Orchestra, est disponible en mode SaaS. Lire la suite
-
Actualités
25 sept. 2019
OpenWorld 2019 : Clive Swan remet le point sur le I d’IA
Pour le patron de l’IA chez Oracle, nombre d’entreprises voient leurs projets de Machine Learning échouer. En cause : des données incomplètes et des datascientists absents. Lire la suite
-
Projet IT
23 sept. 2019
Sous pression, le transport aérien entame sa révolution IT (SITA)
Avec une croissance exponentielle du trafic passagers et des capacités aéroportuaires qui stagnent, l'aérien est sous tension. Le secteur est dans l'obligation de se réinventer, de s'améliorer, de s'optimiser et de s'automatiser pour encaisser la charge, partout dans le monde, avec l'IT - et demain l'IA. Des offres que propose l'historique du secteur, SITA. Lire la suite
-
Definition
16 sept. 2019
In-memory data grid (grille de données In-Memory)
Une grille de données en mémoire, ou grille de données In-Memory (IMDG, In-Memory Data Grid), est une structure de données qui réside intégralement en mémoire vive, ou RAM (Random Access Memory), et qui est répartie sur plusieurs serveurs. Lire la suite
-
Definition
10 sept. 2019
Gouvernance des données
La gouvernance des données (GD, ou data governance – DG – en anglais) consiste en la gestion globale de la disponibilité, de l'exploitabilité, de l'intégrité et de la sécurité des données utilisées dans une entreprise. Lire la suite
-
Actualités
06 sept. 2019
Data War : « Applications et Données » numéro 5 est sorti
Au sommaire : une plongée dans HANA, le Data Catalog de Tableau, le coach virtuel du CHU d’Île-de-France, le « reboot » de MicroStrategy, l’IA et les abeilles, et la réponse à la question : la blockchain dans la supply chain a-t-elle du sens ? Lire la suite
-
Conseil
14 août 2019
Data Architect, Data Engineer, Data Scientist, Data Modeler : comment les combiner ?
Ces quatre métiers – complémentaires, mais différents – sont clefs pour une équipe Data performante. L’expert Michael Bowers explique comment constituer une telle équipe et donne ses conseils aux professionnels de la donnée pour augmenter leurs revenus. Lire la suite
-
Actualités
08 août 2019
MapR se vend à HPE : vers l’hiver des pure-players du Big Data
La disparition de MapR, grand pionnier du Big Data, dans HPE pourrait bien être le signe du début de l'extinction des dinosaures d'Hadoop dont Hortonworks et Cloudera. Lire la suite
-
Projet IT
22 juil. 2019
Comment l’innovation IT influence la gouvernance des villes de Vienne, Helsinki et Belfast
Des leaders du numérique dans les villes de Vienne (Autriche), Helsinki (Finlande) et Belfast (Irlande du Nord) mettent en œuvre des stratégies de services innovants, au service des citoyens et des économies locales. Lire la suite
-
Projet IT
11 juil. 2019
Pourquoi Solocal a basculé sa plateforme Big Data vers le cloud
La Data est au cœur de l’activité de Solocal et après l’ère des Data Warehouse, du Big Data avec Hadoop, le Français aborde celle du cloud et de l’IA avec Microsoft et Google. C’est vers le second que Solocal a choisi de migrer son Data Lake. Lire la suite
-
Actualités
09 juil. 2019
L’IA monte en puissance dans le secteur de la distribution française
Bousculé par le E-Commerce, le monde de la distribution, qu’il s’agisse des magasins de centre-ville, des centres commerciaux et de la grande distribution recherche un second souffle. L’IA et ses promesses sont une piste suivie par beaucoup, avec des degrés de maturité très divers. Lire la suite
-
Projet IT
28 juin 2019
Le ministère des Armées accélère sa stratégie Big Data
Fin 2015, le ministère des Armées met en place un Labo BI & Big Data. Sa mission ? Transformer et numériser les métiers d’aide à la décision par l’apport de méthode et de technologies innovantes. Les premiers résultats sont probants mais les besoins sont nombreux dans le Ministère. Le projet est mis en œuvre sur Elastic Stack. Lire la suite
-
Conseil
25 juin 2019
Plongée dans SAP HANA
Véritable « plateforme » qui va du Data Warehouse au serveur applicatif, en passant par le NoSQL et l'intégration de données, la base in-memory de SAP a beaucoup de visages. Certains sont plus que séduisants, d'autres un peu moins. Lire la suite
-
Actualités
19 juin 2019
MongoDB World : le jour où Atlas devint une plateforme de données
MongoDB a étoffé les services de sa plateforme cloud Atlas en la dotant d’un service de requêtage direct sur S3 et d’une méthode d’indexation des collections de documents dans Lucene. L’outil de visualisation de données de MongoDB rejoint officiellement la plateforme. Lire la suite
-
Projet IT
18 juin 2019
Deep Learning : pour sauver les abeilles, le World Bee Project fait son miel des données
L'organisation de recherche va continuer et approfondir son partenariat pour aller encore plus loin dans l'exploitation de l'IoT, du Big Data et de l'Intelligence Artificielle pour mieux comprendre les signaux envoyés par les abeilles. Et donc mieux protéger ces pollinisateurs indispensables à la planète. Lire la suite
-
Actualités
17 juin 2019
AI Paris 2019 : les entreprises mettent leur Machine Learning en action
La seconde édition du salon dédié à l'Intelligence Artificielle montre que l'âge des PoCs touche à sa fin. Les formes plus complexes d'algorithmes commencent à se répandre. Reste la question majeure du « faire maison » ou du « faire faire ». Lire la suite
-
Projet IT
13 juin 2019
Solvay optimise la production de ses usines grâce à l’IA
En 2018, le groupe chimique annonçait un partenariat avec l’éditeur SAS afin de déployer sa plateforme Data Analytics. Il s’agissait d’outiller la transformation digitale de ses sites industriels initiée en 2016, un programme qui voit aujourd’hui les modèles d’IA arriver dans les usines. Lire la suite
-
Actualités
06 juin 2019
SAP intègre intimement Ariba et Fieldglass (et Concur) pour mieux leur injecter de l'IA
Pour fournir une vision complète des dépenses, SAP a entamé un chantier de rapprochement de ces différents rachats. L'unification des données ouvre également des perspectives pour infuser encore plus les trois outils à l'IA. Lire la suite
-
Actualités
31 mai 2019
L’Union Européenne veut pousser ses entreprises vers l’Open Data
L’Open Data comme moteur de croissance, c’est la position de la commission européenne qui a mis en place un portail de partage des données nationales depuis plusieurs années. Désormais, celle-ci cherche à aider les entreprises à emboîter le pas des Etats. Lire la suite
-
Actualités
29 mai 2019
SAP HANA Cloud Services : SAP étend sa stratégie In-Memory bien au-delà de l'ERP
HANA Cloud Services, la nouvelle offre de Database as a Service de SAP, veut ouvrir HANA à davantage de sources de données et la rendre plus accessible et abordable. Lire la suite
par- La Rédaction
- Philippe Ducellier, Rédacteur en chef adjoint
-
Actualités
28 mai 2019
RGPD un an après : les DPO de Dior, Axa, BNP Paribas et Arkéa témoignent
Le 25 mai 2018 entrait en vigueur le règlement européen relatif aux données personnelles, le fameux RGPD. Ce renforcement de la protection des données personnelles a créé une onde de choc dans les entreprises avec des niveaux de maturité encore très différents d’un secteur à un autre. Lire la suite
-
Conseil
27 mai 2019
Où en est SAP HANA ?
Hasso Plattner, cofondateur de SAP, explique les évolutions de HANA, la manière dont elles répondent aux nouvelles exigences des entreprises et le pourquoi de la restructuration en cours de cette division base de données. Lire la suite
-
Conseil
20 mai 2019
Conseils en matière de stockage pour l'intelligence artificielle et le Machine Learning
Les supports de données destinés aux secteurs de l'intelligence artificielle et du Machine Learning nécessitent une planification particulière. Cet article vous rappelle les points à prendre en compte et ce que vous devez prévoir. Lire la suite
-
Conseil
20 mai 2019
Intelligence Artificielle : changement de paradigme dans le domaine du stockage
Dans le stockage également, l'Intelligence Artificielle a le vent en poupe et peut apporter de nombreux avantages : optimisation des latences, modifications de politique aisées et augmentation des performances. Lire la suite
par- Eran Brown, Infinidat
-
Actualités
20 mai 2019
Ces technologies de stockage sont adaptées à l'IA et au ML
Il existe dans le domaine du stockage des données pour l'IA, le ML et le DL différentes tendances que les entreprises se doivent de connaître. Cet article fournit quelques informations à ce sujet. Lire la suite
-
Actualités
20 mai 2019
Les meilleures pratiques de planification du stockage des données d'intelligence artificielle (IA)
La planification du stockage AI est similaire à la planification du stockage à laquelle vous êtes habitué : Il s’agit de tenir compte de la capacité, des IOPS, et des exigences de fiabilité des données sources et de votre application SGBD. Lire la suite
-
Projet IT
13 mai 2019
Une architecture Data « sur mesure » pour Mars Insight
Il est des objets connectés dont il est particulièrement complexe de récupérer les données. La sonde Mars Insight est certainement de ceux-là puisque ses données doivent parcourir 76 millions de km pour nous parvenir. Une série de satellites relais transmettent les mesures réalisées par la sonde, notamment celles de son sismomètre qui sont traitées au CNES, à Toulouse. Lire la suite
-
Actualités
06 mai 2019
Delta Lake ou comment Databricks veut garantir la qualité des données des data lakes
L’outil prend le nom de Delta Lake sous une licence Apache et entend apporter un niveau standard de qualité aux données des data lakes. Lire la suite
-
Actualités
02 mai 2019
SAP fait un quart de son chiffre d'affaires dans le cloud
Au premier trimestre 2019, SAP a dépassé pour la première fois les 1,5 milliard de revenus cloud. Ses objectifs semblent indiquer une stratégie qui va vers de plus en plus de déploiements dans le cloud public. L'ERP S/4HANA frôle les 11.000 clients dans le monde. Lire la suite
-
Projet IT
19 avr. 2019
Les conseils de Zalando pour rendre votre entreprise « Big Data-driven »
Lors du Salon Big Data Paris, le « Monsieur Données » du e-vendeur d'articles de mode a partagé ses bonnes pratiques pour concevoir, mettre en production et infuser le Machine Learning dans une organisation pour que les modèles soient utilisés (et réutilisés). Lire la suite
-
Projet IT
17 avr. 2019
Le Crédit Agricole s’engage dans un projet Big Data pour gérer des transactions à grande échelle
Face aux nouveaux enjeux des paiements électroniques et de l’Open Banking, le crédit agricole CIB a lancé un vaste projet pour disposer d’un système de messagerie hautes performances basé sur de multiples briques Open Source, le projet CMT, en s’appuyant sur les technologies d’Hortonworks. Lire la suite
-
Actualités
15 avr. 2019
Teradata poursuit sa transformation vers l'analytique dans le cloud
De l'entrepôt de données propriétaire à la plateforme analytique « as a Service », Teradata poursuit sa transformation avec un positionnement et une offre rationalisés. La récente conférence Teradata EMEA Universe a été l'occasion de quelques annonces allant dans le sens de la simplification. Lire la suite
-
Definition
11 avr. 2019
Data science
La data science (littéralement « science des données ») est une discipline qui étudie les informations : leur source, ce qu'elles représentent et les méthodes permettant de les transformer en ressources utiles pour la création de stratégies métier et IT. Lire la suite
-
Conseil
01 avr. 2019
Machine Learning : l'indispensable préparation des données requiert encore (beaucoup) d'humain
Vous voulez automatiser vos processus grâce à l'intelligence artificielle ? D'accord. Mais ne négligez surtout pas le travail manuel qui reste encore nécessaire pour préparer les données avant de les injecter dans les algorithmes. Lire la suite
-
Actualités
01 avr. 2019
Entrepôt de données : Google tire une passerelle directe entre Teradata et BigQuery
Google veut accélérer dans l’entrepôt de données et présente un programme de migration vers BigQuery qui cible les utilisateurs de Teradata et Netezza. Lire la suite
-
Projet IT
01 avr. 2019
Splunk, une tour de contrôle pour les flux mondiaux de Bolloré Logistics
Entreprise étendue s’il en est, Bolloré Logistics s’appuie sur une quarantaine d’applications métier qui doivent échanger des informations au niveau mondial entres elles et avec les clients du logisticien. Une mécanique complexe aujourd’hui supervisée via l’outil Splunk. Lire la suite
-
Actualités
26 mars 2019
In-Memory : Gridgain affine petit à petit son modèle économique
A côté d’une offre très récente de support basique d’Apache Ignite, Gridgain a peaufiné sa propre édition communautaire Gridgain sous sa propre licence. Cela rejoint les éditions Entreprise et Ultimate. L’offre se consolide avant une potentielle autre levée de fonds. Lire la suite
-
Conseil
22 mars 2019
Big Data : ce qu'il faut prendre en compte dans les formats de données
Si JSON est aujourd’hui devenu le format de données de référence pour les développeurs, Parquet, ORC peuvent être de meilleures options pour l’analytique. Cet article vous en dit plus sur les différents formats de données Big Data. Lire la suite
-
Projet IT
19 mars 2019
Big Data : comment Tracfin remonte les filières de blanchiment d’argent sale
Une fois n’est pas coutume, le directeur de la cellule anti-blanchiment de Bercy a livré quelques détails sur l’activité de son service qui vont bien au-delà des chiffres officiels. Ce sont plusieurs millions de documents financiers qui sont analysés chaque année par ses algorithmes pour remonter les filières mafieuses et terroristes, dont celles de Daech. Lire la suite
-
Projet IT
14 mars 2019
Big Data : McDonald’s France sait comment vous venez
En analysant deux années de tickets de caisse, la filiale française du géant de la restauration rapide a réussi à faire des liens entre six milliards de lignes de transactions et des typologies clients. Pour le plus grand bonheur de son marketing qui prévoit déjà des actions. Lire la suite
-
Conseil
14 mars 2019
Le Big Data pour consolider ses données de sécurité : oui, mais de manière ordonnée
Gartner recommande une sérieuse préparation afin d’aligner la collecte et le stockage des données sur les objectifs métiers et les besoins de la plateforme d’analyse ou du prestataire de service managé qui sera éventuellement chargé de la surveillance. Lire la suite
-
Actualités
13 mars 2019
Big Data en France : la maturité grandit au rythme de l’industrialisation des projets
La conférence Big Data Paris 2019 a permis de constater que l’industrialisation de projets Big Data était sur les rails, gage d’une avancée dans la maturité des entreprises en France Lire la suite
-
Conseil
12 mars 2019
Machine Learning : les différentes manières dont le « as a Service » démocratise l'IA
L'émergence d'outils d'Intelligence Artificielle « à la demande » permet à un plus grand nombre d'entreprises, au-delà des géants de la Tech et des multinationales, d'accéder aux avantages du Machine Learning et du Deep Learning. Lire la suite
-
Actualités
12 mars 2019
Big Data Paris 2019 : la fusion Cloudera - Hortonworks prend forme en France
Les entreprises françaises ont désormais accès à des intégrations de produits entre les catalogues des deux sociétés. Dataflow est désormais revendu par Cloudera et Data Science Workbench est proposé aux clients Hortonworks. Le bureau français compte aujourd’hui quelques 40 personnes. Lire la suite
-
Definition
12 mars 2019
Streaming des données (architecture de streaming des données)
Une architecture de données en flux (ou streaming data architecture) est une infrastructure des technologies de l'information qui met l'accent sur le traitement des données en mouvement et considère le traitement par lots de type extraction, transformation et chargement (ETL, Extract, Transform, Load) comme une simple opération dans un flux continu d'événements. Lire la suite
-
Actualités
11 mars 2019
Plateformes Big Data et Data Lake : en tête des déploiements dans les entreprises françaises en 2019
Alors que s’ouvre Big Data Paris ce jour, l’étude Priorités IT 2019 réalisée par TechTarget / LeMagIT montre une volonté forte des entreprises françaises d’investir et de déployer des solutions Big Data , des Data Lakes et des entrepôts de données en 2019. Curieusement, cela ne comprend pas l’intégration de données. Lire la suite
-
Actualités
11 mars 2019
Smart Industries Lyon 2019 : l’usine connectée devient réalité
Ce salon européen confirme la mutation numérique de l’industrie qui s’appuie sur l’Iot, les logiciels de MES et l’analyse des données par l’IA. A la clé, une amélioration de la qualité des produits, une organisation du travail optimisée et une maintenance prédictive efficace. Lire la suite
par- Serge Escalé
-
Actualités
07 mars 2019
Deep Learning : Google verse GPipe et TensorFlow Privacy à l'open source
L'équipe R&D en intelligence artificielle de Google a conçu GPipe comme un framework pour construire des réseaux neuronaux profonds à grande échelle, de manière économe en ressources et fiable. TensorFlow Privacy garantit la confidentialité des données utilisées pour entrainer les algorithmes de Deep Learning. Lire la suite
-
Conseil
06 mars 2019
Qu'est-ce que la virtualisation de données ?
Selon Forrester, la virtualisation de données (ou Data Virtualization) est la forme particulière d'intégration de données qui connaît la croissance la plus rapide. Mais pourquoi est-elle si « particulière » ? Lire la suite
-
Definition
05 mars 2019
DaaS (Data as a Service, données à la demande)
Les données à la demande (DaaS, Data as a Service) désignent un modèle de fourniture et de distribution des informations dans lequel les fichiers de données (texte, images, sons et vidéos) sont mis à la disposition des clients via un réseau, généralement Internet. Lire la suite
-
Conseil
28 févr. 2019
Machine Learning : bien comprendre les trois niveaux d'offres de Google Cloud
APIs et services AutoML pour les développeurs, BigQuery ML pour les Data Analystes, boite à outils à base de Tensorflow pour les Data Scientists, Google segmente très clairement son offre pour toucher le plus d'utilisateurs possibles. Lire la suite
-
Actualités
25 févr. 2019
BI : que change l'acquisition d'Attunity pour les clients de Qlik ?
L'acquisition d'Attunity est un nouveau signe des ambitions de l'éditeur de BI dans la gestion de données - une stratégie qui l'aidera aussi peut-être à attirer de nouveaux clients qui veulent unifier Big Data et analytique. Lire la suite
-
Actualités
19 févr. 2019
Presto se loge dans une fondation open source
Le moteur SQL multi-source évoluera désormais au sein d’une fondation indépendante afin d’en garantir la pérénité et la transparence Lire la suite
par- Jack Vaughan, News and Site Editor
- Cyrille Chausson, Rédacteur en Chef
-
Actualités
18 févr. 2019
Indexima arme son concept de Data Hub avec son format open source K-Store
La société qui voulait accélérer les data lakes avec ses hyper-indexes a ouvert son format K-Store à la communauté open source pour en faire émerger un écosystème et garantir aux utilisateurs d’Indexima l’interopérabilité. Lire la suite
-
Actualités
18 févr. 2019
Gartner voit le Machine Learning changer la face de l'analytique
Dans son top 10 des prévisions sur l’évolution de l’analytique d’ici 2022, Gartner met en avant l’arrivée à maturité d’une Intelligence Artificielle qui s’infuse désormais dans quasiment tous les outils – de la BI à la gestion des données en passant par l’analytique intégrée. Lire la suite
-
Conseil
15 févr. 2019
Machine Learning : comment choisir le bon framework ?
Ce ne sont pas les outils open source qui manquent pour le Machine Learning et le Deep Learning. A tel point que choisir les bons peut vite devenir une gageure. Pour faire un choix avisé, voici quelques conseils de spécialistes à bien garder à l'esprit. Lire la suite
-
Actualités
08 févr. 2019
L’open core attire : Databricks séduit Microsoft, Confluent accueille Sequoia
250 M$ pour le premier, 125 M$ pour le second : Databricks et Confluent ont démarré 2019 en annonçant des levées de fonds, mettant en avant l’intérêt par les investisseurs du modèle open core. Lire la suite
-
Actualités
07 févr. 2019
Les directions métiers françaises peu intéressées par le Machine Learning et le prédictif (IDC)
A la place, elles souhaitent faire de l'analytique en temps réel, améliorer la qualité de leurs données et avoir de l'aide pour s'autonomiser, selon une étude d'IDC France. Mais les freins, dont le manque de compétences internes, restent nombreux pour tous les types de projets analytiques. Lire la suite
-
Conseil
31 janv. 2019
Des données non structurées aux données structurées : c’est possible avec le Machine Learning
Avec la puissance de calcul facilement accessible et les progrès en matière de Machine Learning, il devient plus facile et moins coûteux de transformer les données non structurées en sources d'information comestible. Lire la suite
-
Projet IT
29 janv. 2019
BlaBlaCar met du Google Cloud dans son moteur
Pour soutenir sa croissance y compris à l'international, le spécialiste français du covoiturage explique les trois points qui lui ont fait choisir le cloud (PaaS et IaaS) de Google pour migrer sa plateforme dans le cloud. Lire la suite
-
Actualités
25 janv. 2019
Deep Learning : trois nouvelles approches montent en puissance
Les réseaux antagonistes génératifs, l'apprentissage par renforcement et l'apprentissage par transfert sont des approches explorées par les théoriciens et les chercheurs depuis des années. Mais grâce aux récentes évolutions technologiques, ces nouvelles techniques d'apprentissage profond deviennent enfin utilisables pour les entreprises. Lire la suite
-
Actualités
23 janv. 2019
Oliver Ratzesberger, CEO de Teradata : « notre héritage nous a donnés un avantage technologique »
Le cloud et l’AI sont deux des priorités du nouveau CEO de Teradata, qui revient également sur le positionnement de l’entrepôt de données dans un monde de la donnée très changeant. Lire la suite
-
Actualités
07 janv. 2019
Confluent bride à son tour la licence open source de sa plateforme Kafka
Comme Redis Labs et MongoDB, Confluent ne souhaite pas que ses développements autour de Kafka soient intégrés dans des services cloud potentiellement concurrents. Lire la suite
-
Actualités
04 janv. 2019
Cloudera – Hortonworks : la fusion est désormais officielle
Comme prévu, la fusion des deux pure-players du monde Hadoop a été officialisée en ce début 2019. Le nouveau Cloudera pèse 720 millions de dollars et mise sur une plateforme cloud intégrée. Lire la suite
-
Actualités
27 déc. 2018
L'Intelligence Artificielle amenée à se simplifier et à se questionner en 2019
Beaucoup d'analyses sur l'IA sont contradictoires. Mais un consensus émerge pour dire qu'elle va se démocratiser rapidement, créant un besoin d'encadrement de l'exploitation des données et de prise en compte des biais algorithmiques ou humains. Lire la suite
-
Actualités
12 déc. 2018
Saagie : du data lake-as-a-service à la gouvernance des données pour servir les métiers
La startup compte désormais piloter les data lakes des entreprises en y adjoignant des outils de gouvernance des données afin de cibler des usages métiers. Saagie a bénéficié d’un accompagnement de Capgemini via son programme AIE pour se ré-ajuster. Lire la suite
-
Actualités
10 déc. 2018
Cloudera ouvre un club d’utilisateurs en France pour favoriser le partage d’expériences
Ce groupe réunit les grands clients afin qu’ils partagent des bonnes pratiques et des expériences en matière de technologies et de conduite de projets. Lire la suite
-
Projet IT
05 déc. 2018
Intelligence artificielle : comment Total est passé du « PoC » à la production
Depuis plusieurs années, les Data Scientists de Total développent des modèles d’IA avec des PoC réalisés pour le marketing ou la branche exploration / production. L’industriel explique comment il met aujourd'hui ces modèles en production qui est aujourd’hui industrialisée, grâce aux conteneurs et aux workflows Airflow. Lire la suite
-
Definition
04 déc. 2018
Génération automatique de textes en langage naturel (GAT ou NLG)
La génération automatique de textes (GAT ou NLG, pour Natural Language Generation) est un domaine de l'intelligence artificielle (IA) qui vise à produire du contenu ou un discours comparable à celui des humains à partir d’un ensemble de données. Lire la suite
-
Conseil
30 nov. 2018
Intelligence Artificielle : quelle différence entre NLP et NLU ?
NLP (Natural Language Processing) et NLU (Natural Language Understanding) sont de plus en plus importants dans l'entreprise. Le premier se contente d'analyser les mots, mais le second vise à approfondir la compréhension. Lire la suite
-
Conseil
30 nov. 2018
S3 contre HDFS : que choisir pour son data lake
Un lac de données bâti sur S3 rationalise l'analyse des données, mais présente des limites pour ceux qui veulent aller au-delà de l'écosystème du groupe. Lire la suite
-
Projet IT
27 nov. 2018
EAM / GMAO : Eiffage révolutionne la gestion de son parc matériel
Fort d'un parc d'équipement très développé, le groupe Eiffage a saisi l'opportunité en 2016 de remettre à plat sa stratégie, en numérisant et en unifiant presque totalement le suivi de ses matériels avec un seul et unique EAM (Enterprise Asset Management). Lire la suite
-
Projet IT
26 nov. 2018
AirAsia veut devenir une compagnie « Data First » en s'envolant vers le cloud
La compagnie low-cost compte sur le big data et l'analytique de Google pour développer ses revenus, sans augmenter ses billets. Son PDG imagine des voyages « sans couture » entièrement dématérialisés, y compris aux frontières. Et il se réjouit de la collaboration horizontale et verticale que permet G-Suite dans une entreprise sans intermédiaire syndical. Lire la suite
-
Conseil
22 nov. 2018
Gouvernance et data lake : quelles sont les difficultés rencontrées par les entreprises
La mise en place d’une gouvernance de données à un data lake reste compliquée. Cette capacité à déstructurer complique la mise en place de politiques et de gestion précises des données. Pourtant, la gouvernance reste indispensable. Cet article passe au crible les points problématiques. Lire la suite
-
Actualités
19 nov. 2018
Après 22 ans chez Oracle, Thomas Kurian débarque chez Google
L'ex-Président du Développement Produits d'Oracle avait quitté l'éditeur cette année après une brouille supposée avec son CTO. Il a été recruté pour prendre la succession de Diane Greene (ex-VMware) à la tête de Google Cloud. Sa mission : en faire un cloud réellement B2B. Lire la suite
-
Actualités
08 nov. 2018
MapR et Clarity : un gros clin d’oeil aux clients de Cloudera et Hortonworks
A travers son programme Clarity, la société veut rapatrier les clients pour qui le rachat d’Hortonworks par Cloudera reste confus. Lire la suite
-
Actualités
07 nov. 2018
La SNCF s’appuiera sur Azure pour l’information voyageur et la maintenance prédictive
La SNCF a détaillé un peu plus les applications qui utiliseront les services Azure dans le cadre de son grand projet de migration vers le cloud public. Après AWS et IBM, c’est au tour de Microsoft. Lire la suite
-
Actualités
07 nov. 2018
Gartner : un top 10 des prédictions 2019 dominé par l’IA et les risques sur la confidentialité
IA embryonnaire, transformation digitale et prééminence des médias sociaux irréversibles, risque concernant la confidentialité et le cyber-harcèlement : lors de son Symposium 2018, Gartner a présenté une vision chaotique des grandes tendances qui influeront le développement des SI en 2019. Lire la suite
-
Actualités
06 nov. 2018
Gartner Symposium 2018 : 5 priorités pour le DSI du futur
Le DSI du futur sera dynamique et montrera de grandes capacités d’adaptation et de résilience ou ne sera pas. Gartner dresse un portrait tout-terrain de l’IT qui s’impose désormais dans les organisations avec 5 axes à privilégier : la confidentialité des données, l’intelligence augmentée, la culture numérique, la gestion IT orientée produits et le développement de Digital Twins. Lire la suite
-
Conseil
02 nov. 2018
L'essentiel sur les trois versions d’Oracle Cloud at Customer
La gamme d’appliances Cloud@Customer permet aux entreprises de faire tourner le cloud d’Oracle (IaaS, PaaS, SaaS) dans leurs propres centres de données. Voici ce qui différencie les trois versions de cette offre managée qui est à la fois « sur site » et « cloud ». Lire la suite
-
Conseil
02 nov. 2018
Big Data et analytique : des conseils pour optimiser les traitements
Analyser des données brutes demeure une opération difficile et les entreprises ne sont souvent pas ou peu préparées à affronter la masse de données créée au quotidien. Voici quelques conseils pour mieux s’y retrouver. Lire la suite
-
Definition
31 oct. 2018
Apprentissage supervisé
L'apprentissage supervisé, dans le contexte de l'intelligence artificielle (IA) et de l'apprentissage automatique, est un système qui fournit à la fois les données en entrée et les données attendues en sortie. Lire la suite