Big Data et Data lake
-
Actualités
25 avr. 2025
Avec sa « Data Platform », OVHcloud se frotte à Big Query, Microsoft Fabric et Snowflake
La nouvelle « Data Platform » d’OVHcloud se présente comme une solution unifiée pour orchestrer l’ensemble du cycle de vie des données, de la collecte au déploiement de modèles d’intelligence artificielle. Le tout dans un cloud souverain. Lire la suite
-
Actualités
24 avr. 2025
En acquérant Metaplane, Datadog parie sur l’observabilité de données
Datadog évoque des clients qui intègrent déjà la data science aux processus DevOps. Avec sa dernière acquisition en date, l’éditeur vise à créer un ensemble d’outils unifiés adaptés à ce point de convergence naissant. Lire la suite
- Relevez les défis des charges de travail liées à l'IA avec le portefeuille IA ... –Livre Blanc
- Optez pour une technologie à haute efficacité de données afin de réduire le ... –Livre Blanc
- Augmentez la sécurité, la durabilité et l'efficacité grâce aux outils de ... –Livre Blanc
-
Dans ce numéro:
- Magazine Information Sécurité 30 : Là où commencent les cyberattaques
- Chakib Gzenayi : « L’EASM est important, mais le renseignement est plus important que tout »
- Michelin face à la problématique de gestion de la surface d’attaque exposée
-
Actualités
16 oct. 2019
Alteryx met les voiles sur l’automatisation du Machine Learning
Lors de son évènement européen, l’éditeur américain a annoncé la bêta d’un outil pour aider les métiers à se lancer dans les algorithmes. Mais Alteryx ne néglige pas la Data Prep, qui reste un de ses atouts clefs, y compris pour ses nouvelles promesses dans le Machine Learning. Lire la suite
-
Actualités
14 oct. 2019
BI : Alteryx rachète Feature Labs pour automatiser la préparation des algorithmes
La startup du MIT qu'a rachetée Alteryx est spécialiste du « feature engineering ». Elle détermine les variables d'entrées pertinentes pour un algorithme en fonction des données. Une manifestation de plus de l'arrivée de « l'Intelligence Augmentée » chez les gros de la BI. Lire la suite
-
Actualités
11 oct. 2019
L’entreprise intelligente de SAP, un concept aux contours flous
Qu’est-ce que le concept d’entreprise intelligente signifie réellement ? Si le terme de SAP vous trouble, vous n’êtes pas seul. Voilà ce qu’en disent les experts et pourquoi il semble important. Lire la suite
-
Actualités
08 oct. 2019
Snowflake Summit 2019 sous le signe du partage des données
La conférence de la startup, qui se tenait la semaine dernière à Londres, a permis d’en savoir plus sur les nouveautés de l’entrepôt de données « as a service », son futur et certains de ses clients tels qu’Oney Data, filiale d’Auchan spécialisée dans l’analyse de données. Lire la suite
-
Actualités
04 oct. 2019
Cloudera ouvre les voies du multicloud à ses clients
Cloudera a lancé à la fin du mois de septembre sa plateforme Big Data combinant ses technologies et celles d’Hortonworks dans le cloud AWS. Le support du multicloud est d’ores et déjà annoncé. Lire la suite
par- Craig Stedman, Editor at Large
- Gaétan Raoul, LeMagIT
-
Actualités
01 oct. 2019
Tibco porte Orchestra sur le cloud
Londres (Tibco Now 2019) : la solution de gestion de métadonnées EBX, mise au point à l’origine par Orchestra, est disponible en mode SaaS. Lire la suite
-
Actualités
25 sept. 2019
OpenWorld 2019 : Clive Swan remet le point sur le I d’IA
Pour le patron de l’IA chez Oracle, nombre d’entreprises voient leurs projets de Machine Learning échouer. En cause : des données incomplètes et des datascientists absents. Lire la suite
-
Projet IT
23 sept. 2019
Sous pression, le transport aérien entame sa révolution IT (SITA)
Avec une croissance exponentielle du trafic passagers et des capacités aéroportuaires qui stagnent, l'aérien est sous tension. Le secteur est dans l'obligation de se réinventer, de s'améliorer, de s'optimiser et de s'automatiser pour encaisser la charge, partout dans le monde, avec l'IT - et demain l'IA. Des offres que propose l'historique du secteur, SITA. Lire la suite
-
Definition
16 sept. 2019
In-memory data grid (grille de données In-Memory)
Une grille de données en mémoire, ou grille de données In-Memory (IMDG, In-Memory Data Grid), est une structure de données qui réside intégralement en mémoire vive, ou RAM (Random Access Memory), et qui est répartie sur plusieurs serveurs. Lire la suite
-
Definition
10 sept. 2019
Gouvernance des données
La gouvernance des données (GD, ou data governance – DG – en anglais) consiste en la gestion globale de la disponibilité, de l'exploitabilité, de l'intégrité et de la sécurité des données utilisées dans une entreprise. Lire la suite
-
Actualités
06 sept. 2019
Data War : « Applications et Données » numéro 5 est sorti
Au sommaire : une plongée dans HANA, le Data Catalog de Tableau, le coach virtuel du CHU d’Île-de-France, le « reboot » de MicroStrategy, l’IA et les abeilles, et la réponse à la question : la blockchain dans la supply chain a-t-elle du sens ? Lire la suite
-
Conseil
14 août 2019
Data Architect, Data Engineer, Data Scientist, Data Modeler : comment les combiner ?
Ces quatre métiers – complémentaires, mais différents – sont clefs pour une équipe Data performante. L’expert Michael Bowers explique comment constituer une telle équipe et donne ses conseils aux professionnels de la donnée pour augmenter leurs revenus. Lire la suite
-
Actualités
08 août 2019
MapR se vend à HPE : vers l’hiver des pure-players du Big Data
La disparition de MapR, grand pionnier du Big Data, dans HPE pourrait bien être le signe du début de l'extinction des dinosaures d'Hadoop dont Hortonworks et Cloudera. Lire la suite
-
Projet IT
22 juil. 2019
Comment l’innovation IT influence la gouvernance des villes de Vienne, Helsinki et Belfast
Des leaders du numérique dans les villes de Vienne (Autriche), Helsinki (Finlande) et Belfast (Irlande du Nord) mettent en œuvre des stratégies de services innovants, au service des citoyens et des économies locales. Lire la suite
-
Projet IT
11 juil. 2019
Pourquoi Solocal a basculé sa plateforme Big Data vers le cloud
La Data est au cœur de l’activité de Solocal et après l’ère des Data Warehouse, du Big Data avec Hadoop, le Français aborde celle du cloud et de l’IA avec Microsoft et Google. C’est vers le second que Solocal a choisi de migrer son Data Lake. Lire la suite
-
Actualités
09 juil. 2019
L’IA monte en puissance dans le secteur de la distribution française
Bousculé par le E-Commerce, le monde de la distribution, qu’il s’agisse des magasins de centre-ville, des centres commerciaux et de la grande distribution recherche un second souffle. L’IA et ses promesses sont une piste suivie par beaucoup, avec des degrés de maturité très divers. Lire la suite
-
Projet IT
28 juin 2019
Le ministère des Armées accélère sa stratégie Big Data
Fin 2015, le ministère des Armées met en place un Labo BI & Big Data. Sa mission ? Transformer et numériser les métiers d’aide à la décision par l’apport de méthode et de technologies innovantes. Les premiers résultats sont probants mais les besoins sont nombreux dans le Ministère. Le projet est mis en œuvre sur Elastic Stack. Lire la suite
-
Conseil
25 juin 2019
Plongée dans SAP HANA
Véritable « plateforme » qui va du Data Warehouse au serveur applicatif, en passant par le NoSQL et l'intégration de données, la base in-memory de SAP a beaucoup de visages. Certains sont plus que séduisants, d'autres un peu moins. Lire la suite
-
Actualités
19 juin 2019
MongoDB World : le jour où Atlas devint une plateforme de données
MongoDB a étoffé les services de sa plateforme cloud Atlas en la dotant d’un service de requêtage direct sur S3 et d’une méthode d’indexation des collections de documents dans Lucene. L’outil de visualisation de données de MongoDB rejoint officiellement la plateforme. Lire la suite
-
Projet IT
18 juin 2019
Deep Learning : pour sauver les abeilles, le World Bee Project fait son miel des données
L'organisation de recherche va continuer et approfondir son partenariat pour aller encore plus loin dans l'exploitation de l'IoT, du Big Data et de l'Intelligence Artificielle pour mieux comprendre les signaux envoyés par les abeilles. Et donc mieux protéger ces pollinisateurs indispensables à la planète. Lire la suite
-
Actualités
17 juin 2019
AI Paris 2019 : les entreprises mettent leur Machine Learning en action
La seconde édition du salon dédié à l'Intelligence Artificielle montre que l'âge des PoCs touche à sa fin. Les formes plus complexes d'algorithmes commencent à se répandre. Reste la question majeure du « faire maison » ou du « faire faire ». Lire la suite
-
Projet IT
13 juin 2019
Solvay optimise la production de ses usines grâce à l’IA
En 2018, le groupe chimique annonçait un partenariat avec l’éditeur SAS afin de déployer sa plateforme Data Analytics. Il s’agissait d’outiller la transformation digitale de ses sites industriels initiée en 2016, un programme qui voit aujourd’hui les modèles d’IA arriver dans les usines. Lire la suite
-
Actualités
06 juin 2019
SAP intègre intimement Ariba et Fieldglass (et Concur) pour mieux leur injecter de l'IA
Pour fournir une vision complète des dépenses, SAP a entamé un chantier de rapprochement de ces différents rachats. L'unification des données ouvre également des perspectives pour infuser encore plus les trois outils à l'IA. Lire la suite
-
Actualités
31 mai 2019
L’Union Européenne veut pousser ses entreprises vers l’Open Data
L’Open Data comme moteur de croissance, c’est la position de la commission européenne qui a mis en place un portail de partage des données nationales depuis plusieurs années. Désormais, celle-ci cherche à aider les entreprises à emboîter le pas des Etats. Lire la suite
-
Actualités
29 mai 2019
SAP HANA Cloud Services : SAP étend sa stratégie In-Memory bien au-delà de l'ERP
HANA Cloud Services, la nouvelle offre de Database as a Service de SAP, veut ouvrir HANA à davantage de sources de données et la rendre plus accessible et abordable. Lire la suite
par- La Rédaction
- Philippe Ducellier, Rédacteur en chef adjoint
-
Actualités
28 mai 2019
RGPD un an après : les DPO de Dior, Axa, BNP Paribas et Arkéa témoignent
Le 25 mai 2018 entrait en vigueur le règlement européen relatif aux données personnelles, le fameux RGPD. Ce renforcement de la protection des données personnelles a créé une onde de choc dans les entreprises avec des niveaux de maturité encore très différents d’un secteur à un autre. Lire la suite
-
Conseil
27 mai 2019
Où en est SAP HANA ?
Hasso Plattner, cofondateur de SAP, explique les évolutions de HANA, la manière dont elles répondent aux nouvelles exigences des entreprises et le pourquoi de la restructuration en cours de cette division base de données. Lire la suite
-
Conseil
20 mai 2019
Conseils en matière de stockage pour l'intelligence artificielle et le Machine Learning
Les supports de données destinés aux secteurs de l'intelligence artificielle et du Machine Learning nécessitent une planification particulière. Cet article vous rappelle les points à prendre en compte et ce que vous devez prévoir. Lire la suite
-
Conseil
20 mai 2019
Intelligence Artificielle : changement de paradigme dans le domaine du stockage
Dans le stockage également, l'Intelligence Artificielle a le vent en poupe et peut apporter de nombreux avantages : optimisation des latences, modifications de politique aisées et augmentation des performances. Lire la suite
par- Eran Brown, Infinidat
-
Actualités
20 mai 2019
Ces technologies de stockage sont adaptées à l'IA et au ML
Il existe dans le domaine du stockage des données pour l'IA, le ML et le DL différentes tendances que les entreprises se doivent de connaître. Cet article fournit quelques informations à ce sujet. Lire la suite
-
Actualités
20 mai 2019
Les meilleures pratiques de planification du stockage des données d'intelligence artificielle (IA)
La planification du stockage AI est similaire à la planification du stockage à laquelle vous êtes habitué : Il s’agit de tenir compte de la capacité, des IOPS, et des exigences de fiabilité des données sources et de votre application SGBD. Lire la suite
-
Projet IT
13 mai 2019
Une architecture Data « sur mesure » pour Mars Insight
Il est des objets connectés dont il est particulièrement complexe de récupérer les données. La sonde Mars Insight est certainement de ceux-là puisque ses données doivent parcourir 76 millions de km pour nous parvenir. Une série de satellites relais transmettent les mesures réalisées par la sonde, notamment celles de son sismomètre qui sont traitées au CNES, à Toulouse. Lire la suite
-
Actualités
06 mai 2019
Delta Lake ou comment Databricks veut garantir la qualité des données des data lakes
L’outil prend le nom de Delta Lake sous une licence Apache et entend apporter un niveau standard de qualité aux données des data lakes. Lire la suite
-
Actualités
02 mai 2019
SAP fait un quart de son chiffre d'affaires dans le cloud
Au premier trimestre 2019, SAP a dépassé pour la première fois les 1,5 milliard de revenus cloud. Ses objectifs semblent indiquer une stratégie qui va vers de plus en plus de déploiements dans le cloud public. L'ERP S/4HANA frôle les 11.000 clients dans le monde. Lire la suite
-
Projet IT
19 avr. 2019
Les conseils de Zalando pour rendre votre entreprise « Big Data-driven »
Lors du Salon Big Data Paris, le « Monsieur Données » du e-vendeur d'articles de mode a partagé ses bonnes pratiques pour concevoir, mettre en production et infuser le Machine Learning dans une organisation pour que les modèles soient utilisés (et réutilisés). Lire la suite
-
Projet IT
17 avr. 2019
Le Crédit Agricole s’engage dans un projet Big Data pour gérer des transactions à grande échelle
Face aux nouveaux enjeux des paiements électroniques et de l’Open Banking, le crédit agricole CIB a lancé un vaste projet pour disposer d’un système de messagerie hautes performances basé sur de multiples briques Open Source, le projet CMT, en s’appuyant sur les technologies d’Hortonworks. Lire la suite
-
Actualités
15 avr. 2019
Teradata poursuit sa transformation vers l'analytique dans le cloud
De l'entrepôt de données propriétaire à la plateforme analytique « as a Service », Teradata poursuit sa transformation avec un positionnement et une offre rationalisés. La récente conférence Teradata EMEA Universe a été l'occasion de quelques annonces allant dans le sens de la simplification. Lire la suite
-
Definition
11 avr. 2019
Data science
La data science (littéralement « science des données ») est une discipline qui étudie les informations : leur source, ce qu'elles représentent et les méthodes permettant de les transformer en ressources utiles pour la création de stratégies métier et IT. Lire la suite
-
Conseil
01 avr. 2019
Machine Learning : l'indispensable préparation des données requiert encore (beaucoup) d'humain
Vous voulez automatiser vos processus grâce à l'intelligence artificielle ? D'accord. Mais ne négligez surtout pas le travail manuel qui reste encore nécessaire pour préparer les données avant de les injecter dans les algorithmes. Lire la suite
-
Actualités
01 avr. 2019
Entrepôt de données : Google tire une passerelle directe entre Teradata et BigQuery
Google veut accélérer dans l’entrepôt de données et présente un programme de migration vers BigQuery qui cible les utilisateurs de Teradata et Netezza. Lire la suite
-
Projet IT
01 avr. 2019
Splunk, une tour de contrôle pour les flux mondiaux de Bolloré Logistics
Entreprise étendue s’il en est, Bolloré Logistics s’appuie sur une quarantaine d’applications métier qui doivent échanger des informations au niveau mondial entres elles et avec les clients du logisticien. Une mécanique complexe aujourd’hui supervisée via l’outil Splunk. Lire la suite
-
Actualités
26 mars 2019
In-Memory : Gridgain affine petit à petit son modèle économique
A côté d’une offre très récente de support basique d’Apache Ignite, Gridgain a peaufiné sa propre édition communautaire Gridgain sous sa propre licence. Cela rejoint les éditions Entreprise et Ultimate. L’offre se consolide avant une potentielle autre levée de fonds. Lire la suite
-
Conseil
22 mars 2019
Big Data : ce qu'il faut prendre en compte dans les formats de données
Si JSON est aujourd’hui devenu le format de données de référence pour les développeurs, Parquet, ORC peuvent être de meilleures options pour l’analytique. Cet article vous en dit plus sur les différents formats de données Big Data. Lire la suite
-
Projet IT
19 mars 2019
Big Data : comment Tracfin remonte les filières de blanchiment d’argent sale
Une fois n’est pas coutume, le directeur de la cellule anti-blanchiment de Bercy a livré quelques détails sur l’activité de son service qui vont bien au-delà des chiffres officiels. Ce sont plusieurs millions de documents financiers qui sont analysés chaque année par ses algorithmes pour remonter les filières mafieuses et terroristes, dont celles de Daech. Lire la suite
-
Projet IT
14 mars 2019
Big Data : McDonald’s France sait comment vous venez
En analysant deux années de tickets de caisse, la filiale française du géant de la restauration rapide a réussi à faire des liens entre six milliards de lignes de transactions et des typologies clients. Pour le plus grand bonheur de son marketing qui prévoit déjà des actions. Lire la suite
-
Conseil
14 mars 2019
Le Big Data pour consolider ses données de sécurité : oui, mais de manière ordonnée
Gartner recommande une sérieuse préparation afin d’aligner la collecte et le stockage des données sur les objectifs métiers et les besoins de la plateforme d’analyse ou du prestataire de service managé qui sera éventuellement chargé de la surveillance. Lire la suite
-
Actualités
13 mars 2019
Big Data en France : la maturité grandit au rythme de l’industrialisation des projets
La conférence Big Data Paris 2019 a permis de constater que l’industrialisation de projets Big Data était sur les rails, gage d’une avancée dans la maturité des entreprises en France Lire la suite
-
Conseil
12 mars 2019
Machine Learning : les différentes manières dont le « as a Service » démocratise l'IA
L'émergence d'outils d'Intelligence Artificielle « à la demande » permet à un plus grand nombre d'entreprises, au-delà des géants de la Tech et des multinationales, d'accéder aux avantages du Machine Learning et du Deep Learning. Lire la suite
-
Actualités
12 mars 2019
Big Data Paris 2019 : la fusion Cloudera - Hortonworks prend forme en France
Les entreprises françaises ont désormais accès à des intégrations de produits entre les catalogues des deux sociétés. Dataflow est désormais revendu par Cloudera et Data Science Workbench est proposé aux clients Hortonworks. Le bureau français compte aujourd’hui quelques 40 personnes. Lire la suite
-
Definition
12 mars 2019
Streaming des données (architecture de streaming des données)
Une architecture de données en flux (ou streaming data architecture) est une infrastructure des technologies de l'information qui met l'accent sur le traitement des données en mouvement et considère le traitement par lots de type extraction, transformation et chargement (ETL, Extract, Transform, Load) comme une simple opération dans un flux continu d'événements. Lire la suite
-
Actualités
11 mars 2019
Plateformes Big Data et Data Lake : en tête des déploiements dans les entreprises françaises en 2019
Alors que s’ouvre Big Data Paris ce jour, l’étude Priorités IT 2019 réalisée par TechTarget / LeMagIT montre une volonté forte des entreprises françaises d’investir et de déployer des solutions Big Data , des Data Lakes et des entrepôts de données en 2019. Curieusement, cela ne comprend pas l’intégration de données. Lire la suite
-
Actualités
11 mars 2019
Smart Industries Lyon 2019 : l’usine connectée devient réalité
Ce salon européen confirme la mutation numérique de l’industrie qui s’appuie sur l’Iot, les logiciels de MES et l’analyse des données par l’IA. A la clé, une amélioration de la qualité des produits, une organisation du travail optimisée et une maintenance prédictive efficace. Lire la suite
par- Serge Escalé
-
Actualités
07 mars 2019
Deep Learning : Google verse GPipe et TensorFlow Privacy à l'open source
L'équipe R&D en intelligence artificielle de Google a conçu GPipe comme un framework pour construire des réseaux neuronaux profonds à grande échelle, de manière économe en ressources et fiable. TensorFlow Privacy garantit la confidentialité des données utilisées pour entrainer les algorithmes de Deep Learning. Lire la suite
-
Conseil
06 mars 2019
Qu'est-ce que la virtualisation de données ?
Selon Forrester, la virtualisation de données (ou Data Virtualization) est la forme particulière d'intégration de données qui connaît la croissance la plus rapide. Mais pourquoi est-elle si « particulière » ? Lire la suite
-
Definition
05 mars 2019
DaaS (Data as a Service, données à la demande)
Les données à la demande (DaaS, Data as a Service) désignent un modèle de fourniture et de distribution des informations dans lequel les fichiers de données (texte, images, sons et vidéos) sont mis à la disposition des clients via un réseau, généralement Internet. Lire la suite
-
Conseil
28 févr. 2019
Machine Learning : bien comprendre les trois niveaux d'offres de Google Cloud
APIs et services AutoML pour les développeurs, BigQuery ML pour les Data Analystes, boite à outils à base de Tensorflow pour les Data Scientists, Google segmente très clairement son offre pour toucher le plus d'utilisateurs possibles. Lire la suite
-
Actualités
25 févr. 2019
BI : que change l'acquisition d'Attunity pour les clients de Qlik ?
L'acquisition d'Attunity est un nouveau signe des ambitions de l'éditeur de BI dans la gestion de données - une stratégie qui l'aidera aussi peut-être à attirer de nouveaux clients qui veulent unifier Big Data et analytique. Lire la suite
-
Actualités
19 févr. 2019
Presto se loge dans une fondation open source
Le moteur SQL multi-source évoluera désormais au sein d’une fondation indépendante afin d’en garantir la pérénité et la transparence Lire la suite
par- Jack Vaughan, News and Site Editor
- Cyrille Chausson, Rédacteur en Chef
-
Actualités
18 févr. 2019
Indexima arme son concept de Data Hub avec son format open source K-Store
La société qui voulait accélérer les data lakes avec ses hyper-indexes a ouvert son format K-Store à la communauté open source pour en faire émerger un écosystème et garantir aux utilisateurs d’Indexima l’interopérabilité. Lire la suite
-
Actualités
18 févr. 2019
Gartner voit le Machine Learning changer la face de l'analytique
Dans son top 10 des prévisions sur l’évolution de l’analytique d’ici 2022, Gartner met en avant l’arrivée à maturité d’une Intelligence Artificielle qui s’infuse désormais dans quasiment tous les outils – de la BI à la gestion des données en passant par l’analytique intégrée. Lire la suite
-
Conseil
15 févr. 2019
Machine Learning : comment choisir le bon framework ?
Ce ne sont pas les outils open source qui manquent pour le Machine Learning et le Deep Learning. A tel point que choisir les bons peut vite devenir une gageure. Pour faire un choix avisé, voici quelques conseils de spécialistes à bien garder à l'esprit. Lire la suite
-
Actualités
08 févr. 2019
L’open core attire : Databricks séduit Microsoft, Confluent accueille Sequoia
250 M$ pour le premier, 125 M$ pour le second : Databricks et Confluent ont démarré 2019 en annonçant des levées de fonds, mettant en avant l’intérêt par les investisseurs du modèle open core. Lire la suite
-
Actualités
07 févr. 2019
Les directions métiers françaises peu intéressées par le Machine Learning et le prédictif (IDC)
A la place, elles souhaitent faire de l'analytique en temps réel, améliorer la qualité de leurs données et avoir de l'aide pour s'autonomiser, selon une étude d'IDC France. Mais les freins, dont le manque de compétences internes, restent nombreux pour tous les types de projets analytiques. Lire la suite
-
Conseil
31 janv. 2019
Des données non structurées aux données structurées : c’est possible avec le Machine Learning
Avec la puissance de calcul facilement accessible et les progrès en matière de Machine Learning, il devient plus facile et moins coûteux de transformer les données non structurées en sources d'information comestible. Lire la suite
-
Projet IT
29 janv. 2019
BlaBlaCar met du Google Cloud dans son moteur
Pour soutenir sa croissance y compris à l'international, le spécialiste français du covoiturage explique les trois points qui lui ont fait choisir le cloud (PaaS et IaaS) de Google pour migrer sa plateforme dans le cloud. Lire la suite
-
Actualités
25 janv. 2019
Deep Learning : trois nouvelles approches montent en puissance
Les réseaux antagonistes génératifs, l'apprentissage par renforcement et l'apprentissage par transfert sont des approches explorées par les théoriciens et les chercheurs depuis des années. Mais grâce aux récentes évolutions technologiques, ces nouvelles techniques d'apprentissage profond deviennent enfin utilisables pour les entreprises. Lire la suite
-
Actualités
23 janv. 2019
Oliver Ratzesberger, CEO de Teradata : « notre héritage nous a donnés un avantage technologique »
Le cloud et l’AI sont deux des priorités du nouveau CEO de Teradata, qui revient également sur le positionnement de l’entrepôt de données dans un monde de la donnée très changeant. Lire la suite
-
Actualités
07 janv. 2019
Confluent bride à son tour la licence open source de sa plateforme Kafka
Comme Redis Labs et MongoDB, Confluent ne souhaite pas que ses développements autour de Kafka soient intégrés dans des services cloud potentiellement concurrents. Lire la suite
-
Actualités
04 janv. 2019
Cloudera – Hortonworks : la fusion est désormais officielle
Comme prévu, la fusion des deux pure-players du monde Hadoop a été officialisée en ce début 2019. Le nouveau Cloudera pèse 720 millions de dollars et mise sur une plateforme cloud intégrée. Lire la suite
-
Actualités
27 déc. 2018
L'Intelligence Artificielle amenée à se simplifier et à se questionner en 2019
Beaucoup d'analyses sur l'IA sont contradictoires. Mais un consensus émerge pour dire qu'elle va se démocratiser rapidement, créant un besoin d'encadrement de l'exploitation des données et de prise en compte des biais algorithmiques ou humains. Lire la suite
-
Actualités
12 déc. 2018
Saagie : du data lake-as-a-service à la gouvernance des données pour servir les métiers
La startup compte désormais piloter les data lakes des entreprises en y adjoignant des outils de gouvernance des données afin de cibler des usages métiers. Saagie a bénéficié d’un accompagnement de Capgemini via son programme AIE pour se ré-ajuster. Lire la suite
-
Actualités
10 déc. 2018
Cloudera ouvre un club d’utilisateurs en France pour favoriser le partage d’expériences
Ce groupe réunit les grands clients afin qu’ils partagent des bonnes pratiques et des expériences en matière de technologies et de conduite de projets. Lire la suite
-
Projet IT
05 déc. 2018
Intelligence artificielle : comment Total est passé du « PoC » à la production
Depuis plusieurs années, les Data Scientists de Total développent des modèles d’IA avec des PoC réalisés pour le marketing ou la branche exploration / production. L’industriel explique comment il met aujourd'hui ces modèles en production qui est aujourd’hui industrialisée, grâce aux conteneurs et aux workflows Airflow. Lire la suite
-
Definition
04 déc. 2018
Génération automatique de textes en langage naturel (GAT ou NLG)
La génération automatique de textes (GAT ou NLG, pour Natural Language Generation) est un domaine de l'intelligence artificielle (IA) qui vise à produire du contenu ou un discours comparable à celui des humains à partir d’un ensemble de données. Lire la suite
-
Conseil
30 nov. 2018
Intelligence Artificielle : quelle différence entre NLP et NLU ?
NLP (Natural Language Processing) et NLU (Natural Language Understanding) sont de plus en plus importants dans l'entreprise. Le premier se contente d'analyser les mots, mais le second vise à approfondir la compréhension. Lire la suite
-
Conseil
30 nov. 2018
S3 contre HDFS : que choisir pour son data lake
Un lac de données bâti sur S3 rationalise l'analyse des données, mais présente des limites pour ceux qui veulent aller au-delà de l'écosystème du groupe. Lire la suite
-
Projet IT
27 nov. 2018
EAM / GMAO : Eiffage révolutionne la gestion de son parc matériel
Fort d'un parc d'équipement très développé, le groupe Eiffage a saisi l'opportunité en 2016 de remettre à plat sa stratégie, en numérisant et en unifiant presque totalement le suivi de ses matériels avec un seul et unique EAM (Enterprise Asset Management). Lire la suite
-
Projet IT
26 nov. 2018
AirAsia veut devenir une compagnie « Data First » en s'envolant vers le cloud
La compagnie low-cost compte sur le big data et l'analytique de Google pour développer ses revenus, sans augmenter ses billets. Son PDG imagine des voyages « sans couture » entièrement dématérialisés, y compris aux frontières. Et il se réjouit de la collaboration horizontale et verticale que permet G-Suite dans une entreprise sans intermédiaire syndical. Lire la suite
-
Conseil
22 nov. 2018
Gouvernance et data lake : quelles sont les difficultés rencontrées par les entreprises
La mise en place d’une gouvernance de données à un data lake reste compliquée. Cette capacité à déstructurer complique la mise en place de politiques et de gestion précises des données. Pourtant, la gouvernance reste indispensable. Cet article passe au crible les points problématiques. Lire la suite
-
Actualités
19 nov. 2018
Après 22 ans chez Oracle, Thomas Kurian débarque chez Google
L'ex-Président du Développement Produits d'Oracle avait quitté l'éditeur cette année après une brouille supposée avec son CTO. Il a été recruté pour prendre la succession de Diane Greene (ex-VMware) à la tête de Google Cloud. Sa mission : en faire un cloud réellement B2B. Lire la suite
-
Actualités
08 nov. 2018
MapR et Clarity : un gros clin d’oeil aux clients de Cloudera et Hortonworks
A travers son programme Clarity, la société veut rapatrier les clients pour qui le rachat d’Hortonworks par Cloudera reste confus. Lire la suite
-
Actualités
07 nov. 2018
La SNCF s’appuiera sur Azure pour l’information voyageur et la maintenance prédictive
La SNCF a détaillé un peu plus les applications qui utiliseront les services Azure dans le cadre de son grand projet de migration vers le cloud public. Après AWS et IBM, c’est au tour de Microsoft. Lire la suite
-
Actualités
07 nov. 2018
Gartner : un top 10 des prédictions 2019 dominé par l’IA et les risques sur la confidentialité
IA embryonnaire, transformation digitale et prééminence des médias sociaux irréversibles, risque concernant la confidentialité et le cyber-harcèlement : lors de son Symposium 2018, Gartner a présenté une vision chaotique des grandes tendances qui influeront le développement des SI en 2019. Lire la suite
-
Actualités
06 nov. 2018
Gartner Symposium 2018 : 5 priorités pour le DSI du futur
Le DSI du futur sera dynamique et montrera de grandes capacités d’adaptation et de résilience ou ne sera pas. Gartner dresse un portrait tout-terrain de l’IT qui s’impose désormais dans les organisations avec 5 axes à privilégier : la confidentialité des données, l’intelligence augmentée, la culture numérique, la gestion IT orientée produits et le développement de Digital Twins. Lire la suite
-
Conseil
02 nov. 2018
L'essentiel sur les trois versions d’Oracle Cloud at Customer
La gamme d’appliances Cloud@Customer permet aux entreprises de faire tourner le cloud d’Oracle (IaaS, PaaS, SaaS) dans leurs propres centres de données. Voici ce qui différencie les trois versions de cette offre managée qui est à la fois « sur site » et « cloud ». Lire la suite
-
Conseil
02 nov. 2018
Big Data et analytique : des conseils pour optimiser les traitements
Analyser des données brutes demeure une opération difficile et les entreprises ne sont souvent pas ou peu préparées à affronter la masse de données créée au quotidien. Voici quelques conseils pour mieux s’y retrouver. Lire la suite
-
Definition
31 oct. 2018
Apprentissage supervisé
L'apprentissage supervisé, dans le contexte de l'intelligence artificielle (IA) et de l'apprentissage automatique, est un système qui fournit à la fois les données en entrée et les données attendues en sortie. Lire la suite
-
Definition
31 oct. 2018
Apprentissage non supervisé
L'apprentissage non supervisé consiste à apprendre à un algorithme d'intelligence artificielle (IA) des informations qui ne sont ni classées, ni étiquetées, et à permettre à cet algorithme de réagir à ces informations sans supervision. Lire la suite
-
Definition
31 oct. 2018
IA explicable (XAI)
L'IA explicable ou XAI (eXplainable Artificial Intelligence) est une forme d'intelligence artificielle prévue pour décrire son objet, sa logique et sa prise de décision de manière intelligible à une personne lambda. Lire la suite
-
Actualités
22 oct. 2018
Teradata veut simplifier l'analytique qu'il juge encore trop complexe
Teradata poursuit sa mutation de vendeur de base de données à éditeur d'une plateforme analytique intégrée et ouverte. Avec plusieurs mots d'ordre qui répondent aux attentes des clients : la simplification et la démocratisation de l'accès aux analyses des données. Lire la suite
-
Conseil
18 oct. 2018
Comment survivre au déluge de données non structurées ?
Cohesity répond aux lacunes des solutions NAS traditionnelles en proposant une nouvelle approche du stockage secondaire. Lire la suite
-
Actualités
10 oct. 2018
Splunk veut devenir le tableau de bord de tous les métiers
Lors de sa conférence annuelle, l’éditeur a multiplié les annonces pour faire de sa solution la plateforme de visualisation universelle. Ses atouts sont une fonction de prédiction et des connecteurs vers les services applicatifs externes. Lire la suite
-
Opinion
05 oct. 2018
Le Big Data 5 ans après : phénomène de mode ou réalité ?
Juvenal Chokogoue, auteur de l’ouvrage « Hadoop : devenez opérationnel dans le monde du Big Data », revient sur l’évolution du Big Data, de sa perception par les entreprises en France, et du chemin parcouru en parallèle par Hadoop. Le Big Data a-t-il tenu ses promesses cinq ans après sa formalisation et Hadoop est-il là pour durer ? Juvenal Chokogoue affirme qu’il est devenu un standard Lire la suite
par- Juvenal Chokogoue, auteur
-
Actualités
04 oct. 2018
Cloudera et Hortonworks font désormais front commun dans une fusion de 5,2 Md de dollars
Les deux ex-rivaux du monde Hadoop vont travailler à une nouvelle plateforme pour faire évoluer leurs technologies et Hadoop vers le cloud. Ils entendent faire converger leur distribution Hadoop en direction d'un socle commun. Lire la suite
-
Opinion
01 oct. 2018
Amir Netz, Microsoft Fellow : « Power BI est un peu le PowerPoint pour l'analyse de données »
Dans un entretien accordé à LeMagIT lors d'Ignite 2018, Amir Netz, le père de Power BI et architecte en chef des solutions de business Intelligence chez Microsoft revient sur les évolutions du marché de la BI et sur les évolutions que connait Power BI pour s'adapter au monde des « datalakes » et des données non structurées. Lire la suite
-
Conseil
01 oct. 2018
Que font les entreprises avec le Machine Learning ?
Détection de fraudes, moteurs de recommandations, arbre de décision, sécurité sont autant d’usage du Machine Learning en entreprise. On y apprend également la différence entre apprentissage supervisé et non supervisé. Lire la suite
-
Actualités
27 sept. 2018
Ignite 2018 : SQL Server 2019 intègre Spark et progresse sous Linux
Lors de sa conférence Ignite 2018, qui se tient cette semaine à Orlando, Microsoft a présenté la première préversion de SQL Server 2019. La nouvelle mouture rapproche un peu plus la version Linux de celle sous Windows et apporte aussi le support de Hadoop HDFS et de Spark pour la gestion des données non structurées. Lire la suite
-
Actualités
17 sept. 2018
Hortonworks, Red Hat et IBM placent les containers au cœur de la gestion des Big Data
Hortonworks s'associe à Red Hat et IBM pour collaborer autour d’une architecture de référence commune pour absorber les traitements des Big Data. Celle-ci fera usage des containers et de Kubernetes, et pourra fonctionner sur un mode hybride, à la fois dans le cloud et sur site. Lire la suite
-
Actualités
13 sept. 2018
Après HPE ou SuperMicro, Cisco livre un n-ième clone de l’architecture DGX-1 de NVidia
Le constructeur a récemment présenté le serveur UCS C480 ML M5, une machine spécifiquement conçue pour l'exécution d'applications d'intelligence artificielle et de machine learning, dont l'architecture s'inspire étroitement de celle du DGX-1 de Nvidia. Cisco propose ainsi une alternative à des designs similaires d'HPE et Supermicro. Lire la suite
-
Conseil
10 sept. 2018
Outils analytiques Big Data : dix fonctionnalités indispensables
Vous êtes à la recherche d'un outil d'analyse des Big Data ? Vous devrez vous assurer qu'il permet d'encapsuler et de partager les résultats des analyses, qu'il peut facilement s'intégrer à d'autres applications BI et qu'il supporte le versioning, entre autres fonctionnalités clefs. Lire la suite