Conseils IT
Conseils IT
Big Data et Data lake
-
Data Mesh : tout ce qu’il faut savoir sur le produit de données
Au cœur de l’approche Data Mesh réside la notion de data product. Si l’expression est antérieure à l’émergence du concept attribué à Zhamak Dheghani, il convient d’en définir les principaux atours pour mieux comprendre cette théorie de la gestion ... Lire la suite
-
Ce qui distingue l’approche Data Mesh d’une architecture de données
Ce qui est communément appelé un Data Mesh correspond à une approche décentralisée de la gestion de données et de leur valorisation. Bien que compatible avec les Data fabric, entrepôts de données et data lakes, il sous-tend une philosophie opposée. Lire la suite
-
À l’heure du cloud, les data stack traditionnelles sont-elles encore pertinentes ?
Les piles de données traditionnelles n’ont pas la flexibilité et l’évolutivité que le cloud offre aux « data stack » modernes. Cependant, les architectures déployées sur site présentent encore plusieurs avantages par rapport à leurs homologues en ... Lire la suite
-
Les leçons à retenir de l’entraînement de Llama 2
Llama 2 n’est pas la collection de modèles open source espérée. Il n’en reste pas moins que les méthodes décrites par les chercheurs de Meta devraient aider la communauté à y voir plus clair pour tenter de reproduire le succès de ChatGPT (et de GPT-... Lire la suite
-
Embeddings et IA générative : pourquoi faut-il être prudent ?
De plus en plus d’éditeurs vantent l’intérêt de la technique de l’embedding pour enrichir les réponses d’un modèle comme GPT-4 tout en évitant d’envoyer des données confidentielles vers les plateformes d’IA générative. Dans les faits, la méthode ... Lire la suite
-
L’essentiel sur Starburst et Trino
À partir de Trino, une branche du projet Presto de Facebook, Starburst entend proposer un méta data warehouse capable de fédérer des données depuis un maximum de systèmes sources. Lire la suite
-
Pourquoi ne pas se précipiter pour déployer l’analytique en temps réel
Les outils d’analytique en temps réel promettent de fluidifier la récolte d’indicateurs et d’améliorer les processus d’entreprise, mais ils posent également des défis aux organisations qui les adoptent. Lire la suite
-
Gestion de flux de données : une introduction à Apache Airflow
Cette introduction à Apache Airflow passe en revue certaines des bases de l’outil de gestion de flux de travail – des étapes d’installation aux différentes options de l’interface graphique en passant par quelques conseils pour l’utiliser au ... Lire la suite
-
Les cinq piliers de l’observabilité des données
L’observabilité des données doit assurer une surveillance holistique des pipelines de données d’une organisation. Voici les cinq piliers de cette pratique devant garantir, in fine, l’efficacité et la précision des traitements de données. Lire la suite
-
Dix certifications clés pour les data architects et les data engineers
Pour gagner en compétence, les data architects et les data engineers sont invités à passer et obtenir des certifications. Oui, mais lesquelles ? Cet article liste dix certifications clés pour ces deux spécialités. Lire la suite
-
Customer Data Platform (CDP) : définition et intérêt pour le marketing
Une CDP est une application qui centralise, réconcilie, unifie et rend exploitable les données clients, pour avoir une vision 360° de chaque acheteur et personnaliser les actions marketing. Lire la suite
-
Le suivi des émissions de CO2, un enjeu de taille pour l’IT
Les entreprises de divers secteurs ainsi que les pouvoirs publics ont recours à l’IT et aux solutions analytiques pour suivre les émissions de gaz à effet de serre afin de répondre aux nouvelles exigences réglementaires. Lire la suite
-
Data Lakehouse : les subtiles nuances qui divisent les éditeurs
Si le principe de faire converger un lac et un entrepôt de données a séduit les éditeurs et les fournisseurs de cloud, les interprétations du concept de Data Lakehouse sont désormais plus nombreuses qu’il n’y paraît. Lire la suite
-
Les tendances clefs du Big Data en 2023 (et après)
Le big data entraîne des changements dans la manière dont les organisations traitent, stockent et analysent les données. Les avantages qui en découlent stimulent encore plus l’innovation. Voici les grandes tendances du domaine à suivre en 2023. Lire la suite
-
Comment constituer la bonne équipe DataOps
Nombreuses sont les entreprises à se tourner vers le DataOps pour tirer le meilleur parti de la gestion des données. Découvrez comment vous entourer de la bonne équipe pour garantir le succès d’une approche DataOps. Lire la suite
-
Big Data et Machine Learning : comment faire de la vraie hyper personnalisation dans l’e-commerce ?
Qu’est-ce que l’hyper-profiling (ou hyper-personnalisation) ? Comment le mettre réellement en pratique dans l’e-commerce ? Réponse dans cette tribune du cabinet de conseils Daveo (Magellan Partners). Lire la suite
-
Intégration de données : quatre tendances émergentes à évaluer
Selon Forrester, pour accroître leurs performances en matière d’intégration des données, les entreprises doivent évaluer ces quatre technologies d’intégration de données. Lire la suite
-
Quelles différences entre une CDP et une DMP dans une stratégie marketing ?
Les Customer Data Platforms et les Data Management Platforms sont deux outils de gestion de données marketing très complémentaires du CRM. Voici les points clés pour bien les distinguer et bien les utiliser dans une stratégie de vision à 360° du ... Lire la suite
-
CRM : 3 bonnes raisons d’avoir un Data Scientist dans son équipe CX
Les équipes responsables de l’expérience client (CX) n’ont habituellement pas de Data Scientist. Pourtant, en avoir un peut aider à extraire plus de valeur des données que ne le feraient un analyste CRM classique et un logiciel BI. Lire la suite
-
Intégration de données : l’essentiel sur StreamSets
Filiale de Software AG, StreamSets s’est récemment installée en France. Elle propose une plateforme DataOps consacrée à l’orchestration des intégrations de données multicloud et hybride. Lire la suite
-
DAM : bénéfices et défis de la gestion des actifs numériques
Le Digital Asset Management aide à gérer les contenus multimédias et constitue un outil essentiel pour les spécialistes du marketing. Mais n’étant pas sans contraintes, il est important de bien préparer sa mise en œuvre. Lire la suite
-
L’essentiel sur SAP HANA
LeMagIT fait le point sur les principales bases de données du marché. Place à la base In-Memory et multimodèle de SAP, HANA. Lire la suite
-
L’essentiel sur Aerospike
LeMagIT fait le point sur les principales bases de données du marché. Aujourd’hui le SGBD NoSQL open source In-Memory Aerospike. Lire la suite
-
Bases de données : le cloud a-t-il tué le stockage sur site ?
Le Data warehouse – qui rapatrie toutes les données pour les interroger avec des requêtes SQL – était le domaine des grandes appliances physiques. Mais le cloud met fin à leur règne. Lire la suite
-
Data Mining : les sept techniques les plus importantes
Cet article explique ce qu’est la pratique du data mining et les méthodes les plus intéressantes pour le mettre en place dans un projet de data science et de machine learning. Lire la suite
-
Data management : open source ou propriétaire, quel choix faire ?
L’open source et le data management en cloud deviennent des options populaires, mais les solutions propriétaires demeurent incontournables, et parfois plus appropriées à certains cas d’usage. Lire la suite
-
Réussir son projet ESG grâce à l’IA et à la donnée
Les réglementations imposent aux entreprises de plus communiquer sur leurs activités polluantes et d’en réduire les effets. Le fondateur du spécialiste DreamQuark, Nicolas Méric explique pourquoi l’Intelligence Artificielle et la donnée sont deux ... Lire la suite
-
BI : les visualisations les plus populaires (et comment bien les utiliser)
Les modélisations mettent en lumière les données de manière visuelles. En voici douze parmi les plus populaires de la Data Viz, accompagnées de conseils pour choisir la bonne en fonction de l’information à illustrer et pour ne pas faire d’erreur ... Lire la suite
-
Fin des cookies tiers : quelles alternatives pour le marketing digital ?
Les entreprises vont devoir revoir leurs stratégies de marketing numérique, avant que les « third party cookies » ne disparaissent. Voici quelques idées pour les remplacer. Lire la suite
-
Data science : ce qu’attendent les recruteurs lors d’un entretien
L’entretien est une première étape importante pour obtenir un emploi et c’est d’autant plus vrai dans le domaine de la data science. Voici des conseils pour se préparer aux questions et aux besoins des employeurs. Lire la suite
-
L’essentiel sur le Feature Store et ses usages
Le Feature Store promet une architecture centralisée pour administrer l’entraînement, le déploiement des modèles de machine learning et de leurs données. Ce conseil tente de définir une telle approche et passe en revue ses qualités et ses défauts. Lire la suite
-
Architecture Pub/Sub : les clés pour comprendre son importance
Si l’approche Pub/Sub demeure une architecture de messagerie standard depuis des décennies, il est essentiel que les développeurs et les directions IT comprennent ce que c’est, comment elle fonctionne et pourquoi elle est importante. Lire la suite
-
Cloud : trois conseils pour se prémunir d’une suspension par votre CSP (Gartner)
Comme l’ont prouvé de récents événements, les fournisseurs de cloud public ont le pouvoir de mettre un terme aux contrats de leurs clients, de manière unilatérale, laissant démunies des entreprises qui peuvent être parfaitement légitimes. Lire la suite
-
Valoriser ses données grâce au DataOps
Qu’est-ce que le DataOps ? Comment la démarche fiabilise-t-elle la donnée et son utilisation ? Quelles sont ses composantes techniques et d’organisation ? Un expert de SFEIR répond à toutes ces questions. Lire la suite
-
ERP : les 5 différences majeures entre S/4HANA et SAP ECC
Alors que les entreprises sous ECC analysent les options dont elles disposent pour l’avenir de leurs ERP, il est essentiel de bien comprendre comment leurs systèmes SAP actuels diffèrent de S/4HANA. Voici quelques différences parmi les plus ... Lire la suite
-
Transformation digitale : les 5 causes d’échecs les plus fréquentes (et comment les éviter)
Nombreuses sont les transformations numériques qui échouent. Voici les causes les plus fréquentes de ces échecs, qui – si on les évite – sont autant de pistes pour augmenter ses chances de réussite. Lire la suite
-
Transformation digitale : comment mesurer et améliorer un ROI
Démontrer un retour sur investissement (ROI) convaincant est essentiel pour que le projet de transformation numérique obtienne adhésion et financement. Pourtant, de nombreuses entreprises négligent les moyens de mesurer le ROI et de l’améliorer au ... Lire la suite
-
Transformation digitale : 8 profils pour former une bonne équipe
Réunir une équipe est une étape importante pour réussir une transformation numérique. Mais cette tâche est plus facile à dire qu’à faire. Il faut prendre en compte plusieurs facteurs pour chaque membre et bien définir leurs missions. Lire la suite
-
Transformation digitale : construire une feuille de route en 6 étapes
Une transformation numérique bien menée est une des clés de la survie des entreprises. Et une feuille de route bien construite est clé pour cette transformation. Voici un modèle en six étapes qui devrait vous éviter bien des embûches. Lire la suite
-
Conseils pour réussir une transformation digitale d’entreprise
La concrétisation des avantages opérationnels d’une transformation numérique dépend de très nombreux facteurs, qui vont de l’implication des dirigeants à une solide compréhension de la manière dont les outils et les technologies modernes peuvent ... Lire la suite
-
Les premiers jours des jumeaux numériques dans la supply chain
Un jumeau numérique qui résout tous les problèmes de la chaîne d’approvisionnement n’est peut-être pas encore une réalité. Découvrez pourquoi et quels types de projets sont réalistes à date. Lire la suite
-
Transformation digitale : cinq leviers à activer en 2021
Le low-code, MLOps, le multicloud et le streaming de données sont des leviers prioritaires à activer pour favoriser l’agilité de votre entreprise et accélérer sa transformation. Lire la suite
-
Rise with SAP : le programme de SAP pour s’envoler vers le cloud
SAP lance une offre « tout en un », à guichet unique, sur abonnement, pour accompagner ses clients en trois étapes vers le cloud, S/4 et la « Intelligent Enterprise ». Les analystes accueillent positivement cette « conciergerie » de la ... Lire la suite
-
Les trois plus grands défis de la transformation digitale (et comment les résoudre)
Isaac Sacolick, auteur d’un best-seller sur le sujet, décrit ici les principaux défis auxquels les organisations vont être confrontées dans leur transformation numérique et la manière de les résoudre. Lire la suite
-
L’essentiel sur ThoughtSpot, l’étoile montante de la BI en libre-service
ThoughtSpot est un outil de Business Intelligence qui veut démocratiser l’analytique jusqu’aux métiers. Il leur pousse automatiquement des tableaux de bord, et facilite les requêtes via un moteur de recherche en langage naturel. Sa BI s’inspire ... Lire la suite
-
Comment construire un modèle de Machine Learning en 7 étapes
Il faut de la patience, de la préparation et de la persévérance pour construire un modèle de machine learning viable, fiable et agile qui rationalise les opérations et renforce les métiers. Lire la suite
-
IA Frugale : comment entraîner des modèles avec peu de données ?
Entraîner des modèles de machine learning avec peu de données, est-ce possible ? Oui, mais les spécialistes considèrent que les techniques d’enrichissement sont suffisamment performantes pour généraliser les apprentissages de leurs modèles. Lire la suite
-
Les bons et les mauvais cas d’usage d’Apache Kafka
Apache Kafka a de nombreuses applications dans le domaine du Big Data, mais quels sont les cas d’usage qui conviennent le mieux à l’outil ? Des experts décrivent dans quelles situations Kafka excelle pour le traitement de données en entreprise. Lire la suite
-
Analytique en temps réel : les tendances et les cas d’usage à retenir
Alors que de plus en plus d’entreprises adoptent l’analytique en temps réel, de nouvelles infrastructures et pratiques voient le jour. Voici les pratiques les plus marquantes associées aux plateformes d’analyse de données en continu. Lire la suite
-
L’essentiel sur Oracle Data Science
Oracle a ajouté une gamme de nouveaux services à sa plate-forme cloud pour fournir aux Data Scientists et aux Data Analysts plus de fonctionnalités de gestion et d'analytiques avancées. Lire la suite
-
Devriez-vous héberger votre data lake dans le cloud ?
Sur site ou dans le cloud : où est le meilleur endroit pour déployer son lac de données ? Voici quelques éléments à considérer avant de se décider selon Andy Hayler. Lire la suite
-
IoT : les compétences essentielles pour mener à bien vos projets
Les cadres doivent comprendre les compétences nécessaires pour faire démarrer un projet IoT et savoir où trouver l'expertise nécessaire pour les mener à bien. Lire la suite
-
Qu’est-ce que le DataOps (Data Operations) ?
Selon Gartner, le DataOps doit réconcilier les opérateurs avec les consommateurs des données pour favoriser l’exploitation de l’analytique dans toute l’entreprise. Quelles sont les différences avec le DevOps ? Lire la suite
-
Data Science : comment améliorer votre storytelling ?
Comment créer des histoires percutantes et convaincantes à partir de données numériques froides et muettes ? Des experts partagent leurs conseils sur la façon d’améliorer vos compétences en matière de narration et mieux communiquer les résultats de ... Lire la suite
-
Gestion financière : l’analytique transforme les données en or
Les solutions financières modernes ne se limitent plus à analyser des chiffres de manière statique. Elles peuvent transmuter ces données en ventes, en optimisation de processus opérationnels, en stratégie produits. Et augmenter les marges. Lire la suite
-
Bien comprendre les services Data Lake et Data Warehouse d'AWS
Apprenez à distinguer les services data lake et data warehouse d’AWS et assimilez leur fonctionnement. Lire la suite
-
Intelligence Artificielle : cinq conseils pour bien choisir ses premiers cas d’usage
Sept experts partagent leurs expériences pour bien choisir ses projets d’exploration des algorithmes et bien démarrer dans l’IA. Lire la suite
-
Cloudera vs AWS EMR : quelle distribution Hadoop choisir pour vos projets Big Data
Les entreprises qui ont besoin d’une plateforme Big Data doivent généralement sonder eux-mêmes le marché pour choisir un fournisseur. La complémentarité des services AWS est indéniable, mais la solution de Cloudera est-elle un meilleur choix ? Lire la suite
-
Les principales distributions Hadoop sur le marché
Voici les principales distributions Hadoop sur le marché et un ensemble d'éléments pour choisir celle qui convient le mieux aux pratiques analytiques en entreprise. Lire la suite
-
Data Architect, Data Engineer, Data Scientist, Data Modeler : comment les combiner ?
Ces quatre métiers – complémentaires, mais différents – sont clefs pour une équipe Data performante. L’expert Michael Bowers explique comment constituer une telle équipe et donne ses conseils aux professionnels de la donnée pour augmenter leurs ... Lire la suite
-
Plongée dans SAP HANA
Véritable « plateforme » qui va du Data Warehouse au serveur applicatif, en passant par le NoSQL et l'intégration de données, la base in-memory de SAP a beaucoup de visages. Certains sont plus que séduisants, d'autres un peu moins. Lire la suite
-
Où en est SAP HANA ?
Hasso Plattner, cofondateur de SAP, explique les évolutions de HANA, la manière dont elles répondent aux nouvelles exigences des entreprises et le pourquoi de la restructuration en cours de cette division base de données. Lire la suite
-
Conseils en matière de stockage pour l'intelligence artificielle et le Machine Learning
Les supports de données destinés aux secteurs de l'intelligence artificielle et du Machine Learning nécessitent une planification particulière. Cet article vous rappelle les points à prendre en compte et ce que vous devez prévoir. Lire la suite
-
Intelligence Artificielle : changement de paradigme dans le domaine du stockage
Dans le stockage également, l'Intelligence Artificielle a le vent en poupe et peut apporter de nombreux avantages : optimisation des latences, modifications de politique aisées et augmentation des performances. Lire la suite
-
Machine Learning : l'indispensable préparation des données requiert encore (beaucoup) d'humain
Vous voulez automatiser vos processus grâce à l'intelligence artificielle ? D'accord. Mais ne négligez surtout pas le travail manuel qui reste encore nécessaire pour préparer les données avant de les injecter dans les algorithmes. Lire la suite
-
Big Data : ce qu'il faut prendre en compte dans les formats de données
Si JSON est aujourd’hui devenu le format de données de référence pour les développeurs, Parquet, ORC peuvent être de meilleures options pour l’analytique. Cet article vous en dit plus sur les différents formats de données Big Data. Lire la suite
-
Le Big Data pour consolider ses données de sécurité : oui, mais de manière ordonnée
Gartner recommande une sérieuse préparation afin d’aligner la collecte et le stockage des données sur les objectifs métiers et les besoins de la plateforme d’analyse ou du prestataire de service managé qui sera éventuellement chargé de la ... Lire la suite
-
Machine Learning : les différentes manières dont le « as a Service » démocratise l'IA
L'émergence d'outils d'Intelligence Artificielle « à la demande » permet à un plus grand nombre d'entreprises, au-delà des géants de la Tech et des multinationales, d'accéder aux avantages du Machine Learning et du Deep Learning. Lire la suite
-
Qu'est-ce que la virtualisation de données ?
Selon Forrester, la virtualisation de données (ou Data Virtualization) est la forme particulière d'intégration de données qui connaît la croissance la plus rapide. Mais pourquoi est-elle si « particulière » ? Lire la suite
-
Machine Learning : bien comprendre les trois niveaux d'offres de Google Cloud
APIs et services AutoML pour les développeurs, BigQuery ML pour les Data Analystes, boite à outils à base de Tensorflow pour les Data Scientists, Google segmente très clairement son offre pour toucher le plus d'utilisateurs possibles. Lire la suite
-
Machine Learning : comment choisir le bon framework ?
Ce ne sont pas les outils open source qui manquent pour le Machine Learning et le Deep Learning. A tel point que choisir les bons peut vite devenir une gageure. Pour faire un choix avisé, voici quelques conseils de spécialistes à bien garder à ... Lire la suite
-
Des données non structurées aux données structurées : c’est possible avec le Machine Learning
Avec la puissance de calcul facilement accessible et les progrès en matière de Machine Learning, il devient plus facile et moins coûteux de transformer les données non structurées en sources d'information comestible. Lire la suite
-
Intelligence Artificielle : quelle différence entre NLP et NLU ?
NLP (Natural Language Processing) et NLU (Natural Language Understanding) sont de plus en plus importants dans l'entreprise. Le premier se contente d'analyser les mots, mais le second vise à approfondir la compréhension. Lire la suite
-
S3 contre HDFS : que choisir pour son data lake
Un lac de données bâti sur S3 rationalise l'analyse des données, mais présente des limites pour ceux qui veulent aller au-delà de l'écosystème du groupe. Lire la suite
-
Gouvernance et data lake : quelles sont les difficultés rencontrées par les entreprises
La mise en place d’une gouvernance de données à un data lake reste compliquée. Cette capacité à déstructurer complique la mise en place de politiques et de gestion précises des données. Pourtant, la gouvernance reste indispensable. Cet article passe... Lire la suite
-
L'essentiel sur les trois versions d’Oracle Cloud at Customer
La gamme d’appliances Cloud@Customer permet aux entreprises de faire tourner le cloud d’Oracle (IaaS, PaaS, SaaS) dans leurs propres centres de données. Voici ce qui différencie les trois versions de cette offre managée qui est à la fois « sur site ... Lire la suite
-
Big Data et analytique : des conseils pour optimiser les traitements
Analyser des données brutes demeure une opération difficile et les entreprises ne sont souvent pas ou peu préparées à affronter la masse de données créée au quotidien. Voici quelques conseils pour mieux s’y retrouver. Lire la suite
-
Comment survivre au déluge de données non structurées ?
Cohesity répond aux lacunes des solutions NAS traditionnelles en proposant une nouvelle approche du stockage secondaire. Lire la suite
-
Que font les entreprises avec le Machine Learning ?
Détection de fraudes, moteurs de recommandations, arbre de décision, sécurité sont autant d’usage du Machine Learning en entreprise. On y apprend également la différence entre apprentissage supervisé et non supervisé. Lire la suite
-
Outils analytiques Big Data : dix fonctionnalités indispensables
Vous êtes à la recherche d'un outil d'analyse des Big Data ? Vous devrez vous assurer qu'il permet d'encapsuler et de partager les résultats des analyses, qu'il peut facilement s'intégrer à d'autres applications BI et qu'il supporte le versioning, ... Lire la suite
-
Entrepôt de données, Data Lake, Data Mart, ODS : que choisir ?
Il existe de nombreuses façons de stocker des données en volume, mais choisir la bonne technologie est une épreuve de force. Comment savoir si un entrepôt de données, un lac de données ou un data mart convient ? Cet article vous permet de les ... Lire la suite
-
Le stockage est-il toujours important ?
Les grandes tendances dans le monde du stockage semblent converger vers l’élimination du stockage en tant que silo IT. Lire la suite
-
Projets AI : vos concurrents sont timorés, profitez-en pour être ambitieux (McKinsey)
La prudence est souvent conseillée aux entreprises quand elles commencent à s’intéresser à l’Intelligence Artificielle en interne. Mc Kinsey invite au contraire à imaginer dès le départ des projets très disruptifs pour bénéficier de la frilosité des... Lire la suite
-
Quelles différences entre un Data Scientist et un Business Analyst
Le rôle des data scientists et des analystes métiers diffèrent quand on sait que les premiers doivent plonger en profondeur dans les données et trouver des solutions business inédites - mais les distinctions ne s'arrêtent pas là. Lire la suite
-
Qu’est-ce que le Data Wrangling ?
Le Wrangling est une variante, subtile, de la Data Preparation. Il tire son origine de l’imagerie du Grand Ouest américain et de ses cowboys. Le mot est principalement utilisé par Trifacta. Lire la suite
-
GPU, RAM et SSD : des turbos pour l’analytique
Les start-ups californiennes MapD, AeroSpike et GridGain ont développé une technologie de base de données ou de moteur SQL qui exploitent les caractéristiques de vélocité propre à la mémoire RAM, au SSD ou encore au GPU. Lire la suite
-
L'essentiel sur Proxem, pionner français de la reconnaissance sémantique et du Deep Learning
L'entreprise, fondée il y a 10 ans, est devenue experte en AI appliquée à l'analyse sémantique de « données textuelles ». Sa R&D - à la base de 30 publications scientifiques - lui permet aujourd'hui d'appliquer la discipline bien au-delà de ... Lire la suite
-
7 étapes pour créer son data lake
Peupler un cluster Hadoop de données qui ne sont ni organisées ni gérées correctement risque de nuire à vos projets analytiques. Voici 7 étapes clé qui vous permettrons de mieux utiliser les données de votre data lake. Lire la suite
-
HCM/SIRH : promesses et menaces de l’AI dans les Ressources Humaines
L'Intelligence Artificielle dans les outils de gestions des ressources humaines a de nombreux champs d'applications, souvent très novateurs. Mais comme l'AI s'applique ici à l'humain, plusieurs précautions s'imposent pour lutter contre la méfiance ... Lire la suite
-
Trois méthodes pour bien préparer ses fichiers mainframe à Hadoop
Les lacs de données Hadoop constituent un nouveau havre de paix pour les données patrimoniales qui ont encore une valeur analytique. Mais les méthodes de conversion à utiliser dans Hadoop diffèrent selon les besoins analytiques. Lire la suite
-
AWS Athena : comment améliorer la performance des requêtes… et réduire ses coûts
Amazon Athena permet d’interroger plus de formats de données que son rival Google BigQuery. Toutefois, il est préférable de privilégier certains formats pour tirer pleinement parti du service AWS Lire la suite
-
L’expérience utilisateur, une clé du déploiement du Deep Learning en production
Lorsqu’il s’agit de déployer des modèles de Deep Learning en production, les experts s’accordent sur un point : il est fondamental de ne pas perdre de vue des fondamentaux pour s’assurer que les résultats souhaités soient bien là, auprès de la bonne... Lire la suite
-
Machine Learning vs Deep Learning ? La même différence qu'entre un ULM et un Airbus A380
Le Deep Learning partage certaines caractéristiques avec l'apprentissage statistique traditionnel. Mais les utilisateurs expérimentés le considèrent comme une catégorie à part entière avec une conception de modèles prédictifs et des résultats bien ... Lire la suite
-
Smart Cities : les villes doivent consolider leur architecture de données
Pas question d’entamer une transition vers la Smart City si la ville ne dispose pas déjà de solides outils pour gérer, sécuriser et analyser les données. Jennifer Belissent, analyste chez Forrester, fait le point. Lire la suite
-
L’AI Washing brouille le marché de l’Intelligence Artificielle
L'Intelligence Artificielle est présentée comme une tendance d’avenir très porteuse. Poussant de nombreux acteurs du secteur à passer à la moulinette AI leurs produits et déroutant quelque peu les clients. « AI Washing » vous avez dit ? Lire la suite
-
Data Lake : attention aux risques d’indigestion de données
Les acteurs du Big Data poussent les entreprises à placer toutes leurs données dans un data lake. Mais dans de nombreux cas, cela n’est pas nécessaire. Risque d’indigestion de données programmé. Lire la suite
-
L’essentiel sur Cloudera CDH
La distribution Hadoop de Cloudera embarque plusieurs composants Open Source. Elle est déclinée en plusieurs éditions, chacune intégrant des outils d’administration et de déploiement différents. Lire la suite
-
L’essentiel sur IBM BigInsights
IBM BigInsights accole des scenarii d’usage liés à l’analytique et à la data science à une distribution Open Source d’Apache Hadoop. Lire la suite
-
L’essentiel sur Hortonworks Data Platform
La plateforme Hadoop d’Hortonworks se composent de projets essentiellement Open Source, extraits de la Fondation Apache. Elle propose un environnement Open Source pour la collecte, le traitement et l’analyse de données. Lire la suite
-
Power BI, Qlik Sense, Tableau : comparaison des trois leaders de la BI en self-service
Ces trois acteurs tirent le marché de la Business Intelligence en self-service. Cet article vous aide à les comparer. Lire la suite