Big Data et Data lake
-
Projet IT
27 août 2024
Espace santé, Amelipro, appli Carte Vitale : les chantiers numériques de la Cnam
La caisse nationale de l’Assurance maladie mène de front de multiples projets sur le numérique en santé, dont Mon espace santé devenu son « vaisseau amiral ». La Cnam prévoit d’y intégrer de multiples fonctionnalités dans une logique de portail de services. Lire la suite
-
Projet IT
21 août 2024
La mode, un secteur sous-digitalisé, mais en progression
Surproduction et mauvaise qualité sont considérées comme les principaux handicaps de l’industrie de la mode, avec des conséquences environnementales. Un recours accru à des technologies, en particulier prédictives, pourrait contribuer à améliorer le bilan du secteur. Lire la suite
- Faites-en plus à Moindre coût avec Microsoft Azure Red Hat OpenShift –Analyse
- De La Feuille De Calcul À L'analytique Financière Moderne –eBook
- Premiers pas avec Azure Red Hat OpenShift –eBook
-
Dans ce numéro:
- Information Sécurité n° 29 : NIS 2, une véritable révolution en marche
- Une brève histoire des directives NIS
- NIS 2 : pour les DPO, après le RGPD la cybersécurité
-
Actualités
31 juil. 2024
Apache Iceberg : Snowflake libère Polaris et s’allie à Dremio
Non seulement le catalogue de métadonnées lié à Apache Iceberg est accessible plutôt que prévu, mais il va fusionner avec Project Nessie de Dremio. Une demande d’incubation de Polaris auprès de l’Apache Software Foundation est d’ores et déjà déposée. Lire la suite
-
Projet IT
11 juil. 2024
Les secrets d’ArianeGroup pour décoller vers le « Data Centric »
Passer d’une culture d’ingénieur à une culture Data, c’est le pari engagé par ArianeGroup. Le constructeur et intégrateur de la fusée Ariane 6 mise sur l’approche 3 + 3 + 3 pour accélérer le déploiement d’applications Data dans toute son organisation, avec des projets tant destinés à son activité industrielle qu’à ses fonctions support. Lire la suite
-
Guide
11 juil. 2024
Les clés pour comprendre le bras de fer entre Snowflake et Databricks
Ce guide revient sur les annonces principales des conférences annuelles des deux grands concurrents du monde du lakehouse et leur querelle autour du format de tables Apache Iceberg. Lire la suite
-
Actualités
09 juil. 2024
Virtualisation de données : Denodo en quête de simplification
Denodo a lancé à la fin du mois de juin la version 9 (et non pas 9.0) de sa plateforme de virtualisation de données. L’éditeur matérialise sa volonté de cibler des utilisateurs métiers, en simplifiant son interface et en intégrant l’IA générative. Il profite par ailleurs de la compatibilité de son moteur massivement parallèle avec les formats de tables Apache Iceberg et Delta. Lire la suite
-
Actualités
08 juil. 2024
Databricks étend sa gouvernance au-delà des données et de l’IA
Lors de son événement annuel, Databricks a surtout mis en avant le fait qu’il rend open source les fondations de sa couche de gouvernance, mais sa variante propriétaire s’étoffe pour gérer et tracer davantage d’actifs, ainsi que d’en superviser la qualité et les coûts. Lire la suite
-
Actualités
08 juil. 2024
SingleStore se rend compatible avec Apache Iceberg
SingleStore a dévoilé une intégration « bidirectionnelle » avec Apache Iceberg visant à permettre aux entreprises d’exploiter des tables externes gérées depuis d’autres plateformes de gestion de données, dont Snowflake. L’éditeur suit par ailleurs la tendance en matière d’IA générative en combinant prise en charge des recherches vectorielles et plein texte. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
01 juil. 2024
Power BI évolue sous l’influence de Fabric et de Copilot
Depuis l’introduction de Fabric et de Copilot, Microsoft élargit les capacités de Power BI en le rendant, selon ses dires, plus facile d’accès et programmable. Les clients ne semblent pas encore profiter de ses avancées, selon les données de Gartner. Lire la suite
-
Actualités
19 juin 2024
France 2030 : Cleyrop, Outscale et l’Institut Mines-Télécom tirent le bilan du projet EDHISI
Le projet de R&D a prouvé qu’il est possible de déployer une plateforme de traitement et d’échange de données « souveraine », mais les acteurs engagés ne précisent pas clairement les suites de cette initiative. Lire la suite
-
Actualités
17 juin 2024
Lakeflow : Databricks veut unifier sa gestion des pipelines de données
Alors que les fonctions d’ingestion, de transformation de données et de gestion des tâches d’ingénierie de données sont séparées au sein de la plateforme, Databricks souhaite les réunir sous la bannière Lakeflow, à la demande de ses clients. Lire la suite
-
Actualités
17 juin 2024
IA générative : Databricks étend sa couverture fonctionnelle
Lors du Data+AI Summit 2024, Databricks a annoncé une suite de fonctionnalités pour entraîner et exécuter des modèles d’IA générative sur les fondations de sa plateforme et de celle de Mosaic AI. L’objectif, simplifier la mise en place des processus et des applications. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, Senior News Writer
-
Actualités
14 juin 2024
Rachat de Tabular : Databricks défend sa décision
Dans un point avec la presse, Ali Ghodsi, CEO de Databricks, a réfuté toute volonté de prendre le contrôle du projet Apache Iceberg à travers l’acquisition de Tabular. Lire la suite
-
Actualités
13 juin 2024
En réponse à Polaris, Databricks libère Unity Catalog
Databricks a rendu disponible une version open source de sa couche de gouvernance et d’interopérabilité entre plusieurs moteurs de traitements auprès de la LF AI&Data. Un pied de nez à Snowflake et à son projet Polaris. Lire la suite
-
Actualités
13 juin 2024
Databricks prône le « 100 % » serverless
Lors de Data+AI Summit, la conférence annuelle de Databricks, Ali Ghodsi, CEO de l’éditeur, a annoncé que l’ensemble des services disponibles depuis la plateforme s’exécuteront en mode « serverless » dès le 1er juillet 2024. Lire la suite
-
Actualités
10 juin 2024
FinOps : Snowflake infuse la gestion des coûts dans sa plateforme
Pressé par ses clients, Snowflake introduit plusieurs fonctionnalités d’observabilité et de limitation des coûts et rappelle les grands principes de sa facturation. Lire la suite
-
Actualités
07 juin 2024
Snowflake : la stratégie du « tout-en-un » fonctionne
Snowflake affiche désormais un large portfolio de fonctionnalités. Même si tout ce qu’il entend proposer n’est pas disponible, la « vision » convainc déjà les partenaires et les clients existants. Lire la suite
-
Actualités
06 juin 2024
Snowflake embrasse la philosophie « data as code »
Lors du Data Cloud Summit, Snowflake a multiplié les annonces dans le but d’outiller les ingénieurs de données, les développeurs et les opérateurs. Outre la nécessité de se mettre à niveau face à la concurrence, l’éditeur entend répondre aux besoins de ces clients en matière de déploiements en production. Lire la suite
-
Actualités
06 juin 2024
Databricks met la main sur Tabular pour mieux influencer l’avenir d’Iceberg
Databricks se prépare à acquérir Tabular, la startup derrière le format de tables Apache Iceberg. Un signe que l’éditeur ne peut pas soutenir un projet open source sans le contrôler, commente James Malone, directeur de la gestion produit chez Snowflake. Lire la suite
-
Actualités
05 juin 2024
Analytique graphe : Neo4j déploie Graph Data Science sur Snowflake
Dans la foulée de la disponibilité de Snowpark Container Services, Snowflake et Neo4j ont annoncé un partenariat afin de porter en grande partie les librairies de Neo4j Graph Data Science, sur le « Data AI Cloud ». Lire la suite
-
Actualités
04 juin 2024
Snowflake renforce sa couche de gouvernance Horizon
Lors de sa conférence annuelle, l’éditeur du lakehouse a dévoilé un lot d’annonces consacrées à la prise en charge d’Apache Iceberg, enfin en disponibilité générale, et sa couche de gouvernance qui s’étoffe pour simplifier la gestion des données et métadonnées. Reste à réellement généraliser cette gestion à travers plusieurs régions d’un même cloud, puis plusieurs clouds. Lire la suite
-
Actualités
03 juin 2024
Polaris : Snowflake veut élargir l’accès aux tables Iceberg par des moteurs tiers
L’éditeur entend simplifier la centralisation des tables Apache Iceberg et les rendre accessibles à des moteurs de traitement tiers, ouverts ou propriétaires. Un projet qui engage déjà Microsoft, Salesforce, Google Cloud, Dremio, AWS et Confluent. Lire la suite
-
Actualités
03 juin 2024
Hasso Plattner : quel héritage le géant de l’IT laisse-t-il à SAP ?
C’est la fin d’une ère. Hasso Plattner a quitté SAP mi-mai. Le co-fondateur et figure emblématique de l’éditeur allemand laisse un héritage énorme. Avec aussi des erreurs stratégiques que le nouveau leadership devra gérer. Sans lui. Lire la suite
-
Actualités
30 mai 2024
Les défis IT des industriels européens de la défense
KNDS France, Naval Group, Airbus Defence & Space et Dassault Aviation doivent adapter leur production aux besoins des forces armées en Europe. Une nécessité qui se fait en parallèle de projets de transformation numérique d’envergure. Lire la suite
-
Projet IT
21 mai 2024
Comment la RATP façonne sa stratégie Data Mesh
La plateforme de données DIANE, propulsée par le lakehouse Databricks, est le « socle » sur lequel la RATP s’appuie pour mettre en place sa stratégie Data Mesh. Un défi de taille pour le groupe qui se prépare à l’ouverture à la concurrence des réseaux de transports franciliens. Lire la suite
-
Actualités
29 avr. 2024
En France, Databricks gagne du terrain par le bas
Databricks poursuit ses objectifs de croissance en Europe et en France. S’il n’a pas les revenus de son concurrent principal, son lakehouse susciterait l’intérêt des profils techniques et des métiers. Lire la suite
-
Projet IT
26 avr. 2024
BPCE enrichit sa plateforme Data avec un moteur MPP
Doté depuis 2014 d’une plateforme Big Data, le groupe BPCE a progressivement étoffé son catalogue de services, notamment en intégrant un moteur SQL qui lui permet de fédérer l’accès aux données et d’accélérer les requêtes dans un environnement IT hybride. Lire la suite
-
Actualités
23 avr. 2024
Adobe : une plateforme de données colossale qui s’étoffe
L’Adobe Customer Data Platform d’Adobe constitue aujourd’hui un socle des offres Adobe Experience Platform. L’éditeur a décidé d’y apporter des améliorations conséquentes. Lire la suite
-
Actualités
16 avr. 2024
Orange s’appuie sur Google Cloud pour dérouler sa stratégie d’IA « à large échelle »
Orange a annoncé « renforcer son partenariat » avec Google Cloud dans le but de favoriser le déploiement de l’IA et de l’IA générative dans les 26 pays où le groupe est installé. Outre la plateforme Vertex AI et son jardin de modèles, l’opérateur compte s’appuyer sur Google Distributed Cloud, une infrastructure de cloud hybride. Lire la suite
-
Actualités
15 avr. 2024
IA : Google Cloud recentre son discours autour de BigQuery
Alors qu’il termine à peine la jonction de ses services analytiques autour de BigQuery, Google Cloud infuse les modèles et les outils liés à l’IA générative dans sa recette. Sa stratégie historique d’ouverture et l’empreinte existante de son data warehouse cloud devraient l’aider à convaincre les entreprises, selon Constellation Research. Lire la suite
-
Actualités
15 mars 2024
Les LLM de Mistral AI rejoignent les plateformes de Databricks et Snowflake
Après Microsoft, Mistral AI, l’éditeur français de grands modèles de langage a annoncé coup sur coup des partenariats avec les deux grands rivaux de la mouvance lakehouse, Snowflake et Databricks. Pour l’heure, Mistral profite du fait que tous les acteurs IT cherchent à garnir leur catalogue de LLM afin d’offrir du choix aux clients, signalent les analystes. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Actualités
06 mars 2024
Avec CDAM, Informatica veut automatiser l’accès aux données
La nouvelle suite de fonctionnalités propulsées par un moteur de règles et des algorithmes de machine learning gère l’accès aux données d’une entreprise, pour aider à garantir leur sécurité et leur conformité tout en facilitant leur accès par les métiers à travers leurs outils analytiques. Lire la suite
-
Actualités
29 févr. 2024
Frank Slootman quitte la direction de Snowflake
Snowflake nomme Sridhar Ramaswamy en tant que CEO pour remplacer Frank Slootman, qui se retire des opérations tout en conservant la présidence du conseil d’administration. Sridhar Ramaswamy, le nouveau dirigeant, est la caution IA de l’éditeur, dont la prudence financière déplaît aux investisseurs. Lire la suite
-
Projet IT
14 févr. 2024
Comment Interflora compose sa stratégie « Data »
MyFlower, le groupe derrière Interflora en Europe, organise la transformation en profondeur de son architecture de données. L’objectif ? Établir un langage commun entre les métiers et les entités. Lire la suite
-
Actualités
08 févr. 2024
Automatisation, optimisation, gouvernance : les chantiers de Starburst
Starburst multiplie les initiatives afin de se rendre désirable sur un marché dominé par Snowflake et Databricks. En un mot, sa stratégie se résume à l’automatisation de la plupart des charges de travail liées aux entrepôts de données nouvelle génération. Lire la suite
-
Actualités
30 janv. 2024
Les DSI gardent la lumière allumée… mais dans le cloud (étude)
Selon une enquête du chapitre parisien de l’ISACA AFAI, certaines DSI sont peu matures en matière de gestion de données, de conception de services ou encore de communication de leurs avancées. Elles se rattrapent par leurs investissements dans le cloud et la cybersécurité, qui doivent assurer un maintien en condition opérationnelle des systèmes et applications. Lire la suite
-
Guide
30 janv. 2024
Les stratégies clés autour du Data Mesh
Ce guide essentiel évoque les stratégies clés des entreprises et des éditeurs dans la mise en place du Data Mesh, un concept visant à décentraliser la gestion de données. Lire la suite
-
Conseil
29 janv. 2024
Data Mesh : tout ce qu’il faut savoir sur le produit de données
Au cœur de l’approche Data Mesh réside la notion de data product. Si l’expression est antérieure à l’émergence du concept attribué à Zhamak Dheghani, il convient d’en définir les principaux atours pour mieux comprendre cette théorie de la gestion décentralisée de données. Lire la suite
-
Actualités
26 janv. 2024
Avec Pro Max, SingleStore entend rivaliser avec Databricks et Snowflake
L’éditeur de base de données a dévoilé Pro Max, une version rebaptisée de sa plateforme, qui comprend des fonctionnalités de recherche vectorielle et de capture de données en mouvement, afin de propulser les cas d’usage de BI et d’IA en temps réel à l’échelle. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Projet IT
25 janv. 2024
BI : la Branche Services Courrier Colis de La Poste change le moteur, pas la carrosserie
La branche Services Courrier Colis de La Poste a finalement décidé de migrer progressivement ses systèmes de BI opérationnelle vers le cloud. Accompagnée par Capgemini, l’entité a choisi Snowflake, mais ne souhaitait pas, en tout cas pas dans un premier temps, changer sa plateforme Business Objects et bouleverser les habitudes de ses 5 000 utilisateurs. Lire la suite
-
Actualités
24 janv. 2024
Démocratisation des données : un écart de perception flagrant entre directions et métiers (étude)
L’observatoire 2024 de la démocratisation des données dans les entreprises françaises d’Opendatasoft met en lumière l’écart de perception important entre les dirigeants et les métiers. L’étude menée par l’institut Odoxa souligne que le partage des données est apprécié, mais peu structuré, car leur gestion demeure un enjeu de pouvoir. Lire la suite
-
Conseil
22 janv. 2024
Ce qui distingue l’approche Data Mesh d’une architecture de données
Ce qui est communément appelé un Data Mesh correspond à une approche décentralisée de la gestion de données et de leur valorisation. Bien que compatible avec les Data fabric, entrepôts de données et data lakes, il sous-tend une philosophie opposée. Lire la suite
-
Actualités
19 janv. 2024
Pinecone convertit sa base de données vectorielle au serverless
Pinecone a dévoilé une architecture serverless dédiée à sa base de données vectorielle. L’éditeur entend réduire ses prix tout en aidant à améliorer la précision des applications d’IA générative. Reste à voir si les entreprises l’adopteront, s’interrogent les analystes. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
15 janv. 2024
IA et données : Microsoft décline sa stratégie dans Cloud for Retail
Microsoft infuse des fonctions d’analytiques avancées et d’IA générative dans son offre « verticalisée » Cloud for Retail. Selon les analystes, ces ajouts incrémentaux doivent encore faire leurs preuves, alors qu’en matière d’IA, les entreprises demeurent attentistes. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Conseil
12 janv. 2024
À l’heure du cloud, les data stack traditionnelles sont-elles encore pertinentes ?
Les piles de données traditionnelles n’ont pas la flexibilité et l’évolutivité que le cloud offre aux « data stack » modernes. Cependant, les architectures déployées sur site présentent encore plusieurs avantages par rapport à leurs homologues en cloud, selon les experts du secteur. Lire la suite
par- Maria Korolov
- Gaétan Raoul, LeMagIT
-
Actualités
09 janv. 2024
Open Data : la France, championne européenne et vice-championne de l’OCDE
Si la politique française d’ouverture des données était la plus mature d’Europe, et la deuxième du classement de l’OCDE en 2023, les responsables de sa mise en place sont conscients des axes d’amélioration, dont certains étaient déjà soulignés par le rapport Bothorel en 2020. Lire la suite
-
Actualités
08 déc. 2023
Informatica multiplie les partenariats pour accélérer sa stratégie « cloud only »
Entre la fin du mois de novembre et la première semaine de décembre, Informatica a annoncé des partenariats ainsi que des intégrations avec les solutions d’AWS, de Microsoft Azure, de MongoDB, de Databricks et de Snowflake. L’éditeur indépendant entend accélérer sa stratégie « cloud only ». Lire la suite
-
Projet IT
08 déc. 2023
Transformer une organisation avec la Data : la master class de Decathlon et de Crédit Mutuel Arkéa
Spécialistes des articles de sport et banquiers ont des activités différentes. Mais sur la valorisation des données, nombreuses sont les bonnes pratiques qu’ils partagent. Regards croisés entre le CDO du Crédit Mutuel Arkéa et le VP Data & IA de Decathlon. Lire la suite
-
Projet IT
28 nov. 2023
Alcatel Submarine Networks adopte les préceptes de l’industrie 4.0
Face à la demande croissante sur son marché, ASN a entamé une transformation numérique d’envergure, en commençant par l’activité la plus récente du groupe. Le fabricant et gestionnaire de câbles sous-marins déroule un programme dont le socle réside sur l’interconnexion de son PLM, de son ERP et de son MES. Lire la suite
-
Actualités
24 nov. 2023
Avec Fabric, Microsoft tente d’égaler Snowflake et Databricks
La suite, qui était en préversion depuis mai, réunit Power BI, Azure Synapse Analytics et Data Factory dans un environnement intégré, pour mieux permettre la gestion et l’analyse des données, y compris le développement de modèles d’IA. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
21 nov. 2023
LLM Mesh : Dataiku prône une approche agnostique de l’IA générative
Dataiku entend prendre en charge les modèles d’IA générative comme il s’occupe des pipelines de traitement de données, de manière centralisée, mais agnostique des services sous-jacents. Une approche qui nécessite tout de même de signer de nombreux partenariats. Lire la suite
-
Projet IT
15 nov. 2023
Getlink (Eurotunnel) déroule sa stratégie « data as a service »
Le groupe propriétaire d’Eurotunnel a mis en place une stratégie « data as a service », inspirée de l’approche Data Mesh. Un projet qui a nécessité de revoir de fond en comble l’architecture de données et de redoubler d’efforts pour former les métiers. Lire la suite
-
Projet IT
14 nov. 2023
La R&D de Servier accélérée par les bases orientées graphes
Longs à commercialiser, les médicaments nécessitent de trouver des relations entre les molécules et autres gènes. Une base de données graphes s’avère être le moyen le plus adapté, selon les chercheurs de Servier. Lire la suite
-
Actualités
07 nov. 2023
Fivetran veut s’assurer sa place dans la « Modern Data Stack »
Perçu comme un outil pour automatiser les jobs ELT/ETL, Fivetran cherche désormais à adapter sa technologie pour mieux répondre aux besoins spécifiques liés à la « Modern Data Stack ». Si le nerf de la guerre demeure les connecteurs, l’éditeur explore un moyen de traiter les données non structurées et souhaite renforcer la gouvernance des pipelines, ainsi que sa prise en charge du streaming de données. Lire la suite
-
Actualités
06 nov. 2023
Evolve 2023 : Cloudera détaille sa stratégie pour l’IA
Le pionnier du Big Data Open source étend sa solution CDP avec des connecteurs vers les modèles d’IA générative d’AWS et vers la base vectorielle Pinecone, laquelle replace les résultats dans le contexte d’une entreprise. Lire la suite
-
Actualités
06 nov. 2023
Snowflake s’attelle à la gouvernance des données et des coûts
L’éditeur a présenté plus d’une douzaine de fonctionnalités, actuellement à différents stades de développement, toutes dans le but d’aider à mieux construire et à gouverner les modèles de données et les applications. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
03 nov. 2023
Avec Cortex, Snowflake part à la conquête de l’IA générative
Dans sa volonté de proposer une PaaS consacrée aux traitements de données, lors de son événement Snowday, Snowflake a détaillé sa feuille de route en matière d’IA générative. Les analystes déplorent le trop grand nombre d’annonces par rapport aux fonctionnalités réellement disponibles. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Actualités
23 oct. 2023
Avec Delta Lake 3.0, Databricks tente de faire communier Delta, Hudi et Iceberg
Cette communion sert pour l’instant à remettre en avant le format de stockage de table Delta et le format de table Parquet, tout en rendant compatible le Lakehouse open source avec les outils capables de lire uniquement des fichiers Iceberg ou Hudi. Lire la suite
-
Guide
20 oct. 2023
Les théories et pratiques essentielles pour déployer l’IA générative
De la théorie à la pratique, ce guide essentiel explore les premières pistes pour déployer techniquement – et donc concrètement - l’IA générative en entreprise. Lire la suite
-
Actualités
19 oct. 2023
Avec DataZone, AWS s’équipe d’un service câblé pour l’approche Data Mesh
AWS a lancé Amazon DataZone, un service de gestion des données qui doit permettre aux clients de gouverner, cataloguer et partager les données au sein de leur organisation. Une démarche alignée avec l’approche Data Mesh, un concept de plus en plus populaire. Lire la suite
-
Actualités
16 oct. 2023
Cosmian mixe chiffrement pré- et post-quantique
En collaboration avec l’ENS, la startup a accéléré ses algorithmes et propose une suite de sécurité complète. Lire la suite
-
Actualités
11 oct. 2023
Le chiffrement post-quantique se standardise
Les brouillons de trois procédures de chiffrement post-quantique ont été publiés pour commentaires, avant leur adoption définitive d’ici 1 an par le NIST américain. Lire la suite
-
Actualités
09 oct. 2023
Big Data, cloud hybride, IA : Cloudera croit en son retour en grâce
Un temps ébréché par la perte de vitesse de l’écosystème Hadoop, Cloudera entend prouver qu’il est au niveau de ses voisins bruyants que sont Databricks et Snowflake. Pour cela, il rejoue (espère-t-il, de manière stratégique) ses cartes du cloud hybride, de l’open source et de l’élasticité. Lire la suite
-
Projet IT
04 oct. 2023
Paris 2024 : comment les résultats des athlètes seront diffusés
Pour diffuser les résultats des Jeux olympiques et paralympiques 2024, Atos et le Comité d’organisation s’appuient sur une architecture animée par Apache Kafka. Le dispositif devra diffuser 100 millions de messages. Lire la suite
-
Actualités
28 sept. 2023
Big Data & AI Paris 2023 : Data Mesh et données en self-service
Lors du plus grand évènement annuel français dédié à la gestion des données et de l’IA, les retours d’expérience ont montré une montée en puissance de la tendance Data Mesh et de la volonté de diffuser – enfin – l’analytique plus largement aux métiers. Lire la suite
-
Actualités
28 sept. 2023
Confluent met sa plateforme cloud au diapason du Data Mesh
Confluent invite les entreprises à migrer vers Confluent Cloud, en assurant que la plateforme est adaptée à leurs charges de travail les plus complexes. Pour les convaincre, l’éditeur mise sur des fonctionnalités compatibles avec leurs stratégies Data Mesh. C’est également pour cette raison qu’il annonce un service managé consacré à Apache Flink. Lire la suite
-
Actualités
18 sept. 2023
Databricks récolte 500 millions de dollars supplémentaires
Le spécialiste du data lakehouse a récemment acquis MosaicML pour 1,3 milliard de dollars et pourrait utiliser ce nouveau capital pour financer des acquisitions et des investissements supplémentaires dans l’IA générative et la mise en qualité des données, selon les analystes. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
14 sept. 2023
Einstein One : Salesforce fait la lumière sur l’architecture de Data Cloud
Le géant du CRM profite de sa grand-messe pour mettre en avant les évolutions de sa CDP devenue une plateforme de données cloud, pour l’instant consacrée à l’unification de profils clients. L’occasion pour ses porte-parole d’ouvrir le capot. Lire la suite
-
Projet IT
01 sept. 2023
IA, analytiques : comment Equidia veut redorer le blason des courses hippiques
Afin de moderniser l’image des courses hippiques, Equidia propose une expérience enrichie autour de son flux de streaming. Pour ce faire, l’équipe digitale de la chaîne met à contribution l’IA, l’analytique et les technologies d’AWS. Lire la suite
-
Actualités
30 août 2023
IA générative : Google Cloud muscle sa plateforme Vertex AI
Jardins de modèles, fonctionnalités de recherche sémantique, outils de développement supplémentaires, connecteurs, partenariat avec Nvidia… Google Cloud prépare Vertex AI pour tenter de s’imposer dans la course à l’IA générative. Lire la suite
par- Esther Ajao, News Writer
- Gaétan Raoul, LeMagIT
-
Actualités
25 août 2023
Les données non structurées encore trop délaissées, selon IDC
Les entreprises peinent à maîtriser et à exploiter leurs données non structurées, constate IDC dans une enquête menée pour le compte de Box. Une situation qui pourrait évoluer rapidement si les organisations souhaitent exploiter le potentiel de l’IA générative. Lire la suite
-
Conseil
14 août 2023
Les leçons à retenir de l’entraînement de Llama 2
Llama 2 n’est pas la collection de modèles open source espérée. Il n’en reste pas moins que les méthodes décrites par les chercheurs de Meta devraient aider la communauté à y voir plus clair pour tenter de reproduire le succès de ChatGPT (et de GPT-4) sur des jeux de données privées. Lire la suite
-
Definition
08 août 2023
Intelligence artificielle générative
L’IA générative (Generative AI ou GenAI) est l’ensemble des outils d’intelligence artificielle qui génèrent des contenus – textes, multimédias, codes, plans, etc. – en fonction d’une demande (un prompt). Ses promesses sont très nombreuses. Ses travers à maîtriser aussi. Lire la suite
par- Gaétan Raoul, LeMagIT
- George Lawton
- Philippe Ducellier, Rédacteur en chef adjoint
-
Projet IT
03 août 2023
Promod se taille une BI sobre et efficace
Dans un contexte de transformation global, l’équipe Data de Promod se sépare de sa suite BI historique au profit de la plateforme du Français DigDash. L’occasion de mieux équiper les responsables des enseignes et de revoir de fond en comble la gouvernance des indicateurs clés de performance. Lire la suite
-
Projet IT
03 août 2023
Distribution : la multinationale familiale Sonepar branche ses données pour mieux se transformer
Le géant de la distribution B2B d’équipements électriques, Sonepar, a annoncé un investissement d’un milliard d’euros pour poursuivre la numérisation de ses activités. Le chantier avait été amorcé il y a cinq ans. En 2020, un pilier du projet avait été mis en place avec un Data Lake cloud. Lire la suite
-
Actualités
31 juil. 2023
MySQL HeatWave Lakehouse : Oracle joue (encore) la carte de la performance
Pour se différencier de la concurrence, Oracle assure que MySQL HeatWave Lakehouse peut traiter aussi rapidement les données MySQL et celles présentes dans son service de stockage objet. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
12 juil. 2023
Teradata décline VantageCloud Lake sur Azure
Teradata a annoncé la disponibilité générale de VantageCloud Lake sur Microsoft Azure. Si l’éditeur évoque ses projets en matière d’IA générative, il s’agit pour l’instant d’offrir une plateforme robuste pour accueillir de gros cas d’usage d’analytique prédictive. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Actualités
28 juin 2023
IA générative privée : Databricks veut mettre la main sur MosaicML
Databricks met 1,3 milliard de dollars sur la table pour acquérir MosaicML, un spécialiste de l’entraînement et de l’inférence de gros algorithmes de deep learning. Les deux acteurs sont sur la même longueur d’onde : ensemble, ils veulent permettre aux entreprises d’entraîner et de déployer leurs propres grands modèles de langage (LLM). Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Actualités
27 juin 2023
Container Services : Snowflake devient une « Data PaaS »
En lançant Container Services, Snowflake se prépare à donner accès au moteur d’exécution de Native Apps ainsi que de Snowpark, à savoir… des clusters Kubernetes entièrement managés. Ils serviront à exécuter des modèles de machine learning, des transformations de données et des applications au sein d’un compte Snowflake. Lire la suite
-
Actualités
26 juin 2023
Avec Lakehouse Apps, Databricks poursuit son bras de fer avec Snowflake
En amont de Data+AI Summit, l’événement consacré à Apache Spark, MLFlow et Delta Lake, Databricks a présenté certains éléments de sa feuille de route. L’entreprise privée, qui a annoncé avoir généré 1 milliard de dollars de revenus annuels auprès de Bloomberg, tente de rattraper son concurrent Snowflake. Lire la suite
-
Conseil
23 juin 2023
Embeddings et IA générative : pourquoi faut-il être prudent ?
De plus en plus d’éditeurs vantent l’intérêt de la technique de l’embedding pour enrichir les réponses d’un modèle comme GPT-4 tout en évitant d’envoyer des données confidentielles vers les plateformes d’IA générative. Dans les faits, la méthode limite les hallucinations, mais ne garantit pas la protection des données sensibles. Lire la suite
-
Actualités
22 juin 2023
Relational Migrator : le plan de MongoDB pour convertir les entreprises au NoSQL
Si comme tous les éditeurs, MongoDB tente de surfer sur la vague de l’IA générative, c’est sa volonté d’accueillir toutes les charges de travail (ou presque) et son plan pour tenter de convertir les entreprises au NoSQL qui marque son événement new-yorkais. Lire la suite
-
Projet IT
12 juin 2023
OPC-UA : comment Renault unifie la récolte de données dans ses usines
Le constructeur automobile est l’un des premiers à avoir parié massivement sur le protocole de communication OPC-UA. Au-delà de l’interopérabilité réseau offerte par ce standard, c’est la couche unifiée de données qui intéressait le concepteur de la R5 E-Tech. Lire la suite
-
Actualités
05 juin 2023
L’essentiel sur Cleyrop, la plateforme souveraine de données tout-en-un
Pour répondre aux besoins en matière d’indépendance technologique pour les données sensibles, le Français Cleyrop propose un « DataHub », une plateforme de bout en bout de gestion des données. L’éditeur mise aussi sur la « simplification » pour s’imposer face aux géants mondiaux. Lire la suite
-
Actualités
17 mai 2023
Streaming de données : un sujet « critique » encore mal maîtrisé par les entreprises (étude)
Selon une étude commandée par Confluent, la majorité des entreprises ont compris l’intérêt du streaming de données et l’utilisent dans des systèmes critiques, preuve d’un gain de maturité sur le sujet. Pour autant, les projets demeurent fragmentés et les équipes en manque de ressources, tandis que les éditeurs, dont Confluent, doivent faciliter le partage et la gouvernance des données. Lire la suite
-
Actualités
16 mai 2023
Apache Kafka : ZooKeeper fait de la résistance, mais Confluent a un plan
Si la communauté derrière Apache Kafka et Confluent a acté la fin du recours à ZooKeeper depuis deux ans, le protocole de consensus devrait connaître encore quelques années de répit, le temps que les entreprises se fassent à KRaft et qu’elles commencent à déployer ce remplaçant en production. Lire la suite
-
Actualités
10 mai 2023
Watsonx : IBM convertit Watson à l’IA générative
Le géant historique de l’IT se concentre sur la fourniture d’un environnement de cloud hybride et d’une stratégie d’IA générative axée sur les aspects de la technologie liés à l’entreprise, aux données et à la gouvernance. Lire la suite
par- Esther Ajao, News Writer
- Gaétan Raoul, LeMagIT
-
Actualités
04 mai 2023
Les efforts d’Oracle pour redorer le blason d’Autonomous Data Warehouse
Le fournisseur étend l’écosystème autour de son entrepôt de données en même temps qu’il réduit les coûts de stockage pour tenter de convaincre plus largement ses clients existants et de nouveaux venus. Au passage, dans la plus pure tradition « Ellisonienne », il n’hésite pas à tacler Snowflake. Lire la suite
-
Projet IT
20 avr. 2023
Schneider Electric accélère son « time to data »
Schneider Electric a profondément repensé son architecture et sa data platform pour une meilleure adéquation aux besoins, en particulier sur l’IA et le traitement des données non structurées. L’industriel déploie en outre une stratégie Data Mesh. Lire la suite
-
Actualités
20 avr. 2023
Pour Qlik, tous les chemins d’intégration mènent au data warehouse (ou presque)
Impatient de finaliser l’acquisition de Talend, Qlik déroule sa panoplie d’outils d’intégration de données. Son offre se concentre pour l’instant sur les mouvements et les migrations de données vers les data warehouse du marché. Lire la suite
-
Conseil
18 avr. 2023
L’essentiel sur Starburst et Trino
À partir de Trino, une branche du projet Presto de Facebook, Starburst entend proposer un méta data warehouse capable de fédérer des données depuis un maximum de systèmes sources. Lire la suite
-
Actualités
14 avr. 2023
SaaS : Sastrify, l’éditeur qui murmure à l’oreille des éditeurs trop gourmands
Le Cigref s’agace des comportements déloyaux de certains éditeurs SaaS alors que les entreprises sont de plus en plus dépendantes du cloud. L’Allemand Sastrify, lui aussi SaaS, observe ces tensions et s’efforce d’armer ses utilisateurs. Lire la suite
-
Actualités
05 avr. 2023
Suivi des traitements : Alation renforce ses intégrations avec Databricks et DBT
Alation a dévoilé des partenariats étendus avec Databricks et DBT Labs visant à aider les utilisateurs à mieux comprendre leurs données et à avoir une meilleure vision des changements et transformations sous-jacents. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
31 mars 2023
Databricks tire le bilan de sa présence en France
Databricks veut asseoir sa présence en Europe. La France prend une place toute particulière dans le dispositif de l’éditeur qui souhaite étendre ses relations avec les grands industriels et convaincre les startups les mieux dotées dans une période propice à la réduction des coûts. Lire la suite
-
Actualités
30 mars 2023
BigQuery : Google Cloud revoit son modèle économique
Outre des ajouts pour sécuriser le traitement de données partagées et faciliter l’inférence des modèles de machine learning sur BigQuery, Google Cloud annonce une révision de la politique tarifaire du data warehouse cloud. Les options seraient plus flexibles et granulaires, mais cela entraîne une augmentation de 25 % des tarifs analytiques à la demande. Lire la suite
par- Eric Avidon, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
29 mars 2023
Avec Modeler, Google découple la modélisation sémantique de Looker
Google a dévoilé mercredi Looker Modeler, un nouveau service standalone qui permettra aux clients de n’importe quel outil BI d’utiliser les capacités de modélisation sémantique de Looker, pour définir et stocker des métriques. Lire la suite
-
Conseil
28 mars 2023
Pourquoi ne pas se précipiter pour déployer l’analytique en temps réel
Les outils d’analytique en temps réel promettent de fluidifier la récolte d’indicateurs et d’améliorer les processus d’entreprise, mais ils posent également des défis aux organisations qui les adoptent. Lire la suite
-
Opinion
24 mars 2023
Les grands défis du Data Mesh
Le concept de Data Mesh présente des avantages certains dans la gestion de données, mais sa mise en place présente des défis de taille, autant culturels que techniques. Lire la suite
-
Guide
21 mars 2023
Intégrations de données : les clés pour comprendre le « nouveau monde »
L’intégration de données à des fins analytiques évolue en parallèle des pratiques. Ce guide essentiel met en lumière les approches qui ont fait leurs preuves, et celles plus émergentes. Lire la suite
-
Conseil
15 mars 2023
Gestion de flux de données : une introduction à Apache Airflow
Cette introduction à Apache Airflow passe en revue certaines des bases de l’outil de gestion de flux de travail – des étapes d’installation aux différentes options de l’interface graphique en passant par quelques conseils pour l’utiliser au quotidien. Lire la suite
-
Actualités
14 mars 2023
Machine learning : Databricks renforce son support de l’inférence en temps réel
Avec Model Serving, Databricks entend simplifier les déploiements des modèles de machine learning en temps réel en s’appuyant sur une architecture serverless dont les performances sont garanties par SLA. Lire la suite
-
Actualités
09 mars 2023
Datasphere : SAP veut unifier les données sous une seule bannière
SAP a présenté hier Datasphere, une « évolution » de SAP Data Warehouse Cloud. L’entrepôt de données se dote de capacités de « découverte, de modélisation et de distribution de données ». L’annonce s’accompagne d’un partenariat avec Databricks, Collibra et DataRobot, voulu comme le symbole de l’ouverture de la pile technologique du groupe allemand. Lire la suite
par- Gaétan Raoul, LeMagIT
- Jim O'Donnell, Journaliste ERP