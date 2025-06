Avec sa plateforme Confluent 8.0, l’éditeur adopte Apache Kafka 4.0. Ce faisant, il élimine une bonne fois pour toutes le recours à Apache ZooKeeper.

Pour rappel, ZooKeeper est un système de gestion de configuration et de la coordination de systèmes distribués. Dans Kafka, il est principalement utilisé pour la gestion de l’élection des brokers – c’est-à-dire les nœuds d’un cluster Kafka –, leur synchronisation, la localisation des données et des métadonnées associées.

Or Zookeeper présente plusieurs limites à grande échelle, dont de la latence et des pertes de données. Surtout, puisqu’il s’agit d’un projet indépendant, ni les contributeurs de Kafka, ni Confluent n’avaient la main dessus.

KRaft remplace définitivement Zookeeper

Depuis 2019 et l’annonce de Kafka 3.0, le projet de la communauté et de Confluent est de remplacer ZooKeeper par KRaft. Comme son nom l’indique, KRaft implémente l’algorithme et le protocole de consensus Raft.

Il gère les logs de métadonnées de Kafka (topics, partitions, configurations, etc.) à l’intérieur de la plateforme de streaming, sans recourir à un système tiers. Cette internalisation doit simplifier l’architecture de Kafka et donc sa maintenance.

Déployé sous forme de nœud, KRaft tient le même rôle que ZooKeeper, mais au sein de Kafka. Dans le principe, il se comporte comme son prédécesseur : KRaft a besoin d’un nombre minimum de nœuds pour s’exécuter. « Par exemple, un cluster à trois nœuds peut survivre à une panne. Un cluster à cinq nœuds peut survivre à deux pannes, et ainsi de suite », illustre la documentation de Confluent.

« Le leader du journal des métadonnées est appelé le contrôleur actif. Le contrôleur actif gère tous les appels de procédures distants effectués à partir des brokers. Les contrôleurs suiveurs répliquent les données écrites sur le contrôleur actif et servent de relais en cas de défaillance de ce dernier », y lit-on.

Cela promet une plus forte tolérance aux pannes.

Contrairement à ZooKeeper dont le nœud de contrôle pousse les mises à jour de métadonnées vers les brokers, avec KRaft ces nœuds de clusters « écoutent » le contrôleur actif à la recherche des actualisations, à travers l’API MetadataFetch. Ces données qu’il récupère, le broker les persiste sur disque. Les états, eux, sont lus depuis la mémoire.

En plus d’une plus grande simplicité et d’une résilience éventuellement supérieure, cette phase de stockage par le broker doit lui permettre « de se lancer rapidement, même s’il y a des centaines de milliers, voire des millions de partitions ». À condition qu’il ait déjà eu accès aux métadonnées gérées par le contrôleur actif, sinon il recevra une image entière des métadonnées.

De son côté, Confluent assure que cela permet de gérer jusqu’à 10 fois plus de partitions qu’avec ZooKeeper, soit 2 millions de partitions au lieu de 200 000, selon ses tests. Toutefois, l’éditeur préfère être prudent et semble confiant sur la gestion de 400 000 partitions maximum.

KRaft avait déjà été introduit dans les versions ultérieures de la plateforme de Confluent. Les clients pouvaient encore s’appuyer sur ZooKeeper. Avec Confluent 8.0, l’ancien gestionnaire de coordination des brokers Kafka n’est plus du tout accessible, même en option. C’est également vrai avec Kafka 4.0, lancé par la communauté en mars 2025.