En marge du Kafka Summit, Confluent a présenté « Streaming Data Report », une étude auprès de Freeform Dynamics. Elle a été réalisée par Radma Research entre février et mars 2023. L’enquête a permis d’obtenir les réponses de 2250 responsables informatiques dans sept pays différents (France, Allemagne, Royaume-Uni, Australie, États-Unis, Inde, Singapour).

Le streaming de données, un sujet important quand il n’est pas déjà prioritaire Ces responsables, travaillant pour des organisations de plus de 500 salariés, sont majoritairement convaincus par le streaming de données. Pour 89 % des sondés, il est important d’investir dans des capacités de streaming de données. Environ 44 % d’entre eux voient là « une priorité stratégique ». De fait, les systèmes orientés événements sont largement déployés. Pas moins de 72 % des sondés assurent que leur entreprise « s’appuie sur le streaming de données pour leurs systèmes critiques ». Selon l’étude, 60 % des responsables IT déclarent qu’au moins cinq systèmes critiques « dépendent » du streaming de données. Dans le détail, 22 % des répondants comptabilisent 10 à 19 systèmes concernés, quand 20 % d’entre eux déploient Apache Kafka ou d’autres technologies dans 20 à 49 systèmes critiques. Seul 5 % des sondés estiment que plus de 50 applications de ce genre s’appuient sur le streaming de données. Les usages en production les plus répandus concernent « la gestion des risques numériques et la cybersécurité » (pour 44 % des sondés), la supervision IT (43 %), l’expérience client (36 %), l’automatisation des processus (36 %) ou encore la livraison des données aux outils BI et CRM (36 %). Les sondés notent surtout des gains « significatifs » d’efficience et de temps de réponse dans leurs activités.

La gouvernance des flux de données, le trou dans la raquette Les futures pistes d’investissement des sondés concernent l’harmonisation des systèmes, ou encore, le partage de nouveaux flux et l’intégration/la réutilisation des topics déjà en place. En ce sens, Confluent a annoncé la disponibilité générale de Stream Sharing, un moyen de partager et de contrôler les accès de topics entre différentes organisations, tant qu’elles utilisent un client Kafka. Outre le fait de bénéficier d’un plus grand nombre de connecteurs vers les systèmes qu’elles déploient, les organisations seraient également à la recherche de moyens pour mieux gouverner leurs flux de données. « Comme Apache Kafka prend de plus en plus une place centrale dans la couche de gestion de données des clients, ils réclament davantage de capacités de gouvernance », déclare Alexandre Lamy, directeur régional des ventes chez Confluent (France, Belgique, Luxembourg, Suisse, Maghreb). « Dans Confluent Platform 7.4, cela passe par le renforcement des contrats, à savoir des règles de mise en qualité des données, pour le registre de schéma. Mais les clients réclament par ailleurs d’un catalogue des flux de streaming, d’obtenir un lineage, d’avoir la traçabilité des données en presque temps réel », poursuit-il. En ce sens, dans Confluent Platform 7.4, une fonction de validation de la qualité permet de valider l’envoi de données sous forme de booléen. Par exemple, si une carte de crédit ou un numéro de sécurité de sociale n’a pas le bon nombre de numéros, Kafka renverra une exception. Les règles de migration de schéma permettent, elles, de faciliter l’interopérabilité de topics associés à différentes versions d’un schéma. Cela n’est guère surprenant. Les grands clients de Confluent sont des banques, des acteurs de la supply chain, de l’industrie manufacturière, des assurances ou encore des services financiers. Pour comprendre et agir sur cette disparité, Freeform Dynamics et Radma Research ont établi un score de maturité sur 5, où 1 correspond à des organisations faisant des tests dans des environnements en pré-production et 5 à des acteurs capables de non seulement gérer de nombreux systèmes en production, mais également considérés leurs flux comme des produits de données.

Une maturité en forme de ventre-mou à cause de projets lancés en ordre dispersé Seul 1 % des sondés estiment avoir atteint le cinquième niveau de maturité. La majorité d’entre eux (63 %) considèrent avoir atteint le niveau 3. Confluent décrit ce stade comme le moment où les organisations ont « mis en production de quelques systèmes critiques sans partager les données entre différentes équipes ». Ce ventre mou cache en réalité une variété d’approche de déploiement. Confluent parle d’une adoption « souvent fragmentée ». Environ 35 % des responsables IT préfèrent déployer d’un service cloud entièrement géré par un fournisseur tiers. De son côté, l’éditeur voit une croissance importante de son service Confluent Cloud. « Les entreprises qui l’adoptent ne veulent pas développer eux-mêmes les solutions. Elles souhaitent qu’un tel système de distribution de messages soit autonome et sécurisé », avance Alexandre Lamy. « Elles se rendent compte rapidement qu’il y a peu de valeur ajoutée à déployer elles-mêmes une telle architecture ». Pour autant, l’étude démontre que le cloud n’a pas un avantage encore très marqué. Ainsi, d’après le document, 28 % des personnes interrogées préfèrent utiliser un logiciel open source avec l’aide d’un éditeur tiers, 30 % d’entre elles se tournent vers une solution propriétaire. Enfin, 30 % des sondés utilisent un logiciel open source gérée en interne. En clair, il en ressort un léger avantage pour le cloud, mais, en général, un équilibre s’observe entre open source et propriétaire, cloud ou on premise. Peu importe la méthode de déploiement, les architectures orientées événements ne sont pas simples à mettre en place. Comme le conclut le Streaming Data Report, les problèmes d’organisation – plus particulièrement la fragmentation des projets – et le manque de personnels qualifiés affectent respectivement 74 % et 72 % les équipes des responsables interrogés. Ils déplorent également le manque de financement pour moderniser les infrastructures et les contraintes liées aux systèmes existants, surtout quand ils sont propriétaires.