sukanda26 - Fotolia

IoT : avec Quarks, IBM met le traitement des données au plus proche des objets

Cette logique permet de filtrer à la source les informations pertinentes, une réactivité plus grande des opérationnels, et une économie sur les communications réseaux. Mais Dell, Cisco et une multitude de constructeurs sont déjà à l’œuvre sur ce champ émergent de l’Internet des Objets.

Le schéma objet (capteurs) – back-end (plateforme de traitement des données) est une base de l’Internet des Objets. Mais il manque à cette architecture un élément essentiel, sur lequel de nombreuses start-ups, constructeurs et éditeurs travaillent activement. Une brique intermédiaire qui filtre et pré-traite les informations.

Les passerelles IoT, une triple utilité

En résumé, toutes les informations d’un capteur ne sont pas pertinentes et ne méritent pas d’être stockées. Et dans celles qui le méritent, toutes ne nécessitent pas d’être transmises et traitées en temps réel par un back-end taillé pour des opérations mathématiques poussées.

D’où l’émergence d’appliances, de passerelles (gateway), ou d’une intelligence logicielle de plus en plus directement intégrée aux objets. L’intérêt est d’une part alléger le réseau et le prix des transmissions (qui peuvent être couteuses dans des conditions industrielles réelles, par exemple dans des conteneurs en mer ou en vol où seules les transmissions satellites passent), d’autre part d’accélérer les réactions aux évènements (un traitement directement en local est souvent plus réactif) et enfin de soulager le back-end, aussi bien en compute qu’en stockage.

Quarks, l’outil open-source d’IBM dans un univers Java

C’est dans cette optique qu’IBM vient de sortir Quarks, un outil open-source. Il s’agit concrètement d’un runtime Java pour plateformes de type micro-kernel compatible Java (8 et 9) et Android, d’APIs Java et de plusieurs connecteurs (pour le protocole de messagerie MQTT usité dans l’IoT ou pour le système de messaging Kafka).

L’idée est de rapprocher des objets l’intelligence du traitement des données (dans une appliance/gateway dédiée) voire de l’embarquer dans ceux-ci. Dès lors, c’est localement qu’est décidé si une donnée doit être stockée ou non, si elle donne lieu à une action (alerte à un agent humain sur une température, envoi d’un information à un autre objet), ou si elle doit être transmise pour une « analyse centralisée » via le réseau - en temps réel ou en batch.

A noter que dans le cas où Quartz motorise une passerelle, il est possible d’agréger, de traiter et d’analyser les données de plusieurs capteurs ou objets.

Le traitement centralisé des données générées par Quarks peut être exécuté par un back-end avec IBM Streams (traitement Big Data en temps réel) mais aussi avec des outils tiers comme Apache Spark (dont une composante importante est le Machine Learning), Apache Storm (Complexe Event Processing) ou des applications analytiques, Big Data et BI développés en interne.

Cisco, Dell et les acteurs du « Fog Computing »

Cette approche - celle qui est de plus en plus déployée sur le terrain - qui consiste à rendre les collecteurs d’informations locaux capables de comprendre les logiques métiers, a été baptisée dès 2014 par Cisco « Fog Computing ». A une différence notable chez Cisco où ces logiques sont embarquées dans des Gateways (ARM le plus souvent) ou dans des routeurs, mais pas dans les capteurs eux-mêmes.

Mais l’idée est identique : « étendre le Cloud jusque-là où sont les choses ». Ce qui n’a pas empêché le spécialiste du réseau de faire une acquisition majeure dans le back-end 100% Cloud avec Jasper, payé 1.4 milliards de dollars, à l’autre bout de la chaîne de l’IoT.

Un autre constructeur se penche avec acuité sur la question des gateway pour l’Internet des objets. En juin 2015, Dell a dévoilé son premier projet sorti de ses Labs IoT californiens. Il s’agissait d’une passerelle dont l’objectif serait « de faciliter la collecte des données issues de capteurs ou d’objets connectés, de les agréger avant de les préparer à un éventuel traitement ».

Cette passerelle a été rendue publique en octobre, sous le nom explicite de Edge Gateway 5000 (« Edge devices » étant anglais le nom des terminaux terrains – capteurs ou machine à part entière).

Mais le marché du « Fog Computing » se compose aussi d’une multitude de « petits » constructeurs qui embarquent ou commercialisent également leurs plateformes relais maison avec leurs appareils. Ce qui donne lieu à de nombreux rapprochement. Citons à titre d’exemple l’américain Prismtech et sa technologie de traitement de données Vortex, récemment rachetés en décembre 2015 par le constructeur chinois Adlink.

Face à cette concurrence protéiforme (éditeurs, constructeurs, gros et petits, sur site et back-end… où l’on retrouve également AWS, Microsoft ou Salesforce), IBM a décidé d’investir 3 milliards de dollars sur 3 ans et a dédié une division complète à l’IoT en mars 2015. Sans oublier la création de Watson IoT, pour appliquer l’informatique cognitive aux données de cet Internet des Objets.

Quarks hors IoT

Pour IBM, Quarks peut également avoir une utilité en dehors de l’IoT. Intégré à des serveurs d’applications il permettra par exemple d’analyser les logs d’erreurs en temps réel sans impacter le réseau. Ou au niveau du datacenter dans son entier, d’analyser la santé des serveurs de la « salle des machines » sans détériorer la bande passante quand celle-ci est limitée.

Quelle que soit le champ d’application, le code source de Quarks est disponible sur GitHub sous licence Apache. Il s’agit néanmoins d’une version « mi-cuite » puisque l’outil en est encore à sa version de développement 0.3.0.

Pour approfondir sur Outils de développement

Close