H Company lance un modèle pour automatiser les logiciels métiers
La startup vient de lancer Holotron-12B, un modèle d’intelligence artificielle conçu pour piloter des interfaces (UI) comme le ferait un humain. Il vise l’automatisation de processus complexes dans les entreprises.
La startup française H Company a présenté Holotron-12B, un modèle d’intelligence artificielle agentique spécialisé dans ce qu’elle appelle le « computer use », c’est-à-dire la capacité à interagir directement avec des interfaces logicielles.
Ce modèle a été post-entraîné à partir du modèle ouvert Nemotron-Nano-2 VL de NVIDIA, sur un mélange de données propriétaires afin de s’adapter aux environnements de production.
Il est mis à disposition sur Hugging Face.
Un modèle conçu pour agir dans les logiciels
Holotron-12B se distinguerait des modèles multimodaux classiques par son positionnement. Là où ces derniers se concentrent sur la compréhension d’images ou le suivi d’instructions, H Company indique que son modèle va « percevoir, décider et agir efficacement dans des environnements interactifs ».
Ces agents numériques peuvent utiliser un ordinateur « comme un humain », résument ses responsables dans un échange avec LeMagIT. Les agents sont capables de visualiser un écran, de comprendre une interface et d’exécuter des actions comme par exemple cliquer, naviguer ou remplir des formulaires.
Toujours selon H Company, cette approche doit permettre d’automatiser des processus directement dans les systèmes existants, y compris des outils anciens ou dépourvus d’API.
Onboarding, factures et logistique
Plusieurs scénarios d’utilisation dans des contextes opérationnels sont évoqués. Dans le cadre de l’onboarding client (KYC), un agent pourrait ainsi collecter des documents, extraire des données et alimenter les outils internes, avec une validation humaine en fin de chaîne. H Company évoque ici « 80 %+ d’automatisation » et « 65 % de réduction du temps de traitement ».
Dans le traitement des factures, un agent peut vérifier les documents, croiser les données avec des systèmes tiers et enregistrerait les informations dans un ERP. Là encore, la startup estime que le taux d’erreurs baisserait de 30 % avec une accélération du traitement de 40 %.
Enfin, dans la logistique, des agents pourraient suivre des expéditions sur différents portails, normaliser les données et mettre à jour les systèmes internes, avec pour objectif de supprimer le suivi manuel.
Une technologie différente de la RPA
Le tout n’est pas sans faire penser à la RPA. Mais pour H Company, Holotron-12B va plus loin. Les outils de RPA traditionnels sont fondés sur des scripts déterministes, les agents reposeraient sur des modèles capables de comprendre le contexte et d’adapter leurs actions en temps réel.
Les experts de la startup revendiquent également une meilleure robustesse face aux changements d’interface, là où les bots RPA seraient sensibles aux modifications d’éléments graphiques ou de workflows.
Selon H Company, ces agents pourraient en tout cas mieux couvrir des processus complets, gérer des données non structurées et des environnements hétérogènes. Ils pourraient également s’intégrer plus rapidement en s’appuyant sur les interfaces existantes plutôt que sur des intégrations spécifiques.
Pour autant, ces approches ne sont pas exclusives l’une de l’autre. Les agents pourraient orchestrer des briques RPA, utilisées comme des composants d’exécution dans des workflows plus larges.
Un autre modèle à venir
H Company prépare un nouvel entraînement basé sur Nemotron Omni, un modèle multimodal récemment annoncé par NVIDIA.
Cette évolution devrait améliorer les capacités de raisonnement et le traitement d’images haute résolution, ce qui « ouvrira la voie à un déploiement commercial » à plus grande échelle.
