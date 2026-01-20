LightOn a présenté, ce 19 janvier 2026, une nouvelle version de sa technologie de reconnaissance et de structuration de documents, LightOnOCR-2. Cette brique est intégrée à sa plateforme tout-en-un Paradigm.

Elle constitue la première étape d’un plan en 3 parties – baptisé « Bleu, Blanc, Rouge » – destiné à renforcer les capacités de cette solution française d’IA générative face aux offres concurrentes, principalement américaines (OpenAI, Microsoft, Google, etc.)

L’éditeur cible en priorité des corpus documentaires peu exploités, comme certains contrats, les dossiers techniques ou les archives réglementaires. Pour LightOn, ces contenus resteraient « largement inaccessibles à l’IA » en raison de leur complexité, de leur sensibilité.

Sa technologie OCR permet désormais de les analyser avec l’IA générative « là où ils se trouvent déjà », c’est-à-dire sans déplacer ces données.

Un modèle OCR de grande taille, déployable sur site Techniquement, LightOnOCR-2 repose sur un modèle d’environ un milliard de paramètres. L’éditeur affirme qu’il se positionnerait en tête du benchmark OlmOCR, y compris face à des modèles « neuf fois plus grands ». Mais LightOn ne détaille pas les conditions exactes des tests ni les cas d’usage évalués. Autre caractéristique, LightOnOCR-2 s’appuie sur une architecture « de bout en bout » contrairement aux chaînes OCR traditionnelles. Cette approche particulière vise à passer plus facilement à l’échelle lors des déploiements sur site (on-premise) à forte volumétrie. Pour mémoire, LightOn propose des IA génératives packagées (LLM, RAG, supervision, hardware, etc.) à destination des entreprises souhaitant que leurs informations restent entre leurs murs pour des raisons de conformité ou de souveraineté.