Le britannique Tractable accélère par 5 son IA grâce aux puces IPU

Offrant un service d’estimation automatique des frais liés à un sinistre, la startup devait accélérer l’entraînement de ses algorithmes de reconnaissance d’images pour signer avec de nouvelles assurances.

Tractable, une entreprise britannique spécialisée dans l’analyse d’images de sinistres pour les assurances, a récemment remplacé les GPU Nvidia de ses calculateurs par des cartes accélératrices IPU de GraphCore dans le but d’augmenter le rythme de ses traitements.

« Notre activité est en pleine croissance ! Nous avons depuis peu signé avec beaucoup de nouvelles compagnies d’assurance, dernièrement jusqu’au Japon. Plus tôt, nous nous sommes déployés en France ; nous travaillions déjà avec Covéa et, cette année, celui-ci déploie notre service pour les clients de ses trois marques MMA, MAAF et GMF. Nous sommes aujourd’hui présents dans quatorze pays, nous travaillons avec plus de 20 grandes compagnies d’assurance », se réjouit Razvan Ranca, le directeur technique de Tractable.

Tractable a été fondé à Londres en 2014 par Razvan Ranca, ingénieur, et deux Français, Adrien Cohen, un ancien de Goldman Sachs, et Alexandre Dalyac, un entrepreneur rompu à la transformation digitale outre-Atlantique. Après avoir levé 55 millions de dollars, leur startup est passée de soixante-dix salariés à plus de deux cents en 2020. La plupart sont des chercheurs.

Entraîner plus d’algorithmes au fur et à mesure que le marché augmente

Leurs algorithmes ont initialement été construits par-dessus PyTorch, une bibliothèque Python Open source pour le Machine Learning. Ils sont entraînés sur des serveurs bardés de GPUs, hébergés par le prestataire britannique IOmart. Ce sont sur ces machines-là que repose toute l’efficacité du service. Ensuite, ces algorithmes analysent les images depuis de simples serveurs virtuels en cloud public.

« Notre service consiste à générer en quelques secondes seulement des estimations de coûts de réparation, juste en analysant les photos que les particuliers ont prises des dégâts sur leur voiture ou dans leur habitation. Pour les victimes de ces sinistres, cela signifie généralement qu’elles peuvent lancer leurs réparations dans la semaine, alors qu’elles doivent attendre parfois des mois lorsqu’il faut dépêcher un expert », explique Razvan Ranca.

« Pour parvenir à ce résultat, nous entraînons notre algorithme sur des centaines de millions de photos, en prenant en compte des centaines de milliards de paramètres. On pourrait penser que depuis que nous faisons cela, nos algorithmes sont assez entraînés. Il n’en est rien : quand vous arrivez dans un nouveau pays, les voitures, les logements n’ont plus rien à voir avec les photos que vous avez déjà en stock. Et vous devez tout recommencer ! »

« À cela s’ajoute la volonté d’offrir un service de plus en plus précis. Tous les jours, nous découvrons de nouveaux détails qui méritent une analyse. Alors nous améliorons nos algorithmes pour qu’ils soient encore plus précis et nous relançons leur entraînement », dit le directeur technique.

Graphcore : un IPU cinq fois plus puissant qu’un GPU

Au début d’année 2021, Tractable comprend que son effectif désormais triplé et ses nouveaux clients seront bien trop à l’étroit sur les clusters de GPU hébergés chez IOmart. Razvan Ranca se met alors en quête d’une alternative. IOmart lui présente Boston Server & Storage Solutions, un intégrateur qui travaille avec un acteur émergeant du supercalcul, le britannique Graphcore.

Depuis 2016, Graphcore développe un ASIC qu’elle nomme IPU. Cette puce, dans sa dernière version GC200, contient 1472 cœurs, chacun capable d’exécuter six traitements en parallèle, soit une puissance de 250 TeraFLOPS. Graphcore monte son IPU en double sur des cartes PCIe, en quatre exemplaires sur des serveurs racks 1U et propose aussi des PODs – un cluster prêt à l’emploi – de seize lames 1U.

« Pour faire court, avec le même nombre de serveurs, nos algorithmes de Machine Learning s’exécutent cinq fois plus vite ! C’est-à-dire qu’un entraînement qui durait trois semaines sur des GPU Nvidia auparavant se termine à présent en trois ou quatre jours ! », se réjouit le directeur technique.

Conserver le leadership en matière de capacité de recherche

Tractable demande rapidement à IOmart de remplacer un premier lot de 16 GPU par quatre IPU, Boston Server & Storage étant capable de fournir des configurations prêtes à l’emploi.

« Graphcore a conçu sa solution pour que la migration depuis des GPU Nvidia demande un minimum d’efforts de réécriture des algorithmes. Pour autant, nous avons passé quelques semaines à peaufiner nos réglages. »

« L’avantage immédiat est que nous avons pu, sur le même échantillon de photos, augmenter significativement le nombre de détails pris en compte. En l’occurrence, au-delà de la puissance brute des IPU, ceux-ci sont aussi accompagnés de plus de mémoire que les cartes GPU dont nous disposions », constate Razvan Ranca.

Depuis que les IPU sont déployées, les chercheurs de Tractable lancent effectivement cinq fois plus de traitements sur les machines qui en sont équipées. Le directeur technique parle plutôt d’expérimentations : les algorithmes ne nourrissent pas automatiquement une base de connaissance utilisable. Il faut aussi tester leur efficacité et, dans bien des cas, se rendre à l’évidence que les réglages prévus en amont n’étaient pas les bons. Il faut alors recommencer autant de fois que nécessaire pour obtenir un modèle qui correspond aux exigences d’une compagnie d’assurance.

« Nous avons en définitive multiplié par cinq notre capacité de recherche avec les machines équipées d’IPU. Cela signifie que nous restons, sur notre marché, les leaders », lance le directeur technique.

Fort de ce constat enthousiaste, Tractable aurait d’ores et déjà commandé à IOmart le remplacement complet de sa flotte de serveurs à base de GPU par des machines équipées d’IPU.

Pour approfondir sur HPC

Close