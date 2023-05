Ringover est une émanation de BJT Partners, un opérateur téléphonique créé en 2005, renommé Ringover Group.

Depuis 2015, Ringover développe une solution de téléphonie VoIP établie sur le standard WebRTC. Ringover revendique 10 000 clients en France, au Royaume-Uni, aux États-Unis et en Espagne. La société cible « toute entreprise qui aurait des relations de support ou de prospection prête à déployer 1 à 1000 licences » de sa plateforme.

L’entreprise qui s’est d’abord illustrée par ses services de téléphonie IP se convertit à l’approche omnicanale.

Cette tendance à la multiplication des canaux de communication se frotte à la nécessité pour les centres de contact, les clients de Ringover, de gagner en efficacité. Un agent doit passer le moins de temps possible en ligne ou sur le dossier d’un client tout en étant efficace.

L’intelligence conversationnelle, un vecteur de productivité dans les centres de contact

En ce sens, Ringover s’intéresse depuis 2021 à l’intelligence artificielle. Le Français se sait en retard par rapport à ses concurrents américains. « Dans notre milieu, améliorer sa productivité, c’est gagner du temps. Comment fait-on ? En analysant les conversations afin d’y déceler des intentions », résume Ludovic Rateau, directeur des technologies et des produits chez Ringover.

Le fruit de ce travail se nomme Empower. Cet outil disponible le 23 mai permet d’obtenir des transcriptions et des résumés, une identification automatique des sujets abordés, une analyse de « l’humeur » des appels, ainsi que des statistiques et des recommandations « sur la qualité et le contenu des conversations ».

Ringover peut identifier le ton des interlocuteurs, mais aussi le débit de voix, le temps de parole attribué à l’agent et à ses interlocuteurs ou encore les blancs dans les entretiens.

« Nos clients sont des responsables des ventes ou du support. Ils n’ont pas le temps d’écouter l’ensemble des conversations avec leurs contacts. Pourtant, leurs MP3 recèlent d’informations très importantes pour eux », déclare Ludovic Rateau. « Peut-être qu’un agent s’est mal comporté avec un client ou l’inverse. Ils veulent pouvoir retrouver la bonne information au bon moment. Avec la transcription sous les yeux, le résumé permet d’obtenir ces données-là, de pousser les indicateurs dans le CRM ou encore de confirmer des informations ».

Pour développer cette solution, l’éditeur a recruté des ingénieurs NLP à la fin de l’année 2021 et au début de l’année 2022, « ne sachant pas qu’OpenAI provoquerait un raz de marée avec ChatGPT ».

Ringover n’a toutefois pas le même objectif que le poulain de Microsoft.

« 99 % de notre trafic correspond à des conversations téléphoniques ou en visio. Or la plupart des modèles d’IA sont entraînés sur des images ou du texte », rappelle le CTO de Ringover. « Il nous fallait un moteur de transcription très efficace, avec le Word Error Rate le plus faible possible ».

Le Word Error Rate (WER ou taux d’erreur de mots) est une métrique de performance d’un modèle de reconnaissance vocale automatique (ou Automatic Speech Recognition en VO). Plus ce score est faible, plus le système retranscrit fidèlement les conversations entre plusieurs interlocuteurs.

Il existe plusieurs services sur étagère proposés par les fournisseurs cloud : Amazon Transcribe, Azure Cognitive Services et Google Speech-to-Text sont les solutions les plus visibles sur le marché. Ceux-là peuvent, en principe, reconnaître et retranscrire des discours oraux en plusieurs langues (125 annoncées chez Google Cloud) sous forme de textes.