Comparaison de 7 des principales APIs Cloud de reconnaissance vocale : conclusion

LeMagIT s’est penché sur les services de Microsoft, Google, HPE, IBM, Nuance Cloud etSpeechmatics. Voici la synthèse de cette comparaison et les éléments clefs à en retirer.

Au final, on retiendra la grande simplicité de mises en œuvre de toutes ces API. La reconnaissance vocale est désormais vraiment accessible à tous.

On retiendra aussi que les résultats obtenus sont significativement différents d’une API à l’autre. D’où l’importance de les évaluer toutes et de vous faire votre propre opinion en fonction de vos sources audios. Sur nos tests, seul Speechmatics s’en sort vraiment bien.

Les fonctionnalités sont également assez variables, certaines API étant plus adaptées à des petites séquences ou à des flux audio live.

Enfin les prix sont eux aussi très variables d’un service à l’autre bien que les comparaisons directes soient difficilement réalisables, chacun utilisant une métrique différente.

Tableau récapitulatif

Pour approfondir sur Applications et services

Close