Hallucinations des IA : une fiabilité tronquée au nom de l’utilité

Après avoir évoqué son projet lors du sommet de l’IA parisien en février, Giskard a présenté les premiers résultats de son benchmark Phare. Les chercheurs du spécialiste de l’évaluation d’applications d’IA générative mettent en lumière certains mécanismes qui provoquent les hallucinations et identifient les LLM les moins risqués.
> Lire l’article de Gaétan Raoul