Le New York Times vient d’engager une procédure contre OpenAI et Microsoft. Il leur reproche « l'utilisation illégale […] du travail du Times pour créer des produits d'intelligence artificielle qui lui font concurrence et menacent la capacité du Times à fournir ce service ».

Notre confrère estime ainsi que « les outils d'intelligence artificielle générative (“GenAI”) s'appuient sur des modèles linguistiques de grande taille (“LLM”) qui ont été construits en copiant et en utilisant des millions d'articles d'actualité, d'enquêtes approfondies, de tribunes, de critiques, de guides pratiques, etc. du Times, protégés par le droit d'auteur ».

Mais ce n’est pas tout. Selon le New York Times, les « outils de GenAI peuvent générer des résultats qui reprennent mot pour mot le contenu de Times, le résument étroitement et imitent son style expressif, comme le démontrent des dizaines d'exemples ». Quelques-uns sont joints à la plainte, montrant GPT-4 reprendre des pans entiers d’articles de notre confrère, quasiment mot pour mot, ou encore citant, sur demande, des paragraphes d’un article inaccessible gratuitement.

Et cela va au-delà : « les applications de recherche synthétiques construites sur les LLM GPT, y compris Bing Chat et Browse with Bing for ChatGPT, affichent de larges extraits ou des paraphrases du contenu des résultats de recherche, y compris le contenu Times, qui peuvent ne pas avoir été inclus dans l'ensemble d'apprentissage du modèle ».

La plainte affirme que notre confrère a cherché à négocier « durant des mois » pour trouver un accord avec OpenAI et Microsoft, cherchant à « s'assurer de recevoir une juste valeur pour l'utilisation de son contenu », mais sans succès.

Car selon la plainte, les intéressés voient dans leur usage des contenus en question un « nouveau but transformatif ». Ce que réfute le New York Times : « il n'y a rien de “transformatif” dans le fait d'utiliser gratuitement le contenu du Times pour créer des produits qui se substituent au Times et lui volent son audience ».