Les procès intentés contre les fournisseurs de grands modèles de langage tels qu’Anthropic et OpenAI commencent à évoluer. Selon certains, cela signifie que les tribunaux sont en train de clarifier ce qui constitue un usage équitable des données (fair use) lors de l’apprentissage de modèles d’IA générative.

Le 25 mars, un juge fédéral californien a rejeté la demande d’un groupe d’éditeurs de musique, incluant Universal Music Group. Ils avaient intenté un procès à Anthropic en 2023. Dans leur injonction, UMG et les plaignants voulaient empêcher Anthropic d’utiliser sa musique pour entraîner le chatbot Claude, alimenté par l’IA, tant que le procès était en cours. Le juge a déclaré que cette demande était trop large.

« Bien que les éditeurs aient tenté de clarifier la portée de l’injonction proposée, les détails restent flous et mal définis », tranche la juge Eumi K. Lee du tribunal du district nord de la Californie, dans sa décision. La plainte incorpore et mentionne 500 chansons énumérées dans la pièce à conviction A, mais cette liste est « illustrative et non exhaustive ».

Des plaintes trop vagues Les éditeurs de musique ont d’abord accusé Anthropic de violer le droit d’auteur en utilisant les paroles d’environ 500 de leurs chansons pour entraîner son modèle. Ils ont déclaré que Claude était capable de générer des copies exactes des paroles de chansons telles que « Uptown Funk » de Bruno Mars et « Halo » de Beyoncé. Selon Michael Bennett, vice-chancelier associé chargé de la data science et de la stratégie en matière d’intelligence artificielle à l’université de l’Illinois à Chicago, le manque de spécificité de l’injonction l’a probablement rendu irrecevable par le tribunal. La demande des plaignants était également trop vague sur la question de savoir si UMG et les autres ayants droit musicaux souhaitaient qu’Anthropic réentraîne ses modèles sans inclure leur musique ou s’il fallait que le fournisseur exclue certaines œuvres de ses jeux de données d’entraînement. « Une injonction contraignant Anthropic à réentraîner des modèles déjà lancés ou à reconstruire le corpus d’entraînement pour les modèles en développement pourrait imposer des coûts imprévisibles à Anthropic », selon la décision de la juge Lee. Bien que cette décision concerne spécifiquement Anthropic, elle donne un aperçu des attentes des juges envers ceux qui intentent des actions en justice pour atteinte au droit d’auteur contre les fournisseurs de modèles d’IA. « Si vous cherchez à convaincre un tribunal d’ordonner une injonction contre Anthropic ou OpenAI parce que vous êtes persuadé qu’ils ont utilisé votre contenu protégé par le droit d’auteur pour entraîner leur modèle, alors votre demande doit être aussi précise que possible », prévient Michael Bennett. « Si elle ne l’est pas, si elle reste vague, elle sera rejetée ». Un exemple à l’avantage du plaignant semble prouver ce point. En février 2025, le tribunal du district du Delaware a rejeté l’argument du « fair use » brandi par Ross Intelligence en réponse à la plainte de Thomson Reuters. Ross a développé un assistant légal en entraînant ses modèles à partir des notes d’en tête la base de données légale Westlaw appartenant au plaignant. Selon le juge, « “l’utilisation de Ross n’est pas transformatrice parce qu’elle n’a pas un objectif supplémentaire ou un caractère différent de celui de Thomson Reuters”. Cela signifie que la Cour considère que l’utilisation par Ross des notes d’en-tête pour former son IA sert exactement le même objectif que Thomson Reuters : fournir un outil de recherche juridique efficace », explique Vincent Fauchoux, avocat spécialisé en propriété intellectuelle et nouvelles technologies au sein du cabinet Deprez Guignot & Associés, dans un billet de blog. Une décision qui semble résulter d’une analyse préalable du texte définissant le « fair use » par les avocats de Thomson Reuters.