Clairement, Microsoft mise beaucoup sur la marque ombrelle Copilot. Elle rassemble les services du géant du cloud propulsés à l’IA générative. Le premier d'entre eux n'est autre que GitHub Copilot, l'outil de génération et de complétion de code bâti sur Codex, un modèle d’IA entraîné par OpenAI. Dans cette gamme, il y a également des assistants de rédaction, d'analyse de données et de création de visuels incorporés dans la suite Microsoft 365.

La plupart des modèles infusés dans ces produits ont été entraînés à partir de données accessibles publiquement, téléchargées depuis le web. La majorité des contenus proviennent de sources libres de droit ou sous licences open source. Malgré tout, OpenAI et Microsoft n'ont pas forcément réclamé l'autorisation explicite des auteurs avant de les exploiter. GitHub et Microsoft font d'ailleurs l'objet de plaintes soumises à plusieurs cours de district aux États-Unis.

Dans un avis consultatif rendu en 2020, OpenAI défendait auprès de l’USPTO (l’équivalent américain de l’INPI) que l'utilisation des données publiques dans l’entraînement d’IA générative relevait du « fair use ». De son côté, l’USPTO, rappelle que cette loi américaine s’applique au cas par cas, mais qu’elle suffisait généralement à statuer de l’équité de l’usage de contenus lors de l’entraînement d’une IA, même s’ils peuvent être protégés par une forme de copyright.

De sérieux doutes subsistent. Le 30 août, l’US Copyright Office a lancé une enquête publique concernant les copyrights et l’IA. Un sujet qui pose de nombreuses questions, selon l’Administration. « Ces questions portent notamment sur l'utilisation d'œuvres protégées par le droit d'auteur pour entraîner des modèles d'IA, les niveaux appropriés de transparence et de divulgation en ce qui concerne l'utilisation d'œuvres protégées par le droit d'auteur, le statut juridique des résultats générés par l'IA et le traitement approprié des résultats générés par l'IA qui imitent les attributs personnels d'artistes humains ». L’USPTO entend soutenir l’initiative.

Protéger les clients des solutions Copilot Microsoft n’attendra pas l’avis consultatif de l’US Copyright Office. Si un tiers porte plainte contre les entreprises et les individus qui paient la souscription de ses produits propulsés à l’IA générative, Microsoft prendra leur défense. « Nous défendrons le client et paierons le montant réclamé lors d’un jugement ou d’un arrangement défavorable », écrivent à quatre mains Brad Smith, président de Microsoft, et Hossein Nowbar, CVP et Chief Legal Officer chez Microsoft. Pour l’heure, cela concerne particulièrement les utilisateurs payants de Bing Chat Enterprise, Microsoft 365 Copilot, Windows Copilot, Dynamics 365 Copilot, GitHub Copilot ainsi que des versions de Copilot infusées dans Power BI, Power Platform, Viva Sales et Microsoft Security. Microsoft précise qu’il couvrira ses clients lorsqu’ils feront l’objet de « réclamations de tiers, fondées sur les droits d’auteur, les brevets, les marques, les secrets commerciaux ou le droit de publicité ».

Des conditions sine qua non Il y a toutefois une condition à laquelle les clients devront se plier pour bénéficier de cette protection. Le géant du cloud les aidera « tant qu’ils utilisent les garde-fous et les filtres de contenu intégrés dans les produits ». « Nous avons intégré des filtres et d'autres technologies conçus pour réduire la probabilité que les assistants Copilot renvoient des contenus illicites », expliquent les dirigeants. Ceux-là reposent « sur un large éventail de garde-fous tels que les classificateurs, les métaprompts, le filtrage de contenu, la surveillance opérationnelle et la détection des abus, y compris ceux qui sont susceptibles d'enfreindre le contenu de tiers », poursuivent-ils. « Notre nouvel engagement Copilot en matière de copyrights exige que les clients utilisent ces technologies, ce qui incite tout le monde à mieux respecter les droits d’auteurs ». Pour être valable, la demande devra concerner du contenu en sortie de Copilot qui n’a pas été modifié après coup, et dont le client savait qu’il ne porterait pas atteinte aux droits d’autrui. Ainsi, les données en entrées ne doivent pas contenir d’éléments protégés par des copyrights. Sans surprise, les réclamations concernant l’utilisation de marques, la diffamation et la génération de contenus illicites ne feront pas l’objet d’un soutien de la part de Microsoft. Le géant technologique s’engage à ne pas réclamer la propriété des données en sortie de ses services Copilot. « Cela dit, nous ne nous prononçons pas sur la question de savoir si les résultats d'un client sont protégés par des droits d'auteur ou s'ils sont opposables à d'autres utilisateurs », poursuit Microsoft dans une FAQ. « En effet, les systèmes d'IA générative peuvent produire des réponses similaires à des invites ou des requêtes semblables provenant de plusieurs clients. Par conséquent, des clients pourraient revendiquer des droits sur un contenu identique ou substantiellement analogue ».

Une « étape importante » dans l’industrie, selon des analystes de Gartner Sur X (ex-Twitter), certains regrettent que Microsoft ne prenne cet engagement que pour ses grands clients. Dans une discussion sur LinkedIn, les analystes de Gartner observent un engagement fort et se demandent si d’autres éditeurs et fournisseurs suivront. « Une étape importante ! », s’exclame Jan Cook, Analyste, responsable de recherche SAP et ServiceNow chez Gartner. « Voyons si Salesforce et ServiceNow prévoient un engagement similaire ». Pour sa part, Jason Wong, un autre analyste chez Gartner, rappelle qu’Adobe s’est engagé à faire de même pour les entreprises qui utiliseraient Firefly, son système de génération de visuels et de contenus marketing. Par ailleurs, l’analyste considère que cette prise de position est « importante au regard du litige en cours autour de GitHub Copilot ».