Par , publié le 9 janvier 2024

Déjà ciblé par une demi-douzaine de plaintes déposées par des auteurs américains, OpenAI a vu s’ouvrir un nouveau front judiciaire. Fin décembre, le concepteur du robot conversationnel ChatGPT, fer de lance de l’intelligence artificielle générative, a été attaqué en justice par le New York Times, qui l’accuse d’avoir utilisé des millions d’articles pour concevoir ses grands modèles de langage GPT. Et qui lui réclame “des milliards de dollars” de dédommagement. Cette plainte, la première émanant d’un éditeur de presse, a pris la start-up dirigée par Sam Altman par surprise. Et pour cause: celle-ci négociait depuis plusieurs mois un accord de licence avec le grand quotidien américain, dans le cadre d’une nouvelle stratégie visant à solidifier le socle juridique du processus d’entraînement de ses IA.

Risque financier – D’immenses quantités de texte sont nécessaires pour développer un grand modèle de langage. Jusqu’en 2020, OpenAI expliquait s’alimenter auprès de Wikipedia et de deux bibliothèques de livres, simplement appelées Books1 et Books2, qui contiendraient selon des chercheurs plusieurs centaines de milliers d’ouvrages piratés. Exemples à l’appui, le New York Times assure que les dernières versions de GPT ont aussi été entraînées grâce aux articles de ses journalistes, sans autorisation ni rémunération. Ce qui constituerait une violation du droit d’auteur. Pour OpenAI, ces plaintes constituent un important risque financier:  jusqu’à 150.000 dollars par infraction constatée. Mais aussi un risque technologique car la justice pourrait ordonner la suppression de multiples données d’entraînement.

“Usage raisonnable” – Pour éviter que des groupes de presse suivent la voie ouverte par le New York Times, OpenAI a publié lundi un message, non signé, sur son site Internet. L’entreprise assure d’abord que les exemples mis en avant par le quotidien sont des “régurgitations”, un bug contre lequel elle assure lutter, et qui aurait été provoqué par des instructions visant à “manipuler” ChatGPT pour obtenir des résultats accablants. La start-up souligne également que son robot conversationnel entre dans le cadre du fair use, une disposition qui autorise un “usage raisonnable” des œuvres protégées par le droit d’auteur. Et elle rappelle qu’elle permet déjà aux médias de facilement refuser que leurs articles soient utilisés pour entraîner ses modèles, ce qu’a d’ailleurs fait le New York Times cet été.

Accords de licence – Surtout, OpenAI a opéré un changement stratégique. Depuis plusieurs mois, elle s’est rapprochée des éditeurs de presse pour conclure des accords de licence. En juillet, la société s’est entendue avec la grande agence américaine Associated Press, lui permettant d’exploiter toutes les dépêches publiées depuis 1985. En décembre, elle a conclu un partenariat similaire avec l’éditeur allemand Axel Springer, qui détient le tabloïd Bild, le quotidien Die Welt, et les sites Business Insider et Politico. Un accord qui se chiffrerait en dizaines de millions d’euros. “Nous menons de nombreuses négociations”, explique Tom Rubin, responsable de la propriété intellectuelle et du contenu chez OpenAI, interrogé par l’agence Bloomberg. “Les choses avancent bien. Des accords ont déjà été annoncés. D’autres suivront”, promet-il.

Pour aller plus loin:
– Pourquoi Microsoft et OpenAI se retrouvent dans le collimateur des gendarmes antitrust
– OpenAI abandonne le développement de son dernier modèle de langage


No Comments Yet

Comments are closed

Contactez-nous  –  Politique de confidentialité