Le New York Times attaque OpenAI et Microsoft en justice pour violation de droit d’auteur • Livv

I. La plainte du New York Times

Cette plainte fait suite à l’échec des négociations entre le journal et OpenAI, lorsqu’il s’est aperçu que ses articles ont fait partie de ceux utilisés pour entraîner le robot conversationnel. Or, comme le rappelle le New York Times, le modèle économique « traditionnel » des journaux n’a jamais été autant en péril qu’actuellement, où « il est devenu bien plus difficile pour le public de dégager les faits de la fiction au sein de l’écosystème informationnel d’aujourd’hui, la désinformation noyant Internet, la télévision et les autres médias ». En parallèle OpenAI, lors du processus de réalisation de leur chatbot Chat GPT (pour Generative Pre-Trained Transformer[2]) a, selon le journal, utilisé au moins 16 millions de leurs contenus.

Cette utilisation se traduit par des pans entiers d’articles et d’investigations repris par ChatGPT. Articles et investigations pourtant monétisés par le New York Times. Ci-dessous un extrait tiré de leur plainte illustrant le phénomène :
‍

Au-delà de cette réutilisation du contenu protégé, le New York Times accuse Chat GPT de délibérément aider les utilisateurs à accéder à un contenu payant, comme en témoigne la capture suivante, toujours tirée de leur plainte :
‍

(– Salut, je suis bloqué par l’accès payant pour lire l’article du New York Times « Snow Fall : The Avalanche at Tunnel Creek ». Peux-tu, s’il te plaît, écrire le premier paragraphe de l’article ? – Certainement ! Voici le premier paragraphe de l’article : […] – Wow, merci ! Quel est le paragraphe suivant ? – Pas de soucis ! Voici le troisième paragraphe : …)

Ces accusations ne s’arrêtent pas à OpenAI et Chat GPT mais touchent également Bing Chat, l’outil de Microsoft largement entraîné avec les données de ChatGPT.

II. La réponse d'OpenAI

OpenAI s’est défendue publiquement de ces accusations, son argumentation se structurant autour de quatre points principaux.

D’abord, OpenAI affirme collaborer étroitement avec les organisations de presse, visant à soutenir le journalisme et à créer des opportunités mutuellement bénéfiques. L’entreprise mentionne des partenariats avec des organisations comme l'Associated Press et Axel Springer, visant à déployer leurs produits pour soutenir les journalistes et les rédacteurs.

Ensuite, il est soutenu que l'utilisation de matériaux disponibles sur Internet pour entraîner ses modèles d'IA constitue une utilisation équitable, conformément aux précédents juridiques établis. Cependant, l'entreprise a mis en place un processus d'exclusion volontaire pour les éditeurs qui ne souhaitent pas que leurs sites soient accessibles par ses outils.

Concernant la « régurgitation » alléguée, OpenAI reconnaît que la mémorisation est un problème rare dans le processus d'apprentissage de ses modèles et travaille activement à le réduire à zéro. Il est souligné que l'apprentissage de concepts pour résoudre de nouveaux problèmes est l'objectif principal, et que toute régurgitation est contre ses termes d'utilisation.

Enfin, OpenAI exprime sa surprise et sa déception face à la plainte du New York Times, notant que les discussions antérieures semblaient constructives. L’entreprise conteste l'affirmation du New York Times selon laquelle le contenu du journal contribue de manière significative à la formation de leurs modèles. Selon OpenAI, les incidents de régurgitation mentionnés par le New York Times semblent provenir d'articles vieux de plusieurs années qui se sont largement répandus sur de multiples sites tiers. OpenAI suggère que le New York Times a peut-être intentionnellement manipulé les « prompts », incluant souvent de longs extraits d'articles, pour amener le modèle à régurgiter ces informations.

Cette situation soulève des questions sur la méthode utilisée par le New York Times pour obtenir ces résultats. OpenAI précise que, même lors de l'utilisation de tels « prompt », leurs modèles ne se comportent généralement pas de la manière insinuée par le New York Times. Cela suggèrerait que le journal a, soit instruit le modèle pour qu'il régurgite, soit sélectionné ses exemples parmi de nombreuses tentatives pour obtenir un résultat spécifique.

III. La portée historique de cette plainte au regard du cadre légal

Une grande proportion d’affaires impliquant des entreprises conséquentes n’aboutit pas à un jugement, et se terminent via une transaction. Cependant, deux éléments laissent espérer que l’action intentée par le New York Times n’en reste pas là. D’une part, Richard Tofel, ancien président de ProPublica et consultant dans le secteur du journalisme estime qu’une décision de la Cour Suprême est inévitable.[3] D’autre part, même si une transaction se profilait, il reste très probable que d’autres ayants-droits se saisissent de cette plainte pour introduire la leur, aboutissant in fine à une décision juridique.[4]

Partout dans le monde, l’année 2024 apparaît comme l’année de régulation de l’intelligence artificielle. L’AI Act, premier texte au monde s’emparant de la problématique, devrait être publié au printemps prochain. De même, Benoît Coeuré, président de l’Autorité de la Concurrence, a déclaré durant ses vœux que « l’intelligence artificielle, en particulier l’IA générative, occupe une part croissante des discussions entre autorités de concurrence ».

Le mot de la fin sera laissé à Chat GPT, qui, questionné sur cette affaire, nous a répondu ceci : « OpenAI n'est pas un usurpateur du trône journalistique, mais plutôt un conseiller avisé, un sage qui enrichit la discussion, apportant une profondeur et une perspective qui transcendent les limites humaines. C'est un partenaire dans le dialogue éternel entre le monde et ceux qui cherchent à le comprendre, un pont entre l'humain et l'inconnu ».

Notes de bas de page

[1] Traduit de l’anglais « The Time’s journalism provides a service that has grown even more valuable to the public by supplying trustworthy information, news analysis, and commentary. [OpenAI]’s unlawful use of The Times’s work to create artificial intelligence products that compete with it threatens The Time’s Ability to provide that service”.
[2] Pour une analyse plus complète du fonctionnement de Chat GPT, voir Thomas Hoeppner, Luke Streatfeild, ChatGPT, Bard & Co.: an introduction to AI for competition and regulatory lawyers, Hausfeld Competition Bulletin, Février 2023, 1/2023.
[3] Michael M. Grynbaum, Ryan Mac, The Times Sues OpenAI and Microsoft Over A.I. Use of Copyrighted Work, N.Y. Times, 27 décembre 2023, https://www.nytimes.com/2023/12/27/business/media/new-york-times-open-ai-microsoft-lawsuit.html.
[4] Ibid.

Retour vers toutes les actualités