New York Times lance un procès contre OpenAI et Microsoft
| |

Le New York Times lance un procès contre OpenAI et Microsoft

Le New York Times a intenté un procès contre OpenAI et Microsoft, les accusant de violer les droits d’auteur. Selon la plainte, OpenAI aurait reproduit des millions d’articles du Times pour former ses modèles linguistiques, qui alimentent ChatGPT et Microsoft Copilot, et les deux entreprises concurrenceraient désormais directement le contenu du journal.

En novembre 2023, nous avions déjà abordé les problématiques de droit d’auteur avec les IA génératives, Le bureau du droit d’auteur aux Etats-Unis a lancé une enquête le 30 août, enquête ouverte à tout le monde. Globalement, il y a des inquiétudes sur le non-respect du droit d’auteur, que ce soit pour les journalistes, écrivains, créateurs de contenu et plus globalement tout créateur de contenu sur Internet.

Les IA sont entraînées sur des ensembles de données qui peuvent inclure des œuvres protégées par le droit d’auteur. Cela soulève des questions sur la légalité de l’utilisation de ces données pour l’entraînement et la génération de nouvelles œuvres. Malgré quelques différences dans leurs approches, les sociétés d’IA partagent toutes la même conviction : elles pensent qu’elles ne devraient pas être obligées de rémunérer les auteurs pour la formation de leurs modèles d’intelligence artificielle, même avec des œuvres sous droit d’auteur. Le New York Times n’a pas trouvé d’accord avec Microsoft et OpenAI, ce qui amène la société à lancer un procès dont les enjeux dépassent le cadre du journal.

La plainte du New York Times contre OpenAI et Microsoft

La plainte déclare que les modèles linguistiques de grande envergure (LLM) d’OpenAI et de Microsoft, utilisés pour ChatGPT et Copilot, sont capables de générer du contenu qui reproduit littéralement le contenu du Times, le résume de manière très similaire et imite son style d’écriture. Cela aurait pour effet de perturber et de nuire à la relation entre le Times et ses lecteurs, tout en privant le journal de revenus provenant d’abonnements, de licences, de publicités et d’affiliations. Une problématique valable pour de nombreux contenus en dehors du New York Times, que ce soit de simples sites web ou des créateurs de contenu.

La plainte du New York Times contre OpenAI et Microsoft

La plainte souligne également que ces modèles d’IA menacent la qualité du journalisme en entravant la capacité des médias à protéger et à monétiser leur contenu. Elle affirme que Microsoft, à travers son service Bing Chat (rebaptisé récemment Copilot), et OpenAI, via ChatGPT, cherchent à profiter gratuitement de l’investissement massif du Times dans le journalisme en utilisant ce contenu pour créer des produits concurrents sans autorisation ni compensation.

En parallèle, la publication de modèles d’IA formés à partir du contenu du Times aurait été extrêmement rentable pour Microsoft et OpenAI, selon la plainte. Le Times prétend avoir tenté de négocier avec les deux entreprises pendant des mois pour obtenir une compensation équitable pour l’utilisation de son contenu, mais n’a pas réussi à parvenir à un accord.

Des tentatives d’accord entre OpenAI et les éditeurs de contenu

Lindsey Held, porte-parole d’OpenAI, a déclaré dans un courrier électronique à The Verge : « Nous respectons les droits des créateurs de contenu et des propriétaires, et nous nous engageons à collaborer avec eux pour qu’ils bénéficient des avancées technologiques de l’IA et des nouveaux modèles de revenus. Nos discussions en cours avec le New York Times ont été productives et avancent de manière constructive, nous sommes donc surpris et déçus de cette action en justice. Nous espérons trouver un moyen mutuellement bénéfique de collaborer, comme nous le faisons avec de nombreux autres éditeurs« .

En outre, OpenAI a conclu un accord avec le groupe de médias allemand Axel Springer (Politico, Business Insider …), mais cet accord ne concerne pas l’utilisation des contenus des médias du groupe pour entraîner son IA générative. Il s’agit plutôt de l’intégration de ces contenus dans les réponses aux requêtes des utilisateurs de ChatGPT. Cet exemple illustre également une autre problématique, les accords ne sont passés qu’avec de grande société de média.

Le New York Times demande à OpenAI et Microsoft de retirer ses contenus

Le New York Times intente un procès aux deux entreprises pour violation du droit d’auteur et demande qu’elles soient tenues responsables de « milliards de dollars de dommages statutaires et réels » pour avoir présumément copié ses œuvres. Elle sollicite également auprès du tribunal une injonction pour empêcher OpenAI et Microsoft de former leurs modèles d’IA avec son contenu, ainsi que pour exiger la suppression des travaux du New York Times des ensembles de données des entreprises.

Le New York Times fait partie des nombreux médias qui ont récemment bloqué le robot d’exploration web d’OpenAI, empêchant ainsi cette société d’IA de continuer à extraire du contenu de son site web et de l’utiliser pour former des modèles d’IA. La BBC, CNN et Reuters ont également pris des mesures pour bloquer le robot d’exploration web d’OpenAI.

Cependant, d’autres publications semblent adopter l’IA, du moins en ce qui concerne les paiements qui en découlent. Le groupe de médias allemand Axel Springer a conclu un accord avec OpenAI, permettant à ChatGPT de puiser directement des informations dans ses sources, tandis que l’Associated Press autorise OpenAI à former ses modèles sur ses articles de presse au cours des deux prochaines années.

Faut-il se protéger des IA génératives ?

Faut-il se protéger des IA génératives

L’utilisation de ces données d’entraînement sans prendre en compte l’autorisation de l’éditeur ou le consentement de l’auteur à des fins lucratives pourrait clairement être considérée comme une violation du droit d’auteur, étant donné la nature de l’IA générative. Avec les preuves présentées par le New York Times dans cette affaire, on peut seulement espérer qu’ils obtiennent une compensation équitable, et que cette décision de justice contribue à réduire la violation généralisée du droit d’auteur qui sévit dans le domaine de l’IA générative.

Même si l’exploitation de l’IA au détriment d’écrivains, d’artistes et d’autres professionnels est un problème réel mais peu litigieux actuellement, il existe encore des moyens de lutter contre ce problème en dehors des tribunaux.

Par exemple, certains artistes ont commencé à utiliser un outil appelé « Nightshade » qui perturbe les modèles d’entraînement de l’IA qui utilisent leur travail sans autorisation. Néanmoins cela ne concerne que les IA qui génère des images.

Aussi fascinantes que soient les avancées de l’intelligence artificielle et de la technologie informatique, il est essentiel de se rappeler que l’IA générative ne peut pas fonctionner sans être formée par de vrais êtres humains. Dans le cas du New York Times, cependant, ces données d’entraînement ont été utilisées sans autorisation, et si leur action en justice aboutit, OpenAI et Microsoft devront verser des sommes considérables pour réparer cette erreur. Au-delà du procès qui oppose le New York Times à OpenAI et Microsoft, le paradigme d’internet pourrait être remis en cause dans les années à venir. Que ce soit la manière dont nous effectuons des recherches sur Internet mais aussi les sources de rémunération des auteurs.

A lire aussi

Publications similaires

0 0 votes
Article Rating
S’abonner
Notification pour
guest

0 Comments
Commentaires en ligne
Afficher tous les commentaires