Wikipédia met CNET sur liste noire en raison de contenu généré par IA
Wikipédia a retiré CNET des sources fiables depuis l’utilisation de contenu généré par IA. Le contenu, médiocre et parfois inexact, produit par l’intelligence artificielle et d’autres pratiques néfastes ont conduit à l’exclusion de CNET de la liste des sources autorisées de Wikipédia.
La pratique de générer du contenu par IA s’est largement popularisée. Cependant il y a de bonnes et mauvaises pratiques. Si des outils tel que ChatGPT peut s’avérer très utile pour la rédaction, il nécessite une relecture et une expertise. De nombreux site négligent l’étape de relecture, afin de produire du contenu à bas coût. Toutefois cette stratégie ne semble pas viable sur le long terme, comme le montre le cas de CNET.
CNET a publié du contenu généré par l’IA à peine déguisé sur son site fin 2022. Il a été publiquement critiqué pour la qualité médiocre des contenus et également l’inexactitude des informations. Cela a abouti à sa rétrogradation de sources fiables à sources non fiables sur Wikipédia comme l’indique Futurism.
CNET, une fiabilité en baisse à la suite de contenus générés par IA et des mauvaises pratiques
Avant l’utilisation de contenus générés par IA, CNET a maintenu une réputation de haut niveau sur Wikipédia jusqu’à la fin de 2020. De nombreux débats ont eu lieu entre les éditeurs de Wikipédia, ce qui a attiré l’attention des médias, y compris certains membres de l’équipe de CNET.
Il est essentiel de rappeler que bien que Wikipédia soit « l’encyclopédie libre que tout le monde peut modifier« , ce n’est pas un espace sans règles. Les éditeurs et bénévoles de Wikipédia exigent des citations pour toute information ajoutée aux pages Wiki.
Cela garantit un certain niveau de responsabilité dans la vaste communauté qui maintient Wikipédia en activité. L’encyclopédie en ligne est souvent un excellent point de départ pour la recherche, en raison de ses exigences en matière de citations, même s’il ne doit pas être utilisé comme source principale.
Wikipédia, un travail constant d’amélioration du contenu
Wikipédia est souvent utilisé comme source d’information, cependant la plateforme est également victime de contenu incomplet, imprécis et parfois inexacte. Certains contenus présents sur les réseaux sociaux exploitent ces lacunes ou ces imprécisions.
Un exemple en est les référendums concernant l’indépendance de l’Ukraine, où certains contenus mettent en avant des référendums non reconnus et contestés au niveau international, sans préciser ces nuances. Nous en parlons en détails dans notre guide pour identifier les fake news et la désinformation.
Dans une logique d’amélioration continue, Wikipédia a mis en place de nombreuses règles, notamment une liste de sources considéré comme fiable et CNET n’en fait plus partie aujourd’hui.
CNET, un déclin qui a commencé avant les contenus générés par IA
Le déclin apparent de CNET sur Wikipédia a commencé avant que son contenu généré par l’IA ne soit découvert. En octobre 2020, l’acquisition de CNET par l’éditeur Red Ventures a entraîné une baisse de son statut sur Wikipédia, en raison de preuves indiquant une baisse des normes éditoriales et une orientation accrue vers des contenus favorables aux annonceurs.
Cependant, à partir de novembre 2023, lorsque Red Ventures a commencé à publier du contenu généré par l’IA sur l’un des sites technologiques les plus réputés, les éditeurs de Wikipédia ont rapidement commencé à faire pression pour exclure complètement CNET de la liste des sources fiables de Wikipédia.
CNET a pourtant affirmé avoir cessé de publier du contenu généré par l’IA, mais en raison de la stratégie de contenu mise en place par Red Ventures et de la publication de désinformation sur d’autres sites détenus par la société comme Healthline, CNET reste exclu de la liste actuelle des sources fiables.
CNET victime de la stratégie de Red Ventures ?
Un éditeur de Wikipédia a été cité dans l’article de Futurism, déclarant : « Nous ne devrions pas toujours mettre la responsabilité sur les éditeurs pour prouver que Red Ventures a ruiné un site avant de pouvoir le retirer ; ils peuvent facilement en acheter ou en créer un autre. Je pense que nous devrions nous concentrer sur le dénominateur commun ici, qui est Red Ventures, et cibler le problème (un réseau de spam) à sa source.«
Si la position peut surprendre, elle illustre un problème plus large. La création de contenu s’est fortement développée ces dernières années. Ce qui engendre une forte compétition et également une baisse des revenus des éditeurs. De nombreux éditeurs doivent faire des concessions sur la qualité afin de perdurer.
Toutefois, ce n’est pas le cas de CNET qui profite d’un traffic important. Red Ventures recherche avant tout le profit, ce qui reste tout à fait légitime pour ce type de société. Néanmoins la stratégie employée ne semble pas profiter à CNET sur le long terme.
Le problème n’est pas seulement l’utilisation dissimulée de l’IA générative dans des articles publiés sur l’un des sites d’actualités technologiques les plus connus. C’est aussi le fait que ces articles générés par l’IA sont généralement de qualité médiocre et inexacts.
Un exemple d’arnaque au référencement avec l’IA générative
L’histoire entre Wikipédia et CNET illustre un des problèmes liés à l’IA générative, cependant il y a d’autres acteurs qui utilisent cette technologie de manière bien plus malveillante.
Il y a quelques mois, une « arnaque au référencement » a été découverte sur Twitter. Cela aurait pu rester inconnu si la personne responsable ne s’était pas vantée ouvertement de cet « exploit », qui consistait à copier le site d’un concurrent, à tout passer à travers l’IA et à générer immédiatement un site Web concurrent complet avec 1800 articles ciblant la même niche pour « voler 3,6 millions de visites au total à un concurrent ».
Le site victime de cette « arnaque au référencement » s’appelle Exceljet, un site dirigé par l’expert Excel David Bruns pour aider les autres à mieux utiliser Excel. En plus de voir son travail volé, Bruns a découvert que la plupart des contenus était inexacts. Ce qui illustre encore une fois que l’utilisation de l’IA générative sans validation humaine n’est pas viable, du moins pour le moment.
La couverture de cette histoire par Hubspot discute également de la manière dont, heureusement, Google a finalement découvert cela. Face à la croissance de contenu généré par IA, le moteur de recherche Google a effectué de nombreuses modifications dans son algorythme. Il s’agit d’un travail continu et la société a encore de nombreux défis à relever pour trier de manière plus pertinente les contenus.
L’IA générative, un changement de paradigme
Comme le cas de Wikipédia et CNET l’illustre, l’utilisation de l’IA générative présente des risques significatifs. Elle exige toujours une supervision et une correction rigoureuses des contenus. Les entreprises qui adoptent cette technologie trop rapidement, sans avoir suffisamment de recul, peuvent souvent payer un prix élevé pour cet engouement précipité.
Il est surprenant que Red Ventures ait choisi d’appliquer si rapidement cette stratégie à un site renommé comme CNET. Nous pouvons espérer que des histoires comme celle-ci dissuadent les éditeurs de sacrifier le contrôle de la qualité au point de générer automatiquement des contenus erronés.
L’IA générative a de nombreux défis à relever. Aujourd’hui la principale source de préoccupation est la génération de deepfakes par IA et des risques sur les élections. Il y a également les problèmes de droits d’auteur, comme l’illustre le procès du New York Times contre OpenAI et Microsoft. Ce qui nous rappelle également que cette technologie se base sur un travail humain pour son apprentissage et ce dernier n’est pas rémunéré.
Si vous appréciez nos articles, ne manquez les prochains en vous abonnant à Cosmo Games sur Google News, vous pouvez également nous suivre sur X (ex Twitter). N'hésitez pas à partager vos réactions, commentaires ou remarques dans les commentaires, afin d'enrichir le contenu, de mieux vous comprendre et intégrer les différents points de vue.