Externalités négatives

6 bookmarks
Custom sorting
The Generative AI Race Has a Dirty Secret
The Generative AI Race Has a Dirty Secret
L'impact écologique des IA et de la course à l'IA est désastreux. Nos usages du numérique étaient déjà insoutenables avec un climat vivable avant, mais l'IA aggrave le problème.
·wired.com·
The Generative AI Race Has a Dirty Secret
Devs say AI crawlers dominate traffic, forcing blocks on entire countries
Devs say AI crawlers dominate traffic, forcing blocks on entire countries
Les robots qui scrappent le web pour les IA ne respectent pas le code de conduite du web, et scrappent même les sites qui demandent à ne pas l'être. Le trafic généré par ces robots est tellement fort qu'il met en danger certains projets open source, dont les sites sont pilonnés par ces robots.
·arstechnica.com·
Devs say AI crawlers dominate traffic, forcing blocks on entire countries
[Enquête] Plus de 1 000 médias en français, générés par IA, polluent le web (et Google)
[Enquête] Plus de 1 000 médias en français, générés par IA, polluent le web (et Google)

Longue enquête en plusieurs épisodes sur la pollution du web par des sites genAI, qui peuvent plagier et publier en 20 minutes un contenu produit par un vrai journaliste. Ces sites produisent à la chaîne des dizaines de plagiats par jour.

Ils sont très bien repris par Google News, Discover et les moteurs de recherche (https://next.ink/154914/google-actualites-est-truffe-darticles-plagies-par-des-ia/) et plagient aussi la PQR (https://next.ink/158809/la-presse-regionale-est-elle-aussi-cannibalisee-par-des-sites-dinfos-generes-par-ia/)

L'utilisation de GenAI est prisée à l'extrême droite, où l'on a même le directeur pédagogique d'une école de journalisme qui assume (https://next.ink/162296/le-directeur-pedagogique-dune-ecole-de-journalisme-genere-ses-articles-par-ia/)

Next propose un guide pratique pour détecter ces sites (https://next.ink/165310/comment-reconnaitre-les-sites-dinfos-generes-par-des-ia/), une extension navigateur pour être alerté quand on arrive sur l'un deux, et un guide pour identifier les faux-positifs (https://next.ink/172262/faux-positifs-comment-reconnaitre-les-contenus-identifies-a-tort-comme-generes-par-ia/)

MÀJ : À l'opposé de tout ça, Google restreint sévèrement l'usage de l'AI pour faire des publicités en ligne... sa source principale de revenus (https://next.ink/171952/google-penalise-les-publicites-generees-par-ia-mais-pas-les-medias-generes-par-ia/).

·next.ink·
[Enquête] Plus de 1 000 médias en français, générés par IA, polluent le web (et Google)
Word frequency tool ‘wordfreq’ stops updates, overwhelmed by AI spam
Word frequency tool ‘wordfreq’ stops updates, overwhelmed by AI spam
L'outil WordFreq étudiait la fréquence d'usage des mots dans plusieurs langues, pour suivre l'évolution des langues. Les textes générés par IA ont tellement pollué ses sources que le projet a fermé. Il n'est plus possible d'étudier la langue telle qu'elle est écrite par des humains après 2021.
·pivot-to-ai.com·
Word frequency tool ‘wordfreq’ stops updates, overwhelmed by AI spam
AI can't stop making up software dependencies and sabotaging everything
AI can't stop making up software dependencies and sabotaging everything

Les IA génératives citent régulièrement des bibliothèques de code qui n'existent pas vraiment. Des pirates en profitent pour créer des malwares qui portent le nom de ces bibliothèques fictives.

C'est généralisable : l'IA hallucine une fausse information, et quelqu'un génère du contenu qui correspond à cette hallucination pour la légitimer a posteriori et donner l'impression qu'elle était vraie au départ

·theregister.com·
AI can't stop making up software dependencies and sabotaging everything