Lien News publishers limit Internet Archive access due to AI scraping concerns Posté par thoasm le 31 janvier 2026 à 09:19. Étiquettes : intelligence_artificielle robotstxt internet_archive censure censure_internet presse merdification 4 31jan.2026 https://www.niemanlab.org/2026/01/news-publishers-limit-internet-archive-access-due-to-ai-scraping-concerns/
Lien Really Simple Licensing 1.0 Posté par Voltairine le 12 décembre 2025 à 08:00. Étiquettes : moteur_de_recherche robotstxt standard intelligence_artificielle licence 3 12déc.2025 https://rslstandard.org/rsl
Lien Perplexity is using stealth, undeclared crawlers to evade website no-crawl directives - CloudFlare Posté par antistress (site web personnel) le 04 août 2025 à 22:58. Étiquettes : crawler web robotstxt perplexity cloudflare intelligence_artificielle 8 4août2025 https://www.osnews.com/story/142981/perplexity-is-using-stealth-undeclared-crawlers-to-evade-website-no-crawl-directives/
Lien Les infrastructures du Libre attaquées par des entreprises de l'IA Posté par volts (Mastodon) le 21 mars 2025 à 10:24. Étiquettes : ddos gnome kde amazon anthropic curl cybersécurité 4 21mar.2025 https://thelibre.news/foss-infrastructure-is-under-attack-by-ai-companies/
Lien Drew Devault : Please stop externalizing your costs directly into my face Posté par pas_pey le 19 mars 2025 à 07:36. Étiquettes : intelligence_artificielle grands_modèles_de_langage copilot ddos golang robotstxt drew_devault 15 19mar.2025 https://drewdevault.com/2025/03/17/2025-03-17-Stop-externalizing-your-costs-on-me.html
Lien I recently get pinged by slowness ✂ on the ✂ infrastructure, ✂ the log makes me impressively angry✂ Posté par thoasm le 30 décembre 2024 à 20:17. Étiquettes : traffic robotstxt crawler intelligence_artificielle administration_système 12 30déc.2024 https://pod.geraspora.de/posts/17342163