Certains proxys web se retrouvent indexés par les moteurs de recherche, et cela n'a aucun intérêt, voire ça nuit à la recherche d'infos. L'idéal serait qu'ils aient un robots.txt empêchant l'indexation... Mais comme ça n'arrivera pas, on pourrait peut-être avoir un regexp permettant d'ajouter pour un certain type de trafic une balise meta robots='noindex, nofollow' à notre niveau.
À voir si c'est possible sans effet de bord sur le cache.
# Quelle technologie ?
Posté par LupusMic (site web personnel, Mastodon) . Évalué à 1 (+0/-0).
Selon le proxy, la réponse ne sera pas la même.
[^] # Re: Quelle technologie ?
Posté par Benoît Sibaud (site web personnel) . Évalué à 2 (+0/-0).
Je ne comprends pas la question.
Au niveau LinuxFr.org, le but serait juste d'éviter qu'une version du site via un proxy ne soit indexée par les moteurs de recherche (parce que ça nuit à la recherche d'infos sur notre site). Donc nous avons juste à identifier les proxys concernés (*), et à ajouter une entête HTML pour eux.
Les proxys qui ne sont pas indexés, on s'en fiche (que ça soit un proxy d'entreprise, un proxy Tor ou autre).
(*) pour ceux auxquels je pense c'est trivial, via le User-Agent.
Ceci dit il est fort possible que ça soit finalement suffisamment marginal pour être inutile de s'en préoccuper plus.
[^] # Re: Quelle technologie ?
Posté par LupusMic (site web personnel, Mastodon) . Évalué à 1 (+0/-0).
En fait, il manque plein de morceau dans ton appel à contribution. Est-ce que tu as la main sur les proxies ? Est-ce que ce sont des miroirs ?
Si je comprends bien ton problème, l'indexation de DLFP dans les moteurs de recherche est pourrie par des miroirs sauvages de DLFP, et tu voudrais donc neutraliser l'effet de ces sites ?
[^] # Re: Quelle technologie ?
Posté par Benoît Sibaud (site web personnel) . Évalué à 2 (+0/-0).
Ce n'est pas spécialement un appel à contribution, c'est une entrée dans le suivi de LinuxFr.org, pour déclarer un bug/fonctionnalité que l'on pourrait ajouter, et pour ne pas oublier de le faire/d'en discuter plus tard.
# Fait
Posté par Bruno Michel (site web personnel) . Évalué à 2 (+0/-0).
Cf https://github.com/nono/linuxfr.org/commit/5779eeeb70410f8316235e78699cf5bd5aee1eef et https://github.com/nono/linuxfr.org/commit/27cc136deb1738365f0e9eed3da098f5c0657c4c
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.