• # Impressionnant

    Posté par  . Évalué à 4.

    Il y a même la page d'accueil de mon site web, pourtant inconnu, et qui ne contient qu'un texte pour dire qu'il n'y a rien.

  • # droit à l'oubli

    Posté par  . Évalué à 5. Dernière modification le 22 février 2021 à 10:53.

    Du coup, question certainement bête, mais ça marche comment, le «droit à l'oubli», avec ces systèmes d'archivages longue durée?

    Non parce que hein, facebook, linkedin, google, etc sont scannés aussi j'imagine?
    Certains espaces ne serait-ils pas destinés à être tels des mandala, et ne serait-ce pas mieux qu'ils le restent?

    • [^] # Re: droit à l'oubli

      Posté par  (site web personnel) . Évalué à 8.

      ça marche comme partout ailleurs je dirais, il faut contacter le service pour nettoyer (comme pour les GAFAM par exemple).

      https://archive.eu/ -> Terms of Service https://intelx.io/terms-of-service -> The Privacy Policy of Intelligence X https://intelx.io/privacy-policy -> partie "Data Collection & Content Removal"

      https://archive.org/ -> Terms of Service https://archive.org/about/terms.php -> Privacy Policy -> "Contact the Archive by email at info@… to see, update, or delete your information."

      • [^] # Re: droit à l'oubli

        Posté par  . Évalué à 2. Dernière modification le 03 mars 2021 à 10:23.

        Oui, mais non.

        Quand je visite un site, je "signe un contrat". Ici, c'est un site qui vient pomper les autres, sans me demander mon avis ni informer personne.
        D'ailleurs, je doute que ça soit légal, en europe (il faut explicitement accepter, après tout), justement. Bon, je t'avoues ne pas aller voir tes liens, perso je me contente de rien mettre de vraiment sensible sur le net, mais ça m'intrigue quand même.

  • # Précisions

    Posté par  (site web personnel) . Évalué à 8.

    Quelques "User Agent" pour identifier les moteurs d'archivage :

    Et pour choisir un peu ce qui est archivé ou pas : https://fr.wikipedia.org/wiki/Protocole_d'exclusion_des_robots

  • # Mise en forme

    Posté par  . Évalué à 4.

    Ça n’archive que le contenu et pas la mise en forme ou ça dépend des sites ?

    • [^] # Re: Mise en forme

      Posté par  . Évalué à 5.

      D'apres le site:

      Technical details:
      For security reasons, pictures, videos, JavaScript, and other potentially dangerous codes and external references are removed. Therefore historical versions may appear "blank".
      Our crawler only indexes HTML pages; if a website relies heavily on JS and dynamic elements, it will not be properly archived.

      Et il semblerait que le CSS ne soit effectivement pas pris en compte. La seule mise en forme qui est gardée sont les balises HTML de base comme les titres et les listes.

  • # Moteur de recherche pour Firefox

    Posté par  (site web personnel) . Évalué à 4.

    Je n'ai pas trouvé comment en faire un moteur de recherche pour Firefox
    La page archive.eu ne propose pas d'en faire un moteur et je ne trouve pas de greffon propre ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.