Journal Outils de veille sur Internet

Posté par  (site web personnel) .
Étiquettes :
0
22
juin
2004
Existe-t-il des outils de veille libres (mes recherches sur Framasoft et Je suis Libre ont été infructueuses) ?
Par outils de veille, j'entends, par exemple, des logiciels capables de surveiller un ensemble de pages Web et d'alerter en cas de modification de la page.
  • # vcoop

    Posté par  (site web personnel) . Évalué à 2.

    Peut-être vcoop ?

    (trouvé grâce à http://www.google.fr/search?num=20&hl=fr&ie=UTF-8&q=out(...) où tu trouveras au moins un lien sur vcoop)
  • # mozilla ?

    Posté par  . Évalué à 3.

    Mozilla permet de surveiller si la page correspondant à un bookmark a été mise a jour (voir ds les propriété des bookmark)
    • [^] # Re: mozilla ?

      Posté par  . Évalué à 1.

      Quelqu'un sait comment il vérifie cela ? Parce que si ça se contente de regarder les différences dans les sources des pages, ça doit pas marcher très fort vu le nombre de sites qui ont des parties (pubs, fortunes...) aléatoires.
      • [^] # Re: mozilla ?

        Posté par  . Évalué à 2.

        si ça se contente de regarder les différences dans les sources des pages

        je l'ai un peu utilisé, et effectivement pour certains sites ca ne marche pas top... :(
    • [^] # Re: mozilla ?

      Posté par  (site web personnel) . Évalué à 2.

      Effectivement, dans Firefox, il suffit d'aller dans les propriétés du signet, puis prendre l'onglet 'Schedule' (pour la version anglaise).
      Merci pour l'information.
  • # Narval

    Posté par  (site web personnel) . Évalué à 4.

    Narval [http://www.logilab.org/projects/narval(...)] devrait faire ca, j'avais bookmarqué il y a un moment, jamais testé, mais voila ce qu'ils en disent :

    Narval is designed to be a companion that will help you in your daily work in the information world. It runs on your machine or on a remote server, and you can communicate via all standard means (email, web, telnet, phone, etc). It executes recipes you wrote, to perform a wide range of tasks, such as prepare your morning newspaper, help you surf the web by filtering out junk ads, keep searching the web day after day for things you want, participe in on-line auctions, learn you interests and bring you back valuable information, take care of repetitive chores, answer e-mail, and much more...


    C'est GPL pour la version mono-user

    Si qqn a déjà essayé, ca pourrait être sympa de faire un retour d'expérience.
  • # Unix power tools

    Posté par  (site web personnel) . Évalué à 3.

    cron+wget+cmp ?
    Pour le problème des pubs qui font changer la page à chaque chargement, les options -n et -i de cmp sont tes amies. Pour une solution plus propre Perl et le module LWP sont tes amis.

    Evidemment en cherchant un peu tu finiras bien par trouver un programme déjà fait mais c'est tout de suite moins amusant :op

    pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

    • [^] # Re: Unix power tools

      Posté par  . Évalué à 3.

      Je trouve diff bien plus rapide que cmp, même sur des gros binaires genre images ISO. Peut-être une question de taille de tampon ? (On m'avait pourtant dit que c'était pas la taille qui compte !)
      • [^] # Re: Unix power tools

        Posté par  (site web personnel) . Évalué à 2.

        J'ai jamais remarqué de différence de vitesse mais j'ai jamais fait de comparaison non plus. De toute façon pour comparer deux fichiers HTML "normaux", la vitesse n'est pas trop importante et à ma connaissance, il n'y a pas d'équivalent aux options -i et -n de cmp dans diff.

        Sinon il me semble qu'il est possible de connaitre la dernière date de changement d'un fichier sans le télécharger uniquement par HTTP mais il faut que le serveur gère ça correctement aussi.

        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

        • [^] # Re: Unix power tools

          Posté par  . Évalué à 2.

          Sinon il me semble qu'il est possible de connaitre la dernière date de changement d'un fichier sans le télécharger uniquement par HTTP mais il faut que le serveur gère ça correctement aussi.

          Oui on peut le faire avec lynx -head

          $ lynx -head http://linuxfr.org/~ecocentric/14077.html(...)

          HTTP/1.1 200 OK
          Date: Tue, 22 Jun 2004 22:58:35 GMT
          Server: Apache/1.3.26 (Unix) Debian GNU/Linux mod_gzip/1.3.19.1a PHP/4.1.2 mod_ssl/2.8.9 OpenSSL/0.9.6g
          Last-Modified: Tue, 22 Jun 2004 20:25:30 GMT
          ETag: "480f6-3f9f-40d895ba"
          Accept-Ranges: bytes
          Content-Length: 16287
          Connection: close
          Content-Type: text/html; charset=iso-8859-1

          Bon apparemment ça a pas l'air bien géré ici par contre...

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.