Google traque les vieilles news

Posté par . Modéré par Fabien Penso.
Tags :
0
3
oct.
2001
Internet
Google Groups est enfin accessible depuis la page d'accueil de Google!
A cette occasion, la société a posté une annonce dans le but de devenir la référence du web en matière d'archivage d'articles UseNet et se lance à la recherche de compilations de news datant d'avant 1995.
Ce genre de compilation existe sous forme de CD-ROM. Si vous en êtes l'heureux et vétéran possesseur, contactez Google, et sauvez la terre. Une rémunération est prévue si vous sachez fournir une archive dont ils ne disposent pas encore.

Aller plus loin

  • # tribune

    Posté par (page perso) . Évalué à 10.

    Et ils veulent pas archver la tribune aussi, pour sauver la Terre ?
    • [^] # Re: tribune (Score: -beaucoup)

      Posté par (page perso) . Évalué à 4.

      C'est vrai que ça serait chouette une archive de la tribune. Toute cette énergie dépensée pour aligner des reflexions de haute-voltige sur le nombril de britney spears, il ne faut pas la laisser disparaitre dans les limbes de l'inconnu.

      Pour les Générations Futures, je vote (X) pour l'archivage de la tribune.
      • [^] # Re: tribune (Score: -beaucoup)

        Posté par . Évalué à -1.

        En fait, je crois que la tribune est déjà archivée par daCode dans sa base MySQL.

        Il suffit donc d'écrire un module à daCode qui renvoie tous les messages entre un intervalle d'id donnés (actuellement les id sont aux alentour de 140000 !!!!)...
        Et ensuite que le grand l'immense wmcoincoin récupère ces messages.

        Hélas je ne saurais pas faire ! Mais je suis sûr qu'il ya bien une moule qui s'y connaît un peu en php et MysQL ?

        PS: Faudrait aussi que Fabien accepte d'intégrer ce module pour LinuxFr !
        • [^] # Re: tribune (Score: -beaucoup)

          Posté par (page perso) . Évalué à 2.

          je ne crois pas que dacode conserve beaucoup de messageq en mémoire (genre les 1000 derniers , http://linuxfr.org/board/info.php3?id=138000(...) est déjà effacé ), mais bon c'est certainement suffisant .

          quand au module dacode du fameux remote.php3, c'est woof qui l'a fait (woof, si tu nous regardes ;-)

          et il faut aussi que l'équipe dacode ne voit pas d'un trop mauvais oeil ce 'parasitage' du site (surtout si ça génére de la charge sur les serveurs)
        • [^] # Re: tribune (Score: -beaucoup)

          Posté par (page perso) . Évalué à 2.

          Si vous voulez des archives de la tribune, faites un cron qui recupere le RDF toutes les demi-heure et qui prend ce qui est plus recent, ca prendra 5 minutes à ecrire...
          • [^] # Re: tribune (Score: -beaucoup)

            Posté par . Évalué à 4.

            toutes les demi-heures... il risque d'y avoir des pertes à certains moment de la journée!!

            Autrement j'avais fait une commande pour récupérer tous les URLs qui passent sur la tribune (oui oui, c'est tout sur une ligne):

            (cat /var/linuxfr.url; lynx -dump http://linuxfr.org/board/index.php3 | awk "BEGIN { ref=0 } { if ( ref == 0 ) { if ( \$1 == \"References\" ) { ref = 1 } } else { print \$2 } }") | grep -i "^http" | grep -vi "^http://linuxfr.org/" | grep -vi "^http://www.dacode.org/" | grep -vi "^http://www.linuxfr.org/" | sort | uniq > /tmp/linuxfr.url.tmp; mv -f /tmp/linuxfr.url.tmp /var/linuxfr.url

            Hop, toutes les 2 minutes...
  • # Google sauveur de l'information?

    Posté par (page perso) . Évalué à 10.

    Cette idée est fantastique. On se pose souvent le problème de la sauvegarde de nos données et de leur pérennité dans l'histoire. 1995 c'est finalement pas si vieux que ça et on a déjà perdu des quantités d'info. Après les news il faudra envisager de sauver les documentations, les fichiers pdf, voire même les info contenus à l'interieur de ces pdf dans un format universel.

    Reste à savoir ce que Google va faire de ces informations. Elles n'ont pas de prix mais ce n'est pas une raison pour qu'elles deviennent payantes.
  • # Archiver le contenu de l'internet

    Posté par . Évalué à 10.

    Il y a déjà un projet dont le but est d'archiver tout le contenu du Net:
    http://www.archive.org(...)

    Effectivement, les plus anciennes de leurs archives usenet datent de 1996...

    eul'Bob
  • # La ref du web !

    Posté par . Évalué à -1.

    J'aime bien Google mais on ne risque pas de les accuser de pratiques monopolistiques en fin de compte ?
    • [^] # Re: La ref du web !

      Posté par (page perso) . Évalué à 9.

      C'est un service qui est rendu quand meme.
      Je ne pense pas que Google puisse déclarer avoir des droits qu'exclusivité sur les article de UseNet...
      Si quelqu'un arrive a faire la meme chose je pense pas que Google ai son mot a dire.

      Les utilisateurs choisirons ensuite (si ils ont le choix) ...
    • [^] # Re: La ref du web !

      Posté par . Évalué à 5.

      Il n'est pas interdit d'avoir un quasi-monopole ; ce qui est interdit est d'en abuser pour casser la concurence ("Abus de position dominante" comme ils disent).

      De plus, google n'est de loin pas encore en situation de monopole.
  • # "si vous sachez fournir..." ???

    Posté par (page perso) . Évalué à 2.

    Et si vous savez fournir, ils rémunèrent aussi ?
  • # En voilà un...

    Posté par . Évalué à 3.

    Là j'ai retrouvé un obscur message qui date de 1991 :

    From: torvalds@klaava.Helsinki.FI (Linus Benedict Torvalds)
    Newsgroups: comp.os.minix
    Subject: What would you like to see most in minix?
    Summary: small poll for my new operating system
    Message-ID: <1991Aug25.205708.9541@klaava.Helsinki.FI>
    Date: 25 Aug 91 20:57:08 GMT
    Organization: University of Helsinki

    Hello everybody out there using minix -
    I'm doing a (free) operating system (just a hobby, won't be big and
    professional like gnu) for 386(486) AT clones. This has been brewing
    since april, and is starting to get ready. I'd like any feedback on
    things people like/dislike in minix, as my OS resembles it somewhat
    (same physical layout of the file-system (due to practical reasons)
    among other things).
    I've currently ported bash(1.08) and gcc(1.40), and things seem to work.
    This implies that I'll get something practical within a few months, and
    I'd like to know what features most people would want. Any suggestions
    are welcome, but I won't promise I'll implement them :-)
    Linus (torvalds@kruuna.helsinki.fi)
    PS. Yes - it's free of any minix code, and it has a multi-threaded fs.
    It is NOT protable (uses 386 task switching etc), and it probably never
    will support anything other than AT-harddisks, as that's all I have :-(.


    C'est pas un CD, mais j'ai pas droit à une petite rémunération ? :)

    Sinon c'est nouveau les directories en français ? http://directory.google.com/intl/fr/(...)
    • [^] # Re: En voilà un...

      Posté par (page perso) . Évalué à 0.

      Non les directory en français datent d'au moins un mois et demi.
      Nouveau ?
      Tout depend a quel echelle tu te pose :)

      [moua]

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.