La machine à remonter le web

Posté par  . Modéré par Val.
Étiquettes : aucune
0
9
nov.
2001
Internet
La parole s'envole, les écrits reste et les pages HTML s'emmelent.

Pour éviter de perdre les informations primordiales qui circulent sur le réseau une équipe à entrepris d'archiver le net. Le projet à démarré en 1996 mais était jusqu'a présent réservé a quelques chercheurs.

Les archives ont été ouvertes au public depuis la fin octobre et sont prises d'assaut d'où quelques difficultés de connexion.

Si jamais vous voulez avoir une idée du net il y'a quelques années ou si vous recherchez votre site perso perdu au fin fond d'un disque dur essayez, il a peut-être été archivé.

Aller plus loin

  • # Projet d'archives

    Posté par  (site web personnel) . Évalué à 10.

    A propos d'archives, google voulait pas faire la même chose avec Usenet ?
    Ils en sont où ? quelqu'un a des infos ?

    Sinon, je m'interroge sur la 'primordialité' des infos conservées ...

    Bref, quand on voit le prix des solutions de stockage, on comprend que c'est possible...
    • [^] # Re: Projet d'archives

      Posté par  (site web personnel) . Évalué à 10.

      La "recherche avancée" des groupes de google commence en 1995.
      Un exemple de remontage dans le temps :
      http://groups.google.fr/groups?as_q=linux&num=10&as_scoring(...)
      • [^] # Re: Projet d'archives

        Posté par  . Évalué à 8.

        A chaque mise à jour de DLFP, y'a d'anciens bugs qui ressortent: dans le post précédent, il y a une URL qui n'est pas découpée, et donc la page est 2 fois trop large...
    • [^] # Re: Projet d'archives

      Posté par  . Évalué à 5.

      je m'interroge sur la 'primordialité' des infos conservées

      Il suffit d'utiliser la compression lzip pour ne garder que les informations intéressantes: http://lzip.sourceforge.net/(...)

      -1 C0!N
    • [^] # Mémoire court terme

      Posté par  (site web personnel) . Évalué à 10.

      Pour les pages qui ont disparu récemment, un truc bien pratique c'est les pages mise en cache sur Google. Vous connaissez probablement déjà mais au cas où. Ca dépanne bien !
    • [^] # Re: Projet d'archives

      Posté par  (site web personnel) . Évalué à 7.

      Sinon, je m'interroge sur la 'primordialité' des infos conservées ...

      C'est vrai que tout conserver n'est pas forcément utile mais moi j'aime bien.

      Ce site me fait penser, en moindre importance, au moment où tu retournes chez tes parents chercher des cartons ou des affaires et que tu retombes sur un vieux bouquin que tu avais gribouillé, sur de vieilles affaires qui faisait parti de ton monde, des lettres de copines reçu pendant ton adolescence.

      Bref des choses futiles mais qui représente un peu pour moi.

      J'aime bien.
  • # IPoT date de 1998

    Posté par  . Évalué à 10.

    Allez voir les archives de 1998 de linuxfr.
    Vous y verrez qu'on parle ( deja) du sommaire de LinuxMag d'Octobre 2000 :-)

    Trop fort IPoT :-)
    • [^] # Re: IPoT date de 1998

      Posté par  (site web personnel) . Évalué à 10.

      Tu n'as pas bien regardé le système d'archivages de WebArchive (Wayback Machine).

      Effectivement, quand tu recherches DLFP il te donne une entrée pour 02/12/1998 et d'autres pour 1999 mais la première archive dispo est celle du 19/10/2000 (comme l'indique l'URL : http://web.archive.org/web/20001019093638ws_9/linuxfr.org/(...) où la date apparait 20001019) : c'est la première avec une étoile (update de l'archive).

      D'autre part, les admins reconnaissent qu'ils ont ouvert le site un peu tôt et que le service est surchargé donc c'est normal si vous avez des problèmes lors de requêtes.
      • [^] # Re: IPoT date de 1998

        Posté par  . Évalué à -4.

        Je me doute bien que ce n'est pas la realite!
        Mais c'est rigolo quand meme.
  • # Problèmes

    Posté par  . Évalué à 1.

    Note: lu sur la libre belgique:

    Un méga moteur de recherches réactive virus et pages prohibées
    Mis en ligne le 09/11/2001 à 16:30
    - - - - - - - - - - -
    Wayback Machine, un site web lancé la semaine dernière, permet aux internautes de trouver de l'information parmi 10 milliards de pages recensées depuis 1996. Ce serveur pose toutefois certains problèmes de taille puisqu'il risque de réactiver des "virus" en léthargie et des pages web prohibées, a rapporté vendredi le site NewScientist.
    Ce méga moteur de recherches recense et enregistre la plupart des pages internet créées depuis 1996, date laquelle a été lancé le web grand public.
    S'il offre une mine d'informations inégalable, il ouvre, selon le NewScientist, la porte aux virus informatiques endormis et aux pages web au contenu douteux et/ou confidentiel.
    Ainsi, le site avait réactivé des pages de la Commission américaine de régulation nucléaire, qui avait pris le soin de supprimer, après les attentats du 11 septembre, tout contenu pouvant intéresser les terroristes. Ces pages réactivées ont dû par la suite être supprimées dans l'urgence.
    Wayback Machine archive indistinctement toutes les pages web. Et c'est ainsi que des sites pédophiles ou piratés se retrouvent à disposition des internautes. NewScientist rappele que ce site risque gros puisque les autorités américaines impose des amendes allant de 200 à 150.000 dollars (9.000 à 6,7 millions de FB) pour tous sites reprenant des informations piratées (infractions au copyright) et interdites. (BELGA)
  • # Ca a l'air un peu pipo pour linuxfr

    Posté par  . Évalué à 6.

    La page noté du 18 décembre 1998 tourne sous DaCode, or si je ne m'abuse, le projet a démarré en 2000 (l'espace sur sourceforge a été ouvert le 15 juin 2000). Je veux pas dire mais ca m'a pas l'air très au point leur histoire d'archiver le net...

    C'est pareil, dans la tribune libre ca parle de Xfree 4 et de GeForce.

    En fait il s'agit d'une page du 19 Octobre 2000 (il y a plein d'autres indices : pyhton 2.0, Maximum Linux Octobre 2000).

    But du jeu : retrouver le maximum d'indice confirmant la date du 19 Octobre 2000 et non le 2 décembre 1998 comme on veut nous le faire croire)
  • # Oooh c'est lovely!

    Posté par  (site web personnel) . Évalué à -5.

    <nostalgie>J'ai retrouvé la trace de mon premier site web... je l'avais fait pour aider tous ceux qui avaient windows 95 et qui avait des problèmes de drivers ou divers problèmes que j'avais rencontré (je crois que l'un de mes prochain sera un site dans le même genre, avec moins de chichi, pour linux ;oD): déjà à l'époque j'en avait marre de Windows et de tous ses bugs, et c'est a cette époque aussi que mon frère à commencé à me parler d'un autre OS... Linux :oD </nostalgie>

    http://web.archive.org/web/20010719224856/perso.infonie.fr/traverse(...)

    p.s.: ce site n'a jamais été fini :o< (trop de bug dans windows, j'en avait marre ;op)
    • [^] # Re: Oooh c'est lovely!

      Posté par  (site web personnel) . Évalué à -5.

      Oops! Quand j'ai dit que je voulais faire pareil pour Linux, je voulais dire un site genre lea-linux, mais plus orienté newbie et desktop

      Sinon je viens de remarquer qu'il existe encore, et qu'on peut y trouver le fond d'ecran qui manque dans la "version sauvegardé" que j'avais fait avec un magnifique FATAL ERROR au milieu de l'écran ;o)) (précision, ce n'est pas un écran bleu, mais un fatal error home made qui va très bien à windows (fait à partir d'un screen shot))

      Voilà, pour ceux que la signature étonne, ca vient d'une critique de levinas (l'an dernier j'ai du me taper, résumer, et m'exprimer sur le Temps et L'Autre...): aucun doute, l'ontologie de l'hypostase est un phénomène passionant, tout comme la possibilité de l'éxister sans l'éxistant... (y a pas a dire y a des tordus sur Terre)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.