Journal Gmail et simplicité volontaire

Posté par (page perso) .
Tags : aucun
0
5
jan.
2006
Bon il s'agit d'une copie d'un mail que je viens d'envoyer, histoire de...
----

Le 05/01/06, Machin a écrit :
Salut,

Ca me gêne un peu toute cette place sur gmail: d'où vient-il cet
espace disque en constante progression? En plus avec ça
je gaspille un max: je ne trie plus rien, je garde tout. Bien loin de
la simplicité volontaire non?


Ne t'en fait pas: il s'agit d'une vision purement logique. Du point de vue de Google, ces 2 gigas ne prennent aucune place dans un système d'archive bien foutu (c'est la spécialité de Google).

A vrai dire, il s'agit bien de simplicité *volontaire*, puisque la première chose que font les machines de Google, sera d'identifier ton diaporama gros-nichon.pps de 10méga comme la n-ième copie d'un fichier déja vu dans un million de BAL.

Evidemment, à Google, ils sont un peu moins limité qu'un ingénieur de SSII qui conçoit une BDD: ils se disent: "hoooo mais ca ne sert à rien de garder un million de copies de la même chose".

On peut même imaginer, théoriquement, que les besoins de stockage de Google s'amortissent au fil du temps. Cela démontrera l'incroyable misère de nos vies monotones.

Donc, combien valent tes 2 gigas sachant que Google sait ranger le bruit généré par des spams et les mails viraux: Hoax, gros-nichon.pps, etc. avec leurs fichues listes de diffusion en CC? Je sais pas trop dire, mais puisque les mails de mes 3 années d'étude tiennent dans une disquette (et j'avais pourtant pas mal de correspondants), il doit s'agir à peu près du poids véritable de tes 2 gigas: *une disquette*.

Bon. Je reconnais que le travail d'archivage hyper-factorisé de Google n'est pas simple. Ce serait mieux pour tout le monde si le monde numérique était déja structuré: web sémantique, URI unique pour tous les fichiers partagés, etc. Mais là, il manque une techno aussi cool qu'un "système de flèches" à ma façon.

A ce sujet: Ca va venir, les fans du Web2.0 parle déja de taguer les tags. Bientôt, j'espère qu'ils penseront à taguer les taguages (c'est à dire les relations tag-ressource), et peut-être à unifier les tags et les ressources taguées, (pourquoi distinguer les 2? pourquoi ne pas tagguer des ressources avec une autre ressource comme par exemple une image).: Paf! on obtiendra un graphe de flèches. Si tu ne comprends rien à ce que je dis, c'est pas grave, j'ai l'habitude.
  • # Espace personnel

    Posté par (page perso) . Évalué à 10.

    En gros tu essaies de me dire que l'espace personnel qui m'est réservé pour des fichiers personnels n'en est en fait pas un et que je partage sans le savoir mes fichiers personnels avec d'autres personnes ?

    P'tain, c'est du stockage métaphysico-solidaro-collectiviste alors...

    J'ai peut-être rien compris mais j'aime bien ton style !
    • [^] # Re: Espace personnel

      Posté par . Évalué à 8.

      Moi aussi ca me surprend, mais ce n'est pas inconcevable, avec l'utilisation d'un bon hash.
      Sinon quelque chose qui est beaucoup plus probable est que lorsque tu envoies une piece jointe à un autre compte gmail, cette piece ne soit pas dupliquée.
      • [^] # Re: Espace personnel

        Posté par (page perso) . Évalué à 4.

        Un espace comme celui-ci sert également à beaucoup de personne (moi par exemple) pour s'abonner à des mailing-lists à gros volume et ainsi pouvoir lire de temps en temps, sans penser à la saturation de la boîte...

        Là, la fusion est relativement simple (arrivée d'un grand nombre de mails en même temps)

        PS : le risque en laissant s'accumuler pendant les vacances : pour récupérer les 10000 mails non lu, faut en faire des "Suivant>" ;-p
      • [^] # Re: Espace personnel

        Posté par (page perso) . Évalué à 2.

        C'est ultra classique en programmation, c'est le modele de conception "poid leger" ou pour ceux qui comme moi comprennent pas bien le francais, le design pattern flyweight. Cf le bouquin "Design Pattern", par le GoF. A lire si vous faites de la programmaton objet depuis plus d'un an.
    • [^] # Re: Espace personnel

      Posté par . Évalué à 6.

      En gros tu essaies de me dire que l'espace personnel qui m'est réservé pour des fichiers personnels n'en est en fait pas un et que je partage sans le savoir mes fichiers personnels avec d'autres personnes ?

      Ce que t'explique le monsieur est que les fichiers en double ne sont stockés qu'une fois. Donc si dans ton espace *personnel* qui t'es réservé pour tes fichiers *personnels*, tu as un fichier *personnel* que quelqu'un d'autre a aussi, alors gmail n'est gardera qu'une copie. Et ton fichier te restera personnel (à toi) tant que tu n'y feras pas de modification qui le rendra unique.

      Exemple simple : tu as un fichier sarah.txt qui contient le numéro de téléphone de ta copine sarah, sauf que y'a rien dedans parce que tu ne lui a pas encore demandé. Si y'a une autre personne qui a aussi ce fichier sarah.txt sans rien dedans, parce que lui non plus n'a pas encore demandé, alors le fichier n'existera qu'une seule fois.
      Par contre, si tu demandes à ta copine son téléphone et que tu l'inscrit dans ton fichier, alors tu auras toi ton fichier sarah.txt avec le numéro de téléphone, et l'autre personne gardera son fichier vide, et il y aura 2 fichiers sarah.txt chez google (contenus différents). Ne t'inquiètes pas, il n'aura pas le numéro de téléphone, tu as le champs libre !
      • [^] # Re: Espace personnel

        Posté par (page perso) . Évalué à 5.

        Merci Matthieu pour ce sens incomparable de la pédagogie qui caractérise ton post, mais je faisais de l'humour, enfin, j'essayais d'être drôle...

        PS : Sarah Conor ? ... (suite de mon humour : <ma vie>il faut dire qu'actuellement je suis plongé dans la Rubrique A Brac, alors ...</ma vie>)
  • # Fan de tags

    Posté par (page perso) . Évalué à 3.

    Dans le cadre de PySubMind https://gna.org/projects/pysubmind j'avais pensé au tag de tags et aux familles de tags.

    Je suis pas sur que ce soit la même idée que toi et j'avais appellé ça des tags valués de type famille:tonton ou animal:chien. Tu me diras oui mais autant mettre tonton et chien ? Pense alors à date:20060105, time:2359 et note:14. Ca permet des recherches faciles et intéressantes ! Je l'implémenterai un de ces jours ...
    Le projet Kimdaba utilise ce principe : http://ktown.kde.org/kimdaba/

    Pour les familles de tags, je l'ai un peu implémenté avec les tags communs aux autres tags. Exemple : http://l-homme.net/pysubmind/pysubmind.py?action=view_tag&am(...)
    Tu obtiens les tags "proche" et je pense qu'il est intérressant de regrouper certains tags.
    Un peu comme les clusters de flickr : http://flickr.com/photos/tags/linux/clusters/

    Y a encore des trucs à faire avec les tags !

    Désolé pour tout ce blahblah car j'adore bosser sur les tags et ça cache ma question : quel rapport entre tag et web2.0 ?
    • [^] # Re: Fan de tags

      Posté par (page perso) . Évalué à 2.

      fait attention tu vas soit reinventer les systemes de classements hierarchiques, soit mettre au point cette revolution tant attendu qu'est les systemes de gestions de données sur graphes ( google est un peu le pionner dans le domaine ).

      par contre, le probleme avec les graphes, c'est que peu de personnes savent en faire quelque choses, et qu'aujourd'hui, ce que l'on sait faire avec les graphes, ce n'est pas grand choses.
      • [^] # Re: Fan de tags

        Posté par (page perso) . Évalué à 2.

        Hummm ... Pas compris :D

        A partir de quoi je reviens à une organisation en arbre ? Si une partie d'un graphe n'a pas boucle, ça veut pas dire que le graphe n'a pas de boucle.

        Google pionner dans les graphes :D Les metadata, c'est quand même très vieux ! Les applis qui s'en servent genre beagle et google desktop sont relativement récentes mais je me souviens que même Microsoft avait des projets là dessus il y a quelques années. Je crois même que leur FS+DB est encore d'actualité. WinFS il me semble. Si on considère les métadata comme une partie des tags valués, c'est vieux mais les logiciels qui en tirent partis sont relativement récents.

        Je suis à coté ? :)
        • [^] # Re: Fan de tags

          Posté par (page perso) . Évalué à 2.

          si tu fais des tags a:b ... pourquoi pas a:b:c ... puis a:b:c:d . cela peut etre un chemin dans un arbre.

          par contre, si tu as un graphe et que tu fais une selection en associant un chemin de tag ... cela peut etre tres sympatique.

          un cas pratique de l'idee :
          tu prends le graphe produit par un outil de type "mindmapper".
          tu as donc une association libre de tags et un graphe le representant.
          maintenant, si au lieu d'associer des ensemble de tags, tu associes un chemin dans un graphe, cela peut tout de suite prendre une tournure interessante.

          techniquement tu a un fichier :
          [link rel="tagmap" src="/mon-site-web-2.mindmap" type="RDF-quelconque"]

          apres tu associes des chemins a tes elements du genre :
          rel="a:b:c:d" et sur un autre element rel="d:b:k:j"

          l'interet est le meme que les tags mais en plus avec une navigation de genre "mindmap"
          • [^] # Re: Fan de tags

            Posté par (page perso) . Évalué à 1.

            a:b:c:d Tiens j'aurais du y penser à celui là :D Ce serait peut être venu à mon premier essai de temps avec heure:13:00:51 ;)

            Je comprends l'interet de faire des groupes de tags, par exemple : donne moi tous les éléments qui ont le tag a et le tag b mais je comprends pas chemin.

            Est ce que tu parles de ça ?
            http://l-homme.net/pysubmind/pysubmind.py?action=view_tag&am(...)
            sachant qu'on aurait pu mettre test+page ou page+test

            Ce qui me dérange c'est qu'un chemin à un sens et je vois pas l'intérêt de ce sens ... T'as un exemple autre que a, b, c, etc. ?

            Actuellement, si on prenait une carte des relations de tags, ce serait plus une concept map qu'une mind map puisque ce n'est pas un arbre. Les tags sont rattachés aux notes sans classement. Les liens entre les tags sont les notes, les tags n'ont pas de relation entre eux et encore moins de lien avec un sens comme dans les arbres des mind map. C'est comme si j'avais un mind map avec des relations doubles "rattachés à" partout ...

            Désolé pour mon niveau dans les graphes :D
            • [^] # Re: Fan de tags

              Posté par (page perso) . Évalué à 2.

              heu ... si tu regarde un truc comme del.icio.us , tu verras que tu peux naviguer entre les tags. il y a meme une appli flash pour faire cela de maniere plus zolie.

              donc pour faire pseudo-theorique :

              soit un ensemble de tags T.
              soit un ensemble de "pages" taggé par une partie de T.

              si toutes les pages sont taggé par au moins un tag, alors il y a :

              - une relation entre l'ensemble des tags et l'ensemble des pages.
              - une relation entre l'ensemble des tags et l'ensemble des tags ( avec rebond par les pages ).

              donc il est tout a fait possible de déduire un graphe de tags.

              un graphe, meme non orienté, contient des chemins. ces chemins sont les énoncés de comment d'un tag A aller au tag B sachant que A et B ne sont pas lié directement par une page usant des deux.

              dans le cas que je propose, bien souvent, l'on propose d'abord une maniere d'associer les choses, puis apres on les associes en pratique.

              dans le cadre du web sémantique, cela permet d'avoir une notion de cohérence de l'édifice. dans le cadre de l'utilisateur, cela permet de construire son site sans avoir a se taper une navigation trop souvent inadapté à son propre mode de pensé.

              enfin bon, ce que je propose s'appellera peut etre le web 3.0 ( ou au choix s'appelle deja google-base ).

              par contre, si test:page et page:test sont equivalent alors ce que tu proposes est une classe d'équivalence exprimable par une relation n-aire ( ou n le nombre d'élement independant de la relation ).

              dans le cadre de l'heure heure:10:14:01 est plutot à lire heure:[10-14-01] et donc est une relation binaire, sinon elle serait aussi equivalente a heure:14:01:10 .
              • [^] # Re: Fan de tags

                Posté par (page perso) . Évalué à 1.

                Quand je disais heure:10:14:01 je pensais bien à "10:14:01", disons que j'aurai surement eu l'idée de décendre plus loin en "voyant" les :::

                test + page = page + test
                mais
                date:20050105 <> 20050105:date

                On est d'accord et je comprends tout sauf ce que tu appelles le web sémantique :)
                Si tu as quelques liens, donne. Si non, te fatigue pas, mon cerveau doit pas être prêt pour ta révolution :D

                3 google plus tard ...

                Ayé compris ! J'aurais du commencer par là ...
                Merci pour cette découverte !
  • # La réponse en image

    Posté par . Évalué à 10.

    d'où vient-il cet espace disque en constante progression?


    http://gmailspace.istheshit.net/images/buypucuz.jpg
  • # Technique

    Posté par . Évalué à 8.

    Evidemment, à Google, ils sont un peu moins limité qu'un ingénieur de SSII qui conçoit une BDD: ils se disent: "hoooo mais ca ne sert à rien de garder un million de copies de la même chose".

    C'est un point technique avéré que l'on peut lire quelquepart officiellement ou simplement un "je pense que c'est comme ça donc ça l'es surement" ?
    • [^] # Re: Technique

      Posté par . Évalué à 6.

      A mon avis c'est surtout un argument marketing.

      Dans les faits combien de personnes qui ont un compte gmail utilisent effectivement l'espace dédié.
      C'est assez simple d'allouer 2go d'espace virtuel, de ne dimensionner l'espace réel que pour le besoin moyen (qui doit être largement inférieur) et de gerer dynamiquement cet espace.

      Ca n'est du reste pas incompatible avec d'autres techniques de mutualisation.
      • [^] # Re: Technique

        Posté par (page perso) . Évalué à 2.

        hum d'après un petit sondage dans mon entourage immédiat, ces 2gigas se remplissent à une vitesse folle.
        • [^] # Re: Technique

          Posté par . Évalué à 6.

          Mme Michu fait elle parti de ton enourage immédiat :D.

          Tout le monde ne transforme pas son compte gmail en fs de sauvegarde distant ;-)
          • [^] # Re: Technique

            Posté par . Évalué à 3.

            Mme Michu a t'elle transformé son adresse aol.fr en gmail.com ?

            Sachant que (sortit des désagréments habituels liés au changement d'Email) Gmail est encore "Béta" et qu'on ne peut s'y inscrire simplement ?
        • [^] # Re: Technique

          Posté par . Évalué à 3.

          ces 2gigas se remplissent à une vitesse folle.

          Surtout si on utilise gmailfs !
          http://richard.jones.name/google-hacks/gmail-filesystem/gmai(...)
    • [^] # Re: Technique

      Posté par (page perso) . Évalué à 3.

      Pan! dans le nez. C'est vrai: je ne peux rien prouver.

      • [^] # Re: Technique

        Posté par . Évalué à 3.

        Il ne s'agit pas de prouver, il s'agit simplement de faire la distinction entre "quelque chose que tu présume comme ça" et quelque chose qui l'es vraiment. La, tu laisse penser que c'est comme ça, que c'est un fait. Hors, ce n'est pas du tout un fait, c'est "peut être comme ça". Mais peut être pas. Et je serais même tenté de dire "surement pas", a cause des contraintes techniques. Peut être que je me trompe, mais au moins je n'asséne pas comme vérité quelque chose qui n'est qu'une simple opinion. Tu saisis la déifférence et le pourquoi de mon commentaire initale ?
        • [^] # Re: Technique

          Posté par (page perso) . Évalué à 1.

          Oui.

          Au départ, il s'agissait d'un mail à quelqu'un qui me connait bien et qui sait très bien à quoi s'en tenir.

          Je crois que je l'ai posté ici à cause du dernier paragraphe et de la référence à la "simplicité volontaire".

          Pour ma défense, je viens de comprendre que le rôle des journaux sur linuxfr a l'air de changer. J'étais pas au courant qu'il s'agit de participer à l'élaboration d'une base de connaissances collectives.

          Donc, fini la déconnade?





          • [^] # Re: Technique

            Posté par . Évalué à 2.

            Mais euh ... toi tu es celui qui a ecrit le 1er mail ou bien la reponse ?
            Je n'arrive pas a bien saisir avec tes derniers propos :D
          • [^] # Re: Technique

            Posté par . Évalué à 1.

            Au départ, il s'agissait d'un mail à quelqu'un qui me connait bien et qui sait très bien à quoi s'en tenir.

            Il sait que tu déclare comme grande vérité de vastes hypothèses ?


            J'étais pas au courant qu'il s'agit de participer à l'élaboration d'une base de connaissances collectives.
            Donc, fini la déconnade?

            Personnellement, c'est pour cela que je lis les journaux oui, pour la déconnade j'ai rire et chanson. Et c'est quand même plus dans le registre de la déconnade que ton mail (mais c'est une question d'opinion, je te l'accorde, ton correspondant était certainnement écroulé de rire en le lisant).

            Maintenant il y a un juste milieu, simplement je ne vois pas tellement ou est la déconnade dans la divulgation d'informations fausses... M'enfin, c'est une question d'opinion, encore une fois, je te l'accorde :-)
            • [^] # Re: Technique

              Posté par (page perso) . Évalué à 1.

              Il sait que tu déclares comme grandes vérités de vastes hypothèses ?
              c'est ca. En général, je commence ma tirade par "je suis sûr que", mais des fois j'oublie.

              Je répète qu'il ne s'agit pas d'un débat technique mais plutôt d'une "déconnade" avec un ami autour de ce thème: http://www.ecosociete.org/t37.html ... quelquechose que j'ai voulu partager avec les lecteurs de Linuxfr. Mais grace à toi, je ne ferai plus cette erreur: je vais tout de suite me défenestrer.
              • [^] # Re: Technique

                Posté par . Évalué à 3.

                Mais grace à toi, je ne ferai plus cette erreur: je vais tout de suite me défenestrer.

                ça c'est de l'humour que je comprend :-)
              • [^] # Re: Technique

                Posté par . Évalué à 2.

                faut pas déconner, on est pas sur /. ici o:)
  • # gmail.alt

    Posté par . Évalué à 3.

    Existe-t-il une alternative à Gmail?

    (Je pense surtout au webmail gérant les threads)
  • # Topic maps

    Posté par (page perso) . Évalué à 2.

    A ce sujet: Ca va venir, les fans du Web2.0 parle déja de taguer les tags. Bientôt, j'espère qu'ils penseront à taguer les taguages (c'est à dire les relations tag-ressource), et peut-être à unifier les tags et les ressources taguées, (pourquoi distinguer les 2? pourquoi ne pas tagguer des ressources avec une autre ressource comme par exemple une image).: Paf! on obtiendra un graphe de flèches. Si tu ne comprends rien à ce que je dis, c'est pas grave, j'ai l'habitude.


    Les topics maps proposent cela depuis pas mal de temps. C'est assez intéressant comme concept. Le seul inconvénient étant qu'il n'y a pas vraiment d'applications web libres finalisées qui permettent vraiment d'exploiter le principe (je pense principalement à des applications de knowledge management basées sur ce principe).

    Il y a une belle application (pas libre) réalisée par Ontopia qui permet de naviguer dans des topics maps : http://www.ontopia.net/omnigator/models/index.jsp .
  • # Une disquette ?

    Posté par (page perso) . Évalué à 7.

    Une diquette pour trois ans d'archive mail ?

    Euh ...
    Perso je dois être au dessus des 500Mo pour mes 3 dernières années (au jugé). En tout cas mon dossier imap fait plus que ça.

    Dedans je ne compte qu'assez peu de listes de diffusions (j'avais tendance à les effacer pour ne pas faire ramer les clients imap quand ils cherchent dans tous les dossiers) et tous les fichiers joints supérieurs à 2Mo sont supprimés (parce que sinon ça augmente vraiment trop vite).

    Par contre effectivement, ça fait quelques années que je n'efface plus grand chose à part les fichiers joints et les listes de diffusion (et dernièrement j'ai tendance à laisser aussi quelques listes à faible traffic en archive). Au final ça monte très vite ...

    Loin de moi l'idée de penser que les 2Go sont "utiles", mais les geeks (une des grosses cibles de Google) ont probablement des répertoires mails de plusieurs centaines de Mo.
    Les autres ont probablement plein de mails HTML avec des citations énormes, des images de papier à lettres, des images, mp3 ou powerpoint en fichier joint sans les effacer. Ceux là sont probablement moins succeptibles de "faire le ménage" dans les gros fichiers et consomeront peut être encore plus la place que les autres.
    Je ne parle même pas de ceux qui envoient firefox par mail à leurs copains ;)
  • # Super

    Posté par . Évalué à 4.

    Le 05/01/06, Machin a écrit :


    J'aime bien son nom :)

    Et oui c'est la première chose qu'un geek remarque.

    Comme en cours de sciences-physiques ou le prof met le contrôleur sur le calibre 1000V, et nous demande de dire ce qu'on observe. Il y avait des chiffres en énorme, et un petit éclair sur le côté (disant qu'on est sur le calibre 1000V), alors bien sûr, je dis << Il y a un ptit éclair >> :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.