Journal Indexation de buzz

Posté par  (site web personnel, Mastodon) .
Étiquettes : aucune
3
21
nov.
2008
Cher journal,

J'ai envie de prototyper rapidement un système pour me permettre de suivre les tendances et les buzz. Je m'explique.

J'ai passé quelques heures ce week-end sur des sites par exemple sur celui là : http://pierre-philippe.blogspot.com/2008/09/silicon-valley-v(...) ou en gros on peut voir une personne en vidéo vous expliquer ce qu'est un geek, que pour être efficace il faut faire une réunion tous les soirs, et que pour se secher après la douche il faut une serviette...

Il y a toujours les mêmes d'un microcosme Parisien qui font les mêmes soirées (en général à la Cantine) en ayant l'impression d'avoir inventé le monde (hier soir à une soirée DreamApero que je ne conseille à personne, un mec m'a parlé de son innovation de cartes de visite vidéo super à destination du B2B et dont une version est visible (risible?) à http://itsmecard.com/berndhofstoetter ). Je voudrais pouvoir suivre ces personnes et les cartographier pour voir que ce sont toujours les mêmes qui parlent de leur potes mais que au final rien n'en ressort.

Donc j'ai l'idée de faire un crawler de site qui irait prendre 10 ou 20 blogs connus en France (techcrunch) plus les blogs de quelques zigotos, de suivre les liens à +2 (ça ferait déjà beaucoup de pages) et d'indexer toutes les occurrences des mots, en notant le moment ou ils sont apparus.

Ensuite je pourrais faire des schémas qui indiquent jour après jour les tendances et les termes qui reviennent, pour retomber très rapidement ensuite éventuellement, et noter les sources ou ont été vu les termes et faire des bulles en fonction de leur origine. Je pourrais voir par exemple que le terme "DreamApero" a été évoqué sur les X blogs habituels mais pas ailleurs.

Je dis une connerie, vous avez des idées pour faire quelque chose d'efficace dans le genre ? Bon je vais peut être en parler aussi sur mon blog.
  • # Bonne idée

    Posté par  . Évalué à 10.

    Oublie pas d'indexé le tien ;o)
  • # The Chosen One

    Posté par  . Évalué à 10.

    Le truc dans cette population, c'est que chacun pense être au dessus de la masse et les autres ne sont souvent que des "faire valoir" permettant la mise en valoir de la différence voulu et affiché de l'individu.

    Bon... toi c'est pas pareil hein, tu es différent des autres, mais tu vois ce que je veux dire hein !
  • # web-mining.fr

    Posté par  (site web personnel) . Évalué à 2.

    Sur ce site tu pourra peut-être trouver des choses interessantes : http://www.web-mining.fr

    Il y a de nombreux liens, des cartes, des outils, des procédés toussa. Je ne suis pas expert alors je te laisse découvrir par toi même.
  • # ..

    Posté par  . Évalué à 10.

  • # J'ai bricolé quelques trucs similaires

    Posté par  (site web personnel) . Évalué à 4.

    J'ai un script python qui prend en entrée des flux rss, et t'affiche le liens par ordre de "buzzité", c'est à dire en gros du nombre de mots jamais vus auparavant.

    C'est pas très abouti, mais si ça t'intéresse je peux te le filer. Après tout ça pourrait intéresser pas mal de monde, c'est rigolo de suivre l'apparition (et la disparition) des modes et des nouveaux mots.
  • # In case of success

    Posté par  (site web personnel, Mastodon) . Évalué à 3.

    Si jamais tu aboutis à quelque chose, poste-nous les résultats de tes recherches. Ça doit en intéresser plus d'un ici!

    La gelée de coings est une chose à ne pas avaler de travers.

  • # Réalisation

    Posté par  . Évalué à 1.

    L'idée est assez intéressante. Mais à mon avis assez difficile à faire au final.

    J'aurais eu à le faire, je l'aurais fait en Perl. Je télécharge les pages web avec wget par exemple. Ensuite j'analyse le contenue du texte avec Perl. (Qui à mon avis fait ça très bien)
    Et le tour est joué.
  • # BREVET LOGICIEL ???

    Posté par  . Évalué à 6.

    C'est vrai que les commentaires sont un peu ironiques , j'ai jeté un coup d'oeil sur le site d'itsmecard , et en effet rien de bien impressionnant , une video d'un type qui vante les miracles de son produit en tant que bon markeux , seulement en allant sur la page d'acceuil , Hooo Horeur que vois je ??

    Demande de brevet déposé . Alors bon si c'est pas une trivialité qu'est ce donc ?
    Enfin tant que les brevets logiciels ne sont pas valide en europe , ca me rassure .

    Quelle pourrait etre la définition de ce superbe et nouveau procédé d'utilsation du web ?

    " itsmecard est un procédé de transfert d'information à destination des B2B utilisant une technologie des réseaux , pour communiquer les coordonnées sous format électronique encodée en ASCII combiné avec d'autre codage au cas ou si nécessaire UTF8 ? , et qui est couplé avec une méthode d'envoye et de visualisation de visage d'un émetteur auquel il s'identifie et dont les coordonnées lui sont liés "


    voila un beau brevet , c'est quasi plus intelligent que de breveté le double click .

    Enfin faut avoir du culot pour se croire innovateur de génie , et encore plus pour demander un dépot de brevet logiciel dessus ...

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.