Cher journal,
J'ai envie de prototyper rapidement un système pour me permettre de suivre les tendances et les buzz. Je m'explique.
J'ai passé quelques heures ce week-end sur des sites par exemple sur celui là : http://pierre-philippe.blogspot.com/2008/09/silicon-valley-v(...) ou en gros on peut voir une personne en vidéo vous expliquer ce qu'est un geek, que pour être efficace il faut faire une réunion tous les soirs, et que pour se secher après la douche il faut une serviette...
Il y a toujours les mêmes d'un microcosme Parisien qui font les mêmes soirées (en général à la Cantine) en ayant l'impression d'avoir inventé le monde (hier soir à une soirée DreamApero que je ne conseille à personne, un mec m'a parlé de son innovation de cartes de visite vidéo super à destination du B2B et dont une version est visible (risible?) à http://itsmecard.com/berndhofstoetter ). Je voudrais pouvoir suivre ces personnes et les cartographier pour voir que ce sont toujours les mêmes qui parlent de leur potes mais que au final rien n'en ressort.
Donc j'ai l'idée de faire un crawler de site qui irait prendre 10 ou 20 blogs connus en France (techcrunch) plus les blogs de quelques zigotos, de suivre les liens à +2 (ça ferait déjà beaucoup de pages) et d'indexer toutes les occurrences des mots, en notant le moment ou ils sont apparus.
Ensuite je pourrais faire des schémas qui indiquent jour après jour les tendances et les termes qui reviennent, pour retomber très rapidement ensuite éventuellement, et noter les sources ou ont été vu les termes et faire des bulles en fonction de leur origine. Je pourrais voir par exemple que le terme "DreamApero" a été évoqué sur les X blogs habituels mais pas ailleurs.
Je dis une connerie, vous avez des idées pour faire quelque chose d'efficace dans le genre ? Bon je vais peut être en parler aussi sur mon blog.
# Bonne idée
Posté par okparanoid . Évalué à 10.
# The Chosen One
Posté par kowalsky . Évalué à 10.
Bon... toi c'est pas pareil hein, tu es différent des autres, mais tu vois ce que je veux dire hein !
# web-mining.fr
Posté par Grégory Landais (site web personnel) . Évalué à 2.
Il y a de nombreux liens, des cartes, des outils, des procédés toussa. Je ne suis pas expert alors je te laisse découvrir par toi même.
[^] # Re: web-mining.fr
Posté par jm trivial (site web personnel) . Évalué à 1.
http://aixtal.blogspot.com/
[^] # Re: web-mining.fr
Posté par Yannick . Évalué à 3.
À propos de ce que Fabien veut faire, je ne sais pas si j'ai tout compris mais ça me rappelle une récente analyse du "buzz" autour du bridage du débit de l'iphone. C'est là :
http://linkfluence.net/fr/news/2008/10/07/voir-les-dynamique(...)
et là (en flash) :
http://linkfluence.net/etudes/cas-orange-iphone/
Yannick
[^] # Re: web-mining.fr
Posté par Fabien Penso (site web personnel, Mastodon) . Évalué à 1.
Oui c'est exactement ce que j'avais en tête, une idée des technologies utilisée ?
# ..
Posté par goernil . Évalué à 10.
http://www.liberation.fr/societe/0101267402-big-darcos-is-wa(...)
# J'ai bricolé quelques trucs similaires
Posté par JoeltheLion (site web personnel) . Évalué à 4.
C'est pas très abouti, mais si ça t'intéresse je peux te le filer. Après tout ça pourrait intéresser pas mal de monde, c'est rigolo de suivre l'apparition (et la disparition) des modes et des nouveaux mots.
# In case of success
Posté par Lol Zimmerli (site web personnel, Mastodon) . Évalué à 3.
La gelée de coings est une chose à ne pas avaler de travers.
# Réalisation
Posté par Le Gall Sébastien . Évalué à 1.
J'aurais eu à le faire, je l'aurais fait en Perl. Je télécharge les pages web avec wget par exemple. Ensuite j'analyse le contenue du texte avec Perl. (Qui à mon avis fait ça très bien)
Et le tour est joué.
# BREVET LOGICIEL ???
Posté par eastwind☯ . Évalué à 6.
Demande de brevet déposé . Alors bon si c'est pas une trivialité qu'est ce donc ?
Enfin tant que les brevets logiciels ne sont pas valide en europe , ca me rassure .
Quelle pourrait etre la définition de ce superbe et nouveau procédé d'utilsation du web ?
" itsmecard est un procédé de transfert d'information à destination des B2B utilisant une technologie des réseaux , pour communiquer les coordonnées sous format électronique encodée en ASCII combiné avec d'autre codage au cas ou si nécessaire UTF8 ? , et qui est couplé avec une méthode d'envoye et de visualisation de visage d'un émetteur auquel il s'identifie et dont les coordonnées lui sont liés "
voila un beau brevet , c'est quasi plus intelligent que de breveté le double click .
Enfin faut avoir du culot pour se croire innovateur de génie , et encore plus pour demander un dépot de brevet logiciel dessus ...
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.