Forum Programmation.web APIs Web, Screen Scraping et web sémantique

Posté par  .
Étiquettes : aucune
0
11
jan.
2008
Bonjour,

* On trouve énormément d'informations sur le web, mais elles sont polluées (spam), de mauvaise qualité (incomplètes, périmées, fausses...), ou éclatées sur une myriade de sites différents.

* Grâce aux API Web, aux flux RSS et au screen scraping, il est possible de récupérer ces informations et de les combiner pour leur donner un sens (web sémantique).

* Ces informations acquièrent alors une valeur qui peut être exploitée de plusieurs façons : publication du contenu et monétisation grâce à la pub (AdSense), création d'une communauté autour du contenu, service de veille techno...

Quelques exemples d'applications :

* Vous êtes fan de Céline Dion ? (ça arrive...) Une page simple vous présente une minibio, quelques photos, les dates de ses prochains passages TV/radio en France, la parodie de Florence Foresti (vidéo YouTube)... Vous pouvez mettre en place une alerte pour être averti par e-mail de tout nouvel événement la concernant (par ex : une séance de dédicaces dans la FNAC la plus proche de chez vous).

* Vous ne savez pas quoi regarder à la TV ce soir ? Une page simple vous présente l'ensemble des émissions du soir avec les notes attribuées par chaque magazine TV. Pour les films, une note moyenne est calculée à partir des évaluations des principaux sites de ciné (Allocine, Imdb...).

* Vous aimeriez vous faire une sortie ce week-end ? Une page simple vous présente les événements culturels qui ont lieu à moins de 5 km de chez vous, classés par popularité.

Les idées ne manquent pas. J'aimerais en discuter avec des personnes intéressées.

Vincent

PS. Un bon exemple d'implémentation de cette idée appliquée au eCommerce :
http://www.wikio.fr/produit/hp-3995.html
(une page simple qui synthétise tous les tests, avis, news, vidéos... sur un produit)
  • # c'est à dire que bon...

    Posté par  . Évalué à 2.

    "On trouve énormément d'informations sur le web, mais elles sont polluées (spam)"

    ...parce que...

    "Grâce aux API Web, aux flux RSS et au screen scraping, il est possible de récupérer ces informations et de les combiner pour leur donner un sens" (ou pas, d'ailleurs, tant que ca nourrit les bots)

    ...parce que...

    "Ces informations acquièrent alors une valeur qui peut être exploitée de plusieurs façons : publication du contenu et monétisation grâce à la pub"

    ca fait juste des années que ça dure, faudrait voir à se réveiller un peu.

    et puis bon, vous croyez sérieusement donner un sens en se contentant de recopier le contenu de quelques sites, juste parce qu'ils ont un thème en commun ? (et surtout sans aucune relecture, tri ou autre travail éditiorial ensuite). j'appelle ça rajouter de l'entropie. je ne vais pas dire que c'est inutile mais la volonté même de se faire rénumérer par Google pour ça montre la vanité de la chose : c'est tout juste du parasitage de contenu, s'imposer comme intermédiaire entre Google et les pages que les utilisateurs iront visiter. faut pas s'étonner si ça ne plait ni aux créateurs de ces contenus, ni aux visiteurs, ni à Google...

    il faut voir qu'il y a un écart énorme entre ce qui se cache actuellement sous le nom de mash-up et les annuaires bidons à la bonweb dont une partie des pages n'est constituée que... des requetes des utilisateurs précédents !


    quand à wikio, c'est une telle poubelle d'auto-promotion dégoulinante que c'est même l'exemple typique de ce qu'il ne faut pas faire tellement c'est inutile et truqué, l’éditeur du site prenant grand soin de mettre tous ses sites et blogs dans le top 5 ou 10, avec plusieurs fois Wikio et le blog de Chappaz dans ce propre "classement"
    • [^] # Re: c'est à dire que bon...

      Posté par  . Évalué à 1.

      Hello Gniarf,

      Merci pour ton avis.

      Je suis en partie d'accord avec ce que tu dis, mais je reste persuadé qu'il y a un moyen de produire du contenu à valeur ajoutée en remixant du contenu existant, ; le contenu produit ne va pas ralentir les utilisateurs dans leur visite mais au contraire leur faire gagner du temps (c'est le but d'un mashup).

      Cela dit, je ne sais pas précisément comment. C'est juste qqchose qui m'intéresse et j'y réfléchis.

      Pourrais-tu me donner qq précisions sur ton post ?

      - Qu'entends-tu par "entropie" (y a 8 définitions différentes sur wp)

      - Quand tu dis "il faut voir qu'il y a un écart énorme entre ce qui se cache actuellement sous le nom de mash-up et les annuaires bidons à la bonweb", tu veux dire que les mashups sont supérieurs aux annuaires ?

      Vincent

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.