SPARQL, le SQL du Web, et Linked Data Fragment : le point sur le requêtage du Web

Posté par . Édité par Davy Defaud, Yvan Munoz, palm123, Benoît Sibaud et ZeroHeure. Modéré par Nils Ratusznik. Licence CC by-sa
Tags :
48
1
jan.
2017
Base de données

« Chère pêche »,

En ce début d'année, il ne me semble pas inutile de faire le pont entre la rétrospective et la perspective, afin de conjuguer l’avenir du Web au présent. :-)

Le but de cette dépêche est de faire un tour d’horizon de technologies permettant de faire des requêtes sur des données structurées : le Web sémantique. Comment il a évolué en dix ou quinze ans et ce qu’il permet de faire. Après une introduction contextuelle et historique, il sera question de Sparql et de linked data fragments, ainsi que de leurs usages en pratique chez Wikimedia Foundation.

Accrochez‐vous à votre fauteuil, il va être question de niveaux d’abstractions, d’enrichissement croisé de données, de manipulation de tables, de la pertinence du choix de RDF par rapport à SQL, des outils utilisés par les contributeurs Wikimedia mis au point par les développeurs du projet et, enfin, des limites actuelles et d’un avenir possible.

Wikidata : première bougie

Posté par . Édité par Florent Zara. Modéré par Pierre Jarillon. Licence CC by-sa
Tags : aucun
30
30
oct.
2013
Open Data

Voici passée la première année du dernier né de la fondation Wikimédia, mais pas le moins actif. Il est destiné à fournir une source commune de données objectives, telles que les dates de naissance ou bien le PIB des pays, qui pourront être utilisées dans tous les articles des différentes versions linguistiques de Wikipédia, une mise à jour de Wikidata pouvant être alors répercutée automatiquement sur l'ensemble des Wikipédias en différentes langues. Un lien sur la page communautaire du wiki Wikidata dédié à l'anniversaire, avec les traditionnelles auto-congratulations de la communauté (faudrait pas s'en priver), mais aussi des liens vers des commentaires sur l'état du projet, forces, faiblesse et accomplissement que je trouve pour ma part assez justes.

un logo pour l'événement

Les bilans à l'issue de cette première année sont plutôt positifs, le projet a attiré des nouveaux contributeurs qui n'avaient jamais contribués à un projet Wikimedia, entre autre, et le projet semble s'inscrire dans la durée étant donné les différentes statistiques et chiffres (nombre d'items, d'éditions, croissance des affirmations) même si il reste encore finalement à un stade préliminaire: le développement du logiciel Wikibase a pris du retard par rapport aux prévisions, et il manque encore quelques pièces essentielles pour que le projet prenne l'ampleur qu'on peut lui souhaiter. Denny, l'un des initiateurs, a quitté (amicalement) la fondation pour rejoindre Google sans avoir terminé le plan initial, mais le développement se poursuit activement avec l'équipe actuelle, merci à lui.

Du bon et du un peu décevant, mais le plus important est que le projet continue et semble promis à un bel avenir.

NdM : merci à Thomas Douillard pour son journal.

Wikidata : Wikipedia comme une base de données

Posté par . Édité par baud123, tape, Xavier Claude, cjlano, jihele, Florent Zara et Thomas Debesse. Modéré par patrick_g. Licence CC by-sa
55
13
avr.
2012
Open Data

La mode est à l'Opendata. L'État français a ainsi ouvert son portail et c'est loin d'être le seul exemple. Des téraoctets de données sont ainsi disponibles sur le web. Il serait criminel de laisser ces données moisir quand on n'a jamais eu autant de puissance de calcul pour les exploiter.

Exploiter ces données peut cependant devenir assez casse-tête dès qu'on veut le faire automatiquement (ce qui est parfois indispensable vu le volume). En prenant un exemple de fichier sur data.gouv.fr, on peut voir que les données sont organisées sur le classeur de tableur, de manière pas forcément homogènes (les années sont classées dans les onglets, la description de l'étude est mélangée dans le même document). Elles sont presque plus organisées pour être lues par un humain que pour être exploitées.

Un de ces gigantesques dépôts de données plus ou moins organisés est Wikipédia. Les données sont organisées sous forme de pages, de catégories, d'infobox, mais pas forcément exploitables facilement automatiquement. Des projets issus du monde du Web Sémantique le font cependant, comme par exemple dbpedia dont voici la page concernant la France, qui permettent d'organiser ces données sous forme plus facilement exploitable par la machine et les programmeurs.

Il n'a pas échappé à certains membres de la communauté wikipedia qu'on pouvait faire beaucoup mieux en n'extrayant plus seulement les données à partir de wikipedia mais en mettant une base de données au cœur de Wikipedia et Mediawiki … C'est ainsi qu'est né le projet Wikidata et ça promet d'être une étape importante pour l'encyclopédie, mais pas que.