John Conway n’avait plus assez de cases noires dans son voisinage

Posté par  . Édité par Benoît Sibaud et bubar🦥. Modéré par ZeroHeure. Licence CC By‑SA.
61
12
avr.
2020
Science

Le célèbre mathématicien créateur du jeu de la vie a été emporté par l’épidémie actuelle. On peut noter toute l’ironie pour l’auteur d’un jeu d’un tel nom, emporté par un contact avec un autre humain, ou peut-être trop de contacts ? Dans le jeu de la vie, une cellule passe de l’état « vivant » (noire) à l’état « mort » (blanc) si elle n’a soit pas assez, soit trop de contacts, avec des cellules vivantes de son voisinage.

Wikidata : Wikipedia comme une base de données

Posté par  . Édité par baud123, claudex, tape, cjlano, Florent Zara, jihele et Thomas Debesse. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
55
13
avr.
2012
Open Data

La mode est à l'Opendata. L'État français a ainsi ouvert son portail et c'est loin d'être le seul exemple. Des téraoctets de données sont ainsi disponibles sur le web. Il serait criminel de laisser ces données moisir quand on n'a jamais eu autant de puissance de calcul pour les exploiter.

Exploiter ces données peut cependant devenir assez casse-tête dès qu'on veut le faire automatiquement (ce qui est parfois indispensable vu le volume). En prenant un exemple de fichier sur data.gouv.fr, on peut voir que les données sont organisées sur le classeur de tableur, de manière pas forcément homogènes (les années sont classées dans les onglets, la description de l'étude est mélangée dans le même document). Elles sont presque plus organisées pour être lues par un humain que pour être exploitées.

Un de ces gigantesques dépôts de données plus ou moins organisés est Wikipédia. Les données sont organisées sous forme de pages, de catégories, d'infobox, mais pas forcément exploitables facilement automatiquement. Des projets issus du monde du Web Sémantique le font cependant, comme par exemple dbpedia dont voici la page concernant la France, qui permettent d'organiser ces données sous forme plus facilement exploitable par la machine et les programmeurs.

Il n'a pas échappé à certains membres de la communauté wikipedia qu'on pouvait faire beaucoup mieux en n'extrayant plus seulement les données à partir de wikipedia mais en mettant une base de données au cœur de Wikipedia et Mediawiki … C'est ainsi qu'est né le projet Wikidata et ça promet d'être une étape importante pour l'encyclopédie, mais pas que.

SPARQL, le SQL du Web, et Linked Data Fragment : le point sur le requêtage du Web

Posté par  . Édité par Davy Defaud, bubar🦥, palm123, Benoît Sibaud et ZeroHeure. Modéré par Nils Ratusznik. Licence CC By‑SA.
Étiquettes :
48
1
jan.
2017
Base de données

« Chère pêche »,

En ce début d'année, il ne me semble pas inutile de faire le pont entre la rétrospective et la perspective, afin de conjuguer l’avenir du Web au présent. :-)

Le but de cette dépêche est de faire un tour d’horizon de technologies permettant de faire des requêtes sur des données structurées : le Web sémantique. Comment il a évolué en dix ou quinze ans et ce qu’il permet de faire. Après une introduction contextuelle et historique, il sera question de Sparql et de linked data fragments, ainsi que de leurs usages en pratique chez Wikimedia Foundation.

Accrochez‐vous à votre fauteuil, il va être question de niveaux d’abstractions, d’enrichissement croisé de données, de manipulation de tables, de la pertinence du choix de RDF par rapport à SQL, des outils utilisés par les contributeurs Wikimedia mis au point par les développeurs du projet et, enfin, des limites actuelles et d’un avenir possible.

Abstract Wikipédia

45
5
sept.
2020
Wikimedia

Tout nouveau projet de la fondation Wikimédia, le premier créé depuis des années, Abstract Wikipédia se propose d’écrire des articles d’encyclopédie une unique fois pour toutes les langues. Il propose la création d’une langue d’écriture « abstraite » munie d’une infrastructure de code de traduction, Wikilambda. Ce dernier projet peut se voir comme une sorte de « Wikipédia du code ».

Wikidata : première bougie

Posté par  . Édité par Florent Zara. Modéré par Pierre Jarillon. Licence CC By‑SA.
Étiquettes :
30
30
oct.
2013
Open Data

Voici passée la première année du dernier né de la fondation Wikimédia, mais pas le moins actif. Il est destiné à fournir une source commune de données objectives, telles que les dates de naissance ou bien le PIB des pays, qui pourront être utilisées dans tous les articles des différentes versions linguistiques de Wikipédia, une mise à jour de Wikidata pouvant être alors répercutée automatiquement sur l'ensemble des Wikipédias en différentes langues. Un lien sur la page communautaire du wiki Wikidata dédié à l'anniversaire, avec les traditionnelles auto-congratulations de la communauté (faudrait pas s'en priver), mais aussi des liens vers des commentaires sur l'état du projet, forces, faiblesse et accomplissement que je trouve pour ma part assez justes.

un logo pour l'événement

Les bilans à l'issue de cette première année sont plutôt positifs, le projet a attiré des nouveaux contributeurs qui n'avaient jamais contribués à un projet Wikimedia, entre autre, et le projet semble s'inscrire dans la durée étant donné les différentes statistiques et chiffres (nombre d'items, d'éditions, croissance des affirmations) même si il reste encore finalement à un stade préliminaire: le développement du logiciel Wikibase a pris du retard par rapport aux prévisions, et il manque encore quelques pièces essentielles pour que le projet prenne l'ampleur qu'on peut lui souhaiter. Denny, l'un des initiateurs, a quitté (amicalement) la fondation pour rejoindre Google sans avoir terminé le plan initial, mais le développement se poursuit activement avec l'équipe actuelle, merci à lui.

Du bon et du un peu décevant, mais le plus important est que le projet continue et semble promis à un bel avenir.

NdM : merci à Thomas Douillard pour son journal.