Wikidata : Wikipedia comme une base de données

Posté par  . Édité par baud123, claudex, tape, cjlano, Florent Zara, jihele et Thomas Debesse. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
55
13
avr.
2012
Open Data

La mode est à l'Opendata. L'État français a ainsi ouvert son portail et c'est loin d'être le seul exemple. Des téraoctets de données sont ainsi disponibles sur le web. Il serait criminel de laisser ces données moisir quand on n'a jamais eu autant de puissance de calcul pour les exploiter.

Exploiter ces données peut cependant devenir assez casse-tête dès qu'on veut le faire automatiquement (ce qui est parfois indispensable vu le volume). En prenant un exemple de fichier sur data.gouv.fr, on peut voir que les données sont organisées sur le classeur de tableur, de manière pas forcément homogènes (les années sont classées dans les onglets, la description de l'étude est mélangée dans le même document). Elles sont presque plus organisées pour être lues par un humain que pour être exploitées.

Un de ces gigantesques dépôts de données plus ou moins organisés est Wikipédia. Les données sont organisées sous forme de pages, de catégories, d'infobox, mais pas forcément exploitables facilement automatiquement. Des projets issus du monde du Web Sémantique le font cependant, comme par exemple dbpedia dont voici la page concernant la France, qui permettent d'organiser ces données sous forme plus facilement exploitable par la machine et les programmeurs.

Il n'a pas échappé à certains membres de la communauté wikipedia qu'on pouvait faire beaucoup mieux en n'extrayant plus seulement les données à partir de wikipedia mais en mettant une base de données au cœur de Wikipedia et Mediawiki … C'est ainsi qu'est né le projet Wikidata et ça promet d'être une étape importante pour l'encyclopédie, mais pas que.

SPARQL, le SQL du Web, et Linked Data Fragment : le point sur le requêtage du Web

Posté par  . Édité par Davy Defaud, bubar🦥, palm123, Benoît Sibaud et ZeroHeure. Modéré par Nils Ratusznik. Licence CC By‑SA.
Étiquettes :
48
1
jan.
2017
Base de données

« Chère pêche »,

En ce début d'année, il ne me semble pas inutile de faire le pont entre la rétrospective et la perspective, afin de conjuguer l’avenir du Web au présent. :-)

Le but de cette dépêche est de faire un tour d’horizon de technologies permettant de faire des requêtes sur des données structurées : le Web sémantique. Comment il a évolué en dix ou quinze ans et ce qu’il permet de faire. Après une introduction contextuelle et historique, il sera question de Sparql et de linked data fragments, ainsi que de leurs usages en pratique chez Wikimedia Foundation.

Accrochez‐vous à votre fauteuil, il va être question de niveaux d’abstractions, d’enrichissement croisé de données, de manipulation de tables, de la pertinence du choix de RDF par rapport à SQL, des outils utilisés par les contributeurs Wikimedia mis au point par les développeurs du projet et, enfin, des limites actuelles et d’un avenir possible.

Wikipédia : vingt ans déjà !

Posté par  (site web personnel, Mastodon) . Édité par Benoît Sibaud, Jona et bubar🦥. Modéré par Benoît Sibaud. Licence CC By‑SA.
47
15
jan.
2021
Wikimedia

L’encyclopédie en ligne vient de fêter ses vingt ans. Vingt années au cours desquelles elle est passée de source douteuse à incontournable. Elle a aussi inspiré d’autres projets comme l’encyclopédie des 8 — 13 ans Vikidia.

À certains égards, Wikipédia avec tous ses projets frères font penser à l'Encyclopedia Galactica d’Asimov qui aurait sans doute adoré le projet.

Sans vraiment revenir sur l’histoire de l’encyclopédie, traitée dans la revue de presse, on verra qu’on peut tout de même la suivre au travers des contenus de LinuxFr.org, on découvrira aussi, peut-être, que le thème « vingt ans » est abordé dans plus d’une page de l’encyclopédie. Pour finir, après le rappel des projets de la galaxie Wikimédia, quelques façons d’utiliser l’encyclopédie. Peut-être les connaissez-vous, peut-être en connaissez-vous d’autres, n’hésitez surtout pas à les faire partager.

logo

Abstract Wikipédia

45
5
sept.
2020
Wikimedia

Tout nouveau projet de la fondation Wikimédia, le premier créé depuis des années, Abstract Wikipédia se propose d’écrire des articles d’encyclopédie une unique fois pour toutes les langues. Il propose la création d’une langue d’écriture « abstraite » munie d’une infrastructure de code de traduction, Wikilambda. Ce dernier projet peut se voir comme une sorte de « Wikipédia du code ».

Wikidata fête ses 4 ans

Posté par  (site web personnel) . Édité par Davy Defaud, M5oul et ZeroHeure. Modéré par bubar🦥. Licence CC By‑SA.
37
29
oct.
2016
Wikimedia

Wikidata est une base de connaissances, structurée, multilingue et libre. C’est un projet frère de Wikipédia, développé par Wikimedia Deutschland et hébergé par la Wikimedia Foundation. Le but est de centraliser les connaissances sourcées et utiles aux projets Wikimedia. Le projet fête son quatrième anniversaire le 29 octobre 2016.

Logo Wikidata anniversaire

Les Geek Faëries se font squatter par les libristes

36
28
mai
2018
Communauté

Plusieurs associations de libristes participeront au Village du Libre qui aura lieu pendant les Geek Faëries dans le château de Selles‐sur‐Cher du 1er au 3 juin 2018.

Les Geek Faëries IRL, c’est quoi ?

C’est un voyage vers une contrée lointaine, à préparer bien à l’avance pour pouvoir réellement vivre en immersion et en costume pendant deux jours et deux nuits. Sinon, c’est dans un château au bord de l’eau avec des grenouilles ! On n’y vient pas par hasard.
Entre les rôlistes, les fans d’Harry Potter, de pop art, les cinéastes, etc, beaucoup de sujets pour refaire le monde !

Le Village du Libre

Il se tiendra les 2 et 3 juin, est un lieu de rencontre et de discussions avec de nombreuses personnes représentantes ou issues du monde du libre francophone. Dans cet espace, vous pourrez discuter du libre, poser vos questions, mais aussi participer à des ateliers participatifs ou à des démonstrations de l’utilisation de certains systèmes ou logiciels.
Les associations présentes : Framasoft, April, Parinux, Mozilla, LILA, la Quadrature du Net, Picasoft et les GULL du coin (solix et blogul). Mais aussi et pour la première fois : TDN, Wikimedia, Ubuntu-Fr, Debian, exodus privacy, Rolisteam et Musique Libre.

Les conférences du Mind Palace

Bookynette était en charge du programme et vous a concocté plein de moments fantastiques décrits en seconde partie de la dépêche).

Wikipédia a soufflé ses 15 bougies

Posté par  (site web personnel) . Édité par Davy Defaud, Lucas, j, Nÿco et M5oul. Modéré par bubar🦥. Licence CC By‑SA.
34
2
fév.
2016
Wikimedia

L’encyclopédie collaborative libre Wikipédia a fêté ses 15 ans mi‐janvier. Forte de cinq millions d’articles en anglais, de dix autres langues avec plus d’un million d’articles chacune (dont l’allemand avec 1,8 millions et le français avec 1,7 millions) et globalement plus de 35 millions de pages en 291 langues, ce recueil d’informations et de connaissances, tour à tour adulé et décrié, devenu L’encyclopédie, poursuit son chemin. 28 % des Terriens n’ont jamais connu un monde sans ce commun informationnel (source Fondation Wikimédia).

Wikipédia

Interview de Bastien Guerry, référent logiciels libres à la DINSIC

Posté par  (site web personnel, Mastodon) . Édité par Davy Defaud et ZeroHeure. Modéré par ZeroHeure. Licence CC By‑SA.
33
3
juin
2019
Communauté

Bastien Guerry est, depuis décembre 2018, le référent logiciels libres de la DINSIC (Direction interministérielle du Numérique et du Système d’Information et de Communication de l’État), une direction placée sous l’autorité du Premier ministre, qu’on surnomme aussi la DSI (direction des services informatiques) de l’État. S’il est connu dans le milieu du logiciel libre, certains et certaines ont pu découvrir son nom lors de la publication du SILL 2019. Mais, ses missions ne se limitent pas à cela. Son logiciel libre préféré va, peut‐être, vous étonner.

Journal Hiérarchie de donnée et système de fichier : monter Wikidata grâce à Fuse

Posté par  . Licence CC By‑SA.
31
30
oct.
2018

C’est le sixième anniversaire de Wikidata, la base de donnée de Wikipédia. Dans les cadeaux d’anniversaires j’ai noté un truc rigolo en rapport avec l’os-dont-le-nom-a-donné-le-nom-du-site : wdfs.

Cet outil permet d’accéder aux données Wikidata à la mode Unix, sous forme de fichier. Les hiérarchie de classe Wikidata donnent une hiérarchie de sous-dossier. On peut choisir la langue des noms des fichiers et des dossiers, par exemple la-langue-dont-le-nom-a-donné-le-nom-du-site. Les noms sont donnés par les libellés des éléments Wikidata (…)

Forges logicielles et hébergement de projets libres

30
26
juil.
2018
Communauté

Une forge logicielle est un outil qui permet de travailler et collaborer autour d’un projet logiciel.

Elle comporte généralement un gestionnaire de code source, un visualiseur de code source, une gestion des droits d’accès, un gestionnaire de tickets, un espace de rédaction (wiki…) et des fonctionnalités de gestion de projet.

Wikidata : première bougie

Posté par  . Édité par Florent Zara. Modéré par Pierre Jarillon. Licence CC By‑SA.
Étiquettes :
30
30
oct.
2013
Open Data

Voici passée la première année du dernier né de la fondation Wikimédia, mais pas le moins actif. Il est destiné à fournir une source commune de données objectives, telles que les dates de naissance ou bien le PIB des pays, qui pourront être utilisées dans tous les articles des différentes versions linguistiques de Wikipédia, une mise à jour de Wikidata pouvant être alors répercutée automatiquement sur l'ensemble des Wikipédias en différentes langues. Un lien sur la page communautaire du wiki Wikidata dédié à l'anniversaire, avec les traditionnelles auto-congratulations de la communauté (faudrait pas s'en priver), mais aussi des liens vers des commentaires sur l'état du projet, forces, faiblesse et accomplissement que je trouve pour ma part assez justes.

un logo pour l'événement

Les bilans à l'issue de cette première année sont plutôt positifs, le projet a attiré des nouveaux contributeurs qui n'avaient jamais contribués à un projet Wikimedia, entre autre, et le projet semble s'inscrire dans la durée étant donné les différentes statistiques et chiffres (nombre d'items, d'éditions, croissance des affirmations) même si il reste encore finalement à un stade préliminaire: le développement du logiciel Wikibase a pris du retard par rapport aux prévisions, et il manque encore quelques pièces essentielles pour que le projet prenne l'ampleur qu'on peut lui souhaiter. Denny, l'un des initiateurs, a quitté (amicalement) la fondation pour rejoindre Google sans avoir terminé le plan initial, mais le développement se poursuit activement avec l'équipe actuelle, merci à lui.

Du bon et du un peu décevant, mais le plus important est que le projet continue et semble promis à un bel avenir.

NdM : merci à Thomas Douillard pour son journal.

Journal Wikidata: The Game

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
27
12
juin
2014

Vous voulez améliorer l'encyclopédie libre, mais vous ne savez pas écrire, ou vous avez peur de vous faire effacer ?

Wikidata fait communiquer les wikipédias de différentes langues, pour que par exemple l'enclopédie francophone puisse profiter des années de naissance de tous les samurais présent dans l'encyclopédie japonophone.

Le jeu Wikidata aide à combler les relations manquantes entre articles de différentes langues, et donc profite à toutes les wikipédias. C'est assez fun ! :-)

  • Reconnaissez si Article1 en espagnol parle de la (…)

Journal Wikifunctions est le nouveau projet de le fondation Wikimedia, un wiki de fonctions éditables par

Posté par  . Licence CC By‑SA.
25
27
juil.
2023

Ce journal a d’abord été posté en lien, mais à la demande générale des commentaire …

Wikifunctions (ancien nom de code : Wikilambda) est le nouveau projet de le fondation Wikimedia, un wiki de fonctions, au sens informatico-mathématique du terme, éditables par tout un chacun, avec des implémentations dans plusieurs langages de programmation, que tout le monde peut écrire et appelable/exécutable avec une API publique.

Conçu pour servir d’infrastructure au projet Abstract Wikipedia (Présentation ici), un (…)

Journal L'état de Wikidata (Avril 2015) - 3 ans de développement

25
12
avr.
2015

Nalut.

Extrait non exhaustif et choix totalement contingent d'informations sur Wikidata triés par la méthode du vrac:

  • Wikidata a fêté ses 3 ans - (ne le dites à personne, ce projet est un poisson d'Avril)
  • Le fichier VIAF, qui fédère les données des bibliothèques du monde entier et qui fournit des identifiants pour les auteurs des livres qui paraissent, par exemple, approfondi sa collaboration avec Wikimédia en utilisant les identifiants Wikidata à la place des titres d'articles de la (…)

Journal Chroniques de Wikidata : Évitez le fork, cherchez le Join !

Posté par  . Licence CC By‑SA.
20
15
sept.
2015

On a traduit la lettre d'information hebdomadaire de Wikidata sur Wikipédia, qui est particulièrement riche cette semaine et, ça donne ça

Un truc a particulièrement attiré mon attention et m'a motivé à écrire ce journal : http://ramiro.org/notebook/us-presidents-causes-of-death/ Je vous laisse jeter un œil.

Les habitués d'ici auront reconnu du iPython, ainsi que du SPARQL, ainsi que du Wikidata. En bref, du libre et du standard de bout en bout. Des données libres générées collaborativement, un point d'accès à ces données (…)