Libérer les données publiques de leurs formats propriétaires : l'étape 1 de la chasse aux trésors ?

Posté par Teymour le 02 décembre 2010 à 18:50. Modéré par patrick_g.

Étiquettes :

déc.

2010

La chasse aux trésors des données publiques a démarré en grande pompe vendredi dernier à La Cantine. Cette étape 0 était centrée autour de retours d'expériences afin d'évangéliser, notamment des acteurs institutionnels, sur la libération des données publiques.

L'objectif de NosDonnées.fr est de référencer les données publiques libres. Si le droit français et européen est plutôt favorable aux licences libres, le problème vient surtout des formats utilisés par l'administration. De rapides recherches sur Internet montrent que moins de 1% des fichiers contenant potentiellement des données sont fournis sous des formats libres et lorsque c'est le cas ce sont généralement des documents et non des données.

L'étape 1 de la chasse aux données devrait donc se concentrer sur la conversion de documents non "machine readable" vers des formats ouverts de données (CSV, XML...). Le début de cette chasse pourrait être également l'occasion de défis un peu plus techniques, notamment d'agréger des données accessibles uniquement de manière partielle.

Toutes les bonnes volontés motivées pour promouvoir les formats ouverts et rendre accessibles au plus grand nombre les données publiques sont donc les bienvenues pour contribuer au projet NosDonnées.fr !

Aller plus loin

NosDonnees.fr (15 clics)
Le wiki du projet (8 clics)
Bilan de la soirée chasse aux trésors (16 clics)

# Bien

Posté par grondilu le 02 décembre 2010 à 19:47. Évalué à 10.

Personnellement j'accorde beaucoup d'importance à ce genre d'initiatives.

En fait j'ai presque envie de comparer cette démarche à l'adoption du système métrique pendant la révolution française.
- [^] # Commentaire supprimé
  
  Posté par Anonyme le 02 décembre 2010 à 23:00. Évalué à 4.
  
  Ce commentaire a été supprimé par l’équipe de modération.
# comparaison avec data-publica ?

Posté par TBTB le 02 décembre 2010 à 23:38. Évalué à 1.

J'ai du mal a comprendre s'il y a réellement une différence avec ce que l'on peut déjà trouver sur data-publica ?
http://www.data-publica.com/data
- [^] # Re: comparaison avec data-publica ?
  
  Posté par Teymour le 03 décembre 2010 à 01:56. Évalué à 2.
  
  TBTB,
  
  Comme indiqué sur le dernier billet publié sur le site de Regards Citoyens, ce sont deux projets complémentaires un peu à l'image des distributions GNU/Linux. Data publica est un projet initié par des entreprises (à terme peut être un RedHat des données publiques), NosDonnees.fr par une communauté reposant sur des bénévoles (une Debian pour filer la métaphore employée).
  
  Le premier a la chance de profiter de ressources financées et donc de proposer dès son lancement un catalogue déjà bien fourni. Le second parie sur l'investissement d'une communauté qui pourra veiller à qualifier les données comme se préoccuper des aspects de formats et de licences, taches essentielles pour que les données publiques aient un apport durables sur le plan social, démocratique comme économique.
# Comment ?

Posté par H. Guillaume le 03 décembre 2010 à 11:22. Évalué à 1.

Bonjour,
Je voudrais participer, mais comment fait on ?
où ?
Guillaume
- [^] # Re: Comment ?
  
  Posté par mcben le 03 décembre 2010 à 13:06. Évalué à 1.
  
  >Je voudrais participer, mais comment fait on ?
  Je me suis posé la même question, il y a 2 jours. Du coup, voici ce que j'en ai retenu:
  
  Il n'y a pas encore de ML publique. Il faut utiliser IRC pour communiquer avec l'équipe de Regard Citoyen (#RegardCitoyen sur freenode).
  
  Pour [http://www.nosdonnees.fr], la participation est libre, comme un wiki: tu te créés un compte, et tu proposes des données ou des liens vers des données qui peuvent être intéressante. Et les données seront revues, notées, classifiées, par les uns et les autres au fur et à mesure.
  
  Si tu as des idées de données ou d'outils, tu peux également les contacter via leur formulaire de contact.
# framework python

Posté par jmny le 10 décembre 2010 à 00:00. Évalué à 1.

En s'appuyant sur nosdonnees.fr David Larlet est en train d'écrire un "framework" python pour réutiliser et croiser ces données [1].

D'autres projets autours des données (pas forcément publiques, mais c'est en général le but) existent, par exemple Cubicweb [2].

[1] http://www.biologeek.com/django,python,web-semantique/de-lop(...)
[2] http://www.cubicweb.org/

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.