Libérer les données publiques de leurs formats propriétaires : l'étape 1 de la chasse aux trésors ?

Posté par . Modéré par patrick_g.
24
2
déc.
2010
Communauté
La chasse aux trésors des données publiques a démarré en grande pompe vendredi dernier à La Cantine. Cette étape 0 était centrée autour de retours d'expériences afin d'évangéliser, notamment des acteurs institutionnels, sur la libération des données publiques.

L'objectif de NosDonnées.fr est de référencer les données publiques libres. Si le droit français et européen est plutôt favorable aux licences libres, le problème vient surtout des formats utilisés par l'administration. De rapides recherches sur Internet montrent que moins de 1% des fichiers contenant potentiellement des données sont fournis sous des formats libres et lorsque c'est le cas ce sont généralement des documents et non des données.

L'étape 1 de la chasse aux données devrait donc se concentrer sur la conversion de documents non "machine readable" vers des formats ouverts de données (CSV, XML...). Le début de cette chasse pourrait être également l'occasion de défis un peu plus techniques, notamment d'agréger des données accessibles uniquement de manière partielle.

Toutes les bonnes volontés motivées pour promouvoir les formats ouverts et rendre accessibles au plus grand nombre les données publiques sont donc les bienvenues pour contribuer au projet NosDonnées.fr !
  • # Bien

    Posté par . Évalué à 10.

    Personnellement j'accorde beaucoup d'importance à ce genre d'initiatives.

    En fait j'ai presque envie de comparer cette démarche à l'adoption du système métrique pendant la révolution française.
    • [^] # Re: Bien

      Posté par . Évalué à 4.

      C'est d'ailleurs malheureux que ce travail ne soit pas demande par l'INSEE, qui en profiterait certainement énormément.
      Preuve si il en est qu'il n'y a aucune gouvernance, tous ces organismes nous parasitant le poil ne travaillant pas a chercher a optimiser les choses mais a nos parasiter encore plus...
  • # comparaison avec data-publica ?

    Posté par . Évalué à 1.

    J'ai du mal a comprendre s'il y a réellement une différence avec ce que l'on peut déjà trouver sur data-publica ?
    http://www.data-publica.com/data
    • [^] # Re: comparaison avec data-publica ?

      Posté par . Évalué à 2.

      TBTB,

      Comme indiqué sur le dernier billet publié sur le site de Regards Citoyens, ce sont deux projets complémentaires un peu à l'image des distributions GNU/Linux. Data publica est un projet initié par des entreprises (à terme peut être un RedHat des données publiques), NosDonnees.fr par une communauté reposant sur des bénévoles (une Debian pour filer la métaphore employée).

      Le premier a la chance de profiter de ressources financées et donc de proposer dès son lancement un catalogue déjà bien fourni. Le second parie sur l'investissement d'une communauté qui pourra veiller à qualifier les données comme se préoccuper des aspects de formats et de licences, taches essentielles pour que les données publiques aient un apport durables sur le plan social, démocratique comme économique.
  • # Comment ?

    Posté par . Évalué à 1.

    Bonjour,
    Je voudrais participer, mais comment fait on ?
    où ?
    Guillaume
    • [^] # Re: Comment ?

      Posté par . Évalué à 1.

      >Je voudrais participer, mais comment fait on ?
      Je me suis posé la même question, il y a 2 jours. Du coup, voici ce que j'en ai retenu:

      Il n'y a pas encore de ML publique. Il faut utiliser IRC pour communiquer avec l'équipe de Regard Citoyen (#RegardCitoyen sur freenode).

      Pour [http://www.nosdonnees.fr], la participation est libre, comme un wiki: tu te créés un compte, et tu proposes des données ou des liens vers des données qui peuvent être intéressante. Et les données seront revues, notées, classifiées, par les uns et les autres au fur et à mesure.

      Si tu as des idées de données ou d'outils, tu peux également les contacter via leur formulaire de contact.
  • # framework python

    Posté par . Évalué à 1.

    En s'appuyant sur nosdonnees.fr David Larlet est en train d'écrire un "framework" python pour réutiliser et croiser ces données [1].

    D'autres projets autours des données (pas forcément publiques, mais c'est en général le but) existent, par exemple Cubicweb [2].

    [1] http://www.biologeek.com/django,python,web-semantique/de-lop(...)
    [2] http://www.cubicweb.org/

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.