Hackathon IA & Droit — Village de la legaltech du Paris Open Source Summit

Posté par Open Law . Édité par Davy Defaud, ZeroHeure, Benoît Sibaud et Nÿco. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
14
30
nov.
2017
Justice

Le 7 décembre 2017 aura lieu le hackathon de clôture du programme [Open Law] IA & droit — données d’apprentissage.

Lors des six derniers mois, magistrats, avocats et juristes de l’association Open Law* Le droit ouvert, dont la démarche est résolument orientée sur la production de ressources ouvertes, ont travaillé d’arrache‐pied pour créer un jeu de données de Natural Language Processing (NLP) en langue française. Dans ce jeu, chaque paragraphe de plusieurs centaines de décisions de justice récentes a été typé à la main parmi plus de trente catégories (parties, avocats, magistrats, référence de la décision attaquée, exposé des faits et de la procédure, règle de droit applicable, argumentation du juge, solution…) avec le logiciel libre Brat. L’objet de ce jeu de données, publié sous licence ODbL, est de permettre d’apprendre par machine learning à reconnaître la structure d’une décision de justice.

Le jeu de données pourra être exploité grâce des algorithmes libres comme notamment à XGBoost. Quant aux développements logiciels, le parser original étant en Scala-Xml, ils feront appel à des compétences en R, Python ou Scala.

Cet événement est organisé pour faire se rencontrer juristes et développeurs. Les participants au hackathon sont invités à prolonger le travail du barcamp du 7 novembre pour réfléchir à la conception de cas d’usage concrets pour ce jeu de données. Pour ce faire, ils pourront s’inspirer des cas d’usage ayant émergé ce jour là, dont voici quelques exemples :

  • regrouper les décisions ayant le même fondement juridique ;
  • trier le flux des pourvois pour attribution aux chambres de la Cour de cassation ;
  • améliorer la lisibilité des décisions aux citoyens et simplifier l’affichage des décisions ;
  • fournir des statistiques judiciaires sur les parties ;
  • créer des études d’impact pour le législateur (état de la jurisprudence relative à un texte donné).

Un travail d’analyse de la faisabilité et des enjeux éthiques de chaque projet sera mené en début d’après‐midi. Le hackathon se terminera par une séance de présentation des projets, qui pourront alimenter la feuille de route Intelligence Artificielle d’Open Law pour 2018.

À l’issue de cette séance de pitches, M. Cédric Villani, en charge d’un rapport parlementaire sur l’intelligence artificielle, interviendra pour nous éclairer sur le sujet et introduire une table ronde où les porteurs du projet IA & droit restitueront leur travail sous l’angle de l’évaluation scientifique et éthique de la constitution d’un jeu de données d’apprentissage.

Le programme :

  • 9 h : accueil des participants ;
  • 9 h 30 : présentation du jeu de données ;
  • 10 h : constitution des équipes autour des différents sujets ;
  • 13 h : pause déjeuner ;
  • 14 h : reconstitution des workshops — faisabilité et enjeux éthiques ;
  • 16 h : pitches ;
  • 16 h 30 : tribune de Cédric Villani ;
  • 17 h : restitution du programme IA & droit — données d’apprentissage par Camille Le Douaron ;
  • 17 h 30 : table ronde sur les enjeux éthiques et méthodologiques de la constitution de données d’apprentissage — participants à confirmer.

Pour participer : inscription sur meet-up ou sur place au Paris Open Source Summit.

L’équipe Open Law espère vous retrouver nombreux !

Aller plus loin

  • # Vous êtes qui ?

    Posté par  (site web personnel) . Évalué à 6.

    Cela fait plusieurs news qui passe sur "open law", mais on ne sait toujours pas qui vous êtes, qui vous finances (axa ?), et où sont vos logiciels libres ou jeu de donnés libres.

    Je vois bien l’intérêt d'une formalisation du droit et les usages possibles de ce genre de code. Mais l'association ne ressemble pas du tout à une asso typique du libre. Il serait donc bien de vous présentez sachant qu'en général, ceux qui font un truc qui "ressemble" au libre font surtout du "free washing", comme à l'époque des "sources ouvertes".

    "La première sécurité est la liberté"

    • [^] # Re: Vous êtes qui ?

      Posté par  . Évalué à 3. Dernière modification le 14 décembre 2017 à 16:38.

      C'est vrai qu'il manque une présentation c'est très juste. Open Law est une association loi 1901 qui œuvre sur la transformation numérique des pratiques du droit. Le droit au service du numérique et le numérique au service du droit (réciproquement). L'idée est d'accompagner l'innovation juridique sur un modèle de développement ouvert et d'appliquer les méthodes de l'open source au sein de ce secteur.

      Tous les livrables de l'association sont publiés sous des licences ouvertes, par exemple : http://openlaw.fr/sites/default/files/2017-05/Livret_blanc_interactif21_04_0.pdf. Je vous invite à fouiller le site openlaw.fr pour trouver d'autres ressources ouvertes issues des différents programmes (encore d'autres sont à venir sur une page dédiée du site bientôt disponibles, car les programmes viennent d'être restitués au POSS). En ce qui concerne les logiciels, l'association n'en a pas encore créé (bien que dans le programme IA & Droit Brat ait été adapté aux spécificités des catégories juridiques), mais est tout à fait ouverte aux développeurs car le projet est de faire se connaître juristes et techniciens de l'open source.

      En ce qui concerne les financements, il est ouvert à tous les acteurs du droit qui souhaitent s'ouvrir à ces modèles de développement dans le cadre de leur transformation numérique (Axa protection juridique fait en effet partie de nos membres) au prorata des effectifs et du CA de la structure.

      Pour mieux connaître l'association vous pouvez également consulter les publications de son président (Benjamin Jean) : https://framabook.org/optionlibre-dubonusagedeslicenceslibres/

      • [^] # Re: Vous êtes qui ?

        Posté par  (site web personnel) . Évalué à 3. Dernière modification le 14 décembre 2017 à 16:32.

        Pour compléter la réponse de Cyril, la plupart de nos contributions se font upstream (plus récemment pour DemocracyOS & Discourse, mais on l'avait fait aussi sur d'autres outils plus "métiers" en matière d'ontologie ou de semantic web).

        Concernant IA & Droit, quelques éléments :

        • licence pour le code produit : MIT (par principe, d'autres seraient possibles)
        • licence pour le dataset : ODbL
        • distribution : Github & bientôt Framagit
        • logiciel de taggage est brat (OS) et le format de fichier des annotations est brat mais pour le learning chacun fait ce qu'il veut
        • langage : non défini, mais entre Python ou Scala (le parser est en Scala des XML)
        • algorithme prévu : une baseline avec fasttext (Facebook) mais pas exhaustif…

        Donc oui, on fait un maximum d'Open Source/Logiciel Libre (et notre charte le dit !), mais plus comme étant la solution naturelle qu'une fin en soi. À savoir qu'on aimerait l'année prochaine développer la BDD et, surtout, les usages et techno Open Source l'utilisant.

        Ensuite, concernant le financement, nous sommes sur un financement pour partie attaché aux adhésions de personnes morales (une grande partie des postes des deux permanents est ainsi assurée—étant entendu que tous les résultats restent ouverts et que cela ne confère à personne la possibilité de s'approprier nos actions) et pour partie par programme (sur certains programmes, lorsqu'un budget est nécessaire, on réunit des partenaires pour mutualiser ces investissements). On vient par ailleurs de mettre en place un fond de dotation pour flécher directement des donations/mécénats vers des projets d'intérêt général.

        Voir notamment le site http://openlaw.fr et plus spécifiquement notre page consacrée sur laquelle sont notamment publiés nos statuts (les PV de CA figurent aussi sur site).

        • [^] # Re: Vous êtes qui ?

          Posté par  (site web personnel) . Évalué à 4.

          Pour creuser jusqu'au bout : quel est l’intérêt des personnes morales de vous financer ?

          Google finance la Linux fondation, car il a intérêt à avoir un OS, le meilleur possible. Google finançait mozilla pour contrer IE, et mettre son moteur de recherche en avant.

          "La première sécurité est la liberté"

        • [^] # Re: Vous êtes qui ?

          Posté par  (site web personnel) . Évalué à 3.

          Avez-vous pensez à contacter l'association "regards citoyen" ou la quadrature du net habitué a faire des outils de crowd sourcing, Le votre semble complexe à prendre en main (compte un peu bidon, url en forme d'ip, etc…).

          "La première sécurité est la liberté"

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.