Lien Microsoft R Open: The Enhanced R Distribution

Lors des six derniers mois, magistrats, avocats et juristes de l’association Open Law, dont la démarche est résolument orientée sur la production de ressources ouvertes, ont travaillé d’arrache‐pied pour créer un jeu de données de Natural Language Processing (NLP) en langue française.
Le 7 novembre prochain au Square, un événement est organisé pour faire se rencontrer juristes et développeurs afin de déterminer des cas d’usage concrets pour ce jeu de données. Affichage du plan des décisions, recherche ciblée dans la jurisprudence, extraction d’informations précises, outils de justice prédictive… Quels usages et quels services peuvent être créés grâce à ce jeu de données ? Telle est la problématique qui sera mise à l’honneur à l’occasion de ce prochain rendez‐vous, au cours duquel nous définirons ensemble les défis qui seront portés le 7 décembre prochain lors du Hackathon I. A. & Droit organisé dans le cadre du Paris Open Source Summit.
Date et lieu :
Bonjour à tous,
La collection Framabook (projet Framasoft) ne s'arrête pas ! Cette fois, nous proposons un ouvrage d'initiation au logiciel libre R appliqué à l'analyse géographique.
Pourquoi un tel ouvrage ? D'abord parce que R est un logiciel libre (issu du projet GNU) possédant sans doute un des plus larges éventail de fonctionnalités tant ses contributeurs l'enrichissent depuis plus de 15 ans.
Le livre R et espace est une illustration des nombreux domaines dans lesquels R peut être appliqué.
À l'occasion de la sortie de la version 0.13, je vous présente cette bibliothèque basée sur Python qui permet de travailler simplement et efficacement avec des données structurées. Jusqu'à présent, les versions se sont enchaînées rapidement mais celle-ci arrive plusieurs mois après la précédente. On peut donc espérer qu'un code développé pour cette nouvelle version demandera moins de maintenance.
Les principales possibilités sont :
Pour peu que les données soient correctement formatées, pandas peut s'en sortir même dans le cas où la quantité dépasse les capacités de votre machine en traitant les sources morceaux par morceaux.
Le développement de cette bibliothèque s'inscrit dans la problématique de disposer d'outils pour manipuler de gros volumes de données dans le but de leur exploitation scientifique ou commerciale.
Note : pandas fonctionne avec la même base de code sur Python 2 et 3 mais ce n'est, peut-être, pas le cas de toutes les dépendances.