Ubix Linux, le datalab de poche

25
16
mar.
2024
Distribution

Ubix Linux est une distribution Linux libre et open-source dérivée de Debian.

Le nom « Ubix » est la forme contractée de « Ubics », acronyme issu de l'anglais Universal business intelligence computer system. De fait, le principal objectif d'Ubix Linux est d'offrir une plateforme universelle dédiée à l'informatique décisionnelle et à l'analyse des données.

Il s'agit d'une solution verticale, prête à l'emploi, dédiée à la manipulation des données et à la prise de décision. Allégée par conception, elle n'embarque qu'un jeu limité d'outils spécialisés dans ce domaine. Ceux-ci permettent néanmoins de couvrir tous les besoins dont l'acquisition, la transformation, l'analyse et la présentation des données.

Journal Scrapping de notes sur LinuxFR

Posté par  . Licence CC By‑SA.
Étiquettes :
11
1
déc.
2023

Gil Cot ✔ a dit :

Tiens, tu me rappelle un constat que je me suis fait mais que je n’ai pas encore pu vérifier rigoureusement : plus un journal est commenté et moins il est noté, et quand il l’est c’est alors négativement proportionnel aux commentaires…

Je me suis dit que j'allais tester l'ami ChatGPT pour voir si il pouvait me scrapper les notes, le nombre de commentaires, et mettre le tout sur un graph. Je l'ai laissé choisir (…)

Illico Editor : nouveautés depuis 2019

Posté par  . Édité par orfenor, theojouedubanjo et Benoît Sibaud. Modéré par Ysabeau 🧶 🧦. Licence CC By‑SA.
Étiquettes :
34
18
jan.
2021
Base de données

Pour faire court, Illico Editor est un couteau suisse de la qualification de données qui simplifie les opérations de préparation de données : formatage, pivot, croisement, comparaison avec d’autres jeux de données. Il s’utilise à travers une interface web, et n’a pas besoin de serveur.

explorer les données avec Illico

Pour l’installer on se contente de décompresser une archive et d’ouvrir le fichier HTML. L’application est écrite en Javascript et distribuée sous licence GPL. Je présente ici en résumé les nouveautés depuis la précédente dépêche en 2019. J’en profite pour vous souhaiter une excellente année 2021 !

Illico Editor : rétrospective 2017-2018

Posté par  . Édité par Davy Defaud, palm123 et Pierre Jarillon. Modéré par bubar🦥. Licence CC By‑SA.
Étiquettes :
32
8
jan.
2019
JavaScript

En quelques mots, Illico Editor est un couteau suisse de la qualification de données qui :

  • s’adresse à tous et à toutes (pas uniquement à des experts en informatique) ;
  • simplifie le nettoyage de données (corriger, restructurer des données issues d’un tableur, d’une base de données, d’une application métier) ;
  • simplifie leur exploitation (indicateurs statistiques simples ou complexes, lister, filtrer, enrichir ou croiser avec d’autres sources, etc.).

L’application a été entièrement revisitée en 2017 et 2018 pour créer une nouvelle expérience utilisateur…

DoBuKe : une clef USB amorçable orientée données

Posté par  . Édité par Davy Defaud, Xavier Teyssier, BAud, palm123, Benoît Sibaud et bubar🦥. Modéré par Xavier Teyssier. Licence CC By‑SA.
27
23
jan.
2018
Distribution

DoBuKe est une clef USB amorçable, basée sur Xubuntu, orientée données. Elle contient une grande quantité d’outils utiles au la récupération (scraping), au nettoyage et à l’enrichissement de données, à la datavisualisation et à la recherche en sources ouvertes (OSINT).

Ce projet est parti d’un constat de formateur : dans la plupart des lieux où j’enseigne, les machines sont gérées par un administrateur qui voit souvent d’un mauvais œil l’installation de logiciels non prévus à son palier technique.
Parfois, il n’y a aucune machine dédiée à la formation, et les stagiaires viennent alors avec leur machine personnelle. Dans ce cas, le formateur doit gérer une situation complexe, avec un parc hétérogène : système d’exploitation, mais aussi version logicielle. Et travailler avec des machines virtuelles (VM) n’est pas toujours possible.
Enfin, il peut arriver de vouloir traiter un jeu de données en mobilité ou en vacances, depuis une machine qui ne nous appartient pas (le PC de maman ou un cybercafé…) et réinstaller rapidement son environnement de travail peut s’avérer très compliqué et contre‐productif.
C’est là qu’intervient DoBuKe.

DoBuKe : distribution GNU/Linux amorçable sur clef USB orientée données

Oui, Illico !

Posté par  . Édité par ZeroHeure, Nils Ratusznik, Nÿco, Davy Defaud, Xavier Teyssier, Benoît Sibaud, Anonyme et palm123. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
37
10
avr.
2017
JavaScript

Toute ressemblance avec des personnes existantes ou ayant existé est purement fortuite.
> Dis Arnaud, tu n’aurais pas un outil magique pour m’aider à nettoyer mes données et m’éviter d’y passer ma journée ma soirée mon week‐end ? :(
> Si, Illico !

En très court, Illico propose un catalogue de fonctionnalités prêtes à l’emploi, génériques (paramétrables) pour améliorer la qualité des données.

Et en une minute, Illico, c’est quoi ?

Illico Editor est un couteau suisse de la qualification de données, en JS/HTML, publié sous licence GPL v3. L’outil s’adresse à tous et toutes (et pas uniquement à des expert·e·s informatiques) et permet de manipuler, corriger, re‐structurer des données en quelques clics. Par exemple, des données issues d’un tableur, d’une base de données, d’une application métier, etc., que l’on souhaite corriger ou pour lesquelles on souhaite établir des indicateurs statistiques simples ou complexes, lister et filtrer ces données, les enrichir avec d’autres sources, etc.

Journal Faire des graphiques à partir de données : comparaison

18
17
mai
2015

Bon dimanche à tous !

Tracer des graphiques, je l'ai fait à la main à l'école, comme tous je suppose. Aujourd'hui, l'ordinateur s'en charge bien mieux. Enfin, c'est ce qu'on pourrait penser, mais je trouve que ce n'est pas si bien que ça en fait.

Je vous propose donc une petite comparaison pour créer le même graphique de plusieurs manières différentes : Libreoffice Calc, Calligra Sheets, Gnumeric et à la main (Python/Pandas).

L'idée étant de voir le résultat par défaut obtenu (…)

Journal Colortest.it - simuler le daltonisme avec des filtres CSS SVG

Posté par  (site web personnel) . Licence CC By‑SA.
71
5
déc.
2014

Chers et chères camarades, trichromates ou pas, bonsoir,

Depuis assez longtemps je cherche un moyen de tester l'accessibilité de sites ou de graphiques aux daltoniens. Il existe un certain nombre de sites qui proposent ce genre de service, mais aucun qui m'ait convaincu. J'avais déjà tenté de mettre en place moi-même un tel service il y a des années, mais les technologies du web ne permettaient pas à l'époque de faire ce la. Les choses ont changé aujourd'hui, en particulier (…)

Sixième rendez-vous Python nantais mardi 18 novembre 2014

Posté par  . Édité par Nils Ratusznik, palm123 et Benoît Sibaud. Modéré par Benoît Sibaud. Licence CC By‑SA.
8
12
nov.
2014
Python

Le sixième rendez-vous pour amateurs du langage Python (ou curieux de la bête) aura lieu le 18 novembre à partir de 19h à la Cantine du numérique de Nantes (11 Impasse Juton, 44000 Nantes).

Nous vous proposerons deux présentations :

  • IPython & dataviz : quand on pense cartographie, certains pensent logiciels bureautiques, d'autres en ligne, ici nous montrerons qu'il existe d'autres voies en particulier pour l'analyse de données. Ainsi, nous vous proposons de voir l'utilisation de IPython pour découvrir des données et les cartographier. Nous pourrons ainsi introduire quelques bibliothèques pour l'analyse statistique, la manipulation de données et les représentation cartographiques.
  • Pelican : à contre-courant des frameworks web « full-stack », complexes et lourds, se trouve Pelican, et les générateurs de sites statiques. Pourquoi opter pour une approche si minimaliste ? Que peut-on en tirer ? Découvrez l’utilisation de Pelican, ses forces, ses limites, et comment les contourner.

Vous êtes bienvenus !

GeoCamp à Lyon le 28 novembre 2013

Posté par  (site web personnel) . Édité par Benoît Sibaud, claudex et palm123. Modéré par claudex. Licence CC By‑SA.
8
13
nov.
2013
Communauté

C'est confirmé, le premier GeoCamp Lyon, événement OSGeo-fr, aura lieu le 28 novembre 2013 à l'Antre Autre à Lyon. Rendez vous à 19h30 pour échanger autour d'un verre de tous les sujets liés à la géomatique.

Vous aimez les cartes, vous utilisez la géolocalisation, vous avez un GPS, vous voulez savoir ce qu'est une base de données spatiales, vous êtes contributeurs OpenStreetMap, vous rêvez de piloter un satellite, vous codez avec Mapnik et OpenLayers… Venez en parler !

Ce premier rendez-vous sera très informel, les suivants seront certainement plus orientés "barcamp", nous aurons l'occasion d'en discuter. Si vous souhaitez proposer des choses pour cet événement ou les suivants, n'hésitez pas à éditer cette page :
http://wiki.osgeo.org/wiki/GeoCamp_Lyon

L'inscription n'est pas obligatoire, mais recommandée afin de prévoir l'affluence:
https://www.eventbrite.fr/event/9010772463

Merci de relayer cette information dans tous les milieux Geo-carto-geeko-datavizo-sigistes !

Journal DLFP journalyser 2.1 : rester au top

Posté par  (site web personnel) . Licence CC By‑SA.
13
11
nov.
2013

En attendant mercredi, je tiens à noter que mon dernier journal [7] est resté en haut de l'affiche pendant plus de 24h (mon précédent record personnel étant d'un peu plus de 21h). Un privilège partagé par moins de 0,7% des journaux.

On est cependant loin du record de près de 72h des manchots homosexuels [0] mais vu que le site était vraisemblablement en train de ramasser ses dents pendant tout le weekend concerné [1], je pense qu'on peut les disqualifier. (…)

Journal DLFP journalyser 2.0 : pas de veille techologique le weekend

Posté par  (site web personnel) . Licence CC By‑SA.
21
9
nov.
2013

Depuis bien longtemps, la question que tout le monde se pose a été « quelle est le meilleur jour pour poster un journal ? ». Grâce à la Technologie, cette question n'en n'est plus une.

En reprenant le vieux journals.pl [0] qui sert à tout, un poil de shell/awk et les journaux compris entre le 14/10/02 et 11/11/12 que j'avais déjà récupérés l'autre fois, on obtient un truc ainsi :

$ ./journals.pl  journals/* | while read score comments time url ;do echo
(…)

Journal Rapport signal bruit et filtre passe-haut

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
12
31
mai
2013

Sommaire

< Krunch> grima: tu as encore le temps de lire dlfp toi ?
< grima> avec un mois de retard souvent et je lis que les truc vraiment inter^W^W^Wplus gros trolls
< Krunch> en considérant que les gros trolls font 90% du contenu en terme de texte je suis pas sûr que tu gagnes du temps
< Krunch> oh oui, faudrait que je compte combien de mots il y a dans les commentaires
(…)