Ubix Linux, le datalab de poche

25
16
mar.
2024
Distribution

Ubix Linux est une distribution Linux libre et open-source dérivée de Debian.

Le nom « Ubix » est la forme contractée de « Ubics », acronyme issu de l'anglais Universal business intelligence computer system. De fait, le principal objectif d'Ubix Linux est d'offrir une plateforme universelle dédiée à l'informatique décisionnelle et à l'analyse des données.

Il s'agit d'une solution verticale, prête à l'emploi, dédiée à la manipulation des données et à la prise de décision. Allégée par conception, elle n'embarque qu'un jeu limité d'outils spécialisés dans ce domaine. Ceux-ci permettent néanmoins de couvrir tous les besoins dont l'acquisition, la transformation, l'analyse et la présentation des données.

Journal Scrapping de notes sur LinuxFR

Posté par  . Licence CC By‑SA.
Étiquettes :
11
1
déc.
2023

Gil Cot ✔ a dit :

Tiens, tu me rappelle un constat que je me suis fait mais que je n’ai pas encore pu vérifier rigoureusement : plus un journal est commenté et moins il est noté, et quand il l’est c’est alors négativement proportionnel aux commentaires…

Je me suis dit que j'allais tester l'ami ChatGPT pour voir si il pouvait me scrapper les notes, le nombre de commentaires, et mettre le tout sur un graph. Je l'ai laissé choisir (…)

Illico Editor : nouveautés depuis 2019

Posté par  . Édité par orfenor, theojouedubanjo et Benoît Sibaud. Modéré par Ysabeau 🧶 🧦. Licence CC By‑SA.
Étiquettes :
34
18
jan.
2021
Base de données

Pour faire court, Illico Editor est un couteau suisse de la qualification de données qui simplifie les opérations de préparation de données : formatage, pivot, croisement, comparaison avec d’autres jeux de données. Il s’utilise à travers une interface web, et n’a pas besoin de serveur.

explorer les données avec Illico

Pour l’installer on se contente de décompresser une archive et d’ouvrir le fichier HTML. L’application est écrite en Javascript et distribuée sous licence GPL. Je présente ici en résumé les nouveautés depuis la précédente dépêche en 2019. J’en profite pour vous souhaiter une excellente année 2021 !

Illico Editor : rétrospective 2017-2018

Posté par  . Édité par Davy Defaud, palm123 et Pierre Jarillon. Modéré par bubar🦥. Licence CC By‑SA.
Étiquettes :
32
8
jan.
2019
JavaScript

En quelques mots, Illico Editor est un couteau suisse de la qualification de données qui :

  • s’adresse à tous et à toutes (pas uniquement à des experts en informatique) ;
  • simplifie le nettoyage de données (corriger, restructurer des données issues d’un tableur, d’une base de données, d’une application métier) ;
  • simplifie leur exploitation (indicateurs statistiques simples ou complexes, lister, filtrer, enrichir ou croiser avec d’autres sources, etc.).

L’application a été entièrement revisitée en 2017 et 2018 pour créer une nouvelle expérience utilisateur…

DoBuKe : une clef USB amorçable orientée données

Posté par  . Édité par Davy Defaud, Xavier Teyssier, BAud, palm123, Benoît Sibaud et bubar🦥. Modéré par Xavier Teyssier. Licence CC By‑SA.
27
23
jan.
2018
Distribution

DoBuKe est une clef USB amorçable, basée sur Xubuntu, orientée données. Elle contient une grande quantité d’outils utiles au la récupération (scraping), au nettoyage et à l’enrichissement de données, à la datavisualisation et à la recherche en sources ouvertes (OSINT).

Ce projet est parti d’un constat de formateur : dans la plupart des lieux où j’enseigne, les machines sont gérées par un administrateur qui voit souvent d’un mauvais œil l’installation de logiciels non prévus à son palier technique.
Parfois, il n’y a aucune machine dédiée à la formation, et les stagiaires viennent alors avec leur machine personnelle. Dans ce cas, le formateur doit gérer une situation complexe, avec un parc hétérogène : système d’exploitation, mais aussi version logicielle. Et travailler avec des machines virtuelles (VM) n’est pas toujours possible.
Enfin, il peut arriver de vouloir traiter un jeu de données en mobilité ou en vacances, depuis une machine qui ne nous appartient pas (le PC de maman ou un cybercafé…) et réinstaller rapidement son environnement de travail peut s’avérer très compliqué et contre‐productif.
C’est là qu’intervient DoBuKe.

DoBuKe : distribution GNU/Linux amorçable sur clef USB orientée données

Oui, Illico !

Posté par  . Édité par ZeroHeure, Nils Ratusznik, Nÿco, Davy Defaud, Xavier Teyssier, Benoît Sibaud, Anonyme et palm123. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
37
10
avr.
2017
JavaScript

Toute ressemblance avec des personnes existantes ou ayant existé est purement fortuite.
> Dis Arnaud, tu n’aurais pas un outil magique pour m’aider à nettoyer mes données et m’éviter d’y passer ma journée ma soirée mon week‐end ? :(
> Si, Illico !

En très court, Illico propose un catalogue de fonctionnalités prêtes à l’emploi, génériques (paramétrables) pour améliorer la qualité des données.

Et en une minute, Illico, c’est quoi ?

Illico Editor est un couteau suisse de la qualification de données, en JS/HTML, publié sous licence GPL v3. L’outil s’adresse à tous et toutes (et pas uniquement à des expert·e·s informatiques) et permet de manipuler, corriger, re‐structurer des données en quelques clics. Par exemple, des données issues d’un tableur, d’une base de données, d’une application métier, etc., que l’on souhaite corriger ou pour lesquelles on souhaite établir des indicateurs statistiques simples ou complexes, lister et filtrer ces données, les enrichir avec d’autres sources, etc.

Journal Faire des graphiques à partir de données : comparaison

18
17
mai
2015

Bon dimanche à tous !

Tracer des graphiques, je l'ai fait à la main à l'école, comme tous je suppose. Aujourd'hui, l'ordinateur s'en charge bien mieux. Enfin, c'est ce qu'on pourrait penser, mais je trouve que ce n'est pas si bien que ça en fait.

Je vous propose donc une petite comparaison pour créer le même graphique de plusieurs manières différentes : Libreoffice Calc, Calligra Sheets, Gnumeric et à la main (Python/Pandas).

L'idée étant de voir le résultat par défaut obtenu (…)

Journal Colortest.it - simuler le daltonisme avec des filtres CSS SVG

Posté par  (site web personnel) . Licence CC By‑SA.
71
5
déc.
2014

Chers et chères camarades, trichromates ou pas, bonsoir,

Depuis assez longtemps je cherche un moyen de tester l'accessibilité de sites ou de graphiques aux daltoniens. Il existe un certain nombre de sites qui proposent ce genre de service, mais aucun qui m'ait convaincu. J'avais déjà tenté de mettre en place moi-même un tel service il y a des années, mais les technologies du web ne permettaient pas à l'époque de faire ce la. Les choses ont changé aujourd'hui, en particulier (…)

Journal DLFP journalyser 2.1 : rester au top

Posté par  (site web personnel) . Licence CC By‑SA.
13
11
nov.
2013

En attendant mercredi, je tiens à noter que mon dernier journal [7] est resté en haut de l'affiche pendant plus de 24h (mon précédent record personnel étant d'un peu plus de 21h). Un privilège partagé par moins de 0,7% des journaux.

On est cependant loin du record de près de 72h des manchots homosexuels [0] mais vu que le site était vraisemblablement en train de ramasser ses dents pendant tout le weekend concerné [1], je pense qu'on peut les disqualifier. (…)

Journal DLFP journalyser 2.0 : pas de veille techologique le weekend

Posté par  (site web personnel) . Licence CC By‑SA.
21
9
nov.
2013

Depuis bien longtemps, la question que tout le monde se pose a été « quelle est le meilleur jour pour poster un journal ? ». Grâce à la Technologie, cette question n'en n'est plus une.

En reprenant le vieux journals.pl [0] qui sert à tout, un poil de shell/awk et les journaux compris entre le 14/10/02 et 11/11/12 que j'avais déjà récupérés l'autre fois, on obtient un truc ainsi :

$ ./journals.pl  journals/* | while read score comments time url ;do echo
(…)

Journal Rapport signal bruit et filtre passe-haut

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
12
31
mai
2013

Sommaire

< Krunch> grima: tu as encore le temps de lire dlfp toi ?
< grima> avec un mois de retard souvent et je lis que les truc vraiment inter^W^W^Wplus gros trolls
< Krunch> en considérant que les gros trolls font 90% du contenu en terme de texte je suis pas sûr que tu gagnes du temps
< Krunch> oh oui, faudrait que je compte combien de mots il y a dans les commentaires
(…)

Version 1.0 de Julia

Posté par  . Édité par reno, Nÿco, Brndan, Bruno Michel, Xavier Teyssier et olivierweb. Modéré par NeoX. Licence CC By‑SA.
40
4
mar.
2012
Technologie

Julia, un langage de programmation peu connu, a atteint la version 1.0 (disponible uniquement sur Linux et Mac OS X actuellement). Le langage a été créé par des scientifiques et se veut donc optimisé pour leurs besoins : le calcul scientifique, l'apprentissage automatique (machine learning en anglais), la fouille de données (data mining), le calcul algébrique linéaire à grande échelle et le calcul distribué et parallèle.

Ils veulent un langage :

  • Très simple à apprendre, mais qui puisse aussi convenir aux « hackeurs sérieux » : Julia a une syntaxe facile à apprendre pour les utilisateurs de Matlab, tout en étant homoiconique avec des vrais macros comme le Lisp.
  • Aussi utilisable pour la programmation « normale » que Python, aussi simple pour les statistiques que R, aussi naturel pour le traitement de texte que Perl (Julia supporte les PCRE), aussi puissant pour l'algèbre linéaire que Matlab et aussi bon pour lier des programmes ensemble que le shell.

Avec une implémentation :

  • Open source avec une licence peu contraignante : Julia est sous licence MIT.
  • Aussi performante que le C tout en ayant la dynamicité de Ruby : quelques benchmarks sont sur la page d'accueil de Julia qui est dynamiquement typé avec annotation optionnelle de type (et dispatch multiple).
  • Fournissant un mode interactif et compilé.

Bref, ils sont ambitieux ! Leur manuel de référence est assez bien fait : à vous de juger…

NdA : Merci à Nÿco, olivierweb, Brndan et particulièrement à reno pour leur aide lors de la rédaction de cette dépêche.

Journal DLFP social network

Posté par  (site web personnel) .
2
1
nov.
2006
Dans un moment de désoeuvrement j'ai entrepris d'écrire de quoi générer un graphe des relations entre les utilisateurs de DLFP. Après quelques heures de travail, j'ai un truc qui donne des choses comme ceci :
http://ms800.montefiore.ulg.ac.be/~kunysz/dlfpers.8.png

Chaque flèche représente un certains nombre de réponses à des messages dans l'ordre "message parent -> réponse". Par exemple on peut voir que thoasm a répondu à huit messages de briaeros007. Ce graphe ce base sur 965 dépêches et journaux. Ne sont représentés que (…)