Lien L’IA française dévore la subculture audio-visuelle et on peut dorénavant consulter son caca

Posté par Marotte ⛧ le 08 octobre 2024 à 20:58.

-2

8

oct.

2024

Ubix Linux, le datalab de poche

Posté par Angstel (Mastodon) le 16 mars 2024 à 20:26. Édité par Benoît Sibaud, Julien Jorge, Arkem et Pierre Jarillon. Modéré par Benoît Sibaud. Licence CC By‑SA.

Étiquettes :

25

16

mar.

2024

Ubix Linux est une distribution Linux libre et open-source dérivée de Debian.

Le nom « Ubix » est la forme contractée de « Ubics », acronyme issu de l'anglais Universal business intelligence computer system. De fait, le principal objectif d'Ubix Linux est d'offrir une plateforme universelle dédiée à l'informatique décisionnelle et à l'analyse des données.

Il s'agit d'une solution verticale, prête à l'emploi, dédiée à la manipulation des données et à la prise de décision. Allégée par conception, elle n'embarque qu'un jeu limité d'outils spécialisés dans ce domaine. Ceux-ci permettent néanmoins de couvrir tous les besoins dont l'acquisition, la transformation, l'analyse et la présentation des données.

Lien Science Amusante™ : data-mining dans un monde parallèle (le top des langages informatique)

Posté par jseb le 17 avril 2023 à 19:09.

Étiquettes :

0

17

avr.

2023

https://ossinsight.io/collections/programming-language

Journal analyse de données avec Duckdb

Posté par steph1978 le 04 janvier 2023 à 13:51. Licence CC By‑SA.

Étiquettes :

16

4

jan.

2023

En parallèle de l'advent of code, très orienté algorithmes et structures de données, a eu lieu le hanukkah of data, orienté analyse de données. Huit petits challenges qui demandent de trouver des réponses dans un set de données relationnelles.

Le challenge a été écrit par Saul Pwanson, auteur de visidata ❤, un TUI permettant de manipuler des données tabulées.

Pour ceux qui seraient tenté d'exercer leurs compétences de data miner, rassurez-vous, vous n'y passerez pas des soirées (…)

Lien Notation des allocataires: fébrile, la CAF s’enferme dans l’opacité

Posté par SpaceFox (site web personnel, Mastodon) le 26 décembre 2022 à 07:46.

Étiquettes :

19

26

déc.

2022

https://www.laquadrature.net/2022/12/23/notation-des-allocataires-febrile-la-caf-senferme-dans-lopacite/

Lien Enquête sur l’algorithme qui note les allocataires de la Caf

Posté par Ysabeau 🧶 (site web personnel, Mastodon) le 09 décembre 2022 à 19:45.

Étiquettes :

19

9

déc.

2022

https://www.francebleu.fr/infos/economie-social/enquete-sur-l-algorithme-qui-note-les-allocataires-de-la-caf-5560273

Lien Computer-assisted classification of contrarian claims about climate change

Posté par Big Pete le 08 décembre 2021 à 10:26.

Étiquettes :

3

8

déc.

2021

https://www.nature.com/articles/s41598-021-01714-4

Journal Vélib' et open data

Posté par lovasoa (site web personnel) le 20 février 2020 à 17:15. Licence CC By‑SA.

Étiquettes :

10

20

fév.

2020

Ce court journal pour vous présenter un petit dataset qui pourrait intéresser certain.e.s d'entre vous (les plus parisien.ne.s):

J'ai récolté l'historique des disponibilités de vélos sur l'ensemble du réseau Vélib' depuis décembre 2019.

Le résultat est sur le dépôt github suivant: lovasoa/historique-velib-opendata.

Pourquoi ?

Paris met à disposition sous licence ODBL la disponibilité des vélibs en temps réel. Mais elle ne fournit aucun moyen d'accéder à l'historique de ces données. C'est dommage, car avoir des données historiques permettrait par (…)

Journal SeqTools 1.0.0: la programmation concurrente, c'est dur!

Posté par nlgranger le 28 décembre 2019 à 17:22. Licence CC By‑SA.

Étiquettes :

31

28

déc.

2019

J'ai profité des vacances pour améliorer ma librairie en python SeqTools, déjà présentée sur linuxfr.

Pour rappel, cette librairie permet le traitement "paresseux" de séquences, c'est-à-dire de tout conteneur qui permet l'accès à ses éléments par indexation, en gros des listes, des tableaux ou un objet qui implémente __getitem__.
La librairie se destine plutôt à des transformations éléments par éléments ou à la réorganisation/combinaison d'une ou de plusieurs séquences entre elles. Pour les pythonistes: c'est un peu (…)

Journal SeqTools et retour d'expérience sur le traitement de jeux de données en python

Posté par nlgranger le 29 octobre 2018 à 16:16. Licence CC By‑SA.

Étiquettes :

38

29

oct.

2018

SeqTools est une librairie que j'ai créée pour transformer des jeux de données trop gros pour tenir en mémoire. Elle remplit un rôle comparable à itertools de la librairie standard, mais fait aussi en sorte de donner accès aux éléments par indexation, ce qui est plus pratique.

Dépôt du code
Documentation

L'objectif principal consiste à prendre une ou plusieurs sources de données et de les combiner ou de modifier leurs éléments pour obtenir une version transformée.
Par exemple, partant d'une (…)

Prédire la note d’un journal sur LinuxFr.org

Posté par jnanar (site web personnel) le 09 juin 2017 à 09:30. Édité par BAud, Jean-Baptiste Faure, Yves Bourguignon, Davy Defaud, ZeroHeure, Nicolas Casanova, Nils Ratusznik, palm123, bubar🦥, j_m, Benoît Sibaud, claudex, Pierre Jarillon et Nÿco. Modéré par ZeroHeure. Licence CC By‑SA.

Étiquettes :

139

9

juin

2017

Cette dépêche traite de l’exploration de données sur des données issues de LinuxFr.org.

Ayant découvert récemment scikit-learn, une bibliothèque Python d’apprentissage statistique (machine learning). Je voulais partager ici un début d’analyse sur des contenus issus de LinuxFr.org.

Avertissement : je ne suis pas programmeur, ni statisticien. Je ne maîtrise pas encore tous les arcanes de scikit-learn et de nombreux éléments théoriques m’échappent encore. Je pense néanmoins que les éléments présentés ici pourront en intéresser plus d’un(e).

Tous les scripts sont codés en Python et l’analyse à proprement parler a été réalisée à l’aide d’un notebook Jupyter. Un dépôt contenant les données et les scripts est disponible sur GitLab.

Journal Dans la série ; les LL m'impressionnent : la fouilles de données

Posté par Stop le 19 mai 2011 à 22:02. Licence CC By‑SA.

Étiquettes :

34

19

mai

2011

La manipulation des données via tableurs, tout le monde connait. Le data mining ou fouille de données beaucoup moins.

La page data mining de wikipédia

Lorsque l'on dispose de jeux de données importants en terme de taille et difficilement lisibles, l'utilisation des tableurs n'est plus appropriée. Les logiciels de fouilles de données entrent alors en action. Ils existent des solutions propriétaires performantes mais assez peu nombreuses (Clémentine SPSS, Statitica, SAS...). Des solutions libres très performantes existent également mais elles n'ont (…)

Journal Watson, Jeopardy et le test de Turing

Posté par patrick_g (site web personnel) le 17 janvier 2011 à 18:00.

Étiquettes :

35

17

jan.

2011

Vous connaissez tous le jeu Jeopardy qui passe sur les télévisions de plusieurs pays. En gros les candidats gagnent de l'argent en répondant à des questions. Mouaif pas très nouveau tout ça.
Le seul truc un peu original c'est qu'en fait l'interrogateur donne la réponse et que c'est au candidat de reconstituer la question.
Exemple: Si l'interrogateur vous dit "LinuxFR" vous devez répondre "Quel est le site francophone qui rassemble le plus de trolleurs"....ou un truc de ce style.

C'est (…)

Tous les contenus étiquetés avec « datamining »

Pourquoi ?