Prédire la note d’un journal sur LinuxFr.org

Posté par jnanar (site web personnel) le 09 juin 2017 à 09:30. Édité par BAud, Jean-Baptiste Faure, Yves Bourguignon, Davy Defaud, ZeroHeure, Nicolas Casanova, Nils Ratusznik, palm123, bubar🦥, j_m, Benoît Sibaud, claudex, Pierre Jarillon et Nÿco. Modéré par ZeroHeure. Licence CC By‑SA.

Étiquettes :

139

9

juin

2017

Cette dépêche traite de l’exploration de données sur des données issues de LinuxFr.org.

Ayant découvert récemment scikit-learn, une bibliothèque Python d’apprentissage statistique (machine learning). Je voulais partager ici un début d’analyse sur des contenus issus de LinuxFr.org.

Avertissement : je ne suis pas programmeur, ni statisticien. Je ne maîtrise pas encore tous les arcanes de scikit-learn et de nombreux éléments théoriques m’échappent encore. Je pense néanmoins que les éléments présentés ici pourront en intéresser plus d’un(e).

Tous les scripts sont codés en Python et l’analyse à proprement parler a été réalisée à l’aide d’un notebook Jupyter. Un dépôt contenant les données et les scripts est disponible sur GitLab.

Journal De l'apprentissage profond qui en jette avec Opus 1.5

Posté par Glandos le 05 mars 2024 à 10:55. Licence CC By‑SA.

Étiquettes :

53

5

mar.

2024

Salut,

J'étais déjà impressionné par LPCNet qui est un « codec » permettant d'encoder la voix humaine à l'aide d'un réseau de neurones pré-entraîné.

Bon, les gens de chez Opus ont pris ça, et ont fait un tas de trucs sympas en plus : https://opus-codec.org/demo/opus-1.5/

Si vous voulez aller vite, la dernière démo vaut le coup : elle simule la perte de paquets en transmission de voix, et recrée au mieux ce qui est perdu. Le résultat est bluffant. Essayez (…)

Journal SeqTools et retour d'expérience sur le traitement de jeux de données en python

Posté par nlgranger le 29 octobre 2018 à 16:16. Licence CC By‑SA.

Étiquettes :

38

29

oct.

2018

SeqTools est une librairie que j'ai créée pour transformer des jeux de données trop gros pour tenir en mémoire. Elle remplit un rôle comparable à itertools de la librairie standard, mais fait aussi en sorte de donner accès aux éléments par indexation, ce qui est plus pratique.

Dépôt du code
Documentation

L'objectif principal consiste à prendre une ou plusieurs sources de données et de les combiner ou de modifier leurs éléments pour obtenir une version transformée.
Par exemple, partant d'une (…)

Journal GitHub lance copilot, un générateur de code entraîné sur du code GPL

Posté par Anonyme le 01 juillet 2021 à 15:35. Licence CC By‑SA.

Étiquettes :

38

1

juil.

2021

GitHub vient d’annoncer le lancement de Copilot, un générateur de code, basé sur « l’intelligence artificiel ».

Le principe est qu’à partir d’un fichier vide, Copilot va vous proposer des bouts de code au fur et à mesure de votre édition. Les vidéos sur la page d’accueil du projet sont assez parlantes, avec seulement le nom et la description d’une fonction, Copilot va automatiquement créer son contenu.

On peut se dire que jusqu’ici « tout va bien » (…)

Ubix Linux, le datalab de poche

Posté par Angstel (Mastodon) le 16 mars 2024 à 20:26. Édité par Benoît Sibaud, Arkem, Pierre Jarillon et Julien Jorge. Modéré par Benoît Sibaud. Licence CC By‑SA.

Étiquettes :

25

16

mar.

2024

Ubix Linux est une distribution Linux libre et open-source dérivée de Debian.

Le nom « Ubix » est la forme contractée de « Ubics », acronyme issu de l'anglais Universal business intelligence computer system. De fait, le principal objectif d'Ubix Linux est d'offrir une plateforme universelle dédiée à l'informatique décisionnelle et à l'analyse des données.

Il s'agit d'une solution verticale, prête à l'emploi, dédiée à la manipulation des données et à la prise de décision. Allégée par conception, elle n'embarque qu'un jeu limité d'outils spécialisés dans ce domaine. Ceux-ci permettent néanmoins de couvrir tous les besoins dont l'acquisition, la transformation, l'analyse et la présentation des données.

Journal scratch_manager: gestionnaire de mise en cache de jeux de données

Posté par nlgranger le 16 décembre 2022 à 17:14. Licence CC By‑SA.

Étiquettes :

21

16

déc.

2022

J'ai eu l'occasion de développer un petit logiciel open-source pour mon travail, donc j'en profite pour partager ici.

Motivation

Sur les grappes de calculs (clusters) dédiés à l'intelligence artificielle, il y a un problème assez récurrent lié au stockage et à l'accès aux données.
Dans ces installations, on trouve généralement d'un côté une baie de stockage avec des jeux de données composés de millions de petits fichiers, et de l'autre côté les nœuds de calcul qui lisent ces fichiers.
La (…)

Lien De quoi ChatGPT est-il VRAIMENT capable ? (par Monsieur Phi)

Posté par tisaac (Mastodon) le 08 janvier 2023 à 23:57.

Étiquettes :

19

8

jan.

2023

https://www.youtube.com/watch?v=R2fjRbc9Sa0

Journal [~Signet] IA, la grande escroquerie

Posté par SpaceFox (site web personnel, Mastodon) le 04 septembre 2025 à 13:46. Licence CC By‑SA.

Étiquettes :

18

4

sept.

2025

Vu que le titre est provocateur, je vous met aussi le chapeau et le paragraphe d’introduction, pour vous inciter à prendre ce lien pour ce qu’il est, c’est-à-dire quelque chose de bien plus intéressant et mieux sourcé que ce qu’en laisse penser son titre.

Emily Bender et Alex Hanna publient The AI con, « L’escroquerie de l’IA ». Une synthèse très documentée qui nous invite à lutter contre le monde que nous proposent les géants de l’IA. Lecture.

L’arnaque de (…)

Journal Intégration d'une clé USB accélérateur Coral Edge TPU sous ZoneMinder et Frigate

Posté par Funix (site web personnel, Mastodon) le 01 novembre 2025 à 10:12. Licence CC By‑SA.

Étiquettes :

16

1

nov.

2025

'lut les moules,

Je prends le risque de me faire moinser pour faire le panégyrique d'un outil Google, de modèles de détection d'image chinois, mais le monde n'est pas aussi binaire et même le diable incarné peut contribuer à sa manière aux logiciels libres et permettre au plus grand nombre d'accéder au développement d'outils basés sur l'IA.

J’ai donc investi dans une clé USB accélérateur Google Coral Edge TPU pour moins d’une centaine d’euros sur un célèbre site de vente (…)

Lien Intelligence artificielle : le vrai coût environnemental de la course à l’IA [LONG article]

Posté par SpaceFox (site web personnel, Mastodon) le 02 septembre 2025 à 13:40.

Étiquettes :

16

2

sept.

2025

https://bonpote.com/intelligence-artificielle-le-vrai-cout-environnemental-de-la-course-a-lia/

Journal Revue (pas du tout exhaustive) de livres orientés machine learning / deep learning

Posté par aboulle le 21 avril 2020 à 14:57. Licence CC By‑SA.

Étiquettes :

16

21

avr.

2020

Chère linuxfrienne, cher linuxfrien,
voici une petite dizaine d'année que l'"IA" a commencé à diffuser hors de la sphère des scientifiques/développeurs/experts et a commencé à faire la une d'articles plus ou moins grand public.
Étant d'un naturel curieux et, profitant de cette période d'accalmie forcée, je me suis lancé dans lecture d'ouvrages dédiés à l'apprentissage automatique (machine learning) et l'apprentissage profond (deep learning, DL) en Python. Bon en fait j'ai commencé avant, mais on s'en fout.

À toutes fins utiles (…)

Journal machine learning - expérimentation foireuse

Posté par steph1978 le 06 mars 2019 à 19:04. Licence CC By‑SA.

Étiquettes :

15

6

mar.

2019

Bonjour Nal,

Je dois vendre mon véhicule. Je souhaite estimer le bon prix pour le vendre : juste assez pour en tirer un bon bénéfice mais pas trop pour qu'il puisse trouver acquéreur.
Je peux aller sur un site spécialisé qui moyennant quelques informations me produira cette estimation.
Mais à l'heure du machine learning, avouez que ce n'est pas très palpitant.

Alors j'ai collecté deux cent annonces de ventes d'un véhicule de même marque, même modèle, dont j'ai extrait le (…)

Lien Google a empoisonné la communauté scientifique, qui amplifie maintenant sa désinformation

Posté par El Titi le 23 octobre 2022 à 11:51.

Étiquettes :

14

23

oct.

2022

https://www.youtube.com/watch?v=IVqXKP91L4E

Lien Trouver des développeurs va être votre plus gros casse-tête cette année (Python, Java, Javascript)

Posté par Ysabeau 🧶 (site web personnel, Mastodon) le 14 janvier 2022 à 13:15.

Étiquettes :

13

14

jan.

2022

https://www.zdnet.fr/actualites/trouver-des-developpeurs-va-etre-votre-plus-gros-casse-tete-cette-annee-39935405.htm

Lien Comment nous avons trouvé qui était derrière QAnon

Posté par jmiven le 18 mars 2022 à 16:54.

Étiquettes :

11

18

mar.

2022

https://legrandcontinent.eu/fr/2022/03/18/comment-nous-avons-trouve-qui-etait-derriere-qanon/

Tous les contenus étiquetés avec « machine_learning »

Motivation