Journal Quoi penser de l'IA dans mon monde de linuxien ...

Posté par netchaiev le 09 février 2025 à 01:13. Licence CC By‑SA.

Étiquettes :

15

9

fév.

2025

C'est un journal d'humeur, de questionnements et de vrais problèmes techniques …

Pas mal de discours pour faire l'éloge (ou pas) de l'IA abordent le coté moteur OpenSource boostant la recherche autour de l'IA.
Ouais …. mais l'OpenSource en sort il gagnant de cette folle effervescence ?

C'est qd même toujours jouissif d'entendre à la radio (ou autres grands médias) les qualités de l'OpenSource (Pour l'IA) quand cela fait des années que tu prêches dans le désert.
Faut pas être (…)

Journal NoComprendo, le retour

Posté par be.root (site web personnel) le 06 janvier 2025 à 11:50. Licence CC By‑SA.

Étiquettes :

45

6

jan.

2025

Rappel des faits

Il y a déjà 5 ans, quelques semaines avant le début du grand enfermement, je vous présentais NoComprendo, un programme de commande vocale pour Linux.
Il permet d'associer des énoncés (mot ou groupe de mots précédés et suivis d'un silence) à des actions pré-programmée.
Les actions disponibles sont : séquences de touches (raccourcis claviers), saisie de texte, déplacement de souris, lancement de programme plus quelques métas commandes de pilotage de l'application.

Première présentation
Dépêche de l'époque

Les (…)

Lien Une application de mastering audio qui matche le son d'un morceau de référence

Posté par Luc-Skywalker le 24 mai 2024 à 23:36.

Étiquettes :

4

24

mai

2024

https://sergree.github.io/matchering/

Lien Elograf: rendre la reconnaissance vocale accessible

Posté par Ysabeau 🧶 (site web personnel, Mastodon) le 03 janvier 2024 à 15:03.

Étiquettes :

16

3

jan.

2024

https://blog.mageia.org/fr/2024/01/03/elograf-rendre-la-reconnaissance-vocale-accessible/

Forum général.cherche-logiciel Saisie vocale

Posté par Serge Julien le 06 avril 2023 à 11:10. Licence CC By‑SA.

Étiquettes :

6

avr.

2023

Bonjour,

Je cherche une solution pour une connaissance dont le besoin est simple à énoncer : pouvoir dicter au lieu d'écrire, et remplacer ainsi la saisie au clavier dans LibreOffice ou un éditeur de texte.

La personne utilise un laptop sur lequel tourne une version récente (la dernière, il me semble) de Linux Mint (famille Debian/Ubuntu, donc).

L'idéal serait que le traitement du signal se fasse sur la machine elle-même plutôt que via un service en ligne, mais ce n'est (…)

Lien Preuve de concept d’un assistant vocal respectueux de la vie privée des utilisateurs

Posté par tisaac (Mastodon) le 30 novembre 2022 à 15:22.

Étiquettes :

9

30

nov.

2022

https://linc.cnil.fr/fr/preuve-de-concept-dun-assistant-vocal-respectueux-de-la-vie-privee-des-utilisateurs

Journal Compter automatiquement les mots prononcés sur les chaînes d'information continue

Posté par magsoft le 27 décembre 2021 à 00:20. Licence CC By‑SA.

Étiquettes :

117

27

déc.

2021

Ce journal a été promu en dépêche : Compter automatiquement les mots prononcés sur les chaînes d'information continue.

Ce journal traite d'un système d’acquisition, de reconnaissance vocale et une base de donnée des mots prononcés sur les chaînes d’information continue de la Télévision Numérique Terrestre française (TNT). Je présente aussi des résultats obtenus sur quelques candidats à l'élection présidentielle française et quelques thèmes d'actualité.

Le code est disponible ici sous licence AGPL.

Introduction

Ces dernières années en France, le traitement de l’information par les médias grand public a fait l’objet de virulents débats, notamment durant la crise des (…)

Forum Linux.debian/ubuntu Voix vers Texte en français avec Deepspeech/CommonVoice [Ubuntu 20.04]

Posté par rockn (site web personnel) le 05 octobre 2021 à 15:35. Licence CC By‑SA.

Étiquettes :

6

5

oct.

2021

À la recherche d'un logiciel de reconnaissance vocale, j'ai passé quelques heures à installer deepspeech. Bien sûr la documentation que j'ai trouvé sur internet ne parle que des modèles pré entraîné anglais.
La difficulté était donc de trouver des modèles français qui fonctionnent…
Voici un condensé des commandes que j'ai tapé dans le terminal pour avoir de la reconnaissance vocale en français.

Prérequis:

sudo apt install pyaudio portaudio19-dev
mkdir $HOME/tmp/
cd $HOME/tmp/
git clone git@github.com:mozilla/DeepSpeech-examples.git
wget https://github.com/common-voice/commonvoice-fr/releases/download/fr-v0.6/model_tensorflow_fr.tar.xz
tar -Jxvf model_tensorflow_fr.tar.xz

(…)

Lien Aidez le moteur de reconnaissance vocale open source de Mozilla à progresser (appel à tester)

Posté par antistress (site web personnel) le 26 mai 2020 à 12:40.

Étiquettes :

7

26

mai

2020

https://blog.mozfr.org/post/2020/05/aidez-nous-creer-premier-segment-cible-common-voice

Firefox 76 (dites : Septantesix)

Posté par antistress (site web personnel) le 05 mai 2020 à 23:42. Édité par Davy Defaud, Benoît Sibaud, Strash, ZeroHeure et Serge Julien. Modéré par patrick_g. Licence CC By‑SA.

Étiquettes :

53

5

mai

2020

La version 76 de Firefox desktop a été publiée le 5 mai 2020.

La crise sanitaire actuelle commence à se ressentir dans le rythme des nouveautés proposées. En effet, Mozilla a décidé de maintenir le calendrier de publication des nouvelles versions de Firefox, quitte à reporter certaines fonctionnalités.

Paradoxalement, on pourrait dire que les principales améliorations de cette version, outre les corrections de bogues toujours bienvenues, sont des améliorations en devenir : l’implémentation d’un mode « HTTPS uniquement » mais qui, à ce stade, reste caché – car expérimental – comme l’est l’accélération matérielle du décodage des vidéos VP9 sous Wayland ; l’adossement de WebRender au compositeur système sur Windows, mais dont le déploiement chez les utilisateurs se fait progressivement.

Les nouveautés sont développées dans la deuxième partie. Nous en profitons en effet pour faire le point sur un certain nombre de développements en cours (du côté d’Android, par exemple, une grande étape vient d’être franchie avec Firefox Preview).


	Dessin d’Albert Uderzo

NoComprendo continue son chemin

Posté par be.root (site web personnel) le 25 février 2020 à 11:57. Édité par Davy Defaud, Ysabeau 🧶, ZeroHeure et palm123. Modéré par Nÿco. Licence CC By‑SA.

Étiquettes :

56

25

fév.

2020

Il y a quelque temps, je vous présentais NoComprendo, logiciel de commandes vocales en cours de développement. Deux mois plus tard sortait la version 1.0.

Depuis, j’ai été contacté par l’équipe de Mageia et celle de DVKBuntu un projet handy opensource. Pour les premiers, j’ai amélioré et simplifié le processus de construction et les outils utilisés. Pour les seconds, j’ai apporté quelques modifications d’ergonomie. Pour le plaisir, j’ai éliminé les outils externes de création de « Language model » pour les remplacer par un interne, codé en Qt/C++.

Voici donc une nouvelle version numérotée 1.1.

Firefox 72

Posté par antistress (site web personnel) le 08 janvier 2020 à 18:54. Édité par ZeroHeure et Davy Defaud. Modéré par Ysabeau 🧶. Licence CC By‑SA.

Étiquettes :

69

8

jan.

2020

La version 72 de Firefox pour le bureau a été publiée le 7 janvier 2020. Les principales améliorations concernent la fin des fenêtres surgissantes pour les notifications des sites Web, le blocage par défaut des détecteurs d’empreinte numérique, et le mode « image dans l’image » — Picture in Picture — qui débarque (notamment) sur GNU/Linux !

Par ailleurs, un bogue touchant Firefox 71 dans ses versions diffusées par les distributions GNU/Linux qui entravait le bon fonctionnement de différentes extensions (qui ne pouvaient plus sauvegarder localement leurs données de fonctionnement) a été corrigé dans l’intervalle.

Comme d’habitude, les nouveautés sont développées dans la deuxième partie.

Journal NoComprendo, la commande vocale pour Linux

Posté par be.root (site web personnel) le 28 novembre 2019 à 09:26. Licence CC By‑SA.

Étiquettes :

74

28

nov.

2019

Un contexte douloureux

Je pousse la souris depuis sa démocratisation (dans les années 80), je control-alt-shifte depuis encore plus longtemps ce qui fait de moi un bon connaisseur en TMS.
Ajoutons aussi une fracture du poignet gauche, il y a quelques années, qui m'ont rendu le Ctrl+Shift+Lettre douloureux en fin de journée.

J'ai pensé à la commande vocale. L'idée n'était pas de se passer d'un clavier, mais de pouvoir lancer verbalement quelques raccourcis claviers pour soulager mes articulations.

Trouver

(…)

Firefox 66 sur la route !

Posté par antistress (site web personnel) le 20 mars 2019 à 09:59. Édité par ZeroHeure, BAud, cracky, Davy Defaud, patrick_g et Strash. Modéré par claudex. Licence CC By‑SA.

Étiquettes :

60

20

mar.

2019

La version 66 de Firefox a été publiée le 19 mars 2019.

Les principales nouveautés amélioreront votre confort (lecture automatique bloquée sur les versions bureau et Android, défilement d’une page en cours de chargement optimisé pour éviter les sauts sur la version bureau), votre productivité (recherche possible à travers les onglets ouverts sur la version bureau, prise en charge préliminaire de la Touch Bar des Mac), sans oublier les performances et la sécurité!

Nous évoquerons aussi les avancées dans l’implémentation du moteur de rendu graphique WebRender, et un nouveau projet d’envergure : Fission.

Comme d’habitude, le détail des nouveautés suit ci‐dessous.

Lien Common Voice, la base de données vocales de Mozilla, se met au français !

Posté par tchaik le 10 juin 2018 à 12:45.

Étiquettes :

7

10

juin

2018

https://blog.mozilla.org/blog/2018/06/07/parlez-vous-deutsch-rhagor-o-leisiau-i-common-voice/

Tous les contenus étiquetés avec « reconnaissance_vocale »

Rappel des faits

Introduction

Un contexte douloureux

Trouver