Journal Compter automatiquement les mots prononcés sur les chaînes d'information continue

Posté par magsoft le 27 décembre 2021 à 00:20. Licence CC By‑SA.

Étiquettes :

117

27

déc.

2021

Ce journal a été promu en dépêche : Compter automatiquement les mots prononcés sur les chaînes d'information continue.

Ce journal traite d'un système d’acquisition, de reconnaissance vocale et une base de donnée des mots prononcés sur les chaînes d’information continue de la Télévision Numérique Terrestre française (TNT). Je présente aussi des résultats obtenus sur quelques candidats à l'élection présidentielle française et quelques thèmes d'actualité.

Le code est disponible ici sous licence AGPL.

Introduction

Ces dernières années en France, le traitement de l’information par les médias grand public a fait l’objet de virulents débats, notamment durant la crise des (…)

Forum Linux.debian/ubuntu Voix vers Texte en français avec Deepspeech/CommonVoice [Ubuntu 20.04]

Posté par rockn (site web personnel) le 05 octobre 2021 à 15:35. Licence CC By‑SA.

Étiquettes :

6

5

oct.

2021

À la recherche d'un logiciel de reconnaissance vocale, j'ai passé quelques heures à installer deepspeech. Bien sûr la documentation que j'ai trouvé sur internet ne parle que des modèles pré entraîné anglais.
La difficulté était donc de trouver des modèles français qui fonctionnent…
Voici un condensé des commandes que j'ai tapé dans le terminal pour avoir de la reconnaissance vocale en français.

Prérequis:

sudo apt install pyaudio portaudio19-dev
mkdir $HOME/tmp/
cd $HOME/tmp/
git clone git@github.com:mozilla/DeepSpeech-examples.git
wget https://github.com/common-voice/commonvoice-fr/releases/download/fr-v0.6/model_tensorflow_fr.tar.xz
tar -Jxvf model_tensorflow_fr.tar.xz

(…)

Forum général.test reconnaissance vocale

Posté par robertix le 22 septembre 2021 à 19:09. Licence CC By‑SA.

Étiquettes :

1

22

sept.

2021

bonjour à tous

voila le projet vosk
https://alphacephei.com/vosk/install
https://github.com/alphacep/vosk-api

plusieurs langages sont disponibles
https://alphacephei.com/vosk/models

https://alphacephei.com/vosk/models/vosk-model-fr-0.6-linto-2.2.0.zip
http://alphacephei.com/vosk/models/vosk-model-en-us-0.21.zip

il faut installer les paquets python3-vosk et python3-pysrt

j'ai trouvé le vosk rpm ici

$wget https://ftp.nluug.nl/pub/os/Linux/distr/pclinuxos/pclinuxos/srpms/SRPMS.pclos/python3-vosk-0.3.27-1pclos2021.src.rpm
$wget https://ftp.nluug.nl/pub/os/Linux/distr/pclinuxos/pclinuxos/apt/pclinuxos/64bit/RPMS.x86_64/python3-vosk-0.3.27-1pclos2021.x86_64.rpm

puis j'ai converti le rpm en deb avec le programme alien en root
# alien --script python3-vosk-0.3.27-1pclos2021.x86_64.rpm

donne
python3-vosk_0.3.27-2_amd64.deb

puis
# chown robertix:robertix python3-vosk_0.3.27-2_amd64.deb

puis controler les droits
# dpkg -c python3-vosk_0.3.27-2_amd64.deb
drwxr-xr-x root/root         0 2021-09-21 16:28 ./
drwxr-xr-x root/root         0 2021-09-21 16:28 ./usr/
drwxr-xr-x root/root

(…)

Snips ouvre sa technologie NLU

Posté par Bruno Michel (site web personnel) le 25 avril 2018 à 11:05. Édité par Davy Defaud. Modéré par Nÿco. Licence CC By‑SA.

Étiquettes :

66

25

avr.

2018

Snips est une jeune pousse parisienne dont le produit est un assistant vocal respectueux de la vie privée. Un assistant vocal agit en quatre étapes :

détecter qu’on s’adresse à lui, généralement via un mot‐clef du type « OK » ou le surnom de l’assistant ;
transformer l’entrée sonore en texte (la reconnaissance vocale) ;
analyser le texte pour en sortir une intention ;
agir à partir de cette intention.

Snips a publié sous licence libre (Apache 2.0) le code qui lui permet d’effectuer la troisième étape, la partie dite NLU pour « Natural Language Understanding ». Le code est en Python, mais certaines parties sont en Rust. D’un point de vue performance et précision, l’outil de Snips fait jeu égal avec les versions dans le cloud des GAFAM, voire fait parfois mieux. Et quand on sait que l’on peut faire tourner ce code sur son propre Rasberry Pi, on ne peut que saluer cette prouesse.

Forum Linux.android Alternative à Google Now ?

Posté par Mayster le 27 novembre 2015 à 13:12. Licence CC By‑SA.

Étiquettes :

1

27

nov.

2015

Bonjour à la communauté,

Je voulais savoir s'il existait une alternative disons plus ou moins libre de Google Now, en fait plus particulièrement la fonction de reconnaissance vocale qui m'est régulièrement utile pour rédiger des sms rapidement (je dois dire que c'est particulièrement efficace). Le reste de fonctionnalités de Google Now m'importe guère.

Merci d'avance.

Phoseg, stockage et analyse de données phonétiques transcrites

Posté par Xavier Faure (site web personnel) le 14 décembre 2012 à 09:29. Édité par Pierre Jarillon. Modéré par patrick_g. Licence CC By‑SA.

Étiquettes :

25

14

déc.

2012

Bonjour à tous,
dans le cadre d'un projet j'ai besoin d'un module pour stocker et analyser des données phonétiques transcrites, par exemple avec l'alphabet phonétique international. Mon code commence à devenir (vaguement) utilisable : je le publie donc sous une licence GLPv3 : Phoseg est un module pour Python3 que vous trouverez à cette adresse.

J'ai essayé de coller à certains principes facilitant le travail en communauté ainsi que l'écriture de code lisible : tests unitaires, code et commentaires écrits en anglais, surveillance de la qualité du code par pylint, documentation fournie.

Concrètement, je cherche d'autres personnes susceptibles d'utiliser ou d'améliorer mon module. Si vous êtes un spécialiste de la phonétique, j'ai aussi de nombreuses questions à vous poser… De façon générale, n'hésitez pas à faire remonter vos remarques, je n'attends que ça, surtout si elles sont négatives !

Sondage Comment aimez-vous les serveurs vocaux ?

Posté par goeb le 22 octobre 2012 à 11:30.

Étiquettes :

5

22

oct.

2012

On voit utiliser de plus en plus la reconnaissance vocale dans les systèmes de serveurs vocaux (banques, assurances, etc.), comme par exemple pour

consulter votre facture, dites facture
demander un devis, dites devis
etc.

Ces systèmes se veulent modernes, bien que ça ait commencé il y a près de 15 ans (serveur vocal de la cité des sciences de La Villette en 1998 par exemple, auquel il fallait répondre oui ou non). Cependant ces systèmes sont potentiellement gênants, car ils imposent à l'usager (le client) de prononcer à haute voix les mots. Donc dans les lieux publics ou les réunions ça manque de discrétion.

Et vous comment aimez-vous les serveurs vocaux ?

Reconnaissance vocale :
8
(0.6 %)
Chiffres à taper :
307
(22.7 %)
Les deux : reconnaissance vocale ou chiffres à taper :
105
(7.7 %)
Pas de serveur vocal : personne physique uniquement au téléphone :
330
(24.4 %)
Pas de serveur vocal : Internet et clic de souris :
467
(34.5 %)
Pas de serveur vocal : je me déplace au guichet :
79
(5.8 %)
Pas de serveur vocal : je reçois les infos par courriel, SMS, etc. :
59
(4.4 %)

Total : 1355 votes

Journal La transcription vocale naturelle.

Posté par Wlanfr le 06 mars 2012 à 10:04.

Étiquettes :

20

6

mar.

2012

Pour m'aider a rédiger les documentations nécessaires à mon travail, j'ai acheté Dragon version home. Comme je travaille aussi sous le Linux le je me demandais où en été la reconnaissance vocale sur notre système préféré. J'ouvre donc ce journal pour essayer de réunir toutes les informations sur la reconnaissance vocale disponible sous Linux.

Merci d'avance de votre aide.

Voici ce que j'ai déjà collecté :

1 - "CMU_Sphinx" Librairie utilisé par exemple Perlbox
2 - "gnome-voice-control" Contrôler l'environnement GNOME (…)

Avancées de la reconnaissance vocale en 2011

Posté par Benjamin Verhaeghe (site web personnel) le 27 mars 2011 à 19:11. Modéré par baud123. Licence CC By‑SA.

Étiquettes :

42

27

mar.

2011

Voici un sujet qui fait parler de lui, un rêve de l'informatique qui s'approche à grand pas, voire qui est déjà présent dans bien des applications ! Vous avez certainement en tête le fameux « Via Voice » édité par IBM ou son successeur « Dragon naturally Speaking » édité par Scansoft. Les plus accros d'entre vous n'auront pas hésité à installer la reconnaissance vocale prévue par défaut dans XP, Vista ou Seven.

Mais lors du passage au libre, que nous effectuons pour la plupart pour des raisons différentes, avec des approches philosophiques, économiques ou pratiques, nous sommes confrontés à la perte de plusieurs des logiciels et/ou fonctionnalités que nous avions adoptés précédemment (compatibilité de notre écosystème logiciel). Pour ceux d'entre nous qui avaient fait le choix de la reconnaissance vocale, cette fonctionnalité reste difficilement remplaçable dans le monde de GNU/Linux. Les logiciels propriétaires cités précédemment ne sont pas prévus pour fonctionner sous nos distributions, et la communauté ne semble pas encore prête à offrir une alternative efficace. Il existe cependant quelques projets similaires dont l'avancement ne peut être négligé :

tout d'abord la source de données audio qui aide à la mise en place de ces projets : Voxforge collecte les données audio dans différentes langues pour permettre l'implémentation de l'utilisation de ces données par des moteurs de moteurs de reconnaissance vocale Open Source ;
CMUSphinx est le plus célèbre d'entre eux. Il permet – dans le cadre de la recherche principalement – d'obtenir la transcription écrite de données orales. D'un langage de programmation assez simple, basé sur des phonèmes, il permet d'obtenir des résultats prometteurs pour le développement d'applications libres selon les 3 règles chères aux plus stricts d'entre nous ;
un premier développement a été effectué il y a quelques années déjà pour la communauté française, avec Perlbox, qui permet de piloter son ordinateur en français, basé sur CMUsphinx 2 ;
une approche plus récente, toujours basée sur le projet CMUsphinx, est proposée par EvalDictator, mais pas encore disponible en français.

Alors vous me direz, quoi de neuf ? Et bien Google s'est aussi lancé dans la course à la reconnaissance vocale. Cela ne date pas d'hier :

retranscription écrite des dialogue de vidéos en novembre 2008 ;
lancement d'applications et reconnaissance vocale d'un texte sous Android en août 2010 ;
maintenant, c'est au tour de Chrome 11 de bénéficier de ces compétences (peut être).

Forum Programmation.c Synthèse & Reconnaissance vocale

Posté par thechief le 05 mars 2008 à 18:31.

Étiquettes :

0

5

mar.

2008

Bonjour,

Je m'interesse à la reconnaissance vocale dans le but de piloter un programme très simple. Avec une dizaine de mots tout au plus. Il ne s'agit donc pas de reconnaissance vocale véritable mais plutôt de "pilotage vocal". Connaissez-vous une librairie regroupant l'essentiel ?
Même question à propos de la synthèse vocale, une librairie toute simple ?

Merci d'avance

Journal Micromou s'essaye à la reconnaissance vocale

Posté par py (site web personnel) le 31 juillet 2006 à 14:28.

Étiquettes :

0

31

juil.

2006

Et leur démonstration est impressionnante ...
Je vous laisse juger par vous-même.

http://www.youtube.com/watch?v=2Y_Jp6PxsSQ
(Flash)

Forum général.cherche-logiciel reconnaissance vocale

Posté par ueric le 07 septembre 2005 à 14:59.

Étiquettes :

0

7

sept.

2005

Bonjour,

ayant un canal carpien je suis à la recherche d'un systeme me permettant d' écrire à la voix (je fais principalement du code php et xml). Après quelque recherche j'ai trouvé principalement via voice, mais je voudrais savoir si il y a d'autre logiciel le permettant et, si vous avez utilisé via voice, est il pratique d'utilisation, quelqu'un utilise t-il la reconnaissance vocale pour coder, est ce qu'un tel logiciel peut s'interfacer avec eclipse?

Merci

Journal Reconnaissance vocale et logicels libres ?

Posté par Anonyme le 13 avril 2004 à 23:17.

Étiquettes :

1

13

avr.

2004

bonjour tous, (ou bonjour cher journal, en fonction de vos préférences)

je me suis dernièrement posé la question égoiste de savoir si il existait des
solutions de reconnaissances vocales dans notre joli monde des logiciels libres.
Après quelques recherches sur google, j'ai bien trouvé une faq:
http://www.faqs.org/docs/Linux-HOWTO/Speech-Recognition-HOWTO.html(...)
et certains exemples tels que xvoice, mais la plupart de ces logiciels dépendent
du SDK Viavoice d'ibm qui n'est pas libre en plus d'etre distribué sous le
manteau, ou bien ne semblent pas (…)

Reconnaissance de la parole: HOWTO

Posté par DAGAN Alexandre (site web personnel) le 22 avril 2002 à 11:11. Modéré par Fabien Penso.

Étiquettes :

0

22

avr.

2002

Ce document est destiné à un public allant du débutant aux utilisateurs intermédiaires de Linux qui sont intéressés par la reconnaissance de la parole et qui veulent en savoir plus. Il peut être intéressant pour des développeurs qui veulent se faire expliquer les bases de la programmation d'outils de reconnaissance de la parole.

Ce domaine est encore émergeant sous Linux, et l'auteur ne cache pas son désir de motiver les gens pour y participer...
(Disponible en .html, .pdf, .txt, .rtf et source SGML)

Tous les contenus étiquetés avec « reconnaissance_parole »

Introduction