Journal La transcription vocale naturelle.

Posté par  .
20
6
mar.
2012

Pour m'aider a rédiger les documentations nécessaires à mon travail, j'ai acheté Dragon version home. Comme je travaille aussi sous le Linux le je me demandais où en été la reconnaissance vocale sur notre système préféré. J'ouvre donc ce journal pour essayer de réunir toutes les informations sur la reconnaissance vocale disponible sous Linux.

Merci d'avance de votre aide.

Voici ce que j'ai déjà collecté :

1 - "CMU_Sphinx" Librairie utilisé par exemple Perlbox
2 - "gnome-voice-control" Contrôler l'environnement GNOME (…)

Avancées de la reconnaissance vocale en 2011

Posté par  (site web personnel) . Modéré par baud123. Licence CC By‑SA.
42
27
mar.
2011
Audiovisuel

Voici un sujet qui fait parler de lui, un rêve de l'informatique qui s'approche à grand pas, voire qui est déjà présent dans bien des applications ! Vous avez certainement en tête le fameux « Via Voice » édité par IBM ou son successeur « Dragon naturally Speaking » édité par Scansoft. Les plus accros d'entre vous n'auront pas hésité à installer la reconnaissance vocale prévue par défaut dans XP, Vista ou Seven.

Mais lors du passage au libre, que nous effectuons pour la plupart pour des raisons différentes, avec des approches philosophiques, économiques ou pratiques, nous sommes confrontés à la perte de plusieurs des logiciels et/ou fonctionnalités que nous avions adoptés précédemment (compatibilité de notre écosystème logiciel). Pour ceux d'entre nous qui avaient fait le choix de la reconnaissance vocale, cette fonctionnalité reste difficilement remplaçable dans le monde de GNU/Linux. Les logiciels propriétaires cités précédemment ne sont pas prévus pour fonctionner sous nos distributions, et la communauté ne semble pas encore prête à offrir une alternative efficace. Il existe cependant quelques projets similaires dont l'avancement ne peut être négligé :

  • tout d'abord la source de données audio qui aide à la mise en place de ces projets : Voxforge collecte les données audio dans différentes langues pour permettre l'implémentation de l'utilisation de ces données par des moteurs de moteurs de reconnaissance vocale Open Source ;
  • CMUSphinx est le plus célèbre d'entre eux. Il permet – dans le cadre de la recherche principalement – d'obtenir la transcription écrite de données orales. D'un langage de programmation assez simple, basé sur des phonèmes, il permet d'obtenir des résultats prometteurs pour le développement d'applications libres selon les 3 règles chères aux plus stricts d'entre nous ;
  • un premier développement a été effectué il y a quelques années déjà pour la communauté française, avec Perlbox, qui permet de piloter son ordinateur en français, basé sur CMUsphinx 2 ;
  • une approche plus récente, toujours basée sur le projet CMUsphinx, est proposée par EvalDictator, mais pas encore disponible en français.

Alors vous me direz, quoi de neuf ? Et bien Google s'est aussi lancé dans la course à la reconnaissance vocale. Cela ne date pas d'hier :

Simon, vous connaissez ?

Posté par  . Modéré par Nÿco.
37
26
août
2009
KDE
Depuis un bon moment, la communauté kde recherche une application tierce de reconnaissance vocale qui serait bien intégrée à l'environnement. L'une de ces applications s'appelle simon.

Qu'est-ce que simon ?

Il s'agit d'un système de reconnaissance vocale qui peut être intégré aussi bien à X11 qu'à windows, et qui utilise une architecture basée sur des greffons pour en contrôler l'interface.
Il tire son nom d'un jeu pour enfant "Simon dit", mais dans le cas présent "Simon écoute". Ce nom est en minuscule exprès, car l'organisation financière qui le supporte s'appelle "SIMON listens". C'est aussi un acronyme pour "Speech Interaction MONitor".

Peter Grash, l'un des développeurs de cette application indique à propos de l'origine du projet :

Il était dans une école (en 2006) qui proposait un sujet nommé "project development" pour lequel des groupes d'étudiants devaient développer des projets avec des sociétés externes. Alors qu'il cherchait un projet, il a été contacté par Franz Stieger, un enseignant qui s'occupait d'enfants en difficultés, notamment des problèmes de paralysie spasmodique spasticity. Du fait de leur problèmes moteurs, ces enfants ont des difficultés pour écrire et pour taper au clavier. Franz voulait savoir si un logiciel de reconnaissance vocale pourrait les aider à participer plus dans la classe. Après cet exposé, Peter et 4 de ses camarades ont cherché des logiciels de ce type, mais sont rapidement arrivés à la conclusion qu'aucun des logiciels de reconnaissance vocale existants, qu'ils soient commerciaux ou non, était capable de s'adapter aux éventuels problèmes de diction de leurs sujets de tests. C'est ainsi que le projet est né.

Dès 2007, Peter Grash et son équipe avait déjà un prototype fonctionnel. Le premier mot que simon reconnut était "thunfish" (thon en allemand) qui, quand il était prononcé, affichait une image plein écran d'un thon. Peu de temps après, simon avait deux commandes : exécutables et lieux. Depuis, beaucoup de commandes ont été ajoutées, mais il vaut mieux se référer à la vidéo de démonstration pour s'en faire une idée précise et voir simon en pleine action.

Pour le moment, les commandes sont implémentées sous forme de greffons configurables.

Il est d'ores et déjà disponible en version 0.2, car toujours en développement, mais semble déjà bien fonctionnel, comme le montre la vidéo de démonstration sur la page de la news.

NdM : ceci est une traduction de l'article de Troy Unrau sur KDEnews avec son autorisation, merci à Gyro Gearllose (geo_trouvetout) et Troy ; merci aussi à gnumdk pour son journal sur le sujet.

Journal Toi aussi, donnes des ordres à ton ordinateur!

Posté par  (site web personnel) .
Étiquettes :
9
24
août
2009
http://dot.kde.org/2009/08/22/simon-speech-activated-user-in(...)

Simon, le système de gestion d'entrées utilisateur pour X (et Windows) basé sur les librairies Kde vient de sortir en version 0.2.

Avec un architecture à base de plugins, il permet faire beaucoup de choses avec sa bouche ;)

Journal Un «détecteur de mensonge» basé sur la voix

Posté par  .
Étiquettes :
9
16
déc.
2008
Cet article du Monde :

http://www.lemonde.fr/europe/article/2008/12/16/un-detecteur(...)

décrit un système de traque d'éventuels fraudeurs aux allocations publiques basé sur la détection des changements de la voix lors d'une conversation téléphonique.

J'aimerai vraiment que des gens calés en mathématiques et friands d'open source s'essaient à coder ça, que l'on puisse appliquer ça aux discours des gens qui décident la mise en place de ce genre d'outils sympathiques.

Journal On s'en moque mais mon ordi comprend enfin le Français

Posté par  .
Étiquettes :
0
25
juil.
2007
http://www.dailymotion.com/relevance/search/mikfr/video/x2ln(...)

Alors avant de télécharger assurez vous que les pré-requis sont conformes à votre installation.

Il vous faut :
- Perl (which perl pour vous aider à déterminer si vous l'avez...en principe oui)

- Espeak compilé depuis les sources, certaines distributions proposent des packages fonctionnels mais hélas trop anciens.

-Sphinx 2 sans aucune condition supplémentaire, n'importe quelle version devrait faire l'affaire, ne vous souciez pas des dictionnaires le tout étant d'avoir sphinx en version minimale et en anglais.

Téléchargez perlbox (…)

Journal Reconnaissance vocale sous Linux

Posté par  (site web personnel) .
Étiquettes :
0
4
nov.
2005
Par l'intermédiaire de mon travail, je viens de rencontrer une américaine qui utilise un logiciel de reconnaissance vocale pour pouvoir travailler sur son Windows. Avec des problèmes apparents aux poignets, elle utilise entierement la voix pour donner des ordres à Windows, qui s'execute sans trop de problèmes. Je suis à la recherche d'un équivalent en logiciel libre, une idée ? De même, existe t'il des pages web à propos de l'utilisation de Linux pour les handicapés ?

IBM dope la reconnaissance vocale Open Source

Posté par  . Modéré par jerome.
Étiquettes :
0
13
sept.
2004
Audiovisuel
IBM a annoncé qu'il allait donner à la Fondation Apache une collection de logiciels de reconnaissance de la parole (dont le coût de développement est estimé à 10 millions de USD). Ne vous attendez pas à avoir (de nouveau) ViaVoice sous GNU/Linux : ces logiciels ne manipuleront que des mots, dates, heures et endroits (villes, états, ...). De plus, IBM va également donner des outils d'édition de la parole à la Fondation Eclipse, un groupe open source qu'il a créé.

Journal Reconnaissance vocale et logicels libres ?

Posté par  .
1
13
avr.
2004
bonjour tous, (ou bonjour cher journal, en fonction de vos préférences)

je me suis dernièrement posé la question égoiste de savoir si il existait des
solutions de reconnaissances vocales dans notre joli monde des logiciels libres.
Après quelques recherches sur google, j'ai bien trouvé une faq:
http://www.faqs.org/docs/Linux-HOWTO/Speech-Recognition-HOWTO.html(...)
et certains exemples tels que xvoice, mais la plupart de ces logiciels dépendent
du SDK Viavoice d'ibm qui n'est pas libre en plus d'etre distribué sous le
manteau, ou bien ne semblent pas (…)

Voice XML : bientôt un standard pour surfer à la voix

Posté par  . Modéré par Nÿco.
Étiquettes :
0
6
fév.
2004
Internet
Le 3 février 2004, le W3C (Consortium World Wide Web) a publié une proposition de recommendation pour VoiceXML 2.0.

Comme son nom l'indique, VoiceXML 2.0 est une extension du format XML (Extensible Markup Language), principal standard de description de données numériques. Son objectif est «de faciliter l'utilisation des techniques de développement web pour la mise en place d'applications vocales interactives».

Cela entre dans le cadre de la plate-forme Interface Vocale sur lequel le W3C travaille depuis 1999 dans le but d'étendre l'accès universel au Web, à l'aide d'interactions de type clavier téléphonique, commandes vocales, annonces préenregistrées, voix et musiques synthétisées.