Forum général.cherche-logiciel Saisie vocale

Posté par  . Licence CC By‑SA.
Étiquettes :
6
6
avr.
2023

Bonjour,

Je cherche une solution pour une connaissance dont le besoin est simple à énoncer : pouvoir dicter au lieu d'écrire, et remplacer ainsi la saisie au clavier dans LibreOffice ou un éditeur de texte.

La personne utilise un laptop sur lequel tourne une version récente (la dernière, il me semble) de Linux Mint (famille Debian/Ubuntu, donc).

L'idéal serait que le traitement du signal se fasse sur la machine elle-même plutôt que via un service en ligne, mais ce n'est (…)

Forum Linux.debian/ubuntu Voix vers Texte en français avec Deepspeech/CommonVoice [Ubuntu 20.04]

Posté par  (site web personnel) . Licence CC By‑SA.
6
5
oct.
2021

À la recherche d'un logiciel de reconnaissance vocale, j'ai passé quelques heures à installer deepspeech. Bien sûr la documentation que j'ai trouvé sur internet ne parle que des modèles pré entraîné anglais.
La difficulté était donc de trouver des modèles français qui fonctionnent…
Voici un condensé des commandes que j'ai tapé dans le terminal pour avoir de la reconnaissance vocale en français.

Prérequis:

sudo apt install pyaudio portaudio19-dev
mkdir $HOME/tmp/
cd $HOME/tmp/
git clone git@github.com:mozilla/DeepSpeech-examples.git
wget https://github.com/common-voice/commonvoice-fr/releases/download/fr-v0.6/model_tensorflow_fr.tar.xz
tar -Jxvf model_tensorflow_fr.tar.xz

(…)

Sondage Comment aimez-vous les serveurs vocaux ?

Posté par  .
5
22
oct.
2012

On voit utiliser de plus en plus la reconnaissance vocale dans les systèmes de serveurs vocaux (banques, assurances, etc.), comme par exemple pour

  • consulter votre facture, dites facture
  • demander un devis, dites devis
  • etc.

Ces systèmes se veulent modernes, bien que ça ait commencé il y a près de 15 ans (serveur vocal de la cité des sciences de La Villette en 1998 par exemple, auquel il fallait répondre oui ou non). Cependant ces systèmes sont potentiellement gênants, car ils imposent à l'usager (le client) de prononcer à haute voix les mots. Donc dans les lieux publics ou les réunions ça manque de discrétion.

Et vous comment aimez-vous les serveurs vocaux ?

  • Reconnaissance vocale :
    8
    (0.6 %)
  • Chiffres à taper :
    307
    (22.7 %)
  • Les deux : reconnaissance vocale ou chiffres à taper :
    105
    (7.7 %)
  • Pas de serveur vocal : personne physique uniquement au téléphone :
    330
    (24.4 %)
  • Pas de serveur vocal : Internet et clic de souris :
    467
    (34.5 %)
  • Pas de serveur vocal : je me déplace au guichet :
    79
    (5.8 %)
  • Pas de serveur vocal : je reçois les infos par courriel, SMS, etc. :
    59
    (4.4 %)

Total : 1355 votes

Forum général.cherche-logiciel [android] logiciel de transcription voix vers texte

Posté par  . Licence CC By‑SA.
1
30
mai
2017

Bonjour.

Je cherche un logiciel capable d'afficher en temps réel les paroles détectées en texte sur une tablette. Le but est de faciliter la communication avec ma grand mère qui a de gros problèmes auditifs (une oreille HS et l'autre en très piteux état).
L'utilisateur ne serait pas ma grand-mère.

L'appareil de destination est une tablette xperia Z5, je ne connais pas la version d'android qui tourne dessus, très probablement celle d'origine (l'appareil n'est pas a moi).

Journal Reconnaissance vocale et logicels libres ?

Posté par  .
1
13
avr.
2004
bonjour tous, (ou bonjour cher journal, en fonction de vos préférences)

je me suis dernièrement posé la question égoiste de savoir si il existait des
solutions de reconnaissances vocales dans notre joli monde des logiciels libres.
Après quelques recherches sur google, j'ai bien trouvé une faq:
http://www.faqs.org/docs/Linux-HOWTO/Speech-Recognition-HOWTO.html(...)
et certains exemples tels que xvoice, mais la plupart de ces logiciels dépendent
du SDK Viavoice d'ibm qui n'est pas libre en plus d'etre distribué sous le
manteau, ou bien ne semblent pas (…)

Voice XML : bientôt un standard pour surfer à la voix

Posté par  . Modéré par Nÿco.
Étiquettes :
0
6
fév.
2004
Internet
Le 3 février 2004, le W3C (Consortium World Wide Web) a publié une proposition de recommendation pour VoiceXML 2.0.

Comme son nom l'indique, VoiceXML 2.0 est une extension du format XML (Extensible Markup Language), principal standard de description de données numériques. Son objectif est «de faciliter l'utilisation des techniques de développement web pour la mise en place d'applications vocales interactives».

Cela entre dans le cadre de la plate-forme Interface Vocale sur lequel le W3C travaille depuis 1999 dans le but d'étendre l'accès universel au Web, à l'aide d'interactions de type clavier téléphonique, commandes vocales, annonces préenregistrées, voix et musiques synthétisées.

Journal Reconnaissance vocale sous Linux

Posté par  (site web personnel) .
Étiquettes :
0
4
nov.
2005
Par l'intermédiaire de mon travail, je viens de rencontrer une américaine qui utilise un logiciel de reconnaissance vocale pour pouvoir travailler sur son Windows. Avec des problèmes apparents aux poignets, elle utilise entierement la voix pour donner des ordres à Windows, qui s'execute sans trop de problèmes. Je suis à la recherche d'un équivalent en logiciel libre, une idée ? De même, existe t'il des pages web à propos de l'utilisation de Linux pour les handicapés ?

Journal On s'en moque mais mon ordi comprend enfin le Français

Posté par  .
Étiquettes :
0
25
juil.
2007
http://www.dailymotion.com/relevance/search/mikfr/video/x2ln(...)

Alors avant de télécharger assurez vous que les pré-requis sont conformes à votre installation.

Il vous faut :
- Perl (which perl pour vous aider à déterminer si vous l'avez...en principe oui)

- Espeak compilé depuis les sources, certaines distributions proposent des packages fonctionnels mais hélas trop anciens.

-Sphinx 2 sans aucune condition supplémentaire, n'importe quelle version devrait faire l'affaire, ne vous souciez pas des dictionnaires le tout étant d'avoir sphinx en version minimale et en anglais.

Téléchargez perlbox (…)

IBM dope la reconnaissance vocale Open Source

Posté par  . Modéré par jerome.
Étiquettes :
0
13
sept.
2004
Audiovisuel
IBM a annoncé qu'il allait donner à la Fondation Apache une collection de logiciels de reconnaissance de la parole (dont le coût de développement est estimé à 10 millions de USD). Ne vous attendez pas à avoir (de nouveau) ViaVoice sous GNU/Linux : ces logiciels ne manipuleront que des mots, dates, heures et endroits (villes, états, ...). De plus, IBM va également donner des outils d'édition de la parole à la Fondation Eclipse, un groupe open source qu'il a créé.