Forum Linux.debian/ubuntu Voix vers Texte en français avec Deepspeech/CommonVoice [Ubuntu 20.04]

Posté par  (site web personnel) . Licence CC By‑SA.
6
5
oct.
2021

À la recherche d'un logiciel de reconnaissance vocale, j'ai passé quelques heures à installer deepspeech. Bien sûr la documentation que j'ai trouvé sur internet ne parle que des modèles pré entraîné anglais.
La difficulté était donc de trouver des modèles français qui fonctionnent…
Voici un condensé des commandes que j'ai tapé dans le terminal pour avoir de la reconnaissance vocale en français.

Prérequis:

sudo apt install pyaudio portaudio19-dev
mkdir $HOME/tmp/
cd $HOME/tmp/
git clone git@github.com:mozilla/DeepSpeech-examples.git
wget https://github.com/common-voice/commonvoice-fr/releases/download/fr-v0.6/model_tensorflow_fr.tar.xz
tar -Jxvf model_tensorflow_fr.tar.xz

(…)

gSpeech passe en 0.10

Posté par  . Édité par tisaac, palm123, Xavier Teyssier, Davy Defaud et claudex. Modéré par Davy Defaud. Licence CC By‑SA.
38
15
déc.
2020
Son

gSpeech est un petit utilitaire permettant la synthèse vocale sur GNU/Linux. Cette dépêche retrace les évolutions depuis la version 0.8 et esquisse des évolutions possibles pour le futur.

Journal gSpeech passe en 0.10

Posté par  . Licence CC By‑SA.
20
27
juin
2020
Ce journal a été promu en dépêche : gSpeech passe en 0.10.

Bonjour à tous.

gSpeech est un petit utilitaire que je vous avait déjà présenté ici pour le lancement de la 0.8 : https://linuxfr.org/users/mothsart/journaux/lancement-de-gspeech-0-8 et qui permet la synthèse vocale sur linux.
Une présentation, somme toute sommaire est disponible ici : https://wiki.primtux.fr/doku.php/gspeech

Je rappel que avant tout, j'ai repris et amélioré ce soft en vue d'améliorer l'expérience utilisateur dans la distribution Primtux et par conséquent pour le milieu francophone.
Maintenant, son usage permet bien évidement de couvrir un champ plus large.

(…)

Forum Linux.général Synthèse vocale Pico tts et voix supplémentaires

Posté par  . Licence CC By‑SA.
2
28
mar.
2018

Bonjour à tous

J'ai mis en place pico tts sur un système à base de x86 sous Debian tout fonctionne très bien. Mais la voix fournie en français par défaut ne me plaît pas trop. J'ai fais une recherche pour savoir si des voix additionnelles existaient.

A priori ce n'est pas le cas. Donc je me demandai si il était possible de créer une voix personnalisée.

Je me demandais, si quelqu'un connaissait des spécifications ou des outils permettant de faire (…)

Forum général.cherche-logiciel Ma copine fais du théâtre. (text to speech)

Posté par  (site web personnel) .
Étiquettes :
3
13
juin
2011

Je sais vous vous en foutez.

Voilà l'idée. Elle apprend en ce moment un texte, et pour cela enregistre les répliques grâce à Audacity, ce qui lui permet de lire/apprendre/répéter son texte avec une réplique virtuelle. Je me demandais s'il existait une appli capable, grâce à un copié/collé ou une entrée clavier, de lire du texte, en réglant peut-être le débit, surtout les pauses entre chaque tirade.

Le fait que la voix soit synthétique n'a aucune importance pour une italienne (…)

Tux Droid est mort, vive Tux Droid !

Posté par  . Modéré par Florent Zara.
Étiquettes :
18
21
août
2010
Linux
Kysoh, société belge produisant Tux Droid, a fermé ses portes au mois de juillet pour faillite. Depuis, les sources et paquets d'installation ne sont plus publiquement disponibles.

Tux Droid est un robot libre sans fil à l'image de la mascotte Tux, permettant d'utiliser les services internet et de contrôler l'ordinateur. Il est nécessaire d'installer un logiciel sur son ordinateur, MS Windows ou GNU/Linux, pour contrôler par interface web l'appareil. Un dongle en forme de poisson se connecte en USB à l'ordinateur et communique par onde radio avec Tux Droid permettant ainsi de s'affranchir d'une connexion personnelle wifi. Tux Droid n'a pas besoin non plus de serveur central pour communiquer.

À l'heure actuelle, les sources sont en cours de migration sur sourceforge. Un des soucis à venir est l'utilisation de la bibliothèque non libre Acapela pour le TTS (Text to Speech, Synthèse vocale).

Son canal IRC reste disponible (#tuxdroid@freenode). Le projet a besoin d'être repris par la communauté pour continuer d'exister.

NdM : Rappelons que Kysoh avait régulièrement soutenu les concours et autres quizz organisés par LinuxFr.org en nous permettant de faire gagner des Tux Droid. Encore merci à eux.

Forum général.cherche-logiciel Text-to-speech chinois

Posté par  .
Étiquettes :
1
6
fév.
2010
Bonjour à tous,

je recherche depuis un petit bout de temps un logiciel de text-to-speech gérant le mandarin et qui soit disponible sous Linux (si possible libre, mais devant l'offre, je pourrais faire une concession...). Est-ce que cela existe déjà, ou y a-t-il des projets en cours que je pourrais aider?

Un logiciel faisant l'inverse pourrait également m'intéresser.

Publication d'une « Base audio libre de mots tchèques »

Posté par  . Modéré par Nÿco.
0
20
nov.
2007
Éducation
Le « Projet Shtooka » est fier de pouvoir vous présenter sa dernière collection audio de mots et expressions.

La « Base audio libre de mots tchèques » rassemble l'enregistrement de la prononciation d'environ 3500 mots et expressions en langue tchèque.

Le contenu de cet ensemble d'enregistrement audio est distribué sous licence « Creative Commons Paternité 2.0 ». Vous pouvez donc librement la télécharger, la modifier, la rediffuser.

Ces enregistrements peuvent bien évidemment être écoutés par les personnes étudiant la langue tchèque leur permettant ainsi de faire connaissance avec la prononciation réelle des différents mots appris. Cependant, cette collection se destine essentiellement à la production de matériel pédagogique. Grâce à la mise à disposition d'index au format XML, les enregistrements peuvent être intégrés dans des dictionnaires électroniques, des plateformes pédagogiques ou bien être utilisés par des logiciels éducatifs.

Les verbes irréguliers anglais enfin libres !

Posté par  . Modéré par rootix.
0
29
oct.
2007
Éducation
Le Projet Shtooka a enregistré la prononciation des formes conjuguées d'environ 160 verbes irréguliers anglais qui sont habituellement présentés dans les manuels scolaires. Cette collections, comme l'ensemble des collections enregistrées par le Projet Shtooka (comme la "Base audio libre de mots français"), est distribuée sous licence "Creative Commons Paternité 2.0".

Ces fichiers sonores ont été prononcés par Alyson Heimer, une étudiante américaine originaire du Massachusetts.

Un ensemble d'exercices audio de mémorisation est mis à disposition des internautes sous la même licence. La prononciation des formes conjuguées est précédée de la traduction du verbe en français. L'apprenant peut alors mémoriser les verbes irréguliers grâce à une écoute répétée, se familiarisant par là même avec leur prononciation réelle.

Base audio libre de mots français

Posté par  . Modéré par Mouns.
1
16
juil.
2006
Son
La "Base Audio Libre De Mots Français" est une base de données d'enregistrements sonores tirés d'une liste d'environ 7000 mots ou expressions en langue française. Le contenu de cette base de données est distribué librement sous licence "Creative Commons By-ShareAlike 2.0".

Ces fichiers sonores sont essentiellement destinés aux personnes étudiant le français comme langue étrangère ainsi qu'à la production de matériel pédagogique. La liste des mots est tirée du dictionnaire bilingue franco-anglais libre distribué par freedict.org (Il a été ajouté un ou plusieurs articles aux substantifs).

L'ensemble des enregistrements sonores, accompagné d'une index XML et d'un index alphabétique HTML peut être téléchargé depuis le site. Les fichiers audio peuvent également être téléchargés individuellement aux formats ogg et mp3.

FreeTTS : de la synthèse vocale libre

Posté par  . Modéré par Nÿco.
Étiquettes :
0
24
avr.
2003
Audiovisuel
Vraiment on trouve de tout dans le logiciel libre. Preuve que l'on peut même réaliser des outils très techniques, j'ai trouvé une bibliothèque libre permettant de créer des logiciels contenant la synthèse vocale.

NdM : TTS = Text To Speech Synthesis. FreeTTS est en Java sous License BSD.
Sinon, il y a aussi Festival et le module speech de Gnopernicus.