Articles précédents : Développeur
- [15] Azuki recherche des contributeurs
- [126] Intel libère TBB
- [21] Sortie de la version 2.5 du langage Tom
- [15] Ouverture du code de CFE, un nouveau frontend C/C++ et sortie de l'infrastructure de compilation LLVM 2.0
- [21] Jajuk, l'organisateur de collection musicale recherche des développeurs
- [19] Relief 1.1, visualisation 3D de projets Java
- [119] Zend Framework 1.0.0 : PHP à la suite de Ruby on Rail
- [17] Mesa 7.0 : OpenGL 2.0 et 2.1
- [50] Anjuta 2.2.0 - Hurricane - est sorti
- [23] AJAX Chat Engine a besoin de vous
Liens connexes
- Appel à contribution (530 hits)
- eSpeak (391 hits)
- iStoa (221 hits)
Dépêche modérée par
Dépêche éditée par
Développeur : Appel à contributeur synthèse vocale
Posté par Fernandes Hilaire (page perso, ). Modéré le 30 juillet 2007.Bien sûr toutes les améliorations bénéficieront à l'ensemble de la communauté utilisatrice de synthèse vocale : dispositifs pour mal voyant, logiciels pédagogiques...
eSpeak est un logiciel de synthèse vocale sous licence GPL v3, et iSTOA est une plateforme pédagogique d'activités interactives et de suivi par Internet, multiplateforme et publié sous licence MIT.
Appel à contribution (530 hits)
eSpeak (391 hits)
iStoa (221 hits)
> Lire la dépêche (14 commentaires, moyenne: 2,9).
infos
Ayant travaillé avec des personnes mal voyantes je suis intéressé pour apporter ma contribution au projet mais je n'ai pas compris quelle est la contribution attendue même en allant sur le site.
Qui faut-il contacter pour avoir plus d'information ?
-
[^]Re: infos
Posté par nats (Jabber id, page perso, ) le 30/07/2007 à 12:20. (lien). Évalué à 3.Si j'ai bien compris il cherche quelqu'un pour améliorer les librairies des divers langages.
http://espeak.sourceforge.net/languages.html--
On vous ment! Mais pas moi...-
[^]Re: infos
Posté par Fernandes Hilaire (page perso, ) le 30/07/2007 à 15:57. (lien). Évalué à 4.Non uniquement pour le français, je cite :
OFSET recherche une ou des personnes intéressées par le domaine pour améliorer la qualité de la synthèse vocale en français de ce logiciel.
-
Peut on utiliser...
eSpeak peut être utilisé avec le plugin kttsd en ajoutant une synthèse de lecture utilisant la commande suivante
espeak --stdin -w %w -v french-test
Codage de caractère: UTF-8
cocher "envoyer les données dans l'entrée standard"
selon les distributions, la commande peut être speack ou espeak.
Pour connaître la voix disponible pour le français, taper espeak --voices=fr , dans mon cas, c'était french-test
-
[^]Re: Peut on utiliser...
Posté par baud123 (Jabber id, page perso, ) le 30/07/2007 à 13:44. (lien). Évalué à 5.tu peux même l'utiliser avec kmouth (pareil ou presque pour le configurer) ou zenity qui est très facile à paramétrer.
http://cookerspot.tuxfamily.org/wikka.php?wakka=SyntheseVoca(...)
La nouvelle version de espeak propose directement fr comme langue (et aussi celles de mbrola, qui ne sont malheureusement pas libres, pour avoir une voix masculine et une féminine).-
[^]Re: Peut on utiliser...
Posté par Fernandes Hilaire (page perso, ) le 30/07/2007 à 15:53. (lien). Évalué à 3.D'où l'appel à contribution pour améliorer la voix proposée directement par eSpeak, qui est la seule à être libre mais qui est largement perfectible.
-
[^]Re: Peut on utiliser...
Posté par baud123 (Jabber id, page perso, ) le 30/07/2007 à 19:07. (lien). Évalué à 3.Cela peut aussi largement servir aux personnes mal-voyantes ou aveugles, avez-vous essayé de reprendre contact avec oralux / biglux (dont les projets semblent s'être arrêtés vers 2005...) ?
http://oralux.org/ et http://www.culte.org/projets/biglux/ (notamment [http://www.culte.org/projets/biglux/devel/lao/dechiffrage.sh(...)] et le projet lliaphon [https://gna.org/projects/lliaphon/])
Il y avait aussi un panorama assez complet sur :
http://blinuxwiki.pbwiki.com/EduVocale
et j'avais pris des notes sur http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole quand j'avais regardé.
Hormis améliorer la voix (ce qui nécessitera quelques séances d'enregistrements) y-a-t-il d'autres sujets à traiter ? (je pense aux décompositions en phonèmes notamment).
Est-il prévu d'ajouter des documentations (la démarche est souvent difficile à comprendre au début pour voir comment contribuer), je suppose qu'il y a un wiki identifiant les différents sujets à aborder ?-
[^]Re: Peut on utiliser...
Posté par Fernandes Hilaire (page perso, ) le 30/07/2007 à 21:38. (lien). Évalué à 2.Re-Lire l'appel à contribution: Oralux est en lien et Gilles aide à cadrer la contribution.
Non l'amélioration de la voix ne nécessitera pas des séances d'enregistrements.
Oui il y a un wiki, re-lire l'appel à contribution.-
[^]Re: Peut on utiliser...
Posté par baud123 (Jabber id, page perso, ) le 30/07/2007 à 23:48. (lien). Évalué à 4.ah, je ne l'avais pas vu :/ ni dans la dépêche, ni dans l'appel à contribution (le rappel du contexte ne citant pas oralux en tant que tel et uniquement eSpeak et iSTOA).
Si je l'avais vu, j'aurais rajouté à la modération de la dépêche les liens vers :
http://oralux.net/wiki/objectif/ qui précise bien le contenu attendu et les pistes de travail
http://oralux.net/wiki/text2pho/ passage de texte en phonèmes [http://fr.wikipedia.org/wiki/Phon%C3%A8me] utilisant notamment lliaphon (lexique de 80000 mots)
http://oralux.net/wiki/evaluation/ l'exemple classique "les poules du couvent couvent" => ça m'intéresserait de voir comment cela se traite ?
À propos, quelle est la licence retenue pour le contenu du wiki ? perso, j'ai tendance à choisir le multi-licence http://cookerspot.tuxfamily.org/wikka.php?wakka=WikiLicense pour pouvoir dispatcher les contenus vers plusieurs autres projets aux licences variées. GFDL et GPL2+ peuvent suffire.
Tu es peut-être conscient du contexte, étant (trop :) ) plongé dedans, les commentaires sont là aussi pour le rappeler quand il n'a pas été explicitement donné ? Primo, tout le monde ne suit pas les liens ; secondo, les liens que j'ai resuivis à partir de mes notes ne m'ont pas permis de tomber dessus :
http://oralux.net/ n'en fait pas mention (ça vaudrait le coup àmha d'ajouter un lien),
une news sur https://gna.org/projects/lliaphon/ pourrait aussi faire de la pub' d'une utilisation en cours,
un mail sur la ML de biglux pourrait aussi servir, ainsi qu'une mise à jour de [http://www.culte.org/projets/biglux/index.shtml]...
c'est beaucoup de communication mais bon c'est autant de personnes différentes qui peuvent être contactées et seront sans doute heureuses de participer ou suivre l'avancement. J'espère que tu ne le prends pas comme une critique, si c'en est une, elle se veut positive et j'espère sincèrement que tu auras plus de participants que nécessaire.
Comment faire une voix féminine par exemple sans réenregistrer ? Hausser le pitch (ou quoique ça s'appelle) ne risque-t-il pas de faire une voix trop artificielle ?-
[^]Re: Peut on utiliser...
Posté par Fernandes Hilaire (page perso, ) le 31/07/2007 à 07:31. (lien). Évalué à 3.Merci de tes nombreux liens et indications.
Pour les questions techniques sur la synthèse, je m'appuie sur les connaissances et compétences de Gilles et Oralux.
-
-
-
-
-
TTS simple et efficace
Ce n'est certainement pas ce que tu recherches mais comme je n'ai pas vu de référence à Cicero, je vous invite à tester ce petit programme qui fait simplement et efficacement de la conversion du texte à la parole (TTS quoi)
http://www.cam.org/~nico/cicero/
À essayer !
-
[+] [^]Re: TTS simple et efficace
Posté par Fernandes Hilaire (page perso, ) le 30/07/2007 à 21:33. (lien). Évalué à -1.Re-Lire l'appel à contribution...
Commentaires
Bon, je ne sais pas du tout ce qui est attendu. Voici un retour.
- espeak s'installe sous /usr au lieu de /usr/local par défaut. Méfiance, cela efface les fichiers du espeak plus ancien de debian.
- La version s'installe avec des data compilées pour i386. il fut les supprimer pour les recompiler pour ppc. espaek --compile=fr depuis le dossier dictsource a eu l'air de marcher. Ne pas oublier de les effacer avant, sinon ça ne marche pas.
- le son est peu audible. trop rapide (160 mots par minute par défaut), haché. En ralentissant vitesse et en diminuant le pitch (-s 120 -p 70) le résultat est nettement meilleur. Le réglage par défaut me semble peu convaincant.
Voici, avec -p 30 -s 120 (pitch 30 et 120 mots par minute) , le passage de:
Gros gras grand grain d’orge, tout gros-gras-grand-grain-d’orgerisé, quand te dé-gros-gras-grand-grain-d’orgeriseras-tu ? Je me dé-gros-gras-grand-grain-d’orgeriserai quand tous les gros gras grands grains d’orge se seront dé-gros-gras-grand-grain-d’orgerisés.
http://fynl.free.fr/vrac/espeak/espeak.wav
-
[^]Re: Commentaires
Posté par Fernandes Hilaire (page perso, ) le 01/08/2007 à 08:37. (lien). Évalué à 1.Les objectifs sont :
* améliorer la qualité du phonème 'r' en utilisant l'éditeur graphique praat
* améliorer la prosodie en se basant sur Cicero
Voir le wiki pour les détails.




Cette discussion est archivée, il n'est plus possible de laisser des commentaires.
Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.