Appel à contributeur synthèse vocale

Posté par  (site web personnel) . Modéré par rootix.
Étiquettes :
0
30
juil.
2007
Éducation
OFSET fait un appel à contribution pour l'amélioration de la synthèse vocale en français du logiciel libre eSpeak. OFSET utilise cette synthèse vocale dans l'application pédagogique iStoa, l'objectif étant d'augmenter l'accessibilité pour des enfants ayant de petites difficultés de lecture.

Bien sûr toutes les améliorations bénéficieront à l'ensemble de la communauté utilisatrice de synthèse vocale : dispositifs pour mal voyant, logiciels pédagogiques...

eSpeak est un logiciel de synthèse vocale sous licence GPL v3, et iSTOA est une plateforme pédagogique d'activités interactives et de suivi par Internet, multiplateforme et publié sous licence MIT.

Aller plus loin

  • # infos

    Posté par  . Évalué à 5.

    Ayant travaillé avec des personnes mal voyantes je suis intéressé pour apporter ma contribution au projet mais je n'ai pas compris quelle est la contribution attendue même en allant sur le site.

    Qui faut-il contacter pour avoir plus d'information ?
  • # Peut on utiliser...

    Posté par  (site web personnel) . Évalué à 5.

    eSpeak peut être utilisé avec le plugin kttsd en ajoutant une synthèse de lecture utilisant la commande suivante

    espeak --stdin -w %w -v french-test
    Codage de caractère: UTF-8
    cocher "envoyer les données dans l'entrée standard"
    selon les distributions, la commande peut être speack ou espeak.

    Pour connaître la voix disponible pour le français, taper espeak --voices=fr , dans mon cas, c'était french-test
    • [^] # Re: Peut on utiliser...

      Posté par  (site web personnel) . Évalué à 5.

      tu peux même l'utiliser avec kmouth (pareil ou presque pour le configurer) ou zenity qui est très facile à paramétrer.
      http://cookerspot.tuxfamily.org/wikka.php?wakka=SyntheseVoca(...)

      La nouvelle version de espeak propose directement fr comme langue (et aussi celles de mbrola, qui ne sont malheureusement pas libres, pour avoir une voix masculine et une féminine).
      • [^] # Re: Peut on utiliser...

        Posté par  (site web personnel) . Évalué à 3.

        D'où l'appel à contribution pour améliorer la voix proposée directement par eSpeak, qui est la seule à être libre mais qui est largement perfectible.
        • [^] # Re: Peut on utiliser...

          Posté par  (site web personnel) . Évalué à 3.

          Cela peut aussi largement servir aux personnes mal-voyantes ou aveugles, avez-vous essayé de reprendre contact avec oralux / biglux (dont les projets semblent s'être arrêtés vers 2005...) ?
          http://oralux.org/ et http://www.culte.org/projets/biglux/ (notamment [http://www.culte.org/projets/biglux/devel/lao/dechiffrage.sh(...)] et le projet lliaphon [https://gna.org/projects/lliaphon/])

          Il y avait aussi un panorama assez complet sur :
          http://blinuxwiki.pbwiki.com/EduVocale

          et j'avais pris des notes sur http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole quand j'avais regardé.

          Hormis améliorer la voix (ce qui nécessitera quelques séances d'enregistrements) y-a-t-il d'autres sujets à traiter ? (je pense aux décompositions en phonèmes notamment).
          Est-il prévu d'ajouter des documentations (la démarche est souvent difficile à comprendre au début pour voir comment contribuer), je suppose qu'il y a un wiki identifiant les différents sujets à aborder ?
          • [^] # Re: Peut on utiliser...

            Posté par  (site web personnel) . Évalué à 2.

            Re-Lire l'appel à contribution: Oralux est en lien et Gilles aide à cadrer la contribution.

            Non l'amélioration de la voix ne nécessitera pas des séances d'enregistrements.

            Oui il y a un wiki, re-lire l'appel à contribution.
            • [^] # Re: Peut on utiliser...

              Posté par  (site web personnel) . Évalué à 4.

              ah, je ne l'avais pas vu :/ ni dans la dépêche, ni dans l'appel à contribution (le rappel du contexte ne citant pas oralux en tant que tel et uniquement eSpeak et iSTOA).

              Si je l'avais vu, j'aurais rajouté à la modération de la dépêche les liens vers :
              http://oralux.net/wiki/objectif/ qui précise bien le contenu attendu et les pistes de travail
              http://oralux.net/wiki/text2pho/ passage de texte en phonèmes [http://fr.wikipedia.org/wiki/Phon%C3%A8me] utilisant notamment lliaphon (lexique de 80000 mots)
              http://oralux.net/wiki/evaluation/ l'exemple classique "les poules du couvent couvent" => ça m'intéresserait de voir comment cela se traite ?
              À propos, quelle est la licence retenue pour le contenu du wiki ? perso, j'ai tendance à choisir le multi-licence http://cookerspot.tuxfamily.org/wikka.php?wakka=WikiLicense pour pouvoir dispatcher les contenus vers plusieurs autres projets aux licences variées. GFDL et GPL2+ peuvent suffire.

              Tu es peut-être conscient du contexte, étant (trop :) ) plongé dedans, les commentaires sont là aussi pour le rappeler quand il n'a pas été explicitement donné ? Primo, tout le monde ne suit pas les liens ; secondo, les liens que j'ai resuivis à partir de mes notes ne m'ont pas permis de tomber dessus :
              http://oralux.net/ n'en fait pas mention (ça vaudrait le coup àmha d'ajouter un lien),
              une news sur https://gna.org/projects/lliaphon/ pourrait aussi faire de la pub' d'une utilisation en cours,
              un mail sur la ML de biglux pourrait aussi servir, ainsi qu'une mise à jour de [http://www.culte.org/projets/biglux/index.shtml]...
              c'est beaucoup de communication mais bon c'est autant de personnes différentes qui peuvent être contactées et seront sans doute heureuses de participer ou suivre l'avancement. J'espère que tu ne le prends pas comme une critique, si c'en est une, elle se veut positive et j'espère sincèrement que tu auras plus de participants que nécessaire.

              Comment faire une voix féminine par exemple sans réenregistrer ? Hausser le pitch (ou quoique ça s'appelle) ne risque-t-il pas de faire une voix trop artificielle ?
  • # TTS simple et efficace

    Posté par  . Évalué à 2.

    Ce n'est certainement pas ce que tu recherches mais comme je n'ai pas vu de référence à Cicero, je vous invite à tester ce petit programme qui fait simplement et efficacement de la conversion du texte à la parole (TTS quoi)

    http://www.cam.org/~nico/cicero/

    À essayer !
  • # Commentaires

    Posté par  . Évalué à 2.

    Bon, je ne sais pas du tout ce qui est attendu. Voici un retour.

    - espeak s'installe sous /usr au lieu de /usr/local par défaut. Méfiance, cela efface les fichiers du espeak plus ancien de debian.
    - La version s'installe avec des data compilées pour i386. il fut les supprimer pour les recompiler pour ppc. espaek --compile=fr depuis le dossier dictsource a eu l'air de marcher. Ne pas oublier de les effacer avant, sinon ça ne marche pas.

    - le son est peu audible. trop rapide (160 mots par minute par défaut), haché. En ralentissant vitesse et en diminuant le pitch (-s 120 -p 70) le résultat est nettement meilleur. Le réglage par défaut me semble peu convaincant.

    Voici, avec -p 30 -s 120 (pitch 30 et 120 mots par minute) , le passage de:
    Gros gras grand grain d’orge, tout gros-gras-grand-grain-d’orgerisé, quand te dé-gros-gras-grand-grain-d’orgeriseras-tu ? Je me dé-gros-gras-grand-grain-d’orgeriserai quand tous les gros gras grands grains d’orge se seront dé-gros-gras-grand-grain-d’orgerisés.

    http://fynl.free.fr/vrac/espeak/espeak.wav
    • [^] # Re: Commentaires

      Posté par  (site web personnel) . Évalué à 1.

      Les objectifs sont :
      * améliorer la qualité du phonème 'r' en utilisant l'éditeur graphique praat
      * améliorer la prosodie en se basant sur Cicero

      Voir le wiki pour les détails.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.