FreeTTS : de la synthèse vocale libre

Posté par  . Modéré par Nÿco.
Étiquettes :
0
24
avr.
2003
Audiovisuel
Vraiment on trouve de tout dans le logiciel libre. Preuve que l'on peut même réaliser des outils très techniques, j'ai trouvé une bibliothèque libre permettant de créer des logiciels contenant la synthèse vocale.

NdM : TTS = Text To Speech Synthesis. FreeTTS est en Java sous License BSD.
Sinon, il y a aussi Festival et le module speech de Gnopernicus. L'idée me semble très intéressante, les possibilités sont multiples et la demande en technologies vocales en croissance constante. Bien sûr la qualité de la synthèse n'est pas encore parfaite mais elle se rapproche de mal d'autres phonétisateurs. J'ai tout de même rajouté un lien vers ce qui à mon humble avis se fait de mieux en synthèse vocale pour le moment (j'ai fait un stage dans cette entreprise). Enfin FreeTTS semble commencer à utiliser la technologie MBROLA développée par la Faculté polytechnique de Mons en Belgique (et utilisée aussi par Babeltechnologie).

Aller plus loin

  • # Pas de machine virtuelle Java Libre ?

    Posté par  . Évalué à 3.

    heu ...
    je comprends pas.

    et blackdown ? http://www.blackdown.org/(...)
    et libgcj ? http://gcc.gnu.org/java/(...)

    c'est pas libre ? ou ce sont pas des machines virtuelles ?
    ou sinon, du fait meme de l'emploi du terme Java, toute machine virtuelle Java ne peut etre libre puisque soumise a la licence de Sun ?

    je comprends pas monsieur modérateur ;(
    • [^] # Re: Pas de machine virtuelle Java Libre ?

      Posté par  (site web personnel) . Évalué à -2.

      Ca ressemble à de l'anti-java primaire ...
      Comme certain font de l'anti-américanisme, anti-communisme, anti-microsoft primaire .... Oublions ...

      Sinon FreeTSS semble supporter en partie JSAPI (Java Speech API : http://java.sun.com/products/java-media/speech/(...) ). C'est une librairie qui permet de spécifier des outils de synthèse et de reconnaissance vocale.

      Y a t'il un projet opensource pour faire de la reconnaissance vocale pour completer le projet (et supporter entièrement JSAPI) ?
      • [^] # Re: Pas de machine virtuelle Java Libre ?

        Posté par  (site web personnel) . Évalué à 1.

        > Ca ressemble à de l'anti-java primaire ...

        Rrrooooo... et toi tu ressembles à un trolleur primaire ?

        Regarde ma jolie réponse plus bas...:
        > Pour la JVM Blackdown «Software is confidential and copyrighted.»
        > Pour GCJ, c'est GPL, mais c'est un compilo.

        Il n'existe à ma connaissance pas de machine virtuelle Java. Si tu veux compiler en langage machine directement libre à toi, mais tu perds un des avantages de Java : sa portabilité sans recompilation. Maintenant, faire du Libre en Java, c'est bien, mais pas complet : il te manque la JVM.

        Sinon, Java, moi rienàpéter.
        • [^] # Re: Pas de machine virtuelle Java Libre ?

          Posté par  . Évalué à 1.

          "Pour GCJ, c'est GPL, mais c'est un compilo. "

          Compiled applications are linked with the GCJ runtime, libgcj, which provides the core class libraries, a garbage collector, and a bytecode interpreter. libgcj can dynamically load and interpret class files, resulting in mixed compiled/interpreted applications.

          humm ? c'est pas ca une jvm ?
          je parle pas de GCJ , qui est un compilo , mais de libgcj ....
        • [^] # Re: Pas de machine virtuelle Java Libre ?

          Posté par  . Évalué à 2.

          <blockquote>
          Si tu veux compiler en langage machine directement libre à toi, mais tu perds un des avantages de Java : sa portabilité sans recompilation.
          </blockquote>

          En meme temps, Java c'est tout sauf portable... Surtout lorsqu'il y a un minimum d'interface graphique.

          Sur nos serveurs, il n'y a pas moins de 4 jvm pour pouvoir faire tourner a peu près tout correctement
          :-((
        • [^] # Re: Pas de machine virtuelle Java Libre ?

          Posté par  . Évalué à 1.

          Il n'existe à ma connaissance pas de machine virtuelle Java.

          (soupir) Si seulement c'était vrai ;)
    • [^] # Re: Pas de machine virtuelle Java Libre ?

      Posté par  (site web personnel) . Évalué à 4.

      Pour la JVM Blackdown «Software is confidential and copyrighted.»
      Pour GCJ, c'est GPL, mais c'est un compilo.
      • [^] # Re: Pas de machine virtuelle Java Libre ?

        Posté par  (site web personnel) . Évalué à 4.

        $ apt-cache show kaffe
        [ ... ]
        Description: A JVM to run Java bytecode
        This is Kaffe, a virtual machine designed to execute Java bytecode.
        It performs "just-in-time" code conversion from the abstract code to
        the host machine's native code. This will ultimately allow execution of
        Java code at the same speed as standard compiled code but while maintaining
        the advantages and flexibility of code independence.

        $ apt-cache show kissme
        [ ... ]
        Description: A free Java Virtual Machine
        kissme is a free Java Virtual Machine for Linux.
        It uses the GNU Classpath java class library.
        .
        Currently it can only run console applications (there is no working AWT support in Classpath).

        Si j'ai bien compris, l'affirmation correcte est "Les JVM libres sont toutes pourraves", mais pas inexistantes.
        • [^] # Re: Pas de machine virtuelle Java Libre ?

          Posté par  (site web personnel) . Évalué à 3.

          $ apt-cache show orp
          Package: orp
          ...
          Description: Java VM and JIT from Intel Research Lab.
          ORP stands for Open Runtime Platform, which is an Intel(TM) Open
          Source research platform for investigating dynamic compilation and
          memory management technologies. The basic ORP system incorporates a
          fast code generating JIT (Just-In-Time) as well as an optimizing
          .
          JIT. It also includes several GC (Garbage Collection) algorithms,
          ranging from a simple mark-sweep algorithm to an advanced train
          algorithm.

          $ apt-cache show sablevm
          Package: sablevm
          ....
          Description: Free implementation of Java Virtual Machine (JVM) second edition
          SableVM is a portable bytecode interpreter written in C and implementing
          the Java virtual machine specification, second edition. Its goals are to be
          reasonably small, fast, and efficient, as well as providing a well-designed
          and robust platform for conducting research.
      • [^] # Re: Pas de machine virtuelle Java Libre ?

        Posté par  . Évalué à 2.

        Et Kaffe ? http://www.kaffe.org/(...) (GPL mais sérieusement en retard)

        Et Electrical Fire ? http://www.mozilla.org/projects/ef/(...)

        Et tous les liens qui se trouvent là http://www.kaffe.org/links.shtml(...) ?
    • [^] # Re: Pas de machine virtuelle Java Libre ?

      Posté par  (site web personnel) . Évalué à 3.

      http://www.sablevm.org/(...) (en LGPL)

      Pas encore parfait mais en bonne voie....
  • # Re: FreeTTS : de la synthèse vocale libre

    Posté par  . Évalué à 2.

    Y'en a qui ont essayé Festival ?
    j'ai essayé il y a environ 1 an et j'ai été très déçu...
    j'avais le souvenir d'une démo que m'avait fait un maqueux (amateur de mac ?) sur un vieux mac il y a au moins 4 ans et la synthèse intégrée était beaucoup plus avancée que ça (très reconnaisable à l'écoute avec en plus le choix du timbre de voix) !!
    Que vaut FreeTTS//Festival ?

    c'est un sujet qui demande à être développé car très démonstratif (c'est comme quand on fait une démo de Gimp avec un script-fu, ça bouge dans tous les sens et au finish apparaît un super logo avec le prénom de ton interlocuteur, et là il est intéressé...).
  • # Re: FreeTTS : de la synthèse vocale libre

    Posté par  (site web personnel) . Évalué à 4.

    Par contre MBROLA http://tcts.fpms.ac.be/synthesis/mbrola.html(...) c'est pas libre mais alors pas libre du tout. Pour une technologie développée par une Faculté, je trouve ça un peu limite (mais c'est loin d'être exceptionnel malheureusement)
  • # Re: FreeTTS : de la synthèse vocale libre

    Posté par  . Évalué à 4.

    Le projet accessibility de KDE http://accessibility.kde.org/(...) , qui sera intégré dans KDE 3.2, comporte un module de synthese de voix basé sur festival. Bientot notre bo pc pourra nous annoncer "qu'il n'y a plus de papier dans l'imprimante". Chouette !

    Quelqu'un sait si le français va bientot être ajouté ? Parce que pour l'instant, l'accent américain, ça le fait pas trop...
  • # Re: FreeTTS : de la synthèse vocale libre

    Posté par  . Évalué à 2.

    Personnellement, je trouve les voix générées par RealSpeakexcellentes.... (http://www.scansoft.com/realspeak/demo/(...) )

    Ca n'est malheureusement pas un produit libre. Que ça ne vous empêche pas d'écouter les démos et de tester leurs produits !
    • [^] # Re: FreeTTS : de la synthèse vocale libre

      Posté par  . Évalué à 3.

      bon je vai essayer de te repondre pour avoir poster la news et fait mon stage dans la technologie vocale (dans la boite dont j'ai laisse le lien) . Tout d'abord il faut savoir que la societe en question en question (babelTechnologie) est un spin off de la FPMS (faculté polytechnique de mons). Babel est née avec Mbrola et ont donc decidé de commercialiser leur technologie vocale. Ils font a la fois de la synthèse, de la reconnaissance et l'identification vocale. Les société qui achète Mbrola l'achete "brut". Babel au fil desd années a retravaillé la technologie en y ajoutant pas mal de fonctionalités (je ne sais pas trop lequels puisque j'ai principalement bossé avec la reconnaissance vocale). Celle ci vend alors une SDK aux entreprises pour qu'elles puissent developper leurs produits. Je dois dire que si tu ecoute la synthèse Mbrola sur leur site c'est deja pas mal et je trouve largement mieux que leur concurent notament l'ex defunte société yperoise. Maintenant je suis assez surpris par leur technologie bright speech qui enleve maintenant cette voix un peu mecanique.

      Maintenant je vien de tester la voix scansoft et on peut dire qu'elle se raproche pas mal de Mbrola babel. La seule petite remarque que j'ai c'est que la ponctuation n'est pas génialement respectée et que l'on a encore un peu cette voix de robot.

      Pour en revenir au libre je crois pas que l'on aura un jour une vrai alternative libre et viable pour la reconnaissance vocale et la synthèse il s'agit d'un marché en plein expension et assez specialisé et je crois que le libre doit d'abortd oeuvrer dasn d'autres directions d'abord comme celle de la bureautique cette annee et dans laquelle de gros effort sont encore necessaire....
      • [^] # Re: FreeTTS : de la synthèse vocale libre

        Posté par  . Évalué à 1.

        Nous nous sommes mal compris ! Je suis le projet MBrola depuis un certain temps et j'ai toujours été très impressionné par la qualité de leurs productions !

        La technologie "Brightspeech" est vraiment très étonnante, et j'ai hâte de voir comment ça se comporte dans une situation réelle et pas sur un fichier enregistré.

        Je connais très peu de chose en synthèse vocale, je m'y intéresse parce que je bosse dans le domaine du handicap et que les demandes sont nombreuses... La solution Microsoft, acheté à l'ex société d'Ypres, est très largement dépassée maintenant ( et heureusement !).

        Il me semble que techniquement les approches de Mons (travail à partir d'un corpus) et celle de RealSpeak (synthèse de formants) sont très différentes...

        Donc, tout cela pour dire qu'il existe d'autres approches !
      • [^] # Re: FreeTTS : de la synthèse vocale libre

        Posté par  . Évalué à 1.

        J'espère que tu te trompes parce que s'il y a bien un domaine où le libre pourrait bien marcher c'est celui là. J'ai eu l'occasion de tester plusieurs solutions, mon père étant malvoyant. Celle que j'ai vues sont des truc bricolées, sous windows ou sous dos. Celle qu'il utilise lui, y'a des bouts d'omnipage pro, une synthèse vocale et une interface toute conne. Le tout est piloté au clavier bien évidemment, l'intérêt d'avoir un système de fenetrage windows est donc nul. Ca lui permet de scanner un document, qui lui est lu après. Il peut aussi taper des textes dessus. Pas moyen d'aller sur le web ni de lire ses mails...
        J'ose pas imaginer ce que pourrait faire un emacs bien configuré avec une synthèse vocale. En fait à peu près tout. J'imagine que c'est ce que fait emacspeak mais il lui faut une synthèse matrielle il me semble, donc pas pu tester. Par contre si quelqu'un arrive à le faire fonctionner avec une synthèse soft, ça m'intéresse.
        Une distibution knoppix avec une synthèse correcte serait un vrai bonheur. Je ne serais pas contre y participer d'ailleurs, si d'autres gens étaient motivés....
        • [^] # Emacspeak

          Posté par  . Évalué à 1.

          J'imagine que c'est ce que fait emacspeak mais il lui faut une synthèse matrielle il me semble

          Non non, j'avais testé une fois, pour voir (enfin, pour entendre... ok ->[]) et je l'avais
          fait marcher avec un soft de synthese d'IBM librement telechargeable (ViaVoice Outloud).
          Mais ça fait longtemps et je ne me souviens plus des détails, en tout cas ça ne m'avait pas posé de difficulté.

          En revanche Viavoice parlait uniquement en anglais je crois.

          Mais si tu regardes dans le package FreeTTS, il y a justement un module pour le faire marcher avec EmacSpeak! (pas testé)
        • [^] # Re: FreeTTS : de la synthèse vocale libre

          Posté par  . Évalué à 1.

          oui tu as raisons je ne pensais pas du tout à ce domaine.... Faut dire que durant mon stage je ne voyais que les possibilités que babel voulit vendre cad principalement dans l'embarqué (jouet parlant, voiture integrant les techno vocales, maisons inteligentes et autres serveurs telephonique) ou encore utiliser la synthèse pour faire des pub dans les grandes surfaces. Tu pourra remarquer que dans ces domaine le libre aura du mal mais c'est pas impossible à s'imposer.
  • # lia_phon : un outil 100% GPL

    Posté par  (site web personnel) . Évalué à 5.

    Javais eu la possibilité il y a 6 mois d'utiliser un outil de phonétisation 100% GPL :
    lia_phon, développé par Frédéric Béchét, du LIA (Laboratoire d'Informatique d'Avignon, spécialisé sur le traîtement de la voix...)

    J'ai eu un peu de mal à retrouver le lien :
    http://tcts.fpms.ac.be/synthesis/mbrola/tts/French/lia_phon.tar.gz(...)

    Comme c'est développé par un chercheur français, je peux dire que la phonétisation est bien meilleure qu'avec un application du type festival...

    Du coup, en cherchant l'url pour télécharger, je suis tombé sur cette page qui décrit un peu la bête :
    http://www.biomath.jussieu.fr/ATALA/outil/lia_phon_bechet_frederic.(...)
  • # Applications de la synthèse vocale

    Posté par  . Évalué à 1.

    Intéressant ! quelqu'un peut-il me dire quelles sont les applications de la synthèse vocale ?
    • [^] # Re: Applications de la synthèse vocale

      Posté par  (site web personnel) . Évalué à 1.

      ...ne serait-ce que pour les non- et mal-voyants... pour lire une page web, retire du fric au distributeur...
    • [^] # Re: Applications de la synthèse vocale

      Posté par  . Évalué à 1.

      je suis un peu feignéant donc je donne ci dessous un extrait de mon TFE répondant à ta question

      "L’activité de BaBel peut se scinder en trois domaines d’application à savoir:

      · les télécommunications,
      · les plates-formes embarquées,
      · les multimédias.

      En effet, la société met en oeuvre les technologies vocales pour créer de nouveaux services de télécommunications. Actuellement, par exemple, les services téléphoniques, notamment les 0800 et les 0900, utilisent une navigation basée sur les touches du clavier téléphonique. Grâce à la technologie vocale, il suffit simplement de parler au lieu d’utiliser le clavier. Mais en fait, cette utilisation de la parole plutôt que des 10 touches permet d’augmenter considérablement les possibilités offertes par de tels systèmes: en effet, l’utilisateur pourra dès lors avoir des centaines ou des milliers de choix accessibles au même moment. Par exemple, la société a déjà travaillé à l’élaboration d’un service météo où il suffit simplement de donner le nom de la ville pour recevoir les prévisions sur le temps qu’il fera.
      Un autre projet fut par exemple la lecture d’E-mails par téléphone. Lorsqu’un courrier arrive dans la messagerie électronique, un propriétaire de GSM peut se faire appeler par un serveur téléphonique intelligent et le message est lu électroniquement.


      Les plates-formes embarquées quant à elles, regroupent tout ce qui est mobile. Prenons l’exemple des téléphones mobiles: ceux-ci devenant de plus en plus sophistiqués, BaBel per-met d’intégrer des options de plus en plus complexes. Le vocal a en effet beaucoup d’avenir dans ce type de produits mais également dans l’automobile où on pourrait envisager que l’homme puisse à l’aide de sa voix commander les appareils de la voiture, et également dans l’électronique de consommation (c’est-à-dire le contrôle du chauffage, de l’éclairage, de la vidéo par la voix, …).

      Le dernier domaine d’application concerne les médias. Un des produits proposé par la société est l’utilisation du vocal dans des bornes interactives. Celles-ci permettent de donner des in-formations. Dans une galerie marchande inconnue, il suffira de demander où se trouve tel magasin et la borne servira de guides aux clients égarés. Une autre illustration est l’aide aux aveugles. Ces derniers devaient se contenter d’un clavier en braille. Désormais, grâce à la synthèse vocale, ils peuvent utiliser un peu plus leur P.C pour lire leurs E-mails et travailler sur Word. Comme dernier exemple, BaBel a également permis la création de petits personna-ges en 3D pouvant parler.
      "

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.