• # complexe

    Posté par  (site web personnel) . Évalué à -2.

    La reconnaissance vocale est quelque chose de trés complexe sur quoi de nombreux groupes se sont cassé les dents.

    Pour ma part je me dis que si MS se permet de faire une présentation meme si celle ci a (encore) foiré c'est qu'ils ont quand meme de la ressource sous le pied et dans ce domaine ca peut vouloir tout dire. Soit ils ont trouvé un moyen quelconque de faire que ca marche pas trop mal, soit ils ont poussé des techno existantes tres loin, soit ils ont ré-inventé un truc qui promet beaucoup et qui comme les autres ne marchera jamais vraiment.
    • [^] # Re: complexe

      Posté par  (site web personnel) . Évalué à 1.

      Je me souviens avoir eu un soft avec un nom du genre « Dragon natural speaking » qui faisait de la reconnaissance vocale et je l'avais sous Win95 ou 98 ! Et il me semble (j'étais petit) que ça marchait pas mal... Régression générale ?
      • [^] # Re: complexe

        Posté par  (site web personnel) . Évalué à 2.

        Dragon dictat qu'il s'appelait me semble t'il. Et non ce n'est pas de la régression. Dragon dictat faisait de la reconnaissance par apprentissage en gros tu lui apprenais a reconnaitre des sons en fonction de ta voix.

        Sauf qu'une langue orale quelqu'elle soit est trés complexe. Il y a de nombreux mots qui sont prononcés de maniéres différentes meme s'ils s'ecrivent avec les memes sons a l'ecrit. résultat sur ces mots le logiciel se rend fou.

        La théorie pour faire un bon logiciel de reconnaissance vocale serait de faire un traitement sur le signal audio de la voie pour reconnaitre les sons séparément et ensuite faire déterminer au logiciel quel a été le son donné puis lui faire retranscrire en texte uniquement de maniére phonique. Seulement une fois ceci fait une légére correction par dico pourrait étre effectuée. Seulement voila on ne peut pas traiter le signal de la voie aussi simplement car le jour ou tu as un rhume le spectre de ta voir sur la phrase "bonjour maman" ne ressemble plus du tout a celui de ta voie quand tu dis la meme phrase sans étre malade.

        Donc non ce n'est pas une régression général. Si MS sort un logiciel de dictée qui ne nécessite pas les heures d'apprentissage nécessaires avec les précédents logiciels pour obtenir des résultats a peine correctes alors ca sera une belle avancée.

        Puis les dragon dictat et ibm voice jsaipluquoi n'ont jamais marché commercialement parce que justement ca marche mal et qu'il faut passer beaucoup de temps dessus pour que ca commence a marcher un peu bien.
  • # C'est pas avec le libre que ça risque d'arriver

    Posté par  . Évalué à 6.

    Vu qu'il n'y a pas de système de reconnaissance vocale qui marche vaguement ....
    • [^] # Re: C'est pas avec le libre que ça risque d'arriver

      Posté par  . Évalué à 0.

      Je plusserais ardemment si je le pouvais. Le retard dans le libre est tel (et il n'est pas anormal, ce n'est pas un domaine facile) qu'il n'y a pas de leçon à donner.

      Personnellement, je connais quelqu'un qui tape des cours de cette façon et c'est sur que c'est bien plus rapide que moi qui tape au clavier et surtout moins fatigant (même s'il est indispensable de corriger après) et là ça me fait regretter pas mal windows.

      Si par contre quelqu'un connaît un outil dans un but bureautique pour faire ça sous linux et qui fonctionne, merci de me le dire. Il y a quelques années j'avais entendu parler d'un logiciel d'IBM qui existerait en binaire pour linux mais je n'ai pas suivi.
      • [^] # Commentaire supprimé

        Posté par  . Évalué à 1.

        Ce commentaire a été supprimé par l’équipe de modération.

        • [^] # Re: C'est pas avec le libre que ça risque d'arriver

          Posté par  . Évalué à -3.

          HAHA ! Micromou s'est vautré... lol mdddrrrrrr
          Et venant de toi, je me dis que ce qui est encore plus rigolo c'est que ce genre d'humour doit automatiquement marcher sur la tribune puiqu'ailleurs sur dlfp tout le monde doit être d'accord pour trouver ça drôle sinon c'est qu'il doit péter un coup.
          Ce qui me fait dire que j'ai encore plus envie qu'avant de mouler histoire de revoir des blagues.

          Plus Moins sérieusement, en parlant de blagues on va aussi faire chacun notre petit florilège. Ah zut, c'est bête on ne pense jamais à enregistrer ce qui se passe quand on utilise des médias amovibles sous linux notamment maintenant les clefs usb alors que sous micromou c'est tout le temps impec.llllloooollll mddrrrr
          Ah daubian et leur distro très stable au summum de la sécu qui régulièrment se fait ridiculiser par des failles. lllloooollllll mmmmdddddrrrrrr
          Je continue ?
          L'incapacité à créer du linux grand public. Ah bah oui il y a toujours des exceptions mais sous windows et mac jamais. lllloooollllll mdddrrrr (et si linux n'était pas destiné à dépasser les 5£ de parts ? pourquoi vouloir aller plus loin)
          La veille qui jusqu'à il y peu marchait super sous linux pour les portables. lllooolllll mmdddddrrrrrr

          Bref, je pourrais passer encore du temps à ça mais j'ai bien assez fait puéril ce soir, peut-être ai-je atteint le niveau du moment.... non ? Peut-être...
          Ah non je ne rigole pas à cette blague, je dois péter un coup parce que j'ai un balai dans le cul. Ah oui bien sur je vois venir le truc, je suis politiquement correct... et bien je vous emmerde (ça vous fait rire de lire ça, ben moi aussi honnêtement :).
          Finalement, les seuls qui puissent rire là-dedans ce sont peut-être les *BSDistes, que je ne suis pas particulièrement (pas en ce moment même en tous cas), qui réussissent bien dans leurs objectifs.

          Et pour tout dire, je n'ai même pas vu la video mais je regarderai avec plaisir celles sur nux qui se vautre comme une superbe bouse, non pas parce que ça me satisfaira mais parce que je penserai à ceux qui gémiront après s'être marrés sur le dos de windows. Je ne pense pas spécialement à toi, je sais que ça te fera marrer et d'ailleurs je ssais très bien que tu as écrit ce message pour me provoquer et comme tu le vois je ne t'en veux pas puisque j'y réponds. Merci d'ailleurs à ce sujet de ta provocation pour m'avoir décidé à dire ce que j'avais envie.
          • [^] # Re: C'est pas avec le libre que ça risque d'arriver

            Posté par  (site web personnel) . Évalué à 7.

            Mais non tu n'as rien compris. Tu te focalises un peu trop sur le grand méchant microsoft.

            Ce qui est drôle est de voir un jeune garçon faire sa démonstration de son super truc de la mort qui tue, et de voir qu'avec un truc tout simple ça ne marche pas.
            On voit bien sa tête qu'il est dans un très grand moment de solitude et qu'il pense "je vais me faire virer... je vais me faire virer..."

            Voir la détresse de cette personne est drôle, après que ça soit microsoft ça rajoute un peu de chose parce que c'est une grande entreprise qui a normalement les moyens de tester ses logiciels avant de les présenter.

            Franchement ça aurait été un truc libre présenté au public ça m'aurait autant fait marrer!
  • # Micromou, c'est de l'eau de Javel non?

    Posté par  (site web personnel) . Évalué à -2.

    J'ignore de quelle société il est question ici, bien que je suppose que tu utilises un logiciel de traduction de mauvaise qualité qui a traduit Microsoft en français. Je n'ose imaginer que tu ais fait exprès.

    Et leur démonstration est impressionnante ...
    Je vous laisse juger par vous-même.

    Effectivement, si tous ce qu'ils ont à montrer est une url suivi du mot flash, c'est un peu court.

    Ceci étant, je n'ai pas Flash d'installé (ordi du bureau, et la dernière fois que je l'ai installé, j'ai cru mourir: son, animation, lourdeur, pub, j'ai cru un instant regarder TF1), alors, que peut-on voir sur cette vidéo pour que même le posteur du journal en reste sans voix?
  • # Marketing viral

    Posté par  . Évalué à 7.

    Et si tout cela n'était qu'une vaste entreprise de marketing viral, destinée à faire parler de Vista et de dire que MS ambitionne d'avoir une reconnaissance vocale de dernière génération ?

    Et si le ratage était un peu trop gros pour être vrai ?

    On ne saura jamais...
    • [^] # Re: Marketing viral

      Posté par  . Évalué à 2.

      On peut se souvenir que windows 98 a planté lors de la démonstration du hot plug usb d'un scanner, et que l'un (win98) et l'autre (usb), ont fini par être des gros succès.
      Marketing viral ou pas, quand tu as les moyens de foirer 3 - 4 versions par produit et de les vendre même quand ils ne fonctionnent pas, ça finit toujours par marcher.
      Sinon, pour les ambitions de microsoft a produire de la reconnaissance vocale, ça fait quand même longtemps qu'on le sait, j'ai vu des vidéos de leur centre de recherche là dessus pré win2000 (couplée avec de la reconnaissance vidéo des gestes de la personne).
      Non, s'ils en parlent, c'est que ça va bientôt marcher et être intégré à l'OS.
      Ca serait plutôt une mauvaise nouvelle.
      Espérons que ce n'est pas le cas et que ça ne marche réellement pas.
  • # probleme de volume

    Posté par  . Évalué à 5.

    Le volume du micro était réglé trop fort, le logiciel a mal interprété "bug connu et déjà corrigé dans les versions utilisées en interne.".

    Source :
    http://blogs.msdn.com/robch/archive/2006/07/29/682479.aspx
    • [^] # Re: probleme de volume

      Posté par  . Évalué à 2.

      "Here's what Wikipedia says"...
      Tiens ... Encarta n'aurait pas d'article sur le sujet ?
    • [^] # Re: probleme de volume

      Posté par  (site web personnel) . Évalué à 1.

      C'est encore pire que tout. Foirer une démo à cause d'une mauvaise configuration... Inexcusable.

      Le minimum est de tester son système en conditions réelles et de ne plus y toucher jusqu'à la démo.
      • [^] # Re: probleme de volume

        Posté par  (site web personnel) . Évalué à 3.

        Si j'en crois le lien cité un peu plus haut, il s'agissait d'un bug qui pointait le bout du nez par intermittence:

        Shanen practiced the demo a few times both off-stage and then again on-stage just prior to FAM starting. The whole demo was working perfectly several times.

        Unfortunately, the nature of this specific audio sub-system bug is that it's intermittent. It worked great every single time. Right up until that one live demonstration -- the one that counted. ;-)


        La malédiction des dieux de l'informatique est sur MS !
        • [^] # Re: probleme de volume

          Posté par  . Évalué à 4.

          C'est le concept même de la démo, non?

          que celui qui n'a jamais foiré de démo leur jette la première pierre...

          ps: donc si t'as pas fait de démo dans ta vie, marre toi et va chercher les graviers! :p
        • [^] # Re: probleme de volume

          Posté par  . Évalué à 3.

          Pour en avoir parlé sur IRC avec un mec qui bosse chez eux. Ils avaient fait des tests complets mais sans bruit de fond (salle vide) et apperement le bruit de fond a forcé le mec à augmenter le volume du micro et après foirage total. C'est le petit truc auquel on pense pas quand on lance un nouveau produit : le détail qui tue parce qu'avant il n'avait jamais posé problème.
  • # Au début, j'ai pensé que ça venait de moi ...

    Posté par  . Évalué à 3.

    L'autre jour, par simple curiosité, pour découvrir à quoi ressemblera Vista, j'ai installé la bêta 2 disponible gratuitement. On ne peut pas se faire une opinion sans tester, même si c'est pas libre.

    Bref, c'était plutôt lent (même sans "l'interface qui va tout déchirer"), le son n'a même pas fonctionné aussitôt, j'ai été obligé d'aller chercher un pilote manuellement. (alors que c'est parfaitement reconnu sous Debian ), mais bon ce n'est pas le sujet. En regardant dans les fonctionnalités, dans le menu "accessoires", j'avais découvert, une outil de reconnaissance d'écriture manuscrite, là je dis chapeau, ça marchait bien du premier coup. J'ai aussi trouvé l'outil de reconnaissance vocale, mais bon, étant donné que c'est un bêta en Anglais, la seule langue disponible était l'Anglais. Bon, ça peut être amusant lorsque l'on a du temps à perdre, d'essayer ça, et c'est bien ce que j'ai fait.
    Après l'assistant d'utilisation, et le texte d'apprentissage supplémentaire, je pensais que Windows finirait par me reconnaître, malgré cependant un accent vraiment déplorable et hilarant.
    Je crois que la reconnaissance était pourtant mieux, avec moi, que ce que l'on voit sur la video, n'étant pourtant pas anglophone.
    Au moins, je trouvais bien pratique les raccourcis vocaux du genre "Start Firefox, Go linuxfr.org, scroll down ..., close that, show calculator ....". La précision était moyenne, mais je l'attribuais à ma mauvaise prononciation.

    Enfin, j'ai eu droit à un redémarrage impromptu, par un caprice de windows, et après, selon ce dernier, je n'avais plus le droit d'utiliser la reconnaissance vocale parce que j'avais défini à l'installation pour langue, le français. Donc, au final, Vista, dans la poubelle.

    J'ai testé, seulement sous windows, Dragon naturally speaking, c'était assez précis. À part ça, j'ai vu quelque part, (peut être sur linuxfr ?) qu'il existait une solution libre : CMU Speech : http://www.speech.cs.cmu.edu/
    Y en a-t ils qui auraient, par hasard, essayé cette solution ?
  • # Speech-to-Text et Text-to-Speech

    Posté par  . Évalué à 3.

    Salut,

    Quel solution sous Gnu/Linux de la reconnaissance vocale ?

    Y a t-il des logiciels simple avec un GUI, plus simple qu'installer : festival/mbrola/emacspeak.

    L'objectif etant d'avoir un logiciel qui fait de la reconnaissance vocale (je pense à
    festival/mbrola) + de la conversion du texte en son .wav/.mp3/.ogg (je pense à emackspeak qui prononce les mots et enregistrer la sortie)
    ++ une options de traduction du texte ou du son entre l'entrée et la sortie (google traducteur).

    merci.
    • [^] # Re: Speech-to-Text et Text-to-Speech

      Posté par  . Évalué à 5.

      euh, festival c'est pas de la synthèse vocale, mbrola de la synthèse plus des voix, et emacspeek un truc qui fait de la synthèse pour emacs en utiliant festival ?
      • [^] # Re: Speech-to-Text et Text-to-Speech

        Posté par  . Évalué à 1.

        > festival c'est pas de la synthèse vocale

        glu ? C'est ce que j'utilise sur la tribune, quand on m'appelle alors que je lit un film, mon ordinateur me dit qui m'appelle, et à propos de quoi

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.