Journal : Micromou s'essaye à la reconnaissance vocale

Posté par py (page perso, ) le 31 juillet 2006
0
Et leur démonstration est impressionnante ...
Je vous laisse juger par vous-même.

http://www.youtube.com/watch?v=2Y_Jp6PxsSQ
(Flash)

> Lire le journal (28 commentaires, moyenne: 2,2).  

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

[+] complexe

Posté par marseillais (page perso, ) le 31/07/2006 à 12:39. (lien). Évalué à -2.

La reconnaissance vocale est quelque chose de trés complexe sur quoi de nombreux groupes se sont cassé les dents.

Pour ma part je me dis que si MS se permet de faire une présentation meme si celle ci a (encore) foiré c'est qu'ils ont quand meme de la ressource sous le pied et dans ce domaine ca peut vouloir tout dire. Soit ils ont trouvé un moyen quelconque de faire que ca marche pas trop mal, soit ils ont poussé des techno existantes tres loin, soit ils ont ré-inventé un truc qui promet beaucoup et qui comme les autres ne marchera jamais vraiment.

  • [^]Re: complexe

    Posté par Sufflope (Jabber id, page perso, ) le 31/07/2006 à 17:44. (lien). Évalué à 1.

    Je me souviens avoir eu un soft avec un nom du genre « Dragon natural speaking » qui faisait de la reconnaissance vocale et je l'avais sous Win95 ou 98 ! Et il me semble (j'étais petit) que ça marchait pas mal... Régression générale ?

    • [^]Re: complexe

      Posté par marseillais (page perso, ) le 01/08/2006 à 06:35. (lien). Évalué à 2.

      Dragon dictat qu'il s'appelait me semble t'il. Et non ce n'est pas de la régression. Dragon dictat faisait de la reconnaissance par apprentissage en gros tu lui apprenais a reconnaitre des sons en fonction de ta voix.

      Sauf qu'une langue orale quelqu'elle soit est trés complexe. Il y a de nombreux mots qui sont prononcés de maniéres différentes meme s'ils s'ecrivent avec les memes sons a l'ecrit. résultat sur ces mots le logiciel se rend fou.

      La théorie pour faire un bon logiciel de reconnaissance vocale serait de faire un traitement sur le signal audio de la voie pour reconnaitre les sons séparément et ensuite faire déterminer au logiciel quel a été le son donné puis lui faire retranscrire en texte uniquement de maniére phonique. Seulement une fois ceci fait une légére correction par dico pourrait étre effectuée. Seulement voila on ne peut pas traiter le signal de la voie aussi simplement car le jour ou tu as un rhume le spectre de ta voir sur la phrase "bonjour maman" ne ressemble plus du tout a celui de ta voie quand tu dis la meme phrase sans étre malade.

      Donc non ce n'est pas une régression général. Si MS sort un logiciel de dictée qui ne nécessite pas les heures d'apprentissage nécessaires avec les précédents logiciels pour obtenir des résultats a peine correctes alors ca sera une belle avancée.

      Puis les dragon dictat et ibm voice jsaipluquoi n'ont jamais marché commercialement parce que justement ca marche mal et qu'il faut passer beaucoup de temps dessus pour que ca commence a marcher un peu bien.

C'est pas avec le libre que ça risque d'arriver

Posté par kadreg (page perso, ) le 31/07/2006 à 12:47. (lien). Évalué à 6.

Vu qu'il n'y a pas de système de reconnaissance vocale qui marche vaguement ....

  • [^]Re: C'est pas avec le libre que ça risque d'arriver

    Posté par Sirrus () le 31/07/2006 à 16:21. (lien). Évalué à 0.

    Je plusserais ardemment si je le pouvais. Le retard dans le libre est tel (et il n'est pas anormal, ce n'est pas un domaine facile) qu'il n'y a pas de leçon à donner.

    Personnellement, je connais quelqu'un qui tape des cours de cette façon et c'est sur que c'est bien plus rapide que moi qui tape au clavier et surtout moins fatigant (même s'il est indispensable de corriger après) et là ça me fait regretter pas mal windows.

    Si par contre quelqu'un connaît un outil dans un but bureautique pour faire ça sous linux et qui fonctionne, merci de me le dire. Il y a quelques années j'avais entendu parler d'un logiciel d'IBM qui existerait en binaire pour linux mais je n'ai pas suivi.

    • [^]Re: C'est pas avec le libre que ça risque d'arriver

      Posté par L () le 31/07/2006 à 16:59. (lien). Évalué à 1.

      Le retard dans le libre est tel (et il n'est pas anormal, ce n'est pas un domaine facile) qu'il n'y a pas de leçon à donner.


      Le but de ce journal n'est pas de donner une leçon, le but c'est de péter un coup et de rire du nième déroulement foireux de la démonstration. Alors certe, tu n'as pas rigolé, mais c'est peut-être que tu as oublié de péter un coup (et ce n'est pas sale).

      • [+] [^]Re: C'est pas avec le libre que ça risque d'arriver

        Posté par Sirrus () le 31/07/2006 à 21:52. (lien). Évalué à -3.

        HAHA ! Micromou s'est vautré... lol mdddrrrrrr
        Et venant de toi, je me dis que ce qui est encore plus rigolo c'est que ce genre d'humour doit automatiquement marcher sur la tribune puiqu'ailleurs sur dlfp tout le monde doit être d'accord pour trouver ça drôle sinon c'est qu'il doit péter un coup.
        Ce qui me fait dire que j'ai encore plus envie qu'avant de mouler histoire de revoir des blagues.

        Plus Moins sérieusement, en parlant de blagues on va aussi faire chacun notre petit florilège. Ah zut, c'est bête on ne pense jamais à enregistrer ce qui se passe quand on utilise des médias amovibles sous linux notamment maintenant les clefs usb alors que sous micromou c'est tout le temps impec.llllloooollll mddrrrr
        Ah daubian et leur distro très stable au summum de la sécu qui régulièrment se fait ridiculiser par des failles. lllloooollllll mmmmdddddrrrrrr
        Je continue ?
        L'incapacité à créer du linux grand public. Ah bah oui il y a toujours des exceptions mais sous windows et mac jamais. lllloooollllll mdddrrrr (et si linux n'était pas destiné à dépasser les 5£ de parts ? pourquoi vouloir aller plus loin)
        La veille qui jusqu'à il y peu marchait super sous linux pour les portables. lllooolllll mmdddddrrrrrr

        Bref, je pourrais passer encore du temps à ça mais j'ai bien assez fait puéril ce soir, peut-être ai-je atteint le niveau du moment.... non ? Peut-être...
        Ah non je ne rigole pas à cette blague, je dois péter un coup parce que j'ai un balai dans le cul. Ah oui bien sur je vois venir le truc, je suis politiquement correct... et bien je vous emmerde (ça vous fait rire de lire ça, ben moi aussi honnêtement :).
        Finalement, les seuls qui puissent rire là-dedans ce sont peut-être les *BSDistes, que je ne suis pas particulièrement (pas en ce moment même en tous cas), qui réussissent bien dans leurs objectifs.

        Et pour tout dire, je n'ai même pas vu la video mais je regarderai avec plaisir celles sur nux qui se vautre comme une superbe bouse, non pas parce que ça me satisfaira mais parce que je penserai à ceux qui gémiront après s'être marrés sur le dos de windows. Je ne pense pas spécialement à toi, je sais que ça te fera marrer et d'ailleurs je ssais très bien que tu as écrit ce message pour me provoquer et comme tu le vois je ne t'en veux pas puisque j'y réponds. Merci d'ailleurs à ce sujet de ta provocation pour m'avoir décidé à dire ce que j'avais envie.

        • [^]Re: C'est pas avec le libre que ça risque d'arriver

          Posté par tiot (Jabber id, page perso, ) le 31/07/2006 à 22:37. (lien). Évalué à 7.

          Mais non tu n'as rien compris. Tu te focalises un peu trop sur le grand méchant microsoft.

          Ce qui est drôle est de voir un jeune garçon faire sa démonstration de son super truc de la mort qui tue, et de voir qu'avec un truc tout simple ça ne marche pas.
          On voit bien sa tête qu'il est dans un très grand moment de solitude et qu'il pense "je vais me faire virer... je vais me faire virer..."

          Voir la détresse de cette personne est drôle, après que ça soit microsoft ça rajoute un peu de chose parce que c'est une grande entreprise qui a normalement les moyens de tester ses logiciels avant de les présenter.

          Franchement ça aurait été un truc libre présenté au public ça m'aurait autant fait marrer!

          --
          Et si vous voulez faire la guerre
          Payez-la de votre peau

[+] Micromou, c'est de l'eau de Javel non?

Posté par Rin Jin (page perso, ) le 31/07/2006 à 12:47. (lien). Évalué à -2.

J'ignore de quelle société il est question ici, bien que je suppose que tu utilises un logiciel de traduction de mauvaise qualité qui a traduit Microsoft en français. Je n'ose imaginer que tu ais fait exprès.

Et leur démonstration est impressionnante ...
Je vous laisse juger par vous-même.

Effectivement, si tous ce qu'ils ont à montrer est une url suivi du mot flash, c'est un peu court.

Ceci étant, je n'ai pas Flash d'installé (ordi du bureau, et la dernière fois que je l'ai installé, j'ai cru mourir: son, animation, lourdeur, pub, j'ai cru un instant regarder TF1), alors, que peut-on voir sur cette vidéo pour que même le posteur du journal en reste sans voix?

--
"On obtient plus de chose en étant poli et armé qu'en étant juste poli" Al Capone
  • [^]Re: Micromou, c'est de l'eau de Javel non?

    Posté par Maxime (Jabber id, page perso, ) le 31/07/2006 à 12:54. (lien). Évalué à 1.

    Oui c'est énervant ces gens qui refusent de parler de Microsoft en utilisant le mot Microsoft (ou MS pour faire court).

    Bref, pour le plaisir de tous les integristes ne voulant pas de flashcapucpalibre sur leur machine (ou pour ceux qui ne peuvent pas installer flash pour x raisons)

    Ayant vu l'information sur http://www.generation-nt.com/actualites/17303/microsoft-vist(...)

    On peut y voir un screenshot ( http://www.generation-nt.com/images/biblio/misc/000000034387(...) )

    En fait et pour faire court, le presentateur commence par "dear mum" et il s'affiche dear aunt, alors il essaye de corriger mais ca ne marche pas, rien ne se passe et puis d'un coup pleins de choses apparaissent à l'écran (voir image) avec bien sur éclats de rire etc...

    Voila voila ^

  • [^]Re: Micromou, c'est de l'eau de Javel non?

    Posté par baud123 (Jabber id, page perso, ) le 31/07/2006 à 12:59. (lien). Évalué à 2.

    je te laisse découvrir dans les commentaires de slashdot ;-)

    http://it.slashdot.org/article.pl?sid=06/07/29/1258212
    (attention : 316 commentaires/ 407 ça trolle un peu :p)

    bon allez, je te donne le teaser tout de même :
    "It seems even MSNBC is willing to take a jab on those rare occasions when Microsoft products don't work. During a demo of Vista's speech recognition technology, Vista couldn't differentiate between mom and aunt, and all attempts to rectify the problem just made it worse. Wait until you see what it spat out, I think we have a new 'All your base.' Don't you just love Microsoft's live demonstrations?"

    http://video.google.com/videoplay?docid=-1123221217782777472

  • [^]Re: Micromou, c'est de l'eau de Javel non?

    Posté par Frédéric Péters (page perso, ) le 31/07/2006 à 16:29. (lien). Évalué à 4.

    Sur l'absence de Flash, je suis tombé récemment sur l'extension
    VideoDownloader pour Firefox: https://addons.mozilla.org/firefox/2390/

    Alors comme je n'utilise pas Firefox, j'ai regardé les sources voir si
    ce serait portable vers Epiphany et en fait, tout ce que ça fait, c'est
    utiliser les services de www.videodownloader.net, où tu peux coller
    ton URL (YouTube et cie) et recevoir en retour un fichier.

    Sur ce fichier, un coup de `file` et ça me donnait 'Macromedia
    Flash Video", un peu déséspérant mais quand même j'essaie et ça
    se lit sans soucis avec vlc.

    Il est donc possible sans Flash de regarder ces vidéos.

Marketing viral

Posté par Hrundi V. Bakshi () le 31/07/2006 à 12:58. (lien). Évalué à 7.

Et si tout cela n'était qu'une vaste entreprise de marketing viral, destinée à faire parler de Vista et de dire que MS ambitionne d'avoir une reconnaissance vocale de dernière génération ?

Et si le ratage était un peu trop gros pour être vrai ?

On ne saura jamais...

  • [^]Re: Marketing viral

    Posté par imr () le 31/07/2006 à 16:15. (lien). Évalué à 2.

    On peut se souvenir que windows 98 a planté lors de la démonstration du hot plug usb d'un scanner, et que l'un (win98) et l'autre (usb), ont fini par être des gros succès.
    Marketing viral ou pas, quand tu as les moyens de foirer 3 - 4 versions par produit et de les vendre même quand ils ne fonctionnent pas, ça finit toujours par marcher.
    Sinon, pour les ambitions de microsoft a produire de la reconnaissance vocale, ça fait quand même longtemps qu'on le sait, j'ai vu des vidéos de leur centre de recherche là dessus pré win2000 (couplée avec de la reconnaissance vidéo des gestes de la personne).
    Non, s'ils en parlent, c'est que ça va bientôt marcher et être intégré à l'OS.
    Ca serait plutôt une mauvaise nouvelle.
    Espérons que ce n'est pas le cas et que ça ne marche réellement pas.

probleme de volume

Posté par plagiats () le 31/07/2006 à 13:05. (lien). Évalué à 5.

Le volume du micro était réglé trop fort, le logiciel a mal interprété "bug connu et déjà corrigé dans les versions utilisées en interne.".

Source :
http://blogs.msdn.com/robch/archive/2006/07/29/682479.aspx

--
La mort est un phénomène naturel qui se produit par l'avalement répété de petites quantités de salive au cours d'une grande période de temps. - George Carlin
  • [^]Re: probleme de volume

    Posté par Olivier Guerrier (Jabber id, page perso, ) le 31/07/2006 à 14:21. (lien). Évalué à 2.

    "Here's what Wikipedia says"...
    Tiens ... Encarta n'aurait pas d'article sur le sujet ?

  • [^]Re: probleme de volume

    Posté par Wawet76 (page perso, ) le 31/07/2006 à 16:46. (lien). Évalué à 1.

    C'est encore pire que tout. Foirer une démo à cause d'une mauvaise configuration... Inexcusable.

    Le minimum est de tester son système en conditions réelles et de ne plus y toucher jusqu'à la démo.

    • [^]Re: probleme de volume

      Posté par GCN (Jabber id, page perso, ) le 31/07/2006 à 19:38. (lien). Évalué à 3.

      Si j'en crois le lien cité un peu plus haut, il s'agissait d'un bug qui pointait le bout du nez par intermittence:

      Shanen practiced the demo a few times both off-stage and then again on-stage just prior to FAM starting. The whole demo was working perfectly several times.

      Unfortunately, the nature of this specific audio sub-system bug is that it's intermittent. It worked great every single time. Right up until that one live demonstration -- the one that counted. ;-)


      La malédiction des dieux de l'informatique est sur MS !

      --
      The UNIX way of sex:
      date;cd ~;gunzip;strip;touch;finger;mount;fsck;more;yes;umount;sleep
      • [^]Re: probleme de volume

        Posté par tene (page perso, ) le 01/08/2006 à 08:43. (lien). Évalué à 4.

        C'est le concept même de la démo, non?

        que celui qui n'a jamais foiré de démo leur jette la première pierre...

        ps: donc si t'as pas fait de démo dans ta vie, marre toi et va chercher les graviers! :p

      • [^]Re: probleme de volume

        Posté par majinboo () le 01/08/2006 à 10:36. (lien). Évalué à 3.

        Pour en avoir parlé sur IRC avec un mec qui bosse chez eux. Ils avaient fait des tests complets mais sans bruit de fond (salle vide) et apperement le bruit de fond a forcé le mec à augmenter le volume du micro et après foirage total. C'est le petit truc auquel on pense pas quand on lance un nouveau produit : le détail qui tue parce qu'avant il n'avait jamais posé problème.

Au début, j'ai pensé que ça venait de moi ...

Posté par P Chevalier () le 31/07/2006 à 17:45. (lien). Évalué à 3.

L'autre jour, par simple curiosité, pour découvrir à quoi ressemblera Vista, j'ai installé la bêta 2 disponible gratuitement. On ne peut pas se faire une opinion sans tester, même si c'est pas libre.

Bref, c'était plutôt lent (même sans "l'interface qui va tout déchirer"), le son n'a même pas fonctionné aussitôt, j'ai été obligé d'aller chercher un pilote manuellement. (alors que c'est parfaitement reconnu sous Debian ), mais bon ce n'est pas le sujet. En regardant dans les fonctionnalités, dans le menu "accessoires", j'avais découvert, une outil de reconnaissance d'écriture manuscrite, là je dis chapeau, ça marchait bien du premier coup. J'ai aussi trouvé l'outil de reconnaissance vocale, mais bon, étant donné que c'est un bêta en Anglais, la seule langue disponible était l'Anglais. Bon, ça peut être amusant lorsque l'on a du temps à perdre, d'essayer ça, et c'est bien ce que j'ai fait.
Après l'assistant d'utilisation, et le texte d'apprentissage supplémentaire, je pensais que Windows finirait par me reconnaître, malgré cependant un accent vraiment déplorable et hilarant.
Je crois que la reconnaissance était pourtant mieux, avec moi, que ce que l'on voit sur la video, n'étant pourtant pas anglophone.
Au moins, je trouvais bien pratique les raccourcis vocaux du genre "Start Firefox, Go linuxfr.org, scroll down ..., close that, show calculator ....". La précision était moyenne, mais je l'attribuais à ma mauvaise prononciation.

Enfin, j'ai eu droit à un redémarrage impromptu, par un caprice de windows, et après, selon ce dernier, je n'avais plus le droit d'utiliser la reconnaissance vocale parce que j'avais défini à l'installation pour langue, le français. Donc, au final, Vista, dans la poubelle.

J'ai testé, seulement sous windows, Dragon naturally speaking, c'était assez précis. À part ça, j'ai vu quelque part, (peut être sur linuxfr ?) qu'il existait une solution libre : CMU Speech : http://www.speech.cs.cmu.edu/
Y en a-t ils qui auraient, par hasard, essayé cette solution ?

--
P. Chevalier
  • [^]Re: Au début, j'ai pensé que ça venait de moi ...

    Posté par zero heure (Jabber id, page perso, ) le 01/08/2006 à 07:25. (lien). Évalué à 3.

    Au moins, je trouvais bien pratique les raccourcis vocaux du genre "Start Firefox, Go linuxfr.org, scroll down ..., close that, show calculator ....".


    Ils n'ont aucun mérite. On le faisait couramment sur OS2/Warp 4 en 1996. C'était d'ailleurs extrèmement pratique.

    --
    J'ai vu bien des choses dans ma petite vie, et je mesure amèrement l'impuissance à les dire. (JP Rosnay, Le 13ème apôtre) http://www.poesie.net/apotre2.htm

Speech-to-Text et Text-to-Speech

Posté par mickaël rameau (page perso, ) le 31/07/2006 à 19:00. (lien). Évalué à 3.

Salut,

Quel solution sous Gnu/Linux de la reconnaissance vocale ?

Y a t-il des logiciels simple avec un GUI, plus simple qu'installer : festival/mbrola/emacspeak.

L'objectif etant d'avoir un logiciel qui fait de la reconnaissance vocale (je pense à
festival/mbrola) + de la conversion du texte en son .wav/.mp3/.ogg (je pense à emackspeak qui prononce les mots et enregistrer la sortie)
++ une options de traduction du texte ou du son entre l'entrée et la sortie (google traducteur).

merci.

  • [^]Re: Speech-to-Text et Text-to-Speech

    Posté par Thomas Douillard () le 31/07/2006 à 20:11. (lien). Évalué à 5.

    euh, festival c'est pas de la synthèse vocale, mbrola de la synthèse plus des voix, et emacspeek un truc qui fait de la synthèse pour emacs en utiliant festival ?

    • [^]Re: Speech-to-Text et Text-to-Speech

      Posté par kadreg (page perso, ) le 31/07/2006 à 21:40. (lien). Évalué à 1.

      > festival c'est pas de la synthèse vocale

      glu ? C'est ce que j'utilise sur la tribune, quand on m'appelle alors que je lit un film, mon ordinateur me dit qui m'appelle, et à propos de quoi

      • [^]Re: Speech-to-Text et Text-to-Speech

        Posté par kaouete (page perso, ) le 01/08/2006 à 08:20. (lien). Évalué à 2.

        c'etait une question :)

        donc oui il dit bien que c'est de la synthese vocale !

Revenir en haut de page