La reconnaissance vocale est quelque chose de trés complexe sur quoi de nombreux groupes se sont cassé les dents.
Pour ma part je me dis que si MS se permet de faire une présentation meme si celle ci a (encore) foiré c'est qu'ils ont quand meme de la ressource sous le pied et dans ce domaine ca peut vouloir tout dire. Soit ils ont trouvé un moyen quelconque de faire que ca marche pas trop mal, soit ils ont poussé des techno existantes tres loin, soit ils ont ré-inventé un truc qui promet beaucoup et qui comme les autres ne marchera jamais vraiment.
Je me souviens avoir eu un soft avec un nom du genre « Dragon natural speaking » qui faisait de la reconnaissance vocale et je l'avais sous Win95 ou 98 ! Et il me semble (j'étais petit) que ça marchait pas mal... Régression générale ?
Dragon dictat qu'il s'appelait me semble t'il. Et non ce n'est pas de la régression. Dragon dictat faisait de la reconnaissance par apprentissage en gros tu lui apprenais a reconnaitre des sons en fonction de ta voix.
Sauf qu'une langue orale quelqu'elle soit est trés complexe. Il y a de nombreux mots qui sont prononcés de maniéres différentes meme s'ils s'ecrivent avec les memes sons a l'ecrit. résultat sur ces mots le logiciel se rend fou.
La théorie pour faire un bon logiciel de reconnaissance vocale serait de faire un traitement sur le signal audio de la voie pour reconnaitre les sons séparément et ensuite faire déterminer au logiciel quel a été le son donné puis lui faire retranscrire en texte uniquement de maniére phonique. Seulement une fois ceci fait une légére correction par dico pourrait étre effectuée. Seulement voila on ne peut pas traiter le signal de la voie aussi simplement car le jour ou tu as un rhume le spectre de ta voir sur la phrase "bonjour maman" ne ressemble plus du tout a celui de ta voie quand tu dis la meme phrase sans étre malade.
Donc non ce n'est pas une régression général. Si MS sort un logiciel de dictée qui ne nécessite pas les heures d'apprentissage nécessaires avec les précédents logiciels pour obtenir des résultats a peine correctes alors ca sera une belle avancée.
Puis les dragon dictat et ibm voice jsaipluquoi n'ont jamais marché commercialement parce que justement ca marche mal et qu'il faut passer beaucoup de temps dessus pour que ca commence a marcher un peu bien.
Je plusserais ardemment si je le pouvais. Le retard dans le libre est tel (et il n'est pas anormal, ce n'est pas un domaine facile) qu'il n'y a pas de leçon à donner.
Personnellement, je connais quelqu'un qui tape des cours de cette façon et c'est sur que c'est bien plus rapide que moi qui tape au clavier et surtout moins fatigant (même s'il est indispensable de corriger après) et là ça me fait regretter pas mal windows.
Si par contre quelqu'un connaît un outil dans un but bureautique pour faire ça sous linux et qui fonctionne, merci de me le dire. Il y a quelques années j'avais entendu parler d'un logiciel d'IBM qui existerait en binaire pour linux mais je n'ai pas suivi.
HAHA ! Micromou s'est vautré... lol mdddrrrrrr
Et venant de toi, je me dis que ce qui est encore plus rigolo c'est que ce genre d'humour doit automatiquement marcher sur la tribune puiqu'ailleurs sur dlfp tout le monde doit être d'accord pour trouver ça drôle sinon c'est qu'il doit péter un coup.
Ce qui me fait dire que j'ai encore plus envie qu'avant de mouler histoire de revoir des blagues.
Plus Moins sérieusement, en parlant de blagues on va aussi faire chacun notre petit florilège. Ah zut, c'est bête on ne pense jamais à enregistrer ce qui se passe quand on utilise des médias amovibles sous linux notamment maintenant les clefs usb alors que sous micromou c'est tout le temps impec.llllloooollll mddrrrr
Ah daubian et leur distro très stable au summum de la sécu qui régulièrment se fait ridiculiser par des failles. lllloooollllll mmmmdddddrrrrrr
Je continue ?
L'incapacité à créer du linux grand public. Ah bah oui il y a toujours des exceptions mais sous windows et mac jamais. lllloooollllll mdddrrrr (et si linux n'était pas destiné à dépasser les 5£ de parts ? pourquoi vouloir aller plus loin)
La veille qui jusqu'à il y peu marchait super sous linux pour les portables. lllooolllll mmdddddrrrrrr
Bref, je pourrais passer encore du temps à ça mais j'ai bien assez fait puéril ce soir, peut-être ai-je atteint le niveau du moment.... non ? Peut-être...
Ah non je ne rigole pas à cette blague, je dois péter un coup parce que j'ai un balai dans le cul. Ah oui bien sur je vois venir le truc, je suis politiquement correct... et bien je vous emmerde (ça vous fait rire de lire ça, ben moi aussi honnêtement :).
Finalement, les seuls qui puissent rire là-dedans ce sont peut-être les *BSDistes, que je ne suis pas particulièrement (pas en ce moment même en tous cas), qui réussissent bien dans leurs objectifs.
Et pour tout dire, je n'ai même pas vu la video mais je regarderai avec plaisir celles sur nux qui se vautre comme une superbe bouse, non pas parce que ça me satisfaira mais parce que je penserai à ceux qui gémiront après s'être marrés sur le dos de windows. Je ne pense pas spécialement à toi, je sais que ça te fera marrer et d'ailleurs je ssais très bien que tu as écrit ce message pour me provoquer et comme tu le vois je ne t'en veux pas puisque j'y réponds. Merci d'ailleurs à ce sujet de ta provocation pour m'avoir décidé à dire ce que j'avais envie.
Mais non tu n'as rien compris. Tu te focalises un peu trop sur le grand méchant microsoft.
Ce qui est drôle est de voir un jeune garçon faire sa démonstration de son super truc de la mort qui tue, et de voir qu'avec un truc tout simple ça ne marche pas.
On voit bien sa tête qu'il est dans un très grand moment de solitude et qu'il pense "je vais me faire virer... je vais me faire virer..."
Voir la détresse de cette personne est drôle, après que ça soit microsoft ça rajoute un peu de chose parce que c'est une grande entreprise qui a normalement les moyens de tester ses logiciels avant de les présenter.
Franchement ça aurait été un truc libre présenté au public ça m'aurait autant fait marrer!
J'ignore de quelle société il est question ici, bien que je suppose que tu utilises un logiciel de traduction de mauvaise qualité qui a traduit Microsoft en français. Je n'ose imaginer que tu ais fait exprès.
Et leur démonstration est impressionnante ...
Je vous laisse juger par vous-même.
Effectivement, si tous ce qu'ils ont à montrer est une url suivi du mot flash, c'est un peu court.
Ceci étant, je n'ai pas Flash d'installé (ordi du bureau, et la dernière fois que je l'ai installé, j'ai cru mourir: son, animation, lourdeur, pub, j'ai cru un instant regarder TF1), alors, que peut-on voir sur cette vidéo pour que même le posteur du journal en reste sans voix?
Oui c'est énervant ces gens qui refusent de parler de Microsoft en utilisant le mot Microsoft (ou MS pour faire court).
Bref, pour le plaisir de tous les integristes ne voulant pas de flashcapucpalibre sur leur machine (ou pour ceux qui ne peuvent pas installer flash pour x raisons)
En fait et pour faire court, le presentateur commence par "dear mum" et il s'affiche dear aunt, alors il essaye de corriger mais ca ne marche pas, rien ne se passe et puis d'un coup pleins de choses apparaissent à l'écran (voir image) avec bien sur éclats de rire etc...
bon allez, je te donne le teaser tout de même :
"It seems even MSNBC is willing to take a jab on those rare occasions when Microsoft products don't work. During a demo of Vista's speech recognition technology, Vista couldn't differentiate between mom and aunt, and all attempts to rectify the problem just made it worse. Wait until you see what it spat out, I think we have a new 'All your base.' Don't you just love Microsoft's live demonstrations?"
Alors comme je n'utilise pas Firefox, j'ai regardé les sources voir si
ce serait portable vers Epiphany et en fait, tout ce que ça fait, c'est
utiliser les services de www.videodownloader.net, où tu peux coller
ton URL (YouTube et cie) et recevoir en retour un fichier.
Sur ce fichier, un coup de `file` et ça me donnait 'Macromedia
Flash Video", un peu déséspérant mais quand même j'essaie et ça
se lit sans soucis avec vlc.
Il est donc possible sans Flash de regarder ces vidéos.
Et si tout cela n'était qu'une vaste entreprise de marketing viral, destinée à faire parler de Vista et de dire que MS ambitionne d'avoir une reconnaissance vocale de dernière génération ?
Et si le ratage était un peu trop gros pour être vrai ?
On peut se souvenir que windows 98 a planté lors de la démonstration du hot plug usb d'un scanner, et que l'un (win98) et l'autre (usb), ont fini par être des gros succès.
Marketing viral ou pas, quand tu as les moyens de foirer 3 - 4 versions par produit et de les vendre même quand ils ne fonctionnent pas, ça finit toujours par marcher.
Sinon, pour les ambitions de microsoft a produire de la reconnaissance vocale, ça fait quand même longtemps qu'on le sait, j'ai vu des vidéos de leur centre de recherche là dessus pré win2000 (couplée avec de la reconnaissance vidéo des gestes de la personne).
Non, s'ils en parlent, c'est que ça va bientôt marcher et être intégré à l'OS.
Ca serait plutôt une mauvaise nouvelle.
Espérons que ce n'est pas le cas et que ça ne marche réellement pas.
Si j'en crois le lien cité un peu plus haut, il s'agissait d'un bug qui pointait le bout du nez par intermittence:
Shanen practiced the demo a few times both off-stage and then again on-stage just prior to FAM starting. The whole demo was working perfectly several times.
Unfortunately, the nature of this specific audio sub-system bug is that it's intermittent. It worked great every single time. Right up until that one live demonstration -- the one that counted. ;-)
La malédiction des dieux de l'informatique est sur MS !
Pour en avoir parlé sur IRC avec un mec qui bosse chez eux. Ils avaient fait des tests complets mais sans bruit de fond (salle vide) et apperement le bruit de fond a forcé le mec à augmenter le volume du micro et après foirage total. C'est le petit truc auquel on pense pas quand on lance un nouveau produit : le détail qui tue parce qu'avant il n'avait jamais posé problème.
L'autre jour, par simple curiosité, pour découvrir à quoi ressemblera Vista, j'ai installé la bêta 2 disponible gratuitement. On ne peut pas se faire une opinion sans tester, même si c'est pas libre.
Bref, c'était plutôt lent (même sans "l'interface qui va tout déchirer"), le son n'a même pas fonctionné aussitôt, j'ai été obligé d'aller chercher un pilote manuellement. (alors que c'est parfaitement reconnu sous Debian ), mais bon ce n'est pas le sujet. En regardant dans les fonctionnalités, dans le menu "accessoires", j'avais découvert, une outil de reconnaissance d'écriture manuscrite, là je dis chapeau, ça marchait bien du premier coup. J'ai aussi trouvé l'outil de reconnaissance vocale, mais bon, étant donné que c'est un bêta en Anglais, la seule langue disponible était l'Anglais. Bon, ça peut être amusant lorsque l'on a du temps à perdre, d'essayer ça, et c'est bien ce que j'ai fait.
Après l'assistant d'utilisation, et le texte d'apprentissage supplémentaire, je pensais que Windows finirait par me reconnaître, malgré cependant un accent vraiment déplorable et hilarant.
Je crois que la reconnaissance était pourtant mieux, avec moi, que ce que l'on voit sur la video, n'étant pourtant pas anglophone.
Au moins, je trouvais bien pratique les raccourcis vocaux du genre "Start Firefox, Go linuxfr.org, scroll down ..., close that, show calculator ....". La précision était moyenne, mais je l'attribuais à ma mauvaise prononciation.
Enfin, j'ai eu droit à un redémarrage impromptu, par un caprice de windows, et après, selon ce dernier, je n'avais plus le droit d'utiliser la reconnaissance vocale parce que j'avais défini à l'installation pour langue, le français. Donc, au final, Vista, dans la poubelle.
J'ai testé, seulement sous windows, Dragon naturally speaking, c'était assez précis. À part ça, j'ai vu quelque part, (peut être sur linuxfr ?) qu'il existait une solution libre : CMU Speech : http://www.speech.cs.cmu.edu/
Y en a-t ils qui auraient, par hasard, essayé cette solution ?
CMU speech ? c'est plutôt une liste de liens il me semble... dont les projets de l'université de Carnegie Mellon dans le domaine de la reconnaissance vocale et la synthèse vocale.
Quel solution sous Gnu/Linux de la reconnaissance vocale ?
Y a t-il des logiciels simple avec un GUI, plus simple qu'installer : festival/mbrola/emacspeak.
L'objectif etant d'avoir un logiciel qui fait de la reconnaissance vocale (je pense à
festival/mbrola) + de la conversion du texte en son .wav/.mp3/.ogg (je pense à emackspeak qui prononce les mots et enregistrer la sortie)
++ une options de traduction du texte ou du son entre l'entrée et la sortie (google traducteur).
euh, festival c'est pas de la synthèse vocale, mbrola de la synthèse plus des voix, et emacspeek un truc qui fait de la synthèse pour emacs en utiliant festival ?
# complexe
Posté par marseillais (site web personnel) . Évalué à -2.
Pour ma part je me dis que si MS se permet de faire une présentation meme si celle ci a (encore) foiré c'est qu'ils ont quand meme de la ressource sous le pied et dans ce domaine ca peut vouloir tout dire. Soit ils ont trouvé un moyen quelconque de faire que ca marche pas trop mal, soit ils ont poussé des techno existantes tres loin, soit ils ont ré-inventé un truc qui promet beaucoup et qui comme les autres ne marchera jamais vraiment.
[^] # Re: complexe
Posté par Sufflope (site web personnel) . Évalué à 1.
[^] # Re: complexe
Posté par marseillais (site web personnel) . Évalué à 2.
Sauf qu'une langue orale quelqu'elle soit est trés complexe. Il y a de nombreux mots qui sont prononcés de maniéres différentes meme s'ils s'ecrivent avec les memes sons a l'ecrit. résultat sur ces mots le logiciel se rend fou.
La théorie pour faire un bon logiciel de reconnaissance vocale serait de faire un traitement sur le signal audio de la voie pour reconnaitre les sons séparément et ensuite faire déterminer au logiciel quel a été le son donné puis lui faire retranscrire en texte uniquement de maniére phonique. Seulement une fois ceci fait une légére correction par dico pourrait étre effectuée. Seulement voila on ne peut pas traiter le signal de la voie aussi simplement car le jour ou tu as un rhume le spectre de ta voir sur la phrase "bonjour maman" ne ressemble plus du tout a celui de ta voie quand tu dis la meme phrase sans étre malade.
Donc non ce n'est pas une régression général. Si MS sort un logiciel de dictée qui ne nécessite pas les heures d'apprentissage nécessaires avec les précédents logiciels pour obtenir des résultats a peine correctes alors ca sera une belle avancée.
Puis les dragon dictat et ibm voice jsaipluquoi n'ont jamais marché commercialement parce que justement ca marche mal et qu'il faut passer beaucoup de temps dessus pour que ca commence a marcher un peu bien.
# C'est pas avec le libre que ça risque d'arriver
Posté par kadreg . Évalué à 6.
[^] # Re: C'est pas avec le libre que ça risque d'arriver
Posté par sirrus . Évalué à 0.
Personnellement, je connais quelqu'un qui tape des cours de cette façon et c'est sur que c'est bien plus rapide que moi qui tape au clavier et surtout moins fatigant (même s'il est indispensable de corriger après) et là ça me fait regretter pas mal windows.
Si par contre quelqu'un connaît un outil dans un but bureautique pour faire ça sous linux et qui fonctionne, merci de me le dire. Il y a quelques années j'avais entendu parler d'un logiciel d'IBM qui existerait en binaire pour linux mais je n'ai pas suivi.
[^] # Commentaire supprimé
Posté par Anonyme . Évalué à 1.
Ce commentaire a été supprimé par l’équipe de modération.
[^] # Re: C'est pas avec le libre que ça risque d'arriver
Posté par sirrus . Évalué à -3.
Et venant de toi, je me dis que ce qui est encore plus rigolo c'est que ce genre d'humour doit automatiquement marcher sur la tribune puiqu'ailleurs sur dlfp tout le monde doit être d'accord pour trouver ça drôle sinon c'est qu'il doit péter un coup.
Ce qui me fait dire que j'ai encore plus envie qu'avant de mouler histoire de revoir des blagues.
Plus Moins sérieusement, en parlant de blagues on va aussi faire chacun notre petit florilège. Ah zut, c'est bête on ne pense jamais à enregistrer ce qui se passe quand on utilise des médias amovibles sous linux notamment maintenant les clefs usb alors que sous micromou c'est tout le temps impec.llllloooollll mddrrrr
Ah daubian et leur distro très stable au summum de la sécu qui régulièrment se fait ridiculiser par des failles. lllloooollllll mmmmdddddrrrrrr
Je continue ?
L'incapacité à créer du linux grand public. Ah bah oui il y a toujours des exceptions mais sous windows et mac jamais. lllloooollllll mdddrrrr (et si linux n'était pas destiné à dépasser les 5£ de parts ? pourquoi vouloir aller plus loin)
La veille qui jusqu'à il y peu marchait super sous linux pour les portables. lllooolllll mmdddddrrrrrr
Bref, je pourrais passer encore du temps à ça mais j'ai bien assez fait puéril ce soir, peut-être ai-je atteint le niveau du moment.... non ? Peut-être...
Ah non je ne rigole pas à cette blague, je dois péter un coup parce que j'ai un balai dans le cul. Ah oui bien sur je vois venir le truc, je suis politiquement correct... et bien je vous emmerde (ça vous fait rire de lire ça, ben moi aussi honnêtement :).
Finalement, les seuls qui puissent rire là-dedans ce sont peut-être les *BSDistes, que je ne suis pas particulièrement (pas en ce moment même en tous cas), qui réussissent bien dans leurs objectifs.
Et pour tout dire, je n'ai même pas vu la video mais je regarderai avec plaisir celles sur nux qui se vautre comme une superbe bouse, non pas parce que ça me satisfaira mais parce que je penserai à ceux qui gémiront après s'être marrés sur le dos de windows. Je ne pense pas spécialement à toi, je sais que ça te fera marrer et d'ailleurs je ssais très bien que tu as écrit ce message pour me provoquer et comme tu le vois je ne t'en veux pas puisque j'y réponds. Merci d'ailleurs à ce sujet de ta provocation pour m'avoir décidé à dire ce que j'avais envie.
[^] # Re: C'est pas avec le libre que ça risque d'arriver
Posté par tiot (site web personnel) . Évalué à 7.
Ce qui est drôle est de voir un jeune garçon faire sa démonstration de son super truc de la mort qui tue, et de voir qu'avec un truc tout simple ça ne marche pas.
On voit bien sa tête qu'il est dans un très grand moment de solitude et qu'il pense "je vais me faire virer... je vais me faire virer..."
Voir la détresse de cette personne est drôle, après que ça soit microsoft ça rajoute un peu de chose parce que c'est une grande entreprise qui a normalement les moyens de tester ses logiciels avant de les présenter.
Franchement ça aurait été un truc libre présenté au public ça m'aurait autant fait marrer!
# Micromou, c'est de l'eau de Javel non?
Posté par Rin Jin (site web personnel) . Évalué à -2.
Et leur démonstration est impressionnante ...
Je vous laisse juger par vous-même.
Effectivement, si tous ce qu'ils ont à montrer est une url suivi du mot flash, c'est un peu court.
Ceci étant, je n'ai pas Flash d'installé (ordi du bureau, et la dernière fois que je l'ai installé, j'ai cru mourir: son, animation, lourdeur, pub, j'ai cru un instant regarder TF1), alors, que peut-on voir sur cette vidéo pour que même le posteur du journal en reste sans voix?
[^] # Re: Micromou, c'est de l'eau de Javel non?
Posté par kadreg . Évalué à -3.
http://www.pcinpact.com/actu/news_multi/30440.htm
[^] # Re: Micromou, c'est de l'eau de Javel non?
Posté par Maxime (site web personnel) . Évalué à 1.
Bref, pour le plaisir de tous les integristes ne voulant pas de flashcapucpalibre sur leur machine (ou pour ceux qui ne peuvent pas installer flash pour x raisons)
Ayant vu l'information sur http://www.generation-nt.com/actualites/17303/microsoft-vist(...)
On peut y voir un screenshot ( http://www.generation-nt.com/images/biblio/misc/000000034387(...) )
En fait et pour faire court, le presentateur commence par "dear mum" et il s'affiche dear aunt, alors il essaye de corriger mais ca ne marche pas, rien ne se passe et puis d'un coup pleins de choses apparaissent à l'écran (voir image) avec bien sur éclats de rire etc...
Voila voila ^
[^] # Re: Micromou, c'est de l'eau de Javel non?
Posté par BAud (site web personnel) . Évalué à 2.
http://it.slashdot.org/article.pl?sid=06/07/29/1258212
(attention : 316 commentaires/ 407 ça trolle un peu :p)
bon allez, je te donne le teaser tout de même :
"It seems even MSNBC is willing to take a jab on those rare occasions when Microsoft products don't work. During a demo of Vista's speech recognition technology, Vista couldn't differentiate between mom and aunt, and all attempts to rectify the problem just made it worse. Wait until you see what it spat out, I think we have a new 'All your base.' Don't you just love Microsoft's live demonstrations?"
http://video.google.com/videoplay?docid=-1123221217782777472
[^] # Re: Micromou, c'est de l'eau de Javel non?
Posté par Frédéric Péters (site web personnel) . Évalué à 4.
VideoDownloader pour Firefox: https://addons.mozilla.org/firefox/2390/
Alors comme je n'utilise pas Firefox, j'ai regardé les sources voir si
ce serait portable vers Epiphany et en fait, tout ce que ça fait, c'est
utiliser les services de www.videodownloader.net, où tu peux coller
ton URL (YouTube et cie) et recevoir en retour un fichier.
Sur ce fichier, un coup de `file` et ça me donnait 'Macromedia
Flash Video", un peu déséspérant mais quand même j'essaie et ça
se lit sans soucis avec vlc.
Il est donc possible sans Flash de regarder ces vidéos.
# Marketing viral
Posté par Hrundi V. Bakshi . Évalué à 7.
Et si le ratage était un peu trop gros pour être vrai ?
On ne saura jamais...
[^] # Re: Marketing viral
Posté par imr . Évalué à 2.
Marketing viral ou pas, quand tu as les moyens de foirer 3 - 4 versions par produit et de les vendre même quand ils ne fonctionnent pas, ça finit toujours par marcher.
Sinon, pour les ambitions de microsoft a produire de la reconnaissance vocale, ça fait quand même longtemps qu'on le sait, j'ai vu des vidéos de leur centre de recherche là dessus pré win2000 (couplée avec de la reconnaissance vidéo des gestes de la personne).
Non, s'ils en parlent, c'est que ça va bientôt marcher et être intégré à l'OS.
Ca serait plutôt une mauvaise nouvelle.
Espérons que ce n'est pas le cas et que ça ne marche réellement pas.
# probleme de volume
Posté par plagiats . Évalué à 5.
Source :
http://blogs.msdn.com/robch/archive/2006/07/29/682479.aspx
[^] # Re: probleme de volume
Posté par Olivier Guerrier . Évalué à 2.
Tiens ... Encarta n'aurait pas d'article sur le sujet ?
[^] # Re: probleme de volume
Posté par Wawet76 . Évalué à 1.
Le minimum est de tester son système en conditions réelles et de ne plus y toucher jusqu'à la démo.
[^] # Re: probleme de volume
Posté par GCN (site web personnel) . Évalué à 3.
La malédiction des dieux de l'informatique est sur MS !
[^] # Re: probleme de volume
Posté par tene . Évalué à 4.
que celui qui n'a jamais foiré de démo leur jette la première pierre...
ps: donc si t'as pas fait de démo dans ta vie, marre toi et va chercher les graviers! :p
[^] # Re: probleme de volume
Posté par majinboo . Évalué à 3.
# Au début, j'ai pensé que ça venait de moi ...
Posté par P Chevalier . Évalué à 3.
Bref, c'était plutôt lent (même sans "l'interface qui va tout déchirer"), le son n'a même pas fonctionné aussitôt, j'ai été obligé d'aller chercher un pilote manuellement. (alors que c'est parfaitement reconnu sous Debian ), mais bon ce n'est pas le sujet. En regardant dans les fonctionnalités, dans le menu "accessoires", j'avais découvert, une outil de reconnaissance d'écriture manuscrite, là je dis chapeau, ça marchait bien du premier coup. J'ai aussi trouvé l'outil de reconnaissance vocale, mais bon, étant donné que c'est un bêta en Anglais, la seule langue disponible était l'Anglais. Bon, ça peut être amusant lorsque l'on a du temps à perdre, d'essayer ça, et c'est bien ce que j'ai fait.
Après l'assistant d'utilisation, et le texte d'apprentissage supplémentaire, je pensais que Windows finirait par me reconnaître, malgré cependant un accent vraiment déplorable et hilarant.
Je crois que la reconnaissance était pourtant mieux, avec moi, que ce que l'on voit sur la video, n'étant pourtant pas anglophone.
Au moins, je trouvais bien pratique les raccourcis vocaux du genre "Start Firefox, Go linuxfr.org, scroll down ..., close that, show calculator ....". La précision était moyenne, mais je l'attribuais à ma mauvaise prononciation.
Enfin, j'ai eu droit à un redémarrage impromptu, par un caprice de windows, et après, selon ce dernier, je n'avais plus le droit d'utiliser la reconnaissance vocale parce que j'avais défini à l'installation pour langue, le français. Donc, au final, Vista, dans la poubelle.
J'ai testé, seulement sous windows, Dragon naturally speaking, c'était assez précis. À part ça, j'ai vu quelque part, (peut être sur linuxfr ?) qu'il existait une solution libre : CMU Speech : http://www.speech.cs.cmu.edu/
Y en a-t ils qui auraient, par hasard, essayé cette solution ?
[^] # Re: Au début, j'ai pensé que ça venait de moi ...
Posté par ZeroHeure . Évalué à 3.
Ils n'ont aucun mérite. On le faisait couramment sur OS2/Warp 4 en 1996. C'était d'ailleurs extrèmement pratique.
"La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay
[^] # Re: Au début, j'ai pensé que ça venait de moi ...
Posté par BAud (site web personnel) . Évalué à 2.
J'ai une liste de liens dont des journaux/dépêches sur linuxfr sur http://wiki.eagle-usb.org/wakka.php?wiki=ReconnaissanceVocal(...) et http://wiki.eagle-usb.org/wakka.php?wiki=SyntheseParole
mais j'ai surtout testé la synthèse de la parole, pour laquelle les voix françaises sont dispo mais pas forcément la prononciation...
# Speech-to-Text et Text-to-Speech
Posté par mickaël rameau . Évalué à 3.
Quel solution sous Gnu/Linux de la reconnaissance vocale ?
Y a t-il des logiciels simple avec un GUI, plus simple qu'installer : festival/mbrola/emacspeak.
L'objectif etant d'avoir un logiciel qui fait de la reconnaissance vocale (je pense à
festival/mbrola) + de la conversion du texte en son .wav/.mp3/.ogg (je pense à emackspeak qui prononce les mots et enregistrer la sortie)
++ une options de traduction du texte ou du son entre l'entrée et la sortie (google traducteur).
merci.
[^] # Re: Speech-to-Text et Text-to-Speech
Posté par Thomas Douillard . Évalué à 5.
[^] # Re: Speech-to-Text et Text-to-Speech
Posté par kadreg . Évalué à 1.
glu ? C'est ce que j'utilise sur la tribune, quand on m'appelle alors que je lit un film, mon ordinateur me dit qui m'appelle, et à propos de quoi
[^] # Re: Speech-to-Text et Text-to-Speech
Posté par Victor . Évalué à 2.
donc oui il dit bien que c'est de la synthese vocale !
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.