Firefox 66 sur la route !

Posté par antistress (site web personnel) le 20 mars 2019 à 09:59. Édité par ZeroHeure, BAud, cracky, Davy Defaud, patrick_g et Strash. Modéré par claudex. Licence CC By‑SA.

Étiquettes :

60

20

mar.

2019

La version 66 de Firefox a été publiée le 19 mars 2019.

Les principales nouveautés amélioreront votre confort (lecture automatique bloquée sur les versions bureau et Android, défilement d’une page en cours de chargement optimisé pour éviter les sauts sur la version bureau), votre productivité (recherche possible à travers les onglets ouverts sur la version bureau, prise en charge préliminaire de la Touch Bar des Mac), sans oublier les performances et la sécurité!

Nous évoquerons aussi les avancées dans l’implémentation du moteur de rendu graphique WebRender, et un nouveau projet d’envergure : Fission.

Comme d’habitude, le détail des nouveautés suit ci‐dessous.

Lien Common Voice, la base de données vocales de Mozilla, se met au français !

Posté par tchaik le 10 juin 2018 à 12:45.

Étiquettes :

7

10

juin

2018

https://blog.mozilla.org/blog/2018/06/07/parlez-vous-deutsch-rhagor-o-leisiau-i-common-voice/

Mozilla Common Voice : vers une reconnaissance vocale libre

Posté par Denis Dordoigne le 01 août 2017 à 11:46. Édité par Benoît Sibaud, Davy Defaud, ZeroHeure et claudex. Modéré par ZeroHeure. Licence CC By‑SA.

Étiquettes :

44

1

août

2017

La Fondation Mozilla a discrètement lancé le projet Common Voice, qui a pour objectif de fournir une base de données de voix à destination des développeurs de logiciels de reconnaissance vocale. D’ici la fin de l’année, la base de données sera mise à disposition de la communauté sous licence CC-0, et pourra être utilisée par les développeurs pour entraîner leurs logiciels de reconnaissance vocale.

Il est actuellement possible de participer depuis le Web, en lisant des phrases en anglais et en indiquant son accent, son âge et son genre pour enrichir la base de données. Des applications sont déjà en cours de développement pour les appareils mobiles et devraient être disponibles prochainement. Pour ceux qui ne parlent pas anglais, il est aussi possible de contribuer au projet en produisant des phrases pertinentes ainsi que du code dans GitHub.

Forum général.cherche-logiciel [android] logiciel de transcription voix vers texte

Posté par freem le 30 mai 2017 à 18:10. Licence CC By‑SA.

Étiquettes :

1

30

mai

2017

Bonjour.

Je cherche un logiciel capable d'afficher en temps réel les paroles détectées en texte sur une tablette. Le but est de faciliter la communication avec ma grand mère qui a de gros problèmes auditifs (une oreille HS et l'autre en très piteux état).
L'utilisateur ne serait pas ma grand-mère.

L'appareil de destination est une tablette xperia Z5, je ne connais pas la version d'android qui tourne dessus, très probablement celle d'origine (l'appareil n'est pas a moi).

Journal Logiciel de reconnaissance automatique d'accord libre

Posté par Jarvis le 21 février 2015 à 18:00. Licence CC By‑SA.

Étiquettes :

14

21

fév.

2015

Bonjour !

En cherchant une partition de musique je suis tombé sur le site suivant :
http://play.riffstation.com/

Le principe du site est le suivant :
* Tu cherches un morceau
* Il le trouve sur Youtube
* Il convertit la bande son en une suite d'accord par un algorithme
* Et après ça fait un karaoke (choix : guitare, ukulélé ou piano)

J'ai testé sur quelques chansons et ça fonctionne bien. Je trouve le site bien sympa. Mais bon personnellement ça (…)

Phoseg, stockage et analyse de données phonétiques transcrites

Posté par Xavier Faure (site web personnel) le 14 décembre 2012 à 09:29. Édité par Pierre Jarillon. Modéré par patrick_g. Licence CC By‑SA.

Étiquettes :

25

14

déc.

2012

Bonjour à tous,
dans le cadre d'un projet j'ai besoin d'un module pour stocker et analyser des données phonétiques transcrites, par exemple avec l'alphabet phonétique international. Mon code commence à devenir (vaguement) utilisable : je le publie donc sous une licence GLPv3 : Phoseg est un module pour Python3 que vous trouverez à cette adresse.

J'ai essayé de coller à certains principes facilitant le travail en communauté ainsi que l'écriture de code lisible : tests unitaires, code et commentaires écrits en anglais, surveillance de la qualité du code par pylint, documentation fournie.

Concrètement, je cherche d'autres personnes susceptibles d'utiliser ou d'améliorer mon module. Si vous êtes un spécialiste de la phonétique, j'ai aussi de nombreuses questions à vous poser… De façon générale, n'hésitez pas à faire remonter vos remarques, je n'attends que ça, surtout si elles sont négatives !

Sondage Comment aimez-vous les serveurs vocaux ?

Posté par goeb le 22 octobre 2012 à 11:30.

Étiquettes :

5

22

oct.

2012

On voit utiliser de plus en plus la reconnaissance vocale dans les systèmes de serveurs vocaux (banques, assurances, etc.), comme par exemple pour

consulter votre facture, dites facture
demander un devis, dites devis
etc.

Ces systèmes se veulent modernes, bien que ça ait commencé il y a près de 15 ans (serveur vocal de la cité des sciences de La Villette en 1998 par exemple, auquel il fallait répondre oui ou non). Cependant ces systèmes sont potentiellement gênants, car ils imposent à l'usager (le client) de prononcer à haute voix les mots. Donc dans les lieux publics ou les réunions ça manque de discrétion.

Et vous comment aimez-vous les serveurs vocaux ?

Reconnaissance vocale :
8
(0.6 %)
Chiffres à taper :
307
(22.7 %)
Les deux : reconnaissance vocale ou chiffres à taper :
105
(7.7 %)
Pas de serveur vocal : personne physique uniquement au téléphone :
330
(24.4 %)
Pas de serveur vocal : Internet et clic de souris :
467
(34.5 %)
Pas de serveur vocal : je me déplace au guichet :
79
(5.8 %)
Pas de serveur vocal : je reçois les infos par courriel, SMS, etc. :
59
(4.4 %)

Total : 1355 votes

Journal La transcription vocale naturelle.

Posté par Wlanfr le 06 mars 2012 à 10:04.

Étiquettes :

20

6

mar.

2012

Pour m'aider a rédiger les documentations nécessaires à mon travail, j'ai acheté Dragon version home. Comme je travaille aussi sous le Linux le je me demandais où en été la reconnaissance vocale sur notre système préféré. J'ouvre donc ce journal pour essayer de réunir toutes les informations sur la reconnaissance vocale disponible sous Linux.

Merci d'avance de votre aide.

Voici ce que j'ai déjà collecté :

1 - "CMU_Sphinx" Librairie utilisé par exemple Perlbox
2 - "gnome-voice-control" Contrôler l'environnement GNOME (…)

Avancées de la reconnaissance vocale en 2011

Posté par Benjamin Verhaeghe le 27 mars 2011 à 19:11. Modéré par baud123. Licence CC By‑SA.

Étiquettes :

42

27

mar.

2011

Voici un sujet qui fait parler de lui, un rêve de l'informatique qui s'approche à grand pas, voire qui est déjà présent dans bien des applications ! Vous avez certainement en tête le fameux « Via Voice » édité par IBM ou son successeur « Dragon naturally Speaking » édité par Scansoft. Les plus accros d'entre vous n'auront pas hésité à installer la reconnaissance vocale prévue par défaut dans XP, Vista ou Seven.

Mais lors du passage au libre, que nous effectuons pour la plupart pour des raisons différentes, avec des approches philosophiques, économiques ou pratiques, nous sommes confrontés à la perte de plusieurs des logiciels et/ou fonctionnalités que nous avions adoptés précédemment (compatibilité de notre écosystème logiciel). Pour ceux d'entre nous qui avaient fait le choix de la reconnaissance vocale, cette fonctionnalité reste difficilement remplaçable dans le monde de GNU/Linux. Les logiciels propriétaires cités précédemment ne sont pas prévus pour fonctionner sous nos distributions, et la communauté ne semble pas encore prête à offrir une alternative efficace. Il existe cependant quelques projets similaires dont l'avancement ne peut être négligé :

tout d'abord la source de données audio qui aide à la mise en place de ces projets : Voxforge collecte les données audio dans différentes langues pour permettre l'implémentation de l'utilisation de ces données par des moteurs de moteurs de reconnaissance vocale Open Source ;
CMUSphinx est le plus célèbre d'entre eux. Il permet – dans le cadre de la recherche principalement – d'obtenir la transcription écrite de données orales. D'un langage de programmation assez simple, basé sur des phonèmes, il permet d'obtenir des résultats prometteurs pour le développement d'applications libres selon les 3 règles chères aux plus stricts d'entre nous ;
un premier développement a été effectué il y a quelques années déjà pour la communauté française, avec Perlbox, qui permet de piloter son ordinateur en français, basé sur CMUsphinx 2 ;
une approche plus récente, toujours basée sur le projet CMUsphinx, est proposée par EvalDictator, mais pas encore disponible en français.

Alors vous me direz, quoi de neuf ? Et bien Google s'est aussi lancé dans la course à la reconnaissance vocale. Cela ne date pas d'hier :

retranscription écrite des dialogue de vidéos en novembre 2008 ;
lancement d'applications et reconnaissance vocale d'un texte sous Android en août 2010 ;
maintenant, c'est au tour de Chrome 11 de bénéficier de ces compétences (peut être).

Simon, vous connaissez ?

Posté par Gyro Gearllose le 26 août 2009 à 15:19. Modéré par Nÿco.

Étiquettes :

37

26

août

2009

Depuis un bon moment, la communauté kde recherche une application tierce de reconnaissance vocale qui serait bien intégrée à l'environnement. L'une de ces applications s'appelle simon.

Qu'est-ce que simon ?

Il s'agit d'un système de reconnaissance vocale qui peut être intégré aussi bien à X11 qu'à windows, et qui utilise une architecture basée sur des greffons pour en contrôler l'interface.
Il tire son nom d'un jeu pour enfant "Simon dit", mais dans le cas présent "Simon écoute". Ce nom est en minuscule exprès, car l'organisation financière qui le supporte s'appelle "SIMON listens". C'est aussi un acronyme pour "Speech Interaction MONitor".

Peter Grash, l'un des développeurs de cette application indique à propos de l'origine du projet :

Il était dans une école (en 2006) qui proposait un sujet nommé "project development" pour lequel des groupes d'étudiants devaient développer des projets avec des sociétés externes. Alors qu'il cherchait un projet, il a été contacté par Franz Stieger, un enseignant qui s'occupait d'enfants en difficultés, notamment des problèmes de paralysie spasmodique spasticity. Du fait de leur problèmes moteurs, ces enfants ont des difficultés pour écrire et pour taper au clavier. Franz voulait savoir si un logiciel de reconnaissance vocale pourrait les aider à participer plus dans la classe. Après cet exposé, Peter et 4 de ses camarades ont cherché des logiciels de ce type, mais sont rapidement arrivés à la conclusion qu'aucun des logiciels de reconnaissance vocale existants, qu'ils soient commerciaux ou non, était capable de s'adapter aux éventuels problèmes de diction de leurs sujets de tests. C'est ainsi que le projet est né.

Dès 2007, Peter Grash et son équipe avait déjà un prototype fonctionnel. Le premier mot que simon reconnut était "thunfish" (thon en allemand) qui, quand il était prononcé, affichait une image plein écran d'un thon. Peu de temps après, simon avait deux commandes : exécutables et lieux. Depuis, beaucoup de commandes ont été ajoutées, mais il vaut mieux se référer à la vidéo de démonstration pour s'en faire une idée précise et voir simon en pleine action.

Pour le moment, les commandes sont implémentées sous forme de greffons configurables.

Il est d'ores et déjà disponible en version 0.2, car toujours en développement, mais semble déjà bien fonctionnel, comme le montre la vidéo de démonstration sur la page de la news.

NdM : ceci est une traduction de l'article de Troy Unrau sur KDEnews avec son autorisation, merci à Gyro Gearllose (geo_trouvetout) et Troy ; merci aussi à gnumdk pour son journal sur le sujet.

Journal Toi aussi, donnes des ordres à ton ordinateur!

Posté par gnumdk (site web personnel) le 24 août 2009 à 16:05.

Étiquettes :

9

24

août

2009

http://dot.kde.org/2009/08/22/simon-speech-activated-user-in(...)

Simon, le système de gestion d'entrées utilisateur pour X (et Windows) basé sur les librairies Kde vient de sortir en version 0.2.

Avec un architecture à base de plugins, il permet faire beaucoup de choses avec sa bouche ;)

Journal Un «détecteur de mensonge» basé sur la voix

Posté par fasthm le 16 décembre 2008 à 22:12.

Étiquettes :

9

16

déc.

2008

Cet article du Monde :

http://www.lemonde.fr/europe/article/2008/12/16/un-detecteur(...)

décrit un système de traque d'éventuels fraudeurs aux allocations publiques basé sur la détection des changements de la voix lors d'une conversation téléphonique.

J'aimerai vraiment que des gens calés en mathématiques et friands d'open source s'essaient à coder ça, que l'on puisse appliquer ça aux discours des gens qui décident la mise en place de ce genre d'outils sympathiques.

Journal On s'en moque mais mon ordi comprend enfin le Français

Posté par Rkraft le 25 juillet 2007 à 19:47.

Étiquettes :

0

25

juil.

2007

http://www.dailymotion.com/relevance/search/mikfr/video/x2ln(...)

Alors avant de télécharger assurez vous que les pré-requis sont conformes à votre installation.

Il vous faut :
- Perl (which perl pour vous aider à déterminer si vous l'avez...en principe oui)

- Espeak compilé depuis les sources, certaines distributions proposent des packages fonctionnels mais hélas trop anciens.

-Sphinx 2 sans aucune condition supplémentaire, n'importe quelle version devrait faire l'affaire, ne vous souciez pas des dictionnaires le tout étant d'avoir sphinx en version minimale et en anglais.

Téléchargez perlbox (…)

Journal Reconnaissance vocale sous Linux

Posté par Julien CARTIGNY le 04 novembre 2005 à 12:33.

Étiquettes :

0

4

nov.

2005

Par l'intermédiaire de mon travail, je viens de rencontrer une américaine qui utilise un logiciel de reconnaissance vocale pour pouvoir travailler sur son Windows. Avec des problèmes apparents aux poignets, elle utilise entierement la voix pour donner des ordres à Windows, qui s'execute sans trop de problèmes. Je suis à la recherche d'un équivalent en logiciel libre, une idée ? De même, existe t'il des pages web à propos de l'utilisation de Linux pour les handicapés ?

IBM dope la reconnaissance vocale Open Source

Posté par jepoirrier le 13 septembre 2004 à 17:32. Modéré par jerome.

Étiquettes :

0

13

sept.

2004

IBM a annoncé qu'il allait donner à la Fondation Apache une collection de logiciels de reconnaissance de la parole (dont le coût de développement est estimé à 10 millions de USD). Ne vous attendez pas à avoir (de nouveau) ViaVoice sous GNU/Linux : ces logiciels ne manipuleront que des mots, dates, heures et endroits (villes, états, ...). De plus, IBM va également donner des outils d'édition de la parole à la Fondation Eclipse, un groupe open source qu'il a créé.

Tous les contenus étiquetés avec « reconnaissance_vocale »