Journal L’IA permet-elle de voir ou entendre le futur proche ? et notre cerveaux, le peut-il ?

Posté par Space_e_man (site web personnel) le 27 mai 2024 à 21:32. Licence CC By‑SA.

Étiquettes :

6

27

mai

2024

Salut Journal,

Je tenais à te faire part d’une réflexion du jour…

J’ai récemment fait l’acquisition d’un casque couvrant bluetooth. J’étais sur le quai de la gare et j’écoutais un « le meilleur de Schubert »…

Le casque couvrant atténue de fait le bruit ambiant, mail il propose également une fonctionnalité numérique, qui repose sur des micros, pour encore réduire la perception de ce bruit.

Je me dis alors qu’il doit y avoir probablement une légère latence malgré tout, entre (…)

Journal De l'apprentissage profond qui en jette avec Opus 1.5

Posté par Glandos le 05 mars 2024 à 10:55. Licence CC By‑SA.

Étiquettes :

53

5

mar.

2024

Salut,

J'étais déjà impressionné par LPCNet qui est un « codec » permettant d'encoder la voix humaine à l'aide d'un réseau de neurones pré-entraîné.

Bon, les gens de chez Opus ont pris ça, et ont fait un tas de trucs sympas en plus : https://opus-codec.org/demo/opus-1.5/

Si vous voulez aller vite, la dernière démo vaut le coup : elle simule la perte de paquets en transmission de voix, et recrée au mieux ce qui est perdu. Le résultat est bluffant. Essayez (…)

gSpeech passe en 0.10

Posté par mothsART le 15 décembre 2020 à 11:59. Édité par tisaac, palm123, Xavier Teyssier, Davy Defaud et claudex. Modéré par Davy Defaud. Licence CC By‑SA.

Étiquettes :

38

15

déc.

2020

gSpeech est un petit utilitaire permettant la synthèse vocale sur GNU/Linux. Cette dépêche retrace les évolutions depuis la version 0.8 et esquisse des évolutions possibles pour le futur.

Journal gSpeech passe en 0.10

Posté par mothsART le 27 juin 2020 à 11:28. Licence CC By‑SA.

Étiquettes :

20

27

juin

2020

Ce journal a été promu en dépêche : gSpeech passe en 0.10.

Bonjour à tous.

gSpeech est un petit utilitaire que je vous avait déjà présenté ici pour le lancement de la 0.8 : https://linuxfr.org/users/mothsart/journaux/lancement-de-gspeech-0-8 et qui permet la synthèse vocale sur linux.
Une présentation, somme toute sommaire est disponible ici : https://wiki.primtux.fr/doku.php/gspeech

Je rappel que avant tout, j'ai repris et amélioré ce soft en vue d'améliorer l'expérience utilisateur dans la distribution Primtux et par conséquent pour le milieu francophone.
Maintenant, son usage permet bien évidement de couvrir un champ plus large.

(…)

Journal Lancement de Gspeech 0.8

Posté par mothsART le 16 avril 2020 à 14:42. Licence CC By‑SA.

Étiquettes :

43

16

avr.

2020

Bonjour à tous.

J'ai décidé de dépoussiérer un logiciel qui me semblait avoir un bon potentiel mais quelques lacunes.

gSpeech est un petit utilitaire qui permet de lire du texte. (synthèse vocale)
Pour un descriptif détaillé : https://wiki.primtux.fr/doku.php/gspeech et pour un complément d'information : https://doc.ubuntu-fr.org/svoxpico

Bon, on peut pas dire que le TTS (Text To Speech) soit la joie sous Linux.

Ça fait maintenant quelques années que j'aide au développement de la distribution Primtux et gSpeech (ainsi que la lib (…)

Forum Linux.général Synthèse vocale Pico tts et voix supplémentaires

Posté par Nodeus le 28 mars 2018 à 08:09. Licence CC By‑SA.

Étiquettes :

2

28

mar.

2018

Bonjour à tous

J'ai mis en place pico tts sur un système à base de x86 sous Debian tout fonctionne très bien. Mais la voix fournie en français par défaut ne me plaît pas trop. J'ai fais une recherche pour savoir si des voix additionnelles existaient.

A priori ce n'est pas le cas. Donc je me demandai si il était possible de créer une voix personnalisée.

Je me demandais, si quelqu'un connaissait des spécifications ou des outils permettant de faire (…)

Kalliope, votre assistant personnel vocal

Posté par barmic le 20 novembre 2016 à 08:43. Édité par Davy Defaud, palm123, Benoît Sibaud, bubar🦥 et ZeroHeure. Modéré par bubar🦥. Licence CC By‑SA.

Étiquettes :

41

20

nov.

2016

Kalliope est un assistant vocal personnel. Il peut, par exemple, vous permettre de piloter votre installation domotique à la voix. Il est écrit en Python et est sous licence MIT. Le code est disponible sur GitHub.

logo kalliope

GNU/Linux s’ouvre à de nouvelles voix de synthèse !

Posté par Texou (site web personnel) le 05 novembre 2016 à 15:16. Édité par bubar🦥, Davy Defaud, palm123, ZeroHeure, Pierre Jarillon et Nÿco. Modéré par Xavier Teyssier. Licence CC By‑SA.

Étiquettes :

34

5

nov.

2016

À l’occasion de la sortie par Hypra d’une nouvelle synthèse vocale, plus naturelle et plus intelligible, il m’a semblé utile de vous présenter le contexte. Car cette sortie, c’est surtout un module supplémentaire pour speech‐dispatcher, la plate‐forme libre de synthèses vocales sous GNU/Linux. Malheureusement, le module libre ne marche qu’avec la synthèse, qui n’est pas libre. Mais sait‐on jamais, l’université pourrait y venir avec le temps.

Forum général.hors-sujets Logiciel de modificateur de voix

Posté par Nozix le 07 septembre 2013 à 18:56. Licence CC By‑SA.

Étiquettes :

0

7

sept.

2013

Bonjour tout le monde, alors voilas je vient sur ce forum pour vous posez une question car je trouve pas de solution si on peux dire ça comme sa.
Moi et un amis on ce lance dans le rap, et il n'est pas trop fan de sa voix, et j'aimerais lui la modifier, mais je ne trouve pas de logiciel adaptée a mes besoins..
Merci de m'aidez car je suis un peux en galère.

Journal La transcription vocale naturelle.

Posté par Wlanfr le 06 mars 2012 à 10:04.

Étiquettes :

20

6

mar.

2012

Pour m'aider a rédiger les documentations nécessaires à mon travail, j'ai acheté Dragon version home. Comme je travaille aussi sous le Linux le je me demandais où en été la reconnaissance vocale sur notre système préféré. J'ouvre donc ce journal pour essayer de réunir toutes les informations sur la reconnaissance vocale disponible sous Linux.

Merci d'avance de votre aide.

Voici ce que j'ai déjà collecté :

1 - "CMU_Sphinx" Librairie utilisé par exemple Perlbox
2 - "gnome-voice-control" Contrôler l'environnement GNOME (…)

Publication d'une « Base audio libre de mots tchèques »

Posté par Nicolas le 20 novembre 2007 à 18:24. Modéré par Nÿco.

Étiquettes :

0

20

nov.

2007

Le « Projet Shtooka » est fier de pouvoir vous présenter sa dernière collection audio de mots et expressions.

La « Base audio libre de mots tchèques » rassemble l'enregistrement de la prononciation d'environ 3500 mots et expressions en langue tchèque.

Le contenu de cet ensemble d'enregistrement audio est distribué sous licence « Creative Commons Paternité 2.0 ». Vous pouvez donc librement la télécharger, la modifier, la rediffuser.

Ces enregistrements peuvent bien évidemment être écoutés par les personnes étudiant la langue tchèque leur permettant ainsi de faire connaissance avec la prononciation réelle des différents mots appris. Cependant, cette collection se destine essentiellement à la production de matériel pédagogique. Grâce à la mise à disposition d'index au format XML, les enregistrements peuvent être intégrés dans des dictionnaires électroniques, des plateformes pédagogiques ou bien être utilisés par des logiciels éducatifs.

Les verbes irréguliers anglais enfin libres !

Posté par Nicolas le 29 octobre 2007 à 10:00. Modéré par rootix.

Étiquettes :

0

29

oct.

2007

Le Projet Shtooka a enregistré la prononciation des formes conjuguées d'environ 160 verbes irréguliers anglais qui sont habituellement présentés dans les manuels scolaires. Cette collections, comme l'ensemble des collections enregistrées par le Projet Shtooka (comme la "Base audio libre de mots français"), est distribuée sous licence "Creative Commons Paternité 2.0".

Ces fichiers sonores ont été prononcés par Alyson Heimer, une étudiante américaine originaire du Massachusetts.

Un ensemble d'exercices audio de mémorisation est mis à disposition des internautes sous la même licence. La prononciation des formes conjuguées est précédée de la traduction du verbe en français. L'apprenant peut alors mémoriser les verbes irréguliers grâce à une écoute répétée, se familiarisant par là même avec leur prononciation réelle.

Base audio libre de mots français

Posté par Nicolas le 16 juillet 2006 à 11:06. Modéré par Mouns.

Étiquettes :

1

16

juil.

2006

La "Base Audio Libre De Mots Français" est une base de données d'enregistrements sonores tirés d'une liste d'environ 7000 mots ou expressions en langue française. Le contenu de cette base de données est distribué librement sous licence "Creative Commons By-ShareAlike 2.0".

Ces fichiers sonores sont essentiellement destinés aux personnes étudiant le français comme langue étrangère ainsi qu'à la production de matériel pédagogique. La liste des mots est tirée du dictionnaire bilingue franco-anglais libre distribué par freedict.org (Il a été ajouté un ou plusieurs articles aux substantifs).

L'ensemble des enregistrements sonores, accompagné d'une index XML et d'un index alphabétique HTML peut être téléchargé depuis le site. Les fichiers audio peuvent également être téléchargés individuellement aux formats ogg et mp3.

Voice XML : bientôt un standard pour surfer à la voix

Posté par tuiu pol le 06 février 2004 à 13:54. Modéré par Nÿco.

Étiquettes :

0

6

fév.

2004

Le 3 février 2004, le W3C (Consortium World Wide Web) a publié une proposition de recommendation pour VoiceXML 2.0.

Comme son nom l'indique, VoiceXML 2.0 est une extension du format XML (Extensible Markup Language), principal standard de description de données numériques. Son objectif est «de faciliter l'utilisation des techniques de développement web pour la mise en place d'applications vocales interactives».

Cela entre dans le cadre de la plate-forme Interface Vocale sur lequel le W3C travaille depuis 1999 dans le but d'étendre l'accès universel au Web, à l'aide d'interactions de type clavier téléphonique, commandes vocales, annonces préenregistrées, voix et musiques synthétisées.

Tous les contenus étiquetés avec « voix »