Journal De l'apprentissage profond qui en jette avec Opus 1.5

Posté par  . Licence CC By‑SA.
Étiquettes :
53
5
mar.
2024

Salut,

J'étais déjà impressionné par LPCNet qui est un « codec » permettant d'encoder la voix humaine à l'aide d'un réseau de neurones pré-entraîné.

Bon, les gens de chez Opus ont pris ça, et ont fait un tas de trucs sympas en plus : https://opus-codec.org/demo/opus-1.5/

Si vous voulez aller vite, la dernière démo vaut le coup : elle simule la perte de paquets en transmission de voix, et recrée au mieux ce qui est perdu. Le résultat est bluffant. Essayez (…)

gSpeech passe en 0.10

Posté par  . Édité par tisaac, palm123, Xavier Teyssier, Davy Defaud et claudex. Modéré par Davy Defaud. Licence CC By‑SA.
38
15
déc.
2020
Son

gSpeech est un petit utilitaire permettant la synthèse vocale sur GNU/Linux. Cette dépêche retrace les évolutions depuis la version 0.8 et esquisse des évolutions possibles pour le futur.

Journal gSpeech passe en 0.10

Posté par  . Licence CC By‑SA.
20
27
juin
2020
Ce journal a été promu en dépêche : gSpeech passe en 0.10.

Bonjour à tous.

gSpeech est un petit utilitaire que je vous avait déjà présenté ici pour le lancement de la 0.8 : https://linuxfr.org/users/mothsart/journaux/lancement-de-gspeech-0-8 et qui permet la synthèse vocale sur linux.
Une présentation, somme toute sommaire est disponible ici : https://wiki.primtux.fr/doku.php/gspeech

Je rappel que avant tout, j'ai repris et amélioré ce soft en vue d'améliorer l'expérience utilisateur dans la distribution Primtux et par conséquent pour le milieu francophone.
Maintenant, son usage permet bien évidement de couvrir un champ plus large.

(…)

Journal Lancement de Gspeech 0.8

Posté par  . Licence CC By‑SA.
Étiquettes :
43
16
avr.
2020

Bonjour à tous.

J'ai décidé de dépoussiérer un logiciel qui me semblait avoir un bon potentiel mais quelques lacunes.

gSpeech est un petit utilitaire qui permet de lire du texte. (synthèse vocale)
Pour un descriptif détaillé : https://wiki.primtux.fr/doku.php/gspeech et pour un complément d'information : https://doc.ubuntu-fr.org/svoxpico

Bon, on peut pas dire que le TTS (Text To Speech) soit la joie sous Linux.

Ça fait maintenant quelques années que j'aide au développement de la distribution Primtux et gSpeech (ainsi que la lib (…)

Forum Linux.général Synthèse vocale Pico tts et voix supplémentaires

Posté par  . Licence CC By‑SA.
2
28
mar.
2018

Bonjour à tous

J'ai mis en place pico tts sur un système à base de x86 sous Debian tout fonctionne très bien. Mais la voix fournie en français par défaut ne me plaît pas trop. J'ai fais une recherche pour savoir si des voix additionnelles existaient.

A priori ce n'est pas le cas. Donc je me demandai si il était possible de créer une voix personnalisée.

Je me demandais, si quelqu'un connaissait des spécifications ou des outils permettant de faire (…)

Kalliope, votre assistant personnel vocal

Posté par  . Édité par Davy Defaud, palm123, Benoît Sibaud, bubar🦥 et ZeroHeure. Modéré par bubar🦥. Licence CC By‑SA.
41
20
nov.
2016
Python

Kalliope est un assistant vocal personnel. Il peut, par exemple, vous permettre de piloter votre installation domotique à la voix. Il est écrit en Python et est sous licence MIT. Le code est disponible sur GitHub.

logo kalliope

GNU/Linux s’ouvre à de nouvelles voix de synthèse !

Posté par  (site web personnel) . Édité par bubar🦥, Davy Defaud, palm123, ZeroHeure, Pierre Jarillon et Nÿco. Modéré par Xavier Teyssier. Licence CC By‑SA.
34
5
nov.
2016
Bureautique

À l’occasion de la sortie par Hypra d’une nouvelle synthèse vocale, plus naturelle et plus intelligible, il m’a semblé utile de vous présenter le contexte. Car cette sortie, c’est surtout un module supplémentaire pour speech‐dispatcher, la plate‐forme libre de synthèses vocales sous GNU/Linux. Malheureusement, le module libre ne marche qu’avec la synthèse, qui n’est pas libre. Mais sait‐on jamais, l’université pourrait y venir avec le temps.

Forum général.hors-sujets Logiciel de modificateur de voix

Posté par  . Licence CC By‑SA.
0
7
sept.
2013

Bonjour tout le monde, alors voilas je vient sur ce forum pour vous posez une question car je trouve pas de solution si on peux dire ça comme sa.
Moi et un amis on ce lance dans le rap, et il n'est pas trop fan de sa voix, et j'aimerais lui la modifier, mais je ne trouve pas de logiciel adaptée a mes besoins..
Merci de m'aidez car je suis un peux en galère.

Journal La transcription vocale naturelle.

Posté par  .
20
6
mar.
2012

Pour m'aider a rédiger les documentations nécessaires à mon travail, j'ai acheté Dragon version home. Comme je travaille aussi sous le Linux le je me demandais où en été la reconnaissance vocale sur notre système préféré. J'ouvre donc ce journal pour essayer de réunir toutes les informations sur la reconnaissance vocale disponible sous Linux.

Merci d'avance de votre aide.

Voici ce que j'ai déjà collecté :

1 - "CMU_Sphinx" Librairie utilisé par exemple Perlbox
2 - "gnome-voice-control" Contrôler l'environnement GNOME (…)

Publication d'une « Base audio libre de mots tchèques »

Posté par  . Modéré par Nÿco.
0
20
nov.
2007
Éducation
Le « Projet Shtooka » est fier de pouvoir vous présenter sa dernière collection audio de mots et expressions.

La « Base audio libre de mots tchèques » rassemble l'enregistrement de la prononciation d'environ 3500 mots et expressions en langue tchèque.

Le contenu de cet ensemble d'enregistrement audio est distribué sous licence « Creative Commons Paternité 2.0 ». Vous pouvez donc librement la télécharger, la modifier, la rediffuser.

Ces enregistrements peuvent bien évidemment être écoutés par les personnes étudiant la langue tchèque leur permettant ainsi de faire connaissance avec la prononciation réelle des différents mots appris. Cependant, cette collection se destine essentiellement à la production de matériel pédagogique. Grâce à la mise à disposition d'index au format XML, les enregistrements peuvent être intégrés dans des dictionnaires électroniques, des plateformes pédagogiques ou bien être utilisés par des logiciels éducatifs.

Les verbes irréguliers anglais enfin libres !

Posté par  . Modéré par rootix.
0
29
oct.
2007
Éducation
Le Projet Shtooka a enregistré la prononciation des formes conjuguées d'environ 160 verbes irréguliers anglais qui sont habituellement présentés dans les manuels scolaires. Cette collections, comme l'ensemble des collections enregistrées par le Projet Shtooka (comme la "Base audio libre de mots français"), est distribuée sous licence "Creative Commons Paternité 2.0".

Ces fichiers sonores ont été prononcés par Alyson Heimer, une étudiante américaine originaire du Massachusetts.

Un ensemble d'exercices audio de mémorisation est mis à disposition des internautes sous la même licence. La prononciation des formes conjuguées est précédée de la traduction du verbe en français. L'apprenant peut alors mémoriser les verbes irréguliers grâce à une écoute répétée, se familiarisant par là même avec leur prononciation réelle.

Base audio libre de mots français

Posté par  . Modéré par Mouns.
1
16
juil.
2006
Son
La "Base Audio Libre De Mots Français" est une base de données d'enregistrements sonores tirés d'une liste d'environ 7000 mots ou expressions en langue française. Le contenu de cette base de données est distribué librement sous licence "Creative Commons By-ShareAlike 2.0".

Ces fichiers sonores sont essentiellement destinés aux personnes étudiant le français comme langue étrangère ainsi qu'à la production de matériel pédagogique. La liste des mots est tirée du dictionnaire bilingue franco-anglais libre distribué par freedict.org (Il a été ajouté un ou plusieurs articles aux substantifs).

L'ensemble des enregistrements sonores, accompagné d'une index XML et d'un index alphabétique HTML peut être téléchargé depuis le site. Les fichiers audio peuvent également être téléchargés individuellement aux formats ogg et mp3.

Voice XML : bientôt un standard pour surfer à la voix

Posté par  . Modéré par Nÿco.
Étiquettes :
0
6
fév.
2004
Internet
Le 3 février 2004, le W3C (Consortium World Wide Web) a publié une proposition de recommendation pour VoiceXML 2.0.

Comme son nom l'indique, VoiceXML 2.0 est une extension du format XML (Extensible Markup Language), principal standard de description de données numériques. Son objectif est «de faciliter l'utilisation des techniques de développement web pour la mise en place d'applications vocales interactives».

Cela entre dans le cadre de la plate-forme Interface Vocale sur lequel le W3C travaille depuis 1999 dans le but d'étendre l'accès universel au Web, à l'aide d'interactions de type clavier téléphonique, commandes vocales, annonces préenregistrées, voix et musiques synthétisées.