Projet Shtooka, quelques nouvelles...

Posté par Nicolas le 07 mai 2008 à 16:29. Modéré par Nÿco.

Étiquettes :

mai

2008

Que les amoureux des langues Slaves de l'Est se réjouissent ! Le Projet Shtooka vient de mettre à disposition des internautes une collection audio libre de 16 000 mots ukrainiens. Cette collection est publiée sous licence libre Creative Commons BY (Attribution). De plus nous avons enregistré près de 8000 mots biélorusses fin mars.

C'est, je pense, une bonne occasion pour faire le point sur le projet.

Le Projet Shtooka vise à constituer un ensemble de bases de données audio linguistiques afin de développer des outils logiciels pour l'apprentissage des langues étrangères.
Le nombre total d'enregistrements libres sur notre serveur atteint maintenant le chiffre de 75 000. La «Collection audio libre de mots français» a, par exemple, doublé de taille depuis sa création. Malgré tout, il est à regretter que l'espagnol et l'allemand qui sont pourtant deux langues fortement enseignées en France restent si mal représentées...

Il s'agit en fait d'un euphémisme, puisque nous n'avons toujours pas un seul enregistrement en espagnol. Avis aux amateurs!

Vivent les collections audio SWAC !

Posté par Nicolas le 25 mars 2007 à 19:42. Modéré par Jaimé Ragnagna.

Étiquettes :

mar.

2007

SWAC Metatags propose une dénomination pour une quarantaine de champs supplémentaires au système des tags Vorbis Comment (ces informations qui accompagnent les fichiers audio Ogg et Flac) pour stocker les informations propres aux collections audio de mots ou d'expressions (la langue maternelle et la région d'origine du locuteur, le mot prononcé etc...). Ces collections peuvent servir de matière première pour des logiciels éducatifs (logiciels de dictée, apprentissage du vocabulaire, dictionnaire électroniques etc..).

Nous avons mis en place cinq collections de ce type : russe, chinois, français, anglais et néerlandais (pour un total d'environ 30 000 mots).
Ces collections sont librement et facilement téléchargeables depuis notre serveur (sous licence Creative Commons BY).

De plus, l'interopérabilité, n'a pas été oubliée : le contenu de ces bases de données est utilisable par n'importe quel développeur grâce à la mise à disposition d'index XML.
Quelques outils logiciels, distribués sous licence GPL permettent d'ores et déjà de tirer parti de ce matériel audio :

«Shtooka Explorer» permet la consultation de ces collections de façon locale ou via internet ;
«Shtooka Recorder» permet l'enregistrement systématique de listes de mots ou expressions (il permet d'enregistrer un millier de mots en moins d'une heure).

Base audio libre de mots français

Posté par Nicolas le 16 juillet 2006 à 11:06. Modéré par Mouns.

Étiquettes :

juil.

2006

La "Base Audio Libre De Mots Français" est une base de données d'enregistrements sonores tirés d'une liste d'environ 7000 mots ou expressions en langue française. Le contenu de cette base de données est distribué librement sous licence "Creative Commons By-ShareAlike 2.0".

Ces fichiers sonores sont essentiellement destinés aux personnes étudiant le français comme langue étrangère ainsi qu'à la production de matériel pédagogique. La liste des mots est tirée du dictionnaire bilingue franco-anglais libre distribué par freedict.org (Il a été ajouté un ou plusieurs articles aux substantifs).

L'ensemble des enregistrements sonores, accompagné d'une index XML et d'un index alphabétique HTML peut être téléchargé depuis le site. Les fichiers audio peuvent également être téléchargés individuellement aux formats ogg et mp3.

Nicolas a écrit 3 contenus de type dépêche ou journal