WikiBabel - des wikicasts libres pour apprendre les langues

Posté par  (site web personnel) . Modéré par baud123.
Étiquettes :
23
26
jan.
2011
Éducation
Né de la frustration de ne pas trouver de cours de langues audio libres pour certaines langues, WikiBabel propose des outils pour créer des podcast gratuits, librement éditables et utilisables.

Il ne s'agit pas seulement d'une base de données de mots ou de phrases traduites, mais de véritables cours de langues. Nous les appelons wikicasts (wiki + podcast), qui sont aux podcasts ce que les wikis sont aux pages web.
Une des forces de WikiBabel est de ne pas être limité à un couple de langues. Théoriquement, on peut trouver des cours de n'importe quelle langue, quelle que soit la langue qu'on parle. On peut aussi y inclure dialectes et langues orales.

Aucun logiciel particulier n'est nécessaire, à part un navigateur à peu près récent, et un greffon permettant la lecture du Flash. Tout le code est sous licence GPLv3, et le contenu du site en Creative Commons (CC-BY-SA).
Nous sommes en train de développer des outils pour traduire rapidement et facilement une leçon en d'autres langues pour faciliter la multiplication du contenu.

Origine


WikiBabel a démarré comme un projet personnel, lorsque je n'arrivais pas à trouver de cours de néerlandais qui me plaisaient. Soit il fallait débourser des centaines d'euros, soit il existait des livres mais qui ne donnaient que très peu d'aide orale (utile pour avoir un accent potable), soit on trouvait quelques exemples de phrases à écouter en ligne, mais ça n'allait généralement pas bien loin.
La démonstration de faisabilité a mis longtemps à émerger, et on n'en est encore réellement que là, une version alpha, mais qui fait ce que dit l'étiquette.
À la manière d'un wiki, on ouvre une leçon qu'on peut lire et/ou écouter. Si l'on souhaite modifier ou enrichir son contenu, un clic sur « modifier », on corrige le script, on enregistre la voix correspondante, on sauvegarde, et le wikicast est recompilé à la volée en quelques secondes, prêt à être écouté en ligne ou sur un iPod.

Aujourd'hui


Actuellement, le site regroupe une vingtaine de leçons/wikicasts en une dizaine de langues, mais ces chiffres peuvent croître très vite grâce à plusieurs nouveautés :
  • la création des wikicasts est découpée autant que possible : écriture du script, traduction, enregistrement du son sont découplés, ce qui fait qu'on peut apporter sa pierre à l'édifice avec une contribution même très modeste ;

  • l'enregistrement peut se faire directement dans le navigateur, pour peu qu'il soit un tant soit peu moderne. Aucun logiciel à télécharger, pas de syntaxe obscure à apprendre. Si besoin, il est aussi possible de télécharger des fichiers sons enregistrés par ailleurs. Le site nécessite seulement un navigateur supportant JavaScript et Flash ;

  • des outils de duplication/traduction des leçons permettent de réutiliser le contenu d'une leçon pour en faire une nouvelle très rapidement. Par exemple, on peut partir d'une leçon anglais-français pour très rapidement produire une nouvelle leçon anglais-espagnol, ou anglais-chinois. L'autre sens (allemand-français à partir d'anglais-français par exemple) est en cours de développement ;

  • de façon similaire, on peut aussi « demander » une leçon personnalisée en tapant le contenu que l'on voudrait apprendre pour qu'un autre utilisateur vienne ensuite le compléter. Par exemple, je voudrais apprendre à commander un thé au beurre de yack pour mes prochaines vacances au Népal...

Au niveau technique, c'est un serveur Debian hébergé sur un VPS de chez Gandi. Lighttpd + MySQL + PHP pour faire tourner MediaWiki, le wiki qui fait ronronner Wikipédia. Pour l'enregistrement en ligne, on utilise Red5, un serveur Flash libre, qui est utilisé par quelques petits sites pour le même but, comme YouTube ou Facebook. Enfin, quelques petits programmes libres pour bidouiller le son (sox, ffmpeg) et un peu de code maison (PHP + JS, disponible sur un SVN chez Assembla) pour coller les morceaux.

L'objectif actuel est d'agrandir l'équipe, qui se résume pour le moment à moi, plus quelques contributeurs ponctuels (merci à eux).

Le futur — axes de développement


Il y a énormément à faire pour développer le site, autant du côté contenu que du côté outils, mais voici quelques priorités :
  • Débogage et stabilisation du site. Pour l'instant, le code va au plus court en éludant les cas d'erreurs, le site ne marche pas toujours comme prévu si on n'utilise pas Firefox 3.6 ;

  • L'interface d'édition des wikicasts est très sommaire et mérite quelques modifications pour améliorer l'édition du contenu ;

  • La qualité du podcast généré pourrait être optimisée ;

  • Enfin un système de dépendances entre leçons (du genre la leçon « lire l'heure » nécessite d'avoir d'abord appris la leçon « compter jusqu'à 60 », qui elle-même requiert la leçon « compter de 1 à 10 »), permettrait de facilement générer une série de leçons personnalisée pour des objectifs spécifiques.

Il y a sans doute d'autres pistes à explorer, peut-être des synergies avec d'autres projets pour partager du contenu, et plein d'autres idées qu'une vraie communauté saura apporter.

Aller plus loin

  • # autres projets

    Posté par  (site web personnel) . Évalué à 8.

    Très bonne idée, reste plus qu'à espérer que ça va s'étoffer.

    Pour les collaborations avec d'autres projets, faisant parti du projet Tatoeba (http://tatoeba.org ) il doit y avoir moyen de bosser ensemble sur le contenu textuel, on doit avoir la plupart des phrases basiques dans une bonne soixantaine de langue, et idem en ne se focalisant pas sur des couples de langues, et pour celles qui manquent, ça s'ajoute :p . Après le seul petit souci c'est la différence de licence (CC-By pour tatoeba), ce qui à ma compréhension de la chose (corrigez-moi si je me trompe) permet d'utiliser le contenu de tatoeba dans wikibabel mais pas l'inverse (vu qu'on n'oblige pas le partage à l'identique)
    • [^] # Re: autres projets

      Posté par  . Évalué à 1.

      Il y a aussi Shtooka en ce qui concerne les enregistrements audio. Ce serait d'ailleurs très bien de pouvoir utiliser ce dernier au lieu de vos propres enregistrements pour éviter les doublons a ce niveau la. Par contre je ne sais pas quelle est la licence utilisée.

      Un des avantages de Shtooka est le soin tout particulier apporté aux
      métadonnées ([http://shtooka.net/swac/fr/]) sur le locuteur (région d'origine, sexe, age, etc.). Ce sont beaucoup de choses importantes pour la compréhension orale (je viens du sud, et j'ai vécu en Irlande, je sais ce que cela veut dire :) ).

      Comme le souligne Allan Simon, les licences différentes sont un problème. Un changement de licence pourrait être utilise tant que le projet est jeune pour être 100% compatible avec Tatoeba et permettre des échanges bidirectionnels?

      En parlant d'entente entre les projets libres, je vois que Shtooka est bien versé la dedans avec des liens vers Tatoeba et le wiktionnaire:
      http://swac-collections.org/listen/bel/%D0%B0%D0%B1%D0%B0%D0(...)
      (De même le wiktionnaire intègre les sons issus du projet Shtooka)


      Ça faisait un bon moment que je n'étais pas retourné sur le site web de Shtooka et je dois dire que leur nouveau site est bluffant et de super qualité! Jugez en vous même: [http://swac-collections.org/search.php?str=test&lang=fra]
      Je trouve cela magnifique. Bravo aux membres du projet.


      Bravo aussi aux membres de WikiBabel. J'insiste, mais essayez d'accorder votre licence avec les autres projets libres tant que vous avez peu de contenu. Plus tard ce sera beaucoup plus difficile (regardez OpenStreetMap par exemple).

      Bonne continuation pour votre projet!
    • [^] # Re: autres projets

      Posté par  . Évalué à 1.

      Je pulsoie, très bonne idée tout ces projets libres qui naissent pour nous aider à apprendre les langues.

      J'ai découvert il y'a peu : http://www.babelcoach.net/ qui vise les mêmes buts que Wikibabel et est également sous licences libres. Le site est pas mal foutue, et propose de nombreuses ressources.

      Ce serait peut-être intéressant, là aussi de faire des échanges interprojets.
  • # Axe de développement

    Posté par  . Évalué à 7.

    La prise en compte de la balise audio en remplacement du greffon Flash n'est pas prévue? C'est dommage pour un projet libre de s'appuyer sur un blob binaire ;+)

    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

    • [^] # Re: Axe de développement

      Posté par  . Évalué à 4.

      Aïe. J'ai rien dit. WikiBabel utilise le protocole RTMP.

      La phrase "un greffon permettant la lecture du Flash" de la description laisse penser qu'il existe autre chose que Adobe Flash Plugin © pour lire le RTMP.. Concrètement, y'a quoi qui fonctionne?

      THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

    • [^] # Re: Axe de développement

      Posté par  (site web personnel) . Évalué à 2.

      Chez moi, flash ne lit absolument aucun son de ce site. Par contre, mon navigateur lit le "listen to the podcast online" sur la page download, mais pas le reste. Donc ça doit faire du <audio>
      • [^] # Re: Axe de développement

        Posté par  (site web personnel) . Évalué à 6.

        Un petit peu d'explications techniques: la dépêche a été éditée par le modérateur, et il y'a peut être eu un peu de perte en ligne.

        En tous cas:
        - on utilise RTMP (et flash) pour la partie enregistrement du son seulement. Une fois enregistré (au format flv), le son est converti sur le serveur en Ogg/vorbis (et on jette le flv). RTMP et flash ne sont pas parfait d'un point de vue Libre, mais ont l'avantage d'être très largement supportés (et le code pour enregistrer le micro du client vers le serveur tient en 50 lignes à tout casser). On pourrait envisager un remplacement par un enregistreur java ou autre. Suggestions et coups de mains bienvenus :) (pour donner une idée sur les 1000 et quelques visiteurs d'aujourd'hui, 98% supportent flash, et 77% java)
        - la lecture en ligne se fait par l'extension OggHandler qui est développée par mediawiki et utilisée sur wikipedia. Donc c'est propre de ce côté là. Cette extension injecte dans la page une balise audio ou un lecteur java ou autre suivant le navigateur du visiteur.
  • # Quelques remarques

    Posté par  . Évalué à 5.

    Tout d'abord félicitation pour une telle initiative, en espérant qu'elle prospère et devienne une référence ;-)

    Le lien pour créé une leçon n'est pas évident, il faut passer par 2 pages avant de trouver le lien. Un gros bouton en page d'accueil serais le bienvenue, pour attirer plus de contributeur.

    La section d'aide manque cruellement de capture d'écran, surtout pour la création d'une leçon. Même mieux faire une petite vidéo serais un vrai plus.

    En tous cas bonne continuation dans ton aventure
    • [^] # Re: Quelques remarques

      Posté par  (site web personnel) . Évalué à 2.

      Bonne remarque sur le lien pour créer une leçon, je vais améliorer ça.

      Même commentaire sur l'aide. Je sais ce que je vais faire ce soir! Des idées sur un bon logiciel pour faire une vidéeo (capture d'écran) et la sous-titrer sous ubuntu?
      • [^] # Re: Quelques remarques

        Posté par  . Évalué à 4.

        L'enregistrement : gtk-recordmydesktop
        La création de sous-titres : gnome-subtitles
        Et l'insertion des sous-titres dans la vidéo : mencoder -oac copy -ovc raw -sub mavideo.srt -sub-bg-alpha 150 -utf8 -o mavideo.ogv mavideo-sous-titrée.ogv

        (je n'est pas testé la dernière commande)

        Voilà, je suis sûr qu'il y a beaucoup plus simple (utiliser OS X ? (troll))

        « En fait, le monde du libre, c’est souvent un peu comme le parti socialiste en France » Troll

      • [^] # Re: Quelques remarques

        Posté par  . Évalué à 2.

        Pour les sous-titres, il y avait aussi un projet pour permettre de le faire en ligne basé sur la balise < video >. Seulement je ne retrouve plus le lien.

        « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

  • # Intro partie française...

    Posté par  (site web personnel) . Évalué à 6.

    Excellente initiative!

    Cela dit, sur la partie français, je ne suis pas sûr que ce genre de remarque sur la page d'accueil soit très constructive, ni très vraie :
    Finally, French is the language of exceptions. There is virtually no grammatical rule that does not have its exception(s).

    Pas très constructif, parceque pédagogiquement, on ne commence jamais par apprendre quelquechose par "alors, ça , ça ne va pas, ça non plus, ça non plus".
    Pas très vrai parceque tous les langages non construits ont des exceptions.
    Ou alors il faudrait signaler que c'est bien pire en anglais (grammaire ET phonétique=ce qui sert à parler) : cela donnerait une référence et éviterait d'effrayer inutilement le débutant ( vu le nombre de locuteurs "anglais second langage").

    Côtoyant pas mal d'étrangers en milieu francophone, je suis toujours surpris du nombre de personnes "traumatisées" par l'imparfait du subjonctif ou l'accord du participe passé avec le COD lorsqu'il est placé avant le verbe. Est ce que les enseignants en FLE (français langue étrangère) ont un gros module la dessus dans leurs études :)

    Je leur dit toujours, retenez juste "sujet verbe complément" avec la conjugaison du présent passé futur et vous avez 90% des cas.
    • [^] # Re: Intro partie française...

      Posté par  . Évalué à 4.

      Tout à fait d'accord !
      Même remarque pour la partie "chaque verbe peut prendre 50 formes différentes".
      Un non-francophone voulant apprendre le français va partir en courant en lisant cette phrase.
      Un petit "mais rassurez vous, connaître une petite dizaine de formes est largement suffisant pour communiquer", en gros les 6 personnes du présent de l'indicatif, le participe passé pour parler au passé (passé composé) et la composition "je vais ..." pour donner une idée de futur et c'est bon.

      L'important c'est de communiquer et après se perfectionner.

      Dans tous les cas, félicitations pour cette initiative. Entre tatoeba, shtooka et ce nouveau site, on commence à avoir de très bonnes ressources libres pour apprendre une nouvelle langue et ça semble vraiment aller dans le bon sens.
      • [^] # Re: Intro partie française...

        Posté par  (site web personnel) . Évalué à 1.

        Effectivement, très bon commentaires, j'ai dû me lever du pied gauche le jour où j'ai écrit ça.

        Je vais réécrire ça de façon plus constructive de ce pas. Cela dit, la nature même du wiki autorise qui que ce soit à modifier le contenu quand on y trouve des erreurs ;)

        Merci pour vos encouragements!
  • # Merci !

    Posté par  . Évalué à 1.

    Tout d'abord merci pour cette superbe idée. J'ai du faire face à cette même frustration il y a quelques années et je dois avouer que ne pas avoir pensé à un wiki me frustre tout autant !

    Mais je compte bien participer à l'aventure à mon niveau ;-)

    Par contre... je n'arrive à lire aucun son dans les leçons. Sauf si je podcaste ou si je lis le podcast en ligne.

    Une idée ?
    • [^] # Re: Merci !

      Posté par  (site web personnel) . Évalué à 1.

      Merci pour tous ces commentaires positifs, c'est vraiment encourageant.

      Pour ce qui est du problème de la lecture des sons, ça pourrait bien être un vilain bug qui se cache là.
      Peux-tu m'envoyer des détails par message privé?
      Merci,
      Laurent

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.