Base audio libre de mots français

Posté par  . Modéré par Mouns.
1
16
juil.
2006
Son
La "Base Audio Libre De Mots Français" est une base de données d'enregistrements sonores tirés d'une liste d'environ 7000 mots ou expressions en langue française. Le contenu de cette base de données est distribué librement sous licence "Creative Commons By-ShareAlike 2.0".

Ces fichiers sonores sont essentiellement destinés aux personnes étudiant le français comme langue étrangère ainsi qu'à la production de matériel pédagogique. La liste des mots est tirée du dictionnaire bilingue franco-anglais libre distribué par freedict.org (Il a été ajouté un ou plusieurs articles aux substantifs).

L'ensemble des enregistrements sonores, accompagné d'une index XML et d'un index alphabétique HTML peut être téléchargé depuis le site. Les fichiers audio peuvent également être téléchargés individuellement aux formats ogg et mp3.

Aller plus loin

  • # communaux creatif -parternite - partage à l'identique 2.0

    Posté par  . Évalué à 2.

    en francais ou
    "Creative Commons by-ShareAlike 2.0".
    le melange des deux fait quand meme assez bizarre non?
    si l'on francise les mots autant le faire en totalite et correctement.
  • # Impressionnant

    Posté par  (site web personnel) . Évalué à 8.

    Quel beau travail ! Sur les mots que j'ai téléchargé c'est toujours la même voix, je sais pas si c'est le cas pour tout les noms ?

    Je trouve dommage que les fichiers téléchargés, à la volée sur le site ne contiennent pas le nom du mot en question, et éventuellement un tag ID3 pour une indexation plus simple ? Bon j'en demande peut-être un peu trop.
    • [^] # Re: Impressionnant

      Posté par  . Évalué à 10.

      - Oui il n'y a qu'une seule voix, la mienne :)

      - J'utilise le crc32 pour "coder" le nom des fichiers afin ne pas avoir de problèmes avec les caractères spéciaux ("e dans l'o" & co, surtout sur les windows non français)

      Par contre, il est possible de se procurer un XML qui permet de faire le liens entre les noms de fichiers et les chaines prononcées.

      - Je n'avais pas pensé au tag ID3, c'est une très bonne idée, je vais essayer de mettre ça en place rapidement.

      Merci bcp pour ton commentaire :)
      • [^] # Re: Impressionnant

        Posté par  (site web personnel) . Évalué à 1.

        et, pendant que tu taggues... tu mettrais pas ça en OGG ?

        Parce que si on doit payer la license mp3... c moins drole.

        TRES gros boulot !! bravo.
        • [^] # Re: Impressionnant

          Posté par  . Évalué à 8.

          "tu mettrais pas ça en OGG ?":
          Les fichiers audio peuvent également être téléchargés individuellement aux formats ogg et mp3.
      • [^] # Re: Impressionnant

        Posté par  . Évalué à 2.

        2 petites questions :

        - comment as-tu eu cette idée ?

        - as-tu pensé à mettre en place une base données plus grande regroupant différentes langues ? Par exemple on peut trouver ici http://www.murrayc.com/blog/permalink/2006/04/09/romanian-au(...) des enregistrements de mots roumains.
        • [^] # Re: Impressionnant

          Posté par  . Évalué à 2.

          J'ai commencé à enregistrer des mots français ainsi que me faire enregistrer des mots russes par des amis, afin d'apprendre plus facilement mon vocabulaire.

          L'idée d'enregistrer cette base d'enregistrements sonores est donc venue naturellement.

          Bien sûr que l'idée d'une base de données plus importante m'interesse (personnellement une base de mots anglais ou russes, me serait beaucoup plus utile)...

          Mon travail va maintenant se concentrer sur la programme d'enregistrement audio lui même, afin de le rendre plus souple et plus portable. (Cet outil permet l'enregistrement d'environ 500 mots par séance de 20 minutes.)
  • # Une version française de festival?

    Posté par  . Évalué à 5.

    Est-ce que ça va permettre d'avoir une version française d'un logiciel de synthese vocal comme festival ou flite? Parce que c'est très frustrant de ne pas en avoir :/
    • [^] # Re: Une version française de festival?

      Posté par  . Évalué à 2.

      Non, ce qu'il faut pour festival ou des trucs comme ça c'est pas des enregisstrements de mots, c'est plus des phonèmes je pense (je ne sais pas bien comment ça fonction, mais ça doit décomposer les mots et appliquer des règles de ce genre je pense).

      De plus, le type de license choisi ici ne conviendrait pas vraimet pour ce besoin.
      • [^] # Re: Une version française de festival?

        Posté par  . Évalué à 4.

        Plus précisément, il faut des diphones. En (très) gros, pour deux sons élémentaires A et B donnés d'une langue, un diphone va représenter le son résultant de l'enchaînement AB. La façon normale de constituer une base de diphones pour alimenter un logiciel de synthèse vocale est d'extraire des diphones d'une base de mots enregistrés en studio. La licence choisie permet de créer des sons dérivés de ceux fournis et de les redistribuer avec la même licence, ce qui a l'air suffisant, à moins que les auteurs du logiciel n'aient d'autres exigences.
  • # Prononciations dans Wiktionary

    Posté par  . Évalué à 4.

    Très gros boulot surement bien fastidieux ! Chapeau !

    As-tu connaissance du projet des prononciations des mots du projet Wikctionary (http://fr.wiktionary.org/wiki/Wiktionnaire:Demande_de_pronon(...) qui est affilié Wikimedia comme Wikipedia ?

    A priori il faut que les sons soient publiés sous licence libre (CC-by-sa 2.0 en faisant partie), or ta base est publiée sous cette licence. Penses-tu pouvoir collaborer avec ce projet ?

    http://commons.wikimedia.org/wiki/French_pronunciation
    http://commons.wikimedia.org/wiki/Commons:Pronunciation_file(...)

    Ca demande un certain reformatage des noms de fichier, mais ce n'est pas le plus compliqué.

    Tibox
  • # Super mais...

    Posté par  . Évalué à 2.

    Les mots sont enregistrés avec l'article : anticorps -> un anticorps.

    Moi qui croyait que j'allais pouvoir me refaire la SNCF à la maison, ça va être plus difficile que prévu ! ;-)

    Bravo quand même !
    • [^] # Re: Super mais...

      Posté par  . Évalué à 2.

      Je n'ai pas très bien compris le rapport avec la SNCF :)
      Mais je crois avoir deviné qu'il serait judicieux d'ajouter un enregistrement avec un atricle pluriel ("les anticorps")... c'est vrai.

      Je vous invite à signaler les "erreurs" que vous remarquez directement sur le site.
      • [^] # Re: Super mais...

        Posté par  . Évalué à 4.

        Le rapport avec la SNCF est que la dame qui te parle le plus souvent dans toutes les gares de France est une voix enregistrée.
        En gros, d'après ce que j'ai compris, la dame en question a enregistré plusieurs mots et toutes les gares, et qu'ensuite les messages ne sont que des montages.

        Donc on aurait pu imaginer pouvoir refaire la même chose (construction de phrase) en utilisant cette base de mot enregistrés.
        • [^] # Re: Super mais...

          Posté par  (site web personnel) . Évalué à 3.

          Chaque nom de gare est au moins enregistré deux fois (comme dans la ligne 3 du métro, pour ceux qui connaissent) et à part les chiffres il n'y a pas vraiment de mots enregistrés isolément, mais plutôt des morceaux de phrases.

          Faire la même chose à partir de mots seulement, que ce soit pour la SNCF ou pour de la synthèse vocale, serait insupportable à écouter.
      • [^] # Re: Super mais...

        Posté par  (site web personnel) . Évalué à 1.

        Mais je crois avoir deviné qu'il serait judicieux d'ajouter un enregistrement avec un atricle pluriel ("les anticorps")... c'est vrai.


        Je dirais même plus : il serait judicieux d'ajouter un enregistrement sans article ('anticorps', tout simplement, quoi) pour 'un groupe d'anticorps' ou 'quatre anticorps', par exemple.

        Tiens, au passage, une question : comment se font les liaisons (à la SNCF, par exemple) ? Autrement dit, comment, à partir des morphèmes 'deux-cents' et 'anticorps', obtient-on 'deussanzanticor' ?
        • [^] # Re: Super mais...

          Posté par  . Évalué à 1.

          Ca c'est un problème, tu as aussi le problème de l'intonnation qui ne semble pas si important mais qui l'est en fait vraiment.
          • [^] # Re: Super mais...

            Posté par  . Évalué à 2.

            En même tps, cette base, n'est _vraiment_ pas faite pour...
  • # Quelques imperfections.

    Posté par  (site web personnel) . Évalué à 10.

    Super Pédant Man se permet de faire remarquer qu'on dit « une anagramme » et « un edelweiss », qu'il manque un « h » à « thaïlandais », et surtout qu'un « s » entre deux voyelles se prononce habituellement comme « z » et qu'il ne voit pas pourquoi « abasourdir » dérogerait à la règle. Par ailleurs il faudrait peut-être réenregistrer certains sons comme « confier une tâche » et « tache » parce qu'ils ne font absolument pas la distinction entre « a » ouvert et « a » fermé (d'ailleurs pour cette exemple précis on a même l'impression qu'ils sont inversés).
    • [^] # Re: Quelques imperfections.

      Posté par  (site web personnel) . Évalué à 2.

      Super Pédant Man présente ses excuses pour la faute d'accord due à une modification vite faite mal faite.
    • [^] # Re: Quelques imperfections.

      Posté par  (site web personnel) . Évalué à 2.

      La prononciation de «abasourdir», au delà de la règle que tu mentionnes (qui connait des exceptions comme je crois toutes les règles de la langue française) est en effet /a.ba.zuʁ.diʁ/ (d'après wiktionary et mes dictionnaires robert et hachette).
      Cependant parmis mes connaissances, personne ne prononce ce mot «abazourdir». Faut-il que les mots de cette bases de données soient prononcés comme on a l'habitude de les entendre, ou cela doit-il être académique, ou les deux ?
      • [^] # Re: Quelques imperfections.

        Posté par  . Évalué à -5.

        ben j'imagine que si ces dicos le prononcent abazourdir, c'est qu'ils sont erronés e qu'il faut leur envoyer une demande de correction.
        Enfin, il existe peut être un accent quelque part en France avec des gens qui prononcent ça comme ça. Pour tous les mots français, je suis sûr qu'il existent 8 ou 9 prononciations *toutes valides*
        • [^] # Re: Quelques imperfections.

          Posté par  (site web personnel) . Évalué à 1.

          Non mais, euh, il y a quoi d'erroné dans les dicos ? C'est un peu hallucinant comme suggestion. Qu'y a-t-il dans « abasourdir » qui soit si difficile à prononcer ? Même au CP on est capable de lire ce mot convenablement.

          La méthode globale aura décidément fait bien des dégâts.
          • [^] # Re: Quelques imperfections.

            Posté par  . Évalué à 2.

            Ou évolution de la langue ... Depuis quand la prononciation est figée dans le temps ?

            Quand un phénomène est aussi massif : je ne me souviens pas avoir entendu prononcer abasourdir avec un 'z', ou très rarement maintenant que j'y réfléchi, et y compris avec des gens de générations précédent la mienne, qui n'ont pas connues la méthode globale, innocente donc en l'occurence, il est peut être temps de considérer que ce n'est plus une faute mais une évolution de la langue.

            Après c'est sûr pour trouver la bonne orthographe ça aide pas, mais des exceptions on en a déja tellement que ...
            • [^] # Re: Quelques imperfections.

              Posté par  (site web personnel) . Évalué à 2.

              Pour abasourdir, je le prononce avec un z.

              Quand au fait des différentes prononciation ça dépend de la région où tu te trouve.

              Par exemple dans la région rhône-alpe ils on tendance a prononcer le ai en é
              Exemple : lait qui devient lét et ainsi de suite...

              Paris est "censé" être la région qui a un accent, prononciation parfait
              (mais je vais rester gentil en disant que c'est carrément pas le cas)

              Dans tous les cas, autant essayer de coller a la norme
              (quitte a se faire ch***r avec toutes les règles et leur plus grand nombre d'exception que de cas applicable...)

              Je pense sincèrement que le français serait bon pour passer a travers une moulinette pour une refonte/simplification complète, mais tant qu'a faire une base pour l'apprentissage du français autant respecter toutes les règles...
            • [^] # Re: Quelques imperfections.

              Posté par  (site web personnel) . Évalué à 2.

              N'exagérons rien : avec les 1000 mots de vocabulaire (et je suis vraiment gentil) qu'on a de nos jours, qui utilise vraiment « abasourdir » ? De nos jours on va dire « étonné », « bluffer », « surprendre », « être sur le cul »...
              • [^] # Re: Quelques imperfections.

                Posté par  . Évalué à 3.

                C'est pas un mot qu'on emploie tout les jours, peut être, mais ça arrive, et la preuve : j'ai encore vu personne qui sache pas ce que ça veut dire. Après, tes "..." montrent qu'on a peut être pas un vocabulaire si pauvre que ça ;)
              • [^] # Re: Quelques imperfections.

                Posté par  . Évalué à 2.

                Je l'ai entendu hier à la radio (France Info je crois), je ne sais plus dans quel contexte, mais il a bien prononcé "abazourdir" avec un son "z". C'est pour cela que je m'en rapelle.

                mes 2 cents
                • [^] # Re: Quelques imperfections.

                  Posté par  . Évalué à 1.

                  Quand j'aurrai un peu de tps, je ferai en sorte qu'il puisse y avoir les deux version sur le site...
      • [^] # Re: Quelques imperfections.

        Posté par  (site web personnel) . Évalué à 6.

        Eh bien ça te fait tout autant de connaissances à qui tu peux apprendre à parler correctement. Illustre-toi dans les dîners mondains en leur signifiant ces erreurs de prononciation comme autant de furoncles à la face de leur diction. C'est exactement comme « carrousel » que tout le monde prononce comme si c'était Cadet Roussel. Super Pédant Man n'a aucune clémence pour ces barbares.
        • [^] # Re: Quelques imperfections.

          Posté par  . Évalué à 3.

          Et pour parasol ?
          • [^] # Re: Quelques imperfections.

            Posté par  (site web personnel) . Évalué à 1.

            [s] intervocalique. Et ?
            • [^] # Re: Quelques imperfections.

              Posté par  . Évalué à 1.

              Ok, merci.

              Je ne connaissais pas la raison pour laquelle on prononçait le 's' ainsi.
            • [^] # Re: Quelques imperfections.

              Posté par  (site web personnel) . Évalué à 2.

              [s] intervocalique. Et ?


              Pourtant, 'aso' dans 'masochisme' se prononce bien 'azo', non ? A mon avis, le 's' de 'parasol' se prononce 's' et non 'z' parce que le 'sol' final vient de 'soleil' (para = contre ; sol = soleil).

              Un(e) phonéticien(ne) dans l'assemblée ?
              • [^] # Re: Quelques imperfections.

                Posté par  (site web personnel) . Évalué à 2.

                Ben oui, je n'ai jamais dit le contraire. Pas besoin d'être phonéticien pour savoir prononcer parasol, si ? Je ne comprends pas exactement à quoi sert ta question ; c'est pour contester la prononciation correcte de « abasourdir » sous prétexte que le « s » de « parasol » se prononce d'une façon particulière ?
                • [^] # Re: Quelques imperfections.

                  Posté par  . Évalué à 2.

                  Ben non, c'est une preuve d'incompréhension, et d'étonnement. D'ailleurs, pour la règle en question, vous avez d'autres exemples du même type ? pour voir si c'est régional, si c'est la rareté du mot, ou si c'est une règle avec un seul exemple. J'ai "biseau", "bisou", "bise" qui se prononcent effectivement "z".
                • [^] # Re: Quelques imperfections.

                  Posté par  (site web personnel) . Évalué à 3.

                  Je ne conteste pas la prononciation [z] dans 'abasourdir' ; il s'agissait en réalité de contester la pertinence de l'argument du 's' intervocalique.

                  Je m'explique : dans ton tout premier message, tu soutiens que le 's' de 'abasourdir' se prononce [z], sous prétexte qu'il se trouve entre deux voyelles ; Jakob Wylleman propose ensuite le contre-exemple 'parasol' où figure un 's' également entre deux voyelles. Tu dis alors qu'il se prononce [s] parce qu'il est intervocalique, c'est-à-dire situé entre deux voyelles.

                  Pour résumer, à deux mêmes causes (un 's' entre deux voyelles), tu imputes deux effets distincts (un 's' prononcé [s] et un 's' prononcé [z]) ; c'est pour cette raison que l'argument du 's' intervocalique ne me paraissait pas pertinent dans le cas de 'parasol'.
                  • [^] # Re: Quelques imperfections.

                    Posté par  (site web personnel) . Évalué à 2.

                    Non, pour résumer je donne l'explication du contre-exemple, et je dis que je ne vois pas pourquoi il s'appliquerait à « abasourdir ». Pour « parasol » ça s'explique par la construction « para » + « sol » (une autre construction possible aurait été « parassol » mais apparemment aucun mot en -sol ne double l's : entresol, tournesol, aérosol... on peut presque parler de règle à ce niveau-là). Pour « abasourdir » on peut difficilement admettre « aba » + « sourdir »... apparemment ça vient du vieil argot « bazir » mais je n'ai pas de truc bien sous la main pour vérifier ll’étymologie.
      • [^] # Re: Quelques imperfections.

        Posté par  . Évalué à 2.

        Il y a les deux versions en ligne
    • [^] # Re: Quelques imperfections.

      Posté par  (site web personnel) . Évalué à 2.

      Effectivement, se pose maintenant la question des différentes nuances entre les régions francophones : beaucoup de mots se prononcent différemment au nord de la France, à Paris, dans Tarn, au Sénégal, au Canada ou en Belgique : il faudrait pouvoir donner accès à une prononciation alternative lorsque ces mots seront intégrés à un dictionnaire.
    • [^] # Re: Quelques imperfections.

      Posté par  . Évalué à 2.

      Par ailleurs il faudrait peut-être réenregistrer certains sons comme « confier une tâche » et « tache » parce qu'ils ne font absolument pas la distinction entre « a » ouvert et « a » fermé (d'ailleurs pour cette exemple précis on a même l'impression qu'ils sont inversés).

      Super chipoteur se dit que "a" ouvert et "a" fermé sonnent exactement de la meme maniere pour lui, pauvre provincial originaire du sud ouest (oui j'ai beaucoup souffert :,( ).

      <ma vie>
      D'ailleurs, il s'agit regulierement d'une source de mesententes:
      - michel (michel) et michèle (michèleuh) ne se prononcent pas pareil pour moi.
      - un verre et un ver ne sont absolument pas des homophones dans ma région. Ca m'a toujours perturbé cette histoire jusqu'à ce que je comprenne que tout le monde ne parlait pas comme chez moi.
      - etc, etc.
      </ma vie>
      • [^] # Re: Quelques imperfections.

        Posté par  . Évalué à 2.

        Enregistre dans la base "pneu" ou "pingoin" et on pourra tout de suite repérer les etrangers :D.

        Dans ma région on serait plutôt fâché avec les accents et pour l'orthographe ca n'aide pas.
        On regarde la tèlè et on fait du vélô
  • # Et les conjugaisons?

    Posté par  . Évalué à 2.

    Ben oui, maintenant, il reste à conjuguer tous les verbes.
    Facile!

    -->[]

    Beau boulot!

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.