Journal Universal Subtitles

Posté par .
Tags : aucun
16
9
oct.
2010
Je viens de tester le site universalsubtitles.org, qui se veut le "Wikipédia des sous-titres".

Le but est simple : faciliter le sous-titrage dans n'importe-quelle langue de n'importe-quelle vidéo se trouvant sur le web.

Voyant les problèmes que nous avons à Framalang pour être efficace en sous-titrage vidéo, chacun faisant une étape dans son coin, sauf la traduction qui se fait via wiki, pas adapté à ça, j'ai donc fait un petit test sur une simple vidéo, en français, pour voir les possibilité de travail collaboratif, de traduction et bien sûr, de sous-titrage lui-même.

La première étape consiste bien sûr à "importer" une vidéo. En fait on travaille directement sur une vidéo déjà en ligne. Donc pas d'upload sur le site, pas de transcodage, rien. Il suffit simplement de donner l'adresse de la vidéo souhaitée. Pour le moment, les format supportés sont Ogg, WebM, FLV, Youtube et Blip.TV (Dailymotion et Vimeo sont en cours).

Cette vidéo apparaît ensuite dans leur "Widget" de traduction. Une page je suppose remplie de HTML5 et javascript, qui offre une interface relativement conviviale, claire et avec des raccourcis clavier. C'est succinct, mais suffisant pour faire ce qu'on lui demande. C'est donc ici que se déroule la première des trois étapes qui mènent au sous-titrage original de la vidéo : taper les sous-titres correspondant à la vidéo. Pour ceux qui ont 42 doigts, pas de soucis, vous laissez filer la vidéo et vous entrez le texte en temps réel... pour les autres, on peut toujours faire des pauses et naviguer avant/arrière tout simplement.

La seconde étape est la synchronisation du texte que vous avez tapé précédemment. Là, la vidéo défile et on doit appuyer sur une touche à chaque fois que l'on veut que le sous-titrage passe à la ligne suivante. Ici, faut être concentré ! Ok, on peut mettre en pause, revenir en arrière, mais le mieux est de faire défiler et synchroniser au fur et à mesure. Faisable, mais pas évident à tenir sur la distance.

La troisième étape est le peaufinage on va dire, où on peut ajuster les sous-titres plus précisément. Si on s'est un peu endormi à l'étape précédente, c'est ici qu'on se réveille.

Au final on nous donne un lien permanent vers la vidéo et ses sous-titres, ainsi qu'un bout de code pour l'intégration dans une page web. La vidéo est toujours la même au même endroit et seuls les sous-titres, qu'on peut se télécharger en .srt, sont sur le site d'universalsubtitles.org .

À partir de cette page, on peut rajouter des sous-titres, donc dans d'autres langues. Ça veut dire qu'une fois la transcription faite et synchronisée, en anglais ou autre, la traduction en français est vraiment simplifiée : on a juste à la rentrer dans les cases en dessous chaque ligne de sous-titres de la langue originale. On peut bien sûr la stopper puis la reprendre plus tard. On voit également sur cette page les langues disponible liées à la vidéo et l'avancement des traductions.

Bref, c'est vraiment du sous-titrage collaboratif. Les outils sont minimalistes mais font ce qu'on leur demande. On peut tout ré-éditer, sauvegarder. Et on peut même uploader un fichier .srt, pour ceux qui ont plus souvent l'occasion de traduire hors ligne plutôt que connectés à internet.

Comme je l'ai déjà dit, les outils sont, pour le moment en tout cas, assez minimalistes. Par exemple on ne peut pas régler les sous-titres : la police, la couleur, l'emplacement... limitation du HTML5 ou pas encore implanté dans ce programme ? On verra. Mais ça risque de poser parfois des gros problèmes de visibilité de sous-titres. Il m'est arrivé à plusieurs reprises, sur les vidéos qu'on a placées sur Framatube, de devoir rajouter une bande noire en-bas, ou les placer en haut, pour pouvoir lire convenablement les sous-titres.

un autre bémol, c'est qu'il faut s'enregistrer : il faut soit un compte Twitter, un compte OpenID ou un compte Google... En fait ça ne crée pas de compte à proprement parler, mais se sert de l'existant, ce qui est vraiment un moindre mal.

En tout cas c'est un bel outil qui va nous rendre bien des services pour nos sous-titrages.


Universal Subtitles : http://universalsubtitles.org/

Test fait avec une vidéo de Fred Couchet, de l'April, vidéo hébergée sur Blip.tv :
http://universalsubtitles.org/videos/sMfosMDpVH7f
  • # PI

    Posté par (page perso) . Évalué à -10.

    Je voudrais pas faire le grognon, mais il me semble que faire du sous-titrage sauvage est tout aussi irrespectueux du droit d'auteur que de regarder un flim sans en avoir le droit.

    Pourquoi tout le monde s'acharne à faire survivre le molosse qui nous mort la main ? Laissez-les dans leur coin faire leurs petites affaires les majors du disque et du film.
    • [^] # Re: PI

      Posté par . Évalué à 10.

      Mais heureusement il existe énormément de vidéos sous licences très ouvertes qui nous permettent de faire du sous-titrage en respectant les droits d'auteur.

      Ici il s'agit d'un outil. On en fait bon usage ou pas. C'est comme tous ceux à qui on parle de P2P et qui aussitôt pense "piratage"...
      • [^] # Re: PI

        Posté par (page perso) . Évalué à 1.

        oui par exemple,
        - la video avec Al pacino
        - le clip david bowie et pat metheny
        - le clip de la Bionda
        - la video de johnny Cash au 1 rue sésame

        ....

        ouais, tout plein de vidéos aux licences très ouvertes
        • [^] # Re: PI

          Posté par (page perso) . Évalué à 2.

          Tu n'as pas cité d'exemple français. Est-ce parce qu'ils sont nettement plus rares parmis les "connus" ?
          Rares ou inexistants d'ailleurs.
          • [^] # Re: PI

            Posté par (page perso) . Évalué à 3.

            Parce que je n'ai pris que la première page et ce dont je suis _presque_ certains que cela pose un problème de droit.

            Mais honnêtement je m'en moque, ils font ce qu'ils veulent, mais le jour ou un maison de cinéma leur tombera sur le dos (on ne trouve pratiquement plus de site de paroles de chanson), je ne pleurerais pas sur leur sort.

            Parce que oui c'est un outil sympa qui peut servir pour plein de vidéos et ce de manière légale (conf RMLL par exemple) , mais lorsque l'on va sur le site, il y en a ou ce n'est pas le cas et c'était le sens de ma remarque.
    • [^] # Re: PI

      Posté par . Évalué à 9.

      PI ~= 3.14
    • [^] # Re: PI

      Posté par (page perso) . Évalué à 3.

      regarder un flim sans en avoir le droit.
      Heu... ils sont rares ces films là.

      Concernant la propriété intellectuelle, il est vrai que modifier une "oeuvre" (je mets des guillemets vu que la plupart du temps c'est pour moi une plante potagère: http://fr.wikipedia.org/wiki/Navet ) n'est pas souvent autorisé. Mais qu'en est-il de la "modification externe" ?

      Par exemple une vidéo présente sur un site, et sur un autre site les sous-titres avec les informations de synchronisation. L'oeuvre n'est en rien modifiée. Mais l'affichage peu l'être (sur demande expresse de celui qui regarde).

      On peut pousser plus loin en modifiant la manière dont la vidéo est affichée (ou l'image, ou le son, etc) sans que les données originales ne soient altérées. Par exemple on modifie la bande son de tout le film en faisant en sorte que la vidéo originale soit jouée, et que la sortie sonore soit remplacée par autre chose.
      La encore, c'est celui qui visionne qui fait ce choix, alors quid de la propriété intellectuelle.

      Personnellement, j'estime que celui qui matte est grand. Il peut bricoler l'oeuvre autant que ça lui chante. D'autres ne sont pas du même avis.
      • [^] # Re: PI

        Posté par (page perso) . Évalué à 2.

        Moi ce que j'en dis...

        Les société de production considèrent que faire des sous-titre viole leur propriété intellectuelle. Maintenant il y a plein de film ou on a expressément le droit de le faire, mais je voulais souligner que ce n'est pas le cas général.

        Maintenant les gens sont grands, ils font comme ils veulent, et j'espère que cette pratique n'est faite que pour des films ou c'est expressément autorisé : par exemple ce n'est pas le cas pour les "fan sub"
        • [^] # Re: PI

          Posté par (page perso) . Évalué à 2.

          "Les société de production considèrent que faire des sous-titre viole leur propriété intellectuelle. "

          Oui mais bon, ils sont chiant aussi. Ils arrivent même a sortir en DVD un film sans mettre de sous titre... (j'ai eut le coup hier pour un film qui a fait 60 millions $)
        • [^] # Re: PI

          Posté par (page perso) . Évalué à 2.

          Les société de production considèrent [etc]
          Nous sommes bien d'accord :-)
          Ils pensent ce qui les arrangent, mais ça n'a aucune valeur. Je dirais même qu'à l'heure actuelle c'est même plutôt une "preuve" que c'est idiot puisque chaque "pensée" qu'ils ont est idiote (terme poli pour désigner la sodomie de leur clientèle).
          Qu'en pensent les lois et les juges ? Je n'en ai aucune idée car je n'y connais rien.
          • [^] # Re: PI

            Posté par . Évalué à 3.

            À priori c’est une traduction. Quoiqu’il en soit il me semble que ça entre bien dans le cadre de cet article de la PI :

            « Article L112-3

            Les auteurs de traductions, d'adaptations, transformations ou arrangements des oeuvres de l'esprit jouissent de la protection instituée par le présent code sans préjudice des droits de l'auteur de l'oeuvre originale. »

            L’emphase vient de moi, c’est ce qui me fait dire qu’il faut une autorisation pour diffuser les sous-titres. Si quelqu’un peut confirmer ?
          • [^] # Re: PI

            Posté par (page perso) . Évalué à 2.

            Cela n'est pas encore passé devant un juge peut être, mais cela ne me choquerait pas plus que demander à retirer des vidéos youtube.
  • # Gros râleur - mais j'ai raison, non?

    Posté par . Évalué à -5.

    Par exemple on ne peut pas régler les sous-titres : la police, la couleur, l'emplacement... limitation du HTML5 ou pas encore implanté dans ce programme ?
    Encore heureux!

    Les sous-titres c'est:
    - soit dans un fichier à part,
    - soit fournidans le fichier, à côté de la vidéo si le conteneur les supporte (DVD, mkv).

    Mais pas incrusté dans la vidéo, bon sang! En plus ça fait deux encodages! Et la compression pourrit les caractères!

    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

    • [^] # Re: Gros râleur - mais j'ai raison, non?

      Posté par . Évalué à 6.

      où t'as vu que ça parle des les mettre dans la vidéo ?
    • [^] # Re: Gros râleur - mais j'ai raison, non?

      Posté par (page perso) . Évalué à 2.

      Et?
      Pour info, il y a des formats dédiés aux sous-titres, qui permettent de changer la police, la couleur, l'emplacement... Sans pour autant les incruster.
      Par exemple :
      - Le format DVD pour des images directement (dur à éditer dans ce format directement par contre)
      - "timed text format" (ISO je sais plus combien) pour du texte pas mal supporté mais sous brevets
      - ASS pour du texte moins bien supporté (quoique pas neuf, donc déjà pas mal d'outils) et libre http://www.matroska.org/technical/specs/subtitles/ssa.html

      Le tout non incrusté dans la vidéo. Donc c'est quoi ton problème avec les polices/couleur/emplacement dans les sous-titres? Le même que ceux qui refusent HTML et préfèrent un .txt?
      • [^] # Re: Gros râleur - mais j'ai raison, non?

        Posté par . Évalué à -1.

        ou le même que ceux qui préfèrent de l'ascii pur à de l'utf-8 qui marche pas ? \o/
      • [^] # Re: Gros râleur - mais j'ai raison, non?

        Posté par . Évalué à 4.

        > [...] c'est quoi ton problème avec les polices/couleur/emplacement dans les sous-titres? Le même que ceux qui refusent HTML et préfèrent un .txt?

        Deux problématique totalement différentes qu'on compare pour laisser croire qu'elles sont globalement identiques. Il me semble que pas mal de personnes seraient contre les mails qu'on enverrait sous forme d'images (jpeg de préférence, avec une qualité < 80), rendant impossible toute manipulation sur le texte. Il semble ici que Grunt est tout complétement à côté de la plaque en ce qui concerne ce type de sous-titrage.

        Enfin, bref, c'est ce genre de phrases qui me rappelle tellement nos hommes politiques actuels. Alimenterais-tu secrètement l'envie de commencer une nouvelle carrière ?

        The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein

        • [^] # Re: Gros râleur - mais j'ai raison, non?

          Posté par (page perso) . Évalué à 2.

          qu'on compare pour laisser croire qu'elles sont globalement identiques

          C'est identique : en analogie, l'auteur du journal dit que c'est dommage de ne pouvoir faire que du texte, et pas de HTML, et Grunt râle que les images inline dans les mails c'est mal.

          Bon, OK, j'ai été un peu méchant, peut-être que Grunt ne connait tout simplement pas la technologie "HTML" pour les sous-titres, et qu'il pensait directement aux images. Mais encore, bof, les sous-titres images, ça existe (.sup, le format des DVD), sans pour autant qu'on doive incruster/compresser (les sous-titres DVD sont des images encodées sans perte, aucun problème de compression), c'est peut-être effectivement un commentaire qui était complètement HS (flux séparé contre incrustation, qui n'a rien à voir avec le fait de mettre des couleurs ou emplacement), mais dans ce cas, avant de dire"encore heureux", il ferait mieux de connaitre le sujet : est-ce que ça viendrait à l'idée de parler d'image c'est mal, d’incrustation, de compression pourrie, quand on dit que le problème avec le texte brut dans les mails est de ne pas pouvoir changer de police de caractère ou d'emplacement?
          • [^] # Re: Gros râleur - mais j'ai raison, non?

            Posté par (page perso) . Évalué à 1.

            "les sous-titres DVD sont des images encodées sans perte, aucun problème de compression"

            Alors quelqu'un peut-il m'expliquer pourquoi 80% des sous-titres de mes DVD sont faits avec une police moche qui n'a pas l'air de connaître l'anti aliasing ?
            Au moins avec un fichier texte, je peux utiliser la police que je veux ! (avec mplayer mais j'imagine que tout bon lecteur peut le faire)

            It's a fez. I wear a fez now. Fezes are cool !

            • [^] # Re: Gros râleur - mais j'ai raison, non?

              Posté par (page perso) . Évalué à 4.

              Alors quelqu'un peut-il m'expliquer pourquoi 80% des sous-titres de mes DVD sont faits avec une police moche qui n'a pas l'air de connaître l'anti aliasing ?

              Parce que ceux qui créent les DVD sont des mauvais.
              Ca n'a absolument rien à voir avec le "Et la compression pourrit les caractères!" de Grunt : c'est possible de faire propre, les sous-titres ne sont pas compressés.

              Au moins avec un fichier texte, je peux utiliser la police que je veux !

              C'est un choix technologique avec des avantages (sûr que c'est partout la même chose) et des inconvénients (la piètre qualité de la transformation texte --> image lors de la création). Qui est le mien aussi (personnellement, ce qui me fait le plus bondir dans les sous-titre faits par les "pros" et de ne pas détourer en noir, des fois les sous-titres sur du blanc sont illisible, même au ciné! la honte), je dis juste que ce n'est pas le problème soulevé par Grunt.
  • # Hourra pour Mozilla

    Posté par (page perso) . Évalué à 7.

    Merci pour le journal très intéressant :-)

    Faudrait juste préciser que l'initiative est issue du projet Mozilla Drumbeat qui est lui-même une initiative de Mozilla dans le cadre de leur mission pour garder/améliorer le Web ouvert

    Mozilla Drumbeat : http://www.drumbeat.org/
  • # JavaScript bof bof

    Posté par (page perso) . Évalué à -5.

    Concernant la brique de code à ajouter à son site, je me demande dans quelle mesure le JavaScript est obligatoire... C'est un peu dommage qu'il faille en passer par du JavaScript et que HTML5 permette pas de gérer ça ?
    • [^] # Re: JavaScript bof bof

      Posté par (page perso) . Évalué à 7.

      HTML5 reste du HTML, un language de description. Pour scripter le comportement des objets décrits par le HTML, on a inventé, tadam.... le Javascript.

      Oui c'est fou, Javascript est un truc utile qui sert à faire de choses.
      • [^] # Re: JavaScript bof bof

        Posté par (page perso) . Évalué à 1.

        Je ne suis pas expert mais ce qu'on a pu mettre dans HTML5 et coté navigateur (une interface lecture pour la balise vidéo) et CSS3 (animations, transitions), j'avais l'impression qu'on aurait pu mettre à jour ces langages pour intégrer le choix des sous-titres sans en passer par du JavaScript : irréaliste ?
  • # Communistes !

    Posté par (page perso) . Évalué à 3.

    Ça prouve que le PCF n'est pas mort, et sait encore se lancer dans de beau projets.

    Adhérer à l'April, ça vous tente ?

    • [^] # Re: Communistes !

      Posté par . Évalué à 2.

      Tu veux nous faire croire que l'April est un repaire de dangereux communistes à la solde de Pyongyang ?
      • [^] # Re: Communistes !

        Posté par (page perso) . Évalué à 3.

        Non, je faisais référence à ça :

        $ wget -nv -O - http://universalsubtitles.org/ | grep -B1 PCF
        Universal Subtitles is a project of <a href="http://participatoryculture.org/">PCF</a>.

        Adhérer à l'April, ça vous tente ?

        • [^] # Re: Communistes !

          Posté par . Évalué à 2.

          Oups, je suis pas sorti de l'hexagone pour comprendre, non plus que j'ai été cherché plus loin que le bout de mon nez. Ça ne m'a pas amené très loin...
  • # synchro

    Posté par . Évalué à 5.

    L'étape de synchro a la main me parait un peu limite.

    Dans les logiciels de sous titre que j'avais vu, il y avait moyen d'avoir la courbe audio pour les synchroniser précisément et pas le faire à l'oreille.
    • [^] # Re: synchro

      Posté par (page perso) . Évalué à 1.

      +1, it's a real pain in the ass de synchroniser sans avoir accès à la courbe audio qui est un indicateur précieux.

      « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

  • # Encore un format

    Posté par (page perso) . Évalué à -10.

    Et voilà… encore un format qui veut nous pousser à compiler nos lecteurs vidéos avec webkit. Il faut vraiment que ça s’arrête. Sérieusement, le ASS/SSA permet vraiment de faire des rendus complètement dingues, les développeurs de la libass s'arrachent déjà les cheveux pour assurer un excellent rendu, si bien que plein de lecteurs utilisent des hack vers cette lib pour le rendu de tous les sous titres. On se retrouve avec des tags ASS/SSA interprétés dans tous les formats, avec toutes les problèmes que cela engendre.

    Et voilà qu'après le brillant succès du format SAMI (une des pires invention en matière de sous titres), on cherche une fois de plus à mettre un XML foireux pour les sous titres.

    Sérieusement, arrêtez ça, on a déjà des dizaines de format de sous titres, dont certains se parsent très simplement ; pourquoi chercher à forcer les lecteurs vidéos (qui s'arrachent les cheveux pour être sur-optimisé) à intégrer des bibliothèque usines à gaz afin de juste parser des pauvres lignes de sous titres ?

    Il faut arrêter avec le XML maintenant, vraiment.

    Je le répète, le ASS/SSA convient PARFAITEMENT.

    (Et je ne parle même pas des problématiques de muxing de cette horreur dans les vidéos).

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.