Forum général.général Extraction sous-titres avec dvdrip sous mdk 10.1

Posté par  .
Étiquettes : aucune
0
7
avr.
2005
bonjour à tou-te-s !

Je suis plutôt newbie sous linux, et bien que j'ai réussi à installer mes sources urpmi sous mdk 10.1 et que j'arrive à installer des logiciels, il y a encore beaucoup de choses que je ne comprends pas...

Venons en au fait. J'ai donc installé dvdrip via rpmdrake, ok, tout est installé, et après l'avoir configuré, j'ai pu lancer une extraction. ça fonctionne sans problème, je peux effectuer un encodage en xvid, divx, mais je n'ai aucun accès au sous-titres ! dvdrip indique "aucun sous-titre activé". J'ai eu beau recommancer l'extraction avec d'autres paramètres, changer de dvd. Que nenni ! pas de sous-titres activés !

J'ai essayé de contourner le problème en utilisant ksubtitleripper. Là, j'arrive à ripper un sous-titre en srt, mais il faut que le dvd ne contienne qu'un fichier de sous-titres, car je n'arrive pas à sélectionner celui que j'extraie....

Merci de votre aide (soit pour dvdrip ou pour sélectionner un sous-titre via ksubtitle)

++
seb

ps: je sais pas si c'est très réglo, mais j'ai aussi posté sur lea-linux, mais comme j'ai pas de réponses...
  • # Utilisation de transcode

    Posté par  . Évalué à 1.

    Salut,

    dvd-rip utilise transcode comme "back-end". Tu peux donc tout faire directement à partir de transcode. Il faut juste utiliser un terminal (ex: Xterm, Eterm, konsole....)

    pour connaitre les sous-titres présent sur ton dvd (je suppose que ton périphérique dvd-rom est accessible depuis "/dev/dvd" a vérifier sur ta machine... peut-etre "/dev/cdrom").

    tcprobe -i /dev/dvd 2>&1 | grep "subtitle\|title"

    Il te renvoi par exemple:
    (dvd_reader.c) DVD title 1/16: 16 chapter(s), 1 angle(s), title set 1
    (dvd_reader.c) title playback time: 01:48:55.12 6536 sec
    (dvd_reader.c) subtitle 00= ‹fr›
    (dvd_reader.c) subtitle 01= ‹nl›

    le SID subtitle identifier est 0 pour le francais, 1 pour le néerlandais
    le 1/16 veut dire 1 track et 16 chapitre

    tccat -i /dev/dvd -T 1 -L | tcextract -x ps1 -t vob -a 0x20 > subs-fr

    tu extrait le sous-titre 0 (fr)... -a 0x20 veut dire (0x20 + SID)... 0x20 est la base de référence des sous-titres... tu ecris donc un fichier subs-fr
    qui contient les sous-titres en format binaire (raw). c'est un peu long puisqu'il parcours l'ensemble du DVD pour en extraire les sous-titres.

    Le DVD n'a pas les sous titres sous forme de texte mais plutôt comme des images. Il faut donc les convertir en images pgm puis faire une reconnaissance de caractère pour le traduire au format texte... voici les laborieuses étapes (cette méthode a l'avantage de creer un fichier de sous titre et non pas de l'inclure dans la video... ca permet de pouvoir l'enlever et de choisir différentes langues...).

    Crée ensuite un repertoire "french"
    mkdir french
    subtitle2pgm -o ./french/french -c 255,255,0,255 < subs-fr

    ceci va creer tout un ensemble de fichier images qu'il faut transformer en .txt
    grace a gocr (logiciel de reconnaissance de caractères a installer: urpmi gocr).
    il crée aussi un fichier french.srtx

    un petit script fait tout ca:
    cd french
    pgm2txt french

    Il risque de poser plein de question sur les caractères qu'il n'arrive pas a traiter automatiquement. Il faut lui répondre à la main ex (ç, plusieurs lettre accoller...).

    tu peux éventuellement corriger les erreurs de OCR par l'utilisation de ispell

    ispell -d francais french*txt (le dictionnaire francais doit etre installé)

    Enfin pour finir... il faut creer le fichier srt de sous titre à partir de tout ca:

    cd ..
    srttool -s -w < french/french.srtx > french.srt

    et voili voilou... pas facile, un peu long... mais efficace.
    enfin pour voir si le résultat te plait :

    mplayer -sub french.srt dvd://1

    Enjoy...
    • [^] # Re: Utilisation de transcode

      Posté par  . Évalué à 1.

      Merci damien !

      ça c'est une réponse on ne peut plus précise que je m'empresse de copier en fichier texte ! :)

      J'ai donc testé et cela fonctionne bien, sauf sur un DVD en particulier où l'extraction des sous-titres s'interrompt avant la fin : j'obtiens des messages d'erreur indiquant que des blocs n'ont pu être lus...et les sous-titres stoppent 30mn avant la fin du film.

      En tous cas, pour la sélection du bon sous-titre, c'est parfait. J'ai encore quelques soucis sur la transcription des textes, genre "a" devient "8" ou "ç" devient "c, ", enfin des trucs comme ça, mais je n'ai pas encore essayer ispell..

      Je te remercie vraiment, et en plus, ça donne envie de se mettre à la ligne de commande ;)

      ++
      seb

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.