Bonjour,
Un petit journal pour vous expliquer comment récupérer les sous-titres DVB des chaînes télé françaises et les convertir sous forme d'un fichier texte srt. J'ai pas mal galéré, donc je me suis dit qu'un petit tuto pourrait être utile.
Pré-requis:
je suppose que vous avez un fichier .ts contenant la video et les sous-titres. Normalement, vlc ou totem sont capables d'afficher ces sous-titres.
Si vous découpez un fichier, attention au découpage, certains logiciels perdent la piste de sous-titres au découpage (par exemple dvbcut). Pour ma part, je coupe avec un dd if=$entree of=$sortie ibs=100000 skip=$taille count=$c.
Installation:
Vous aurez besoin du logiciel de reconnaissance de caractères tesseract, ainsi que d'outils de création de sous-titres: sous debian, ce sont les paquets tesseract, tesseract-ocr-fra, ogmrip.
Je suppose également que java est installé.
Ensuite, il faut récupérer une version très récente de ProjectX.
La version dans les dépots a un bug
http://forum.dvbtechnics.info/showthread.php?t=32024
Une fois ProjectX.zip téléchargé, sauvez-le sous
/usr/local/share/projectx/ProjectX.jar
sudo mkdir /usr/local/share/projectx/lib
cd /usr/local/share/projectx/lib
sudo wget http://mirrors.ibiblio.org/pub/mirrors/maven/commons-net/jars/commons-net-1.3.0.jar
Utilisation:
Mettre le fichier .ts dans un sous-répertoire (pleins de fichiers vont être créés), puis lancer
java -jar /usr/local/share/projectx/ProjectX.jar
File: sélectionner le fichier ts
Cliquer sur Prepare, puis Presettings,
Onglet Output: tout décocher, sauf subpicture
Onglet Subtitle: cocher "additional export as Vobsub", choisir la Fonte (je prends courier). Dans l'onglet "simulate DVB Subpictures IRD Color Model", je prends UkFreeview(mc). Vous pouvez tenter d'autres combinaisons, mais un mauvais choix peux amener à des sous-titres que le logiciel de reconnaissance ne saura pas traiter (en particulier le choix par défaut ne convient pas).
On peut fermer l'onglet, et lancer le traitement avec la touche en forme de triangle. Dans la fenêtre de log, vous pouvez controler le nombre de sous-titres reconnus.
On ouvre maintenant un terminal dans le répertoire utilisé:
b="mon_fichier.sup"
l="fra"
subp2tiff --sid=0 -n $b
for i in *.tif; do tesseract $i $i -l $l; done
subptools -s -w -t srt -i $b.xml -o $b.srt
Et c'est fini, il n'y a plus qu'à éditer le fichier .srt pour corriger les petites erreurs.
# ProjectX, dvbcut et les autres
Posté par antistress (site web personnel) . Évalué à 3. Dernière modification le 12 avril 2014 à 11:42.
Merci pour le partage !
L'interface de ProjectX m'a toujours rebuté (je ne savais pas qu'il était toujours développé !), et j'ai lu que la série 2.6 de avidemux est censée manipuler le MPEG TS :
Une idée s'il garde les sous-titres ?
Par ailleurs GStreamer est en bonne voie pour gérer enfin correctement les fichiers ts (et donc bientôt Pitivi par ex., d'ailleurs c'est un dev de Pitivi qui est à l’œuvre), je ne sais pas ce qu'adviennent les sous-titres en cas ?
[^] # Re: ProjectX, dvbcut et les autres
Posté par Maderios . Évalué à 2. Dernière modification le 12 avril 2014 à 12:05.
Le dépot de Christian Marillat fournit la version la plus récente
http://www.deb-multimedia.org/
[^] # Re: ProjectX, dvbcut et les autres
Posté par mac_is_mac (site web personnel) . Évalué à 2.
Pour moi, ce bug est présent dans la version du dépot de Marillat (0.91.0.08-dmo2 chez moi).
[^] # Re: ProjectX, dvbcut et les autres
Posté par mac_is_mac (site web personnel) . Évalué à 1.
Je viens de faire le test: malheureusement avidemux (1:2.6.8-dmo1) flingue les sous-titres.
[^] # Re: ProjectX, dvbcut et les autres
Posté par antistress (site web personnel) . Évalué à 2.
merci pour le retour
Je vais polluer le rapport de bogue de gstreamer pour poser la question
# mini-tutos ?
Posté par djibb (site web personnel) . Évalué à -10. Dernière modification le 12 avril 2014 à 16:43.
"Salut, bande de mini-salopes !, j'vous aime putain !"
[^] # Re: mini-tutos ?
Posté par Kerro . Évalué à 4.
J'imagine qu'il y a quelque chose à comprendre.
Mais quoi ?
[^] # Re: mini-tutos ?
Posté par steph1978 . Évalué à 4.
oui: https://www.youtube.com/watch?v=__bNqAjlUEM
# mplayer
Posté par sn00py . Évalué à 0.
On peut aussi utiliser mplayer -dumpsub à la place de projectX.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.