Journal Hachoir 0.3 et les méta-données

Posté par  (site web personnel) .
Étiquettes : aucune
0
30
mai
2006
Après un bon mois de développement, voici la sortie de la version 0.3 de Hachoir. Pour rappel, c'est une bibliothèque accompagnée d'un programme d'exemple qui permet de visualiser le contenu d'un fichier binaire sous forme d'une arborescence (à la manière d'un document XML : clé=valeur).

La version 0.3 fait suite à la version 0.2 qui est réécriture complète du projet. L'API est plus homogène et plus simple à utiliser. Cette nouvelle version supporte les formats de fichiers les plus courants et sa fonction d'extraction de méta-données est tout à fait exploitable et très intéressante. Petit exemple :

$ hachoir --metadata TAMPOPO.AVI
Video:
- size: 608x336 pixels
- duration: 1 hour(s) 59 min
- depth: 24 bits/pixels
- codec: "divx"
- rate: 23 frame/sec
- producer: Nandub v1.0rc2
Audio:
- sample/sec: 48.0 KHz
- channel: 2


J'ai comparé les résultats aux programmes extract (qui utilise libextractor) et mminfo. Hé bien, Hachoir donne souvent de meilleures informations (plus nombreuses et plus précises). Mais Hachoir demeure lent et supporte encore peu de formats comparés aux deux outils cités.

Pour l'installation et l'utilisation, reportez-vous au site web :
http://hachoir.python-hosting.com/wiki/WikiStart

Les prochaines évolutions seront la reprise sur erreur lorsqu'on rencontre des données erronées (ou que le parseur est lui-même bogué), la détection automatique du charset du texte. Plus tard, viendra la possibilité d'éditer un fichier et une jolie interface graphique.

Un peu plus d'informations sur le Hachoir et la version 0.3 dans mon blog :
http://www.haypocalc.com/blog/index.php/2006/05/30/13-hachoi(...)

Haypo

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.