Liens connexes

Dépêche modérée par

Dépêche éditée par

: Sortie de la version 2005-12-28 du Hachoir

Posté par Victor STINNER (Jabber id, page perso, ). Modéré le 29 décembre 2005.
0
Hachoir est un outil écrit en Python permettant de visualiser le contenu d'un fichier binaire de manière intelligible. Son objectif n'est pas de reconnaître tous les formats, mais d'avoir une boîte à outils très complète pour supporter rapidement de nouveaux formats. De nombreux formats sont déjà supportés de base (musique mp3, partition ext2, vidéo avi, exécutable elf, archive rpm, image xcf, etc.).

Les données ne sont réellement lues que lorsqu'elles sont accédées. Ceci permet de traiter de très gros fichiers sans problème (ex: partition de 9 Go contenant plusieurs centaine de milliers d'objets), et le chargement d'un fichier prend rarement plus d'une seconde.

Le projet est encore jeune, mais n'hésitez pas à le tester et m'envoyer vos retours d'expérience.

> Lire la suite (29 commentaires, moyenne: 4,2).   [dépêche : 1064 caractères]

Dépendances :

Pour utiliser le Hachoir, vous aurez besoin de Python 2.3, Python GTK+, et Python Glade. Il est conseillé d'utiliser Python Magic (vient de libmagic et de la commande file) si c'est possible.

Pour entrer dans les détails :

L'élément le plus petit est un "chunk" qui peut être de trois types : FormatChunk (entier, chaîne binaire, tableau d'entiers, etc.), StringChunk (chaîne de caractère C, ligne Unix, etc.) et BitsChunk (champs de bits). La décompression est supportée (bzip2, gzip, rle, etc.), et le déchiffrement est prévu (pour plus tard).

Un filtre est un ensemble de chunks sachant qu'il existe un 4e type, FilterChunk, qui embarque à son tour un filtre. Ce qui donne finalement un arbre.

Pour la suite :

Les prochains chantiers sont :

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

Moteurs de recherche de bureau

Posté par yoho (page perso, ) le 29/12/2005 à 11:21. (lien). Évalué à 9.

Est-ce que ce programme ne pourrait pas avoir une application pour les moteurs de recherche de bureau (kat, beagle, et autre...) ? Parcequ'en gros, il te sort du full-text (avec en plus une structure, mais qui n'a pas d'intérêt pour les moteurs de recherche de bureau) à partir d'un fichier ou j'ai mal compris ?

très interessant

Posté par b (page perso, ) le 29/12/2005 à 12:02. (lien). Évalué à 4.

Ca peut etre très util ce programme ... entre autre pour debugger un problème.

Rétro-ingénierie

Posté par Victor STINNER (Jabber id, page perso, ) le 29/12/2005 à 12:55. (lien). Évalué à 9.

Là où le Hachoir est le plus utile actuellement, c'est pour deviner un format binaire. Je bosse d'ailleurs sur le format DIR de Worms2 avec un ami (enfin, surtout lui). Un bon morceau du format est reconnu, reste à comprendre l'algorithme de compression des images.

Si quelqu'un est intéressé (et/ou compétent :-)), je lui envoie le fichier pour qu'il nous file un coup de main.

N'empêche stocker les données (hors palette de couleur) 640x480 pixels et 256 couleurs (80 pour être exact) dans 274 octets, je dis chapeau ! C'est peut-être un format vectoriel, ou bien compression avec codage des répétitions ? Ou alors un pattern utilisant d'autres images ? Genre : tu me dessines l'image 3 en (10,20), tu me dessines l'image 6 en (200,400), etc.

Au passage, j'ai trouvé un site intéressant sur le format des données des jeux :
http://wiki.xentax.com/index.php/Main_Page

Haypo

Bravo !

Posté par Martyanoff Nicolas (Jabber id, page perso, ) le 29/12/2005 à 14:07. (lien). Évalué à 5.

Je viens de tester hachoir sur plusieurs fichiers (images, vidéos, et même exes windows), et je suis très fortement impressioné !
Donc bravo à l'auteur pour son travail, et espérons que d'autres plugins sortiront !

Un beau plugin de CraCkERZ

Posté par djibb (Jabber id, page perso, ) le 29/12/2005 à 15:52. (lien). Évalué à 6.

un plugin qui permet de récupérer les mots de passe et autres broutilles dans les fichiers sniffés (en wifi, en ethernet...) ;)
Quoi il existe des wifis non cryptés... -> toutes les 9Box d'avant Juillet-Aout dernier :)

Récupération après cracsh

Posté par Pierre Jarillon (page perso, ) le 29/12/2005 à 16:13. (lien). Évalué à 3.

Je viens de perdre une partition suite à des pistes défectueuses du disque dur. Après avoir récupéré ce qui l'était http://abul.org/article335.html jai dû identifier les fichiers de lost+found qui avaient perdu leurs noms. Ils se nommaient alors :
45_79078 45_80409 45_80979 45_82674 45_84740 45_86903 45_88031 4_63568 66766_67669
45_79080 45_80431 45_80987 45_82700 45_84746 45_86904 45_88033 4_63958 66766_67674

Je pense que Hachoir aurait pu me rendre service.

jsuis déçu

Posté par Rémi baudruche () le 29/12/2005 à 16:58. (lien). Évalué à 3.

fausse joie

permettant de visualiser le contenu d'un fichier binaire de manière intelligible


Zut, j'ai cru que ça allait afficher de la musique et jouer des images.
Ou plutôt le contraire.

enfin pour moi c'est ça afficher un fichier binnaire de façon intéligible


Sinon, ça a l'air d'un super programme, mais geek-only ;-)

avec FUSE ?

Posté par Mildred (Jabber id, page perso, ) le 29/12/2005 à 17:50. (lien). Évalué à 3.

Je me demande qi il n'est pas possible den faire un plugin pour FUSE ...
Ca permetrait par exemple de 'monter' des archives tar.gz/bz2 ou tout format reconnu par le Hachoir.
Ce serait bien je trouve.

Et si en, plus cela pouvait être intégré à Nautilus/Konqueror, ce serait le mieux.

DataWorkshop

Posté par Bonnefille Guilhem (page perso, ) le 30/12/2005 à 15:45. (lien). Évalué à 6.

Tel un parasite, je profite de ce nouvel article pour rappeler l'existence d'un autre projet qui fonctionne dans la même veine : DataWorkshop[1]. Il ne fonctionne pas exactement comme le hachoir, ce qui le limite dans la taille des fichiers manipulé, mais lui permet de faire de l'édition (modifier les fichiers visualisés).
Très récemment, il a recut une contribution lui permettant de manipuler des flux MPEG1/2[2].

Personnellement, je maintiens ce soft car il m'a bien aidé dans le cadre de mon boulot, mais je n'ai pas le temps d'y porter des modifications pour l'améliorer. Si un développeur Java en mal de sujet passe dans le coin... l'avis est lancé.

[1] https://gna.org/projects/dataworkshop
[2] http://linuxfr.org/~guyou/20446.html

La jungle des formats

Posté par Mickaël L () le 02/01/2006 à 22:53. (lien). Évalué à 3.

Je connais (un peu trop à mon gout) deux formats de fichiers très bien documentés. Ce qui est intéressant c'est qu'ils sont super documentés, à tel point que la plupart des outils de conversion le transforment en xml.
Ce sont les formats ERF et GFF de Bioware (voir http://nwn.bioware.com/developers/ les sections "The Generic File Format (GFF)" et "The Encapsulated Resource Format (ERF)").

Enfin je dis ça, c'est surtout parce que je travaille un peu sur un éditeur de resources en python, et qu'il serait parfois pratique d'examiner ce que l'on écrit :D

Si j'ai le temps, je regarderais peut être comment sont faits tes plugins...

Revenir en haut de page