Il existe aussi 'jpegoptim' qui recompresse sans perte ! J'ai utilisé ça pour faire rentrer les photos des vacances de ma soeur sur un seul CDR (il y avait genre 10 Mo en trop, ça aurait dommage de devoir trier pour si peu de Mo).
Hum, en écrivant "Java" je parle de la totale : langage, machine virtuelle, bibliothèque. La totale pour exécuter du code Java donc. À ce qu'on m'a dit, une machine virtuel, c'est la partie émergée de l'iceberg, Java est surtout intéressant pour les bibliothèques associées.
Je reste très perplexe quand au passage à la licence GPL de Java. J'ai lu que ça sera la version 7 alors que la 6 vient de sortir. Donc pendant encore un bout de temps, Javaçapuecestpaslibre. Donc, aujourd'hui, si on prend un projet comme Looking Glass 3D, quel est le pourcentage de code sous GPL ?
Faites du Python, c'est libre depuis longtemps (juin 2001) au moins.
Le mieux serait, effectivement, de faire en sorte que setuptools arrive à retrouver la version des modules Python installés par Debian, Ubuntu, Mandriva, Gentoo, etc.
Non mais c'est vrai quoi. Déjà la gueule que ça a, erk. En plus, le goût, rien à faire non plus.
Je pense qu'il est bon que le monde entier le sache car c'est d'une importante capitale.
Haypo
PS: Ah sinon, ce journal, c'est n'importe quoi : ça mélange tous les plus gros trolls du moment. Resterait plus qu'à finir sur "vu comment j'aime pas le boudin noir je vais passer à Vista" et ça serait parfait.
Python est à la fois une désavantage et un avantage :
* il est plus lent qu'un programme en C et utilise plus de mémoire (des statistiques sur l'extraction de méta-données m'intéresseraient)
* mais il n'a pas les erreurs du langage C (buffer overflow, pointeur explosif & co) et est plus robuste avec sa gestion des exceptions
Hachoir résiste bien aux fichiers corrompus et tronqués. Je voulais sortir un exemple concret pour le prouver, mais là je me suis souvenu qu'hachoir-metadata est encore très sensible : il n'aime pas les fichiers tronqués :) Il plante lamentablement lorsqu'un champ est absent. Il faudrait que je trouve une solution élégante et générique pour corriger ça.
Hachoir est une bibliothèque bas niveau pour manipuler des fichiers, ce n'est pas un programme dédié à la récupération des données tel que TestDisk. Je pense par contre qu'il peut être un très bon point de départ pour :
- reconnaître le format d'un fichier de format inconnu
- trouver le début d'un fichier dans une image disque
- recupérer une partie d'un fichier tronqué / partiellement corrumpu
Mais je n'ai pas du tout fait d'essai dans ce sens. N'ayant jamais été victime de disque dur fou ou de clé USB malade, je n'ai pas eu l'occasion de mettre en action l'Hachoir sur ce sujet.
Pour le format ZIP, il manque un petit patch pour pouvoir décompresser un fichier dans une archive ZIP. Avec cette fonctionnalité, il serait possible d'extraire un fichier donné d'une archive ZIP. Il faut juste trouver la bonne bilbliothèque Python pour le faire étant donné qu'Hachoir supporte depuis peu la décompression à la demande (on peut entrer dans une archive .gz puis dans une archive .tar puis dans une image .jpeg puis dans les données EXIF, et là trouver le code d'accès à l'immeuble ^^).
Mais en allant plus loin, est-ce que hachoir ne pourrait pas être la base des moteurs d'indexation ?
Ca peut se faire. hachoir-grep est un outil bourrin pour lister toutes les chaînes de caractère d'un fichier binaire. Il sort des chaînes en Unicode propre (si le charset est bien spécifié dans le parseur).
Sinon, hachoir-metadata vise les moteurs d'indexation / de recherche, mais en fait je n'ai jamais zieuté du côté de Beagle & co.
Je ne sais pas si Hachoir est assez rapide pour ces outils. Après il faut choisir vitesse ou qualité des infos :-p
Petit à petit, je déteste setuptools que je trouvais magnifique. À ce que j'ai compris du problème : (aucune distribution linux) n'inclut les informations "egg info". Setuptools n'arrive pas à déterminer les versions des modules Python installés. Alors plutôt que de deviner, il fait son bourrin et installe une deuxième version du module Python.
J'hésite entre :
* Supporter setuptools et ses nombreuses qualités : pouvoir installer tout un module dans un seul oeuf (fichier ".egg"), pouvoir installer plusieurs versions d'un module au même endroits et choisir la version au chargement, pouvoir installer un programme dans son dossier perso sans toucher au PYTHONPATH, ...
* Ne plus utiliser setuptools qui réinstalle tout et de travers en plus
Pour les documents Office, c'est essentiellement le format OLE2, et ce format est le plus complexe de tous les formats qui existent sur Terre. Un parseur a été entamé mais c'est pas encore ça. Aujourd'hui la meilleure bibliothèque pour lire ces informations est libgsf. Plus d'info par ici : http://hachoir.org/wiki/MicrosoftOffice
Pour OpenOffice, rien n'a été fait pour l'instant, bien qu'un parseur ZIP existe et que Python a tout le nécessaire pour manipuler du XML.
Pour PDF, un parseur existait il y a bien longtemps, mais depuis il n'a pas été récupéré.
"et puis un jour les commentateurs liront le texte de la dépêche", il n'y a pas de paquet d'hachoir-* version 0.7. Mais libre à toi, smorico, d'en préparer ;-)
Ceci ressemble à une ancienne installation d'Hachoir (car le module "hachoir" a été renommé "hachoir-core"). Essaye "sudo easy_install -U hachoir-metadata" (U comme Upgrade). Au pire, suppression sauvage de l'ancienne version (rm -rf /usr/bin/hachoir* /usr/lib/python2.4/site-package/hachoir*) puis réinstallation.
Ces brevets ressemble très fortement à ce qu'on trouvait en 1990 sur n'importe quel ordinateur (MS-Dos, Atari, et bien d'autres). On trouvera facilement l'inventeur de l'icône, de la fenêtre, etc.
Ils sont valides ces brevets ? Ou alors c'est juste 7.000.000 de blagues ? C'est n'importe quoi les brevets.
Est-il possible de prendre un jeu codé en C, voir en C++ ou pire en Perl ou Python, pour ce PIC ? On m'a dit un jour qu'un programme C bien codé pour être recompilé pour n'importe quelle archi, mais là j'suis un peu perplexe quand même.
Perso, je me refuse à coder en C ou même en C++. Je ne code plus qu'en Python (à part si je suis payé :-)). Alors me parlez pas d'assembleur.
Est-ce qu'il y a SDL de disponible ? Est-ce qu'il y a un système d'exploitation ? On peut écrire des threads ?
Sinon, je vois que seul les manettes à 2 boutons sont supportées... C'est un peu limité quand même. 4 boutons c'est pas envisageable ? J'avais codé un pilote pour manette de jeu. J'ai appris assez vite qu'il faut écrire un protocole entre la manette et l'ordinateur pour avoir plus d'axes et plus de boutons (enfin plutôt supporter le protocole de la manette...).
Ce qui est assez fort avec cvs2svn, c'est qu'il arrive à recréer des commit atomiques svn. À ce que j'ai entendu, il utilise les dates de commit "tiens celui là est assez proche de l'autre là, on va dire que c'est le même commit" :-)
Hum, et si tu as un flux vidéo et un flux audio (voir 2, 3, 4 flux audios) ? Hum, ta formule est trop simpliste. Et si ne tiens pas compte des entêtes de chaque page Ogg. De plus, Hachoir ne sait pas lire la durée d'un .ogg :-) (j'ai ouvert un ticket pour ça)
J'ai rencontré un warn (fichier .avi, Xvid, MP3) :
[warn] Unable to convert string /info/comment/text to Unicode: 'ascii' codec can 't decode byte 0x89 in position 0: ordinal not in range(128)
Common:
(...)
- Comment: ‰f‘½FDivX640 Q3 PV3cap D-CX
Ouais, il semble pas très catholique ton commentaire. Tu peux m'envoyer la vidéo si elle est pas trop grosse (5 Mo max) ? Si elle est trop grosse, tronque là (dd if=fichier.avi of=fichier_tronque.avi bs=1024 count=1024) et regarde si tu as encore le bug. Si oui, envoie moi ce fichier tronqué. Si non, euh... Contacte moi :)
Et il doit y avoir un problème avec le parseur du .mp4 qui me renvoie :
Metadata:
- Duration: 23 min 6 sec
(...)
C'est tout ce qu'il sait lire pour l'instant. Si t'es chaud pour améliorer le parseur MPEG-4, n'hésite pas :-) Si ta question concernait "MIME type: video/quicktime", sache que le format Quicktime est le format MPEG-4 (ou l'inverse, je sais pas).
J'ai modifié l'extracteur pour qu'il prenne en compte les sous-titres. Exemple :
Subtitle:
- Title: Piste de présentation
- Compression: S_TEXT/UTF8
Subtitle:
- Language: French
- Compression: S_VOBSUB
Subtitle:
- Language: English
- Compression: S_VOBSUB
J'ai ajouté la norme ISO 639-2 à Hachoir pour donne le nom complet de la langue (fre => French).
Je sais pas s'il te faut d'autres info. Si oui, dit moi où les trouver :-)
--
Pour EXIF, il faudrait recoder le parseur pour qu'il bug moins, et réorganiser l'extracteur de méta-données pour qu'il sépare les infos sur la photo et sur l'appareil photo (faut pas tout mélanger).
Pour le format "Canon", ben envoie moi les spec' ou code le parseur. J'y peux rien moi si chaque constructeur invente son format maison :-(
J'ai corrigé l'extracteur Matroska pour accepter plusieurs canaux audios, mais aussi plusieux canaux vidéos (c'est tellement le bordel Matroska, on sait jamais).
Pour le bitrate, j'ai aucune idée de comment l'obtenir.
[^] # Re: Concernant les photos...
Posté par Victor STINNER (site web personnel) . En réponse au journal Nos données. Évalué à 3.
# Mes bonnes résolutions.
Posté par Victor STINNER (site web personnel) . En réponse au journal Bonne année 2007 !. Évalué à 3.
# Dépêche sur la version 0.8alpha1 (plus ancienne)
Posté par Victor STINNER (site web personnel) . En réponse au journal Sortie de Wormux 0.7.9RC1. Évalué à 5.
[^] # Re: La récente GPLisation de Java
Posté par Victor STINNER (site web personnel) . En réponse au journal Looking Glass 3D en version 1.0 !. Évalué à 1.
# La récente GPLisation de Java
Posté par Victor STINNER (site web personnel) . En réponse au journal Looking Glass 3D en version 1.0 !. Évalué à -3.
Faites du Python, c'est libre depuis longtemps (juin 2001) au moins.
[^] # Re: (soucis setuptools)
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 2.
=> http://mail.python.org/pipermail/distutils-sig/2006-November(...)
=> http://mail.python.org/pipermail/distutils-sig/2006-November(...)
Le mieux serait, effectivement, de faire en sorte que setuptools arrive à retrouver la version des modules Python installés par Debian, Ubuntu, Mandriva, Gentoo, etc.
# Je n'aime pas le boudin noir
Posté par Victor STINNER (site web personnel) . En réponse au journal Pourquoi je n'aime pas Ubuntu.. Évalué à 5.
Je pense qu'il est bon que le monde entier le sache car c'est d'une importante capitale.
Haypo
PS: Ah sinon, ce journal, c'est n'importe quoi : ça mélange tous les plus gros trolls du moment. Resterait plus qu'à finir sur "vu comment j'aime pas le boudin noir je vais passer à Vista" et ça serait parfait.
# Paquets Debian
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 2.
http://plumbear.free.fr/hachoir/
et le repository bien rangé dans l'arborescence sous:
http://plumbear.free.fr/debian/
Merci à Michel Casabona (aka plumbear).
[^] # Re: Documents bureautique
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 3.
* il est plus lent qu'un programme en C et utilise plus de mémoire (des statistiques sur l'extraction de méta-données m'intéresseraient)
* mais il n'a pas les erreurs du langage C (buffer overflow, pointeur explosif & co) et est plus robuste avec sa gestion des exceptions
Hachoir résiste bien aux fichiers corrompus et tronqués. Je voulais sortir un exemple concret pour le prouver, mais là je me suis souvenu qu'hachoir-metadata est encore très sensible : il n'aime pas les fichiers tronqués :) Il plante lamentablement lorsqu'un champ est absent. Il faudrait que je trouve une solution élégante et générique pour corriger ça.
[^] # Re: une solution pour des archives corrompues ?
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 2.
- reconnaître le format d'un fichier de format inconnu
- trouver le début d'un fichier dans une image disque
- recupérer une partie d'un fichier tronqué / partiellement corrumpu
Mais je n'ai pas du tout fait d'essai dans ce sens. N'ayant jamais été victime de disque dur fou ou de clé USB malade, je n'ai pas eu l'occasion de mettre en action l'Hachoir sur ce sujet.
Pour le format ZIP, il manque un petit patch pour pouvoir décompresser un fichier dans une archive ZIP. Avec cette fonctionnalité, il serait possible d'extraire un fichier donné d'une archive ZIP. Il faut juste trouver la bonne bilbliothèque Python pour le faire étant donné qu'Hachoir supporte depuis peu la décompression à la demande (on peut entrer dans une archive .gz puis dans une archive .tar puis dans une image .jpeg puis dans les données EXIF, et là trouver le code d'accès à l'immeuble ^^).
[^] # Re: Documents bureautique
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 4.
Ca peut se faire. hachoir-grep est un outil bourrin pour lister toutes les chaînes de caractère d'un fichier binaire. Il sort des chaînes en Unicode propre (si le charset est bien spécifié dans le parseur).
Sinon, hachoir-metadata vise les moteurs d'indexation / de recherche, mais en fait je n'ai jamais zieuté du côté de Beagle & co.
Je ne sais pas si Hachoir est assez rapide pour ces outils. Après il faut choisir vitesse ou qualité des infos :-p
[^] # Re: (soucis setuptools)
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 2.
J'hésite entre :
* Supporter setuptools et ses nombreuses qualités : pouvoir installer tout un module dans un seul oeuf (fichier ".egg"), pouvoir installer plusieurs versions d'un module au même endroits et choisir la version au chargement, pouvoir installer un programme dans son dossier perso sans toucher au PYTHONPATH, ...
* Ne plus utiliser setuptools qui réinstalle tout et de travers en plus
[^] # Re: Documents bureautique
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 4.
http://hachoir.org/wiki/MicrosoftOffice
Pour OpenOffice, rien n'a été fait pour l'instant, bien qu'un parseur ZIP existe et que Python a tout le nécessaire pour manipuler du XML.
Pour PDF, un parseur existait il y a bien longtemps, mais depuis il n'a pas été récupéré.
[^] # Re: Bug sur Debian SID
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 6.
[^] # Re: Bug sur Debian SID
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche Faites parler vos fichiers avec hachoir-metadata. Évalué à 6.
# Barre de défilement
Posté par Victor STINNER (site web personnel) . En réponse au journal nouveau moteur de recherche de google pour les brevets. Évalué à 10.
http://www.google.com/patents?vid=USPATD501213 (D501213, Xerox, 2005)
http://www.google.com/patents?vid=USPATD406123 (D406123, Apple, 1999)
http://www.google.com/patents?vid=USPATD392963 (D392963, Apple, 1998)
Ces brevets ressemble très fortement à ce qu'on trouvait en 1990 sur n'importe quel ordinateur (MS-Dos, Atari, et bien d'autres). On trouvera facilement l'inventeur de l'icône, de la fenêtre, etc.
Ils sont valides ces brevets ? Ou alors c'est juste 7.000.000 de blagues ? C'est n'importe quoi les brevets.
# Oui mais
Posté par Victor STINNER (site web personnel) . En réponse au journal Talend recrute des développeurs Perl. Évalué à 9.
# Recompiler un jeu pour le PIC ?
Posté par Victor STINNER (site web personnel) . En réponse à la dépêche projet Dogs : ordinateur - console de jeux libre. Évalué à 1.
Perso, je me refuse à coder en C ou même en C++. Je ne code plus qu'en Python (à part si je suis payé :-)). Alors me parlez pas d'assembleur.
Est-ce qu'il y a SDL de disponible ? Est-ce qu'il y a un système d'exploitation ? On peut écrire des threads ?
Sinon, je vois que seul les manettes à 2 boutons sont supportées... C'est un peu limité quand même. 4 boutons c'est pas envisageable ? J'avais codé un pilote pour manette de jeu. J'ai appris assez vite qu'il faut écrire un protocole entre la manette et l'ordinateur pour avoir plus d'axes et plus de boutons (enfin plutôt supporter le protocole de la manette...).
Haypo
[^] # Re: SubVersion 1.0 est sorti \o/
Posté par Victor STINNER (site web personnel) . En réponse au journal renommage de fichier sous CVS [script bash]. Évalué à 2.
[^] # Re: Des liens
Posté par Victor STINNER (site web personnel) . En réponse au journal Bd en ascii. Évalué à 5.
# Des liens
Posté par Victor STINNER (site web personnel) . En réponse au journal Bd en ascii. Évalué à 4.
http://fr.wikipedia.org/wiki/ASCII_Art
http://mahonet.info/~kozou/english.html (ASCII Art japonais, avec leur charset, je trouve ça très joli)
Ah oui voilà :
http://en.wikipedia.org/wiki/Shift_JIS_art
Haypo
# SubVersion 1.0 est sorti \o/
Posté par Victor STINNER (site web personnel) . En réponse au journal renommage de fichier sous CVS [script bash]. Évalué à 2.
(ah bon, c'est hors sujet ?)
[^] # Re: mkv multi audio
Posté par Victor STINNER (site web personnel) . En réponse au journal hachoir-metadata cherche des testeurs. Évalué à 3.
Hum, et si tu as un flux vidéo et un flux audio (voir 2, 3, 4 flux audios) ? Hum, ta formule est trop simpliste. Et si ne tiens pas compte des entêtes de chaque page Ogg. De plus, Hachoir ne sait pas lire la durée d'un .ogg :-) (j'ai ouvert un ticket pour ça)
J'ai rencontré un warn (fichier .avi, Xvid, MP3) :
[warn] Unable to convert string /info/comment/text to Unicode: 'ascii' codec can 't decode byte 0x89 in position 0: ordinal not in range(128)
Common:
(...)
- Comment: ‰f‘½FDivX640 Q3 PV3cap D-CX
Ouais, il semble pas très catholique ton commentaire. Tu peux m'envoyer la vidéo si elle est pas trop grosse (5 Mo max) ? Si elle est trop grosse, tronque là (dd if=fichier.avi of=fichier_tronque.avi bs=1024 count=1024) et regarde si tu as encore le bug. Si oui, envoie moi ce fichier tronqué. Si non, euh... Contacte moi :)
Et il doit y avoir un problème avec le parseur du .mp4 qui me renvoie :
Metadata:
- Duration: 23 min 6 sec
(...)
C'est tout ce qu'il sait lire pour l'instant. Si t'es chaud pour améliorer le parseur MPEG-4, n'hésite pas :-) Si ta question concernait "MIME type: video/quicktime", sache que le format Quicktime est le format MPEG-4 (ou l'inverse, je sais pas).
Victor
[^] # Re: sous titres dans un mkv?
Posté par Victor STINNER (site web personnel) . En réponse au journal hachoir-metadata cherche des testeurs. Évalué à 2.
J'ai ajouté la norme ISO 639-2 à Hachoir pour donne le nom complet de la langue (fre => French).
Je sais pas s'il te faut d'autres info. Si oui, dit moi où les trouver :-)
--
Pour EXIF, il faudrait recoder le parseur pour qu'il bug moins, et réorganiser l'extracteur de méta-données pour qu'il sépare les infos sur la photo et sur l'appareil photo (faut pas tout mélanger).
Pour le format "Canon", ben envoie moi les spec' ou code le parseur. J'y peux rien moi si chaque constructeur invente son format maison :-(
[^] # Re: mkv multi audio
Posté par Victor STINNER (site web personnel) . En réponse au journal hachoir-metadata cherche des testeurs. Évalué à 2.
Pour le bitrate, j'ai aucune idée de comment l'obtenir.