Pour rappel, XZ est un format de compression de données, dont la spécification est ouverte, et qui génère des fichiers plus petits : en moyenne 30% par rapport à gzip et 15% par rapport à bzip2, au prix d'un temps de compression plus élevé. Il utilise l'algorithme LZMA2.
Le format XZ est fourni avec :
- Une bibliothèque de compression dont l'interface est similaire à celle de zlib (liblzma) ;
- Un utilitaire en ligne de commande ressemblant à gzip (xz) ;
- Un utilitaire de décompression seule (xzdec) ;
- Un ensemble de scripts shell adaptés de gzip (xzgrep, xzdiff, etc.).
Aller plus loin
- XZ Utils (12 clics)
- XZ (format de fichier) (23 clics)
- Annonce de la version 5.0.0 (4 clics)
- xz vs gzip vs bzip2 (8 clics)
# Archlinux - paquetages logiciel (package)
Posté par _seb_ . Évalué à 4.
XZ est déjà utilisé sur la distribution Archlinux pour les différents paquetages logiciel (package).
http://www.archlinux.org/news/switching-to-xz-compression-fo(...)
[^] # Re: Archlinux - paquetages logiciel (package)
Posté par Cyrille Pontvieux (site web personnel, Mastodon) . Évalué à 5.
[^] # Re: Archlinux - paquetages logiciel (package)
Posté par WhiteCat . Évalué à 4.
[^] # Et pour Debian ?
Posté par grondilu . Évalué à 1.
[^] # Re: Et pour Debian ?
Posté par WhiteCat . Évalué à 1.
[^] # Re: Et pour Debian ?
Posté par teoB . Évalué à 1.
[^] # Re: Et pour Debian ?
Posté par WhiteCat . Évalué à 3.
[^] # Re: Et pour Debian ?
Posté par Space_e_man (site web personnel) . Évalué à 4.
[^] # Re: Et pour Debian ?
Posté par WhiteCat . Évalué à 1.
# Quelques détails
Posté par lfmarante . Évalué à 10.
De plus si on regarde les benchmarks. Le gain de place est certes énorme, mais au prix d’un énorme sacrifice de temps pour de la compression d’archives au quotidien.
Néanmoins analysons quelques lignes savamment choisies :
(Extrait de http://tukaani.org/lzma/benchmarks.html)
Compressed file size in bytes
gzip bzip2 lzmash
1 86322815 76147880 67456213
2 84858575 74320824 62085798
X …………………………………………..
9 78768334 72223858 54068819
Compression time
gzip bzip2 lzmash
1 11.5s 1m 26s 0m 58s
2 12.0s 1m 40s 2m 7s
X ………………………………………...
9 66.9s 2m 37s 12m 20s
On peut constater que certes en -9 sa compresse à l’extrême, mais 12 minutes sur la machine de test pour 200 mo. Pour de la compression de livecd pas de soucis, pour du backup, c’est plus tendu, surtout si les archives pèsent leur poids en gigas.
Par contre si on compresse en lzmash -1 on est plus rapide que du gzip -9 de quelques secondes. (moins d’une minute pour le total). Mais surtout en lzmash -1 l’archive est plus légère que du gzip ou bzip2 compressé à l’extrême.
Si on compresse en lzmash -2 (gain de 2,5% de compression par rapport à -1) on est plus rapide que du bzip2 -9 de 30 sec. tout en compressant toujours mieux que du gzip ou du bzip à l’extrême.
Bref, moi j’adopte ^^
[^] # Re: Quelques détails
Posté par claudex . Évalué à 2.
Tu peux faire tes backups la nuit.
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: Quelques détails
Posté par Amand Tihon (site web personnel) . Évalué à 10.
[^] # Re: Quelques détails
Posté par Gniarf . Évalué à 2.
[^] # Re: Quelques détails
Posté par SQP . Évalué à 5.
Un format excellent pour tout ce qui doit être mis à disposition et téléchargé sur le net. (on rattrape une partie du temps de compression avec nos uploads pourris)
Par contre je n'ai pas le même chiffre pour l'écart entre -1 et -2, j'arrive à un écart de 8% (620/674 = 0,92)
[^] # Re: Quelques détails
Posté par Olivier Jeannet . Évalué à 1.
Ça dépend vraiment de la nature des données compressées, il faut vérifier pour chaque cas. J'avais fait des tests sur certains de mes backups et le gain n'était pas systématique en taille. Par exemple en compressant les 600 M de ma boîte mail, qui contient pas mal de pièces jointes (images souvent), lzma -1 et -2 se situait entre gzip et bzip2 pour la taille, avec un temps de compression supérieur. En lzma -3 ça battait bzip2 mais en prenant le double de temps.
[^] # Re: Quelques détails
Posté par apostle . Évalué à 5.
Tiré du manuel :
« Unless you want to maximize the compression ratio, you probably don't want a higher preset level than -7 due to speed and memory usage. »
# multithreadé ?
Posté par Old Geek . Évalué à 10.
Est-ce que les outils de compression sont multithreadés ?,
vu le nombre de coeurs aujourd'hui, marre de voir 1 proc à 100% et le reste rien faire ...
Nicolas
[^] # Re: multithreadé ?
Posté par Thierry Thomas (site web personnel, Mastodon) . Évalué à 3.
[^] # Re: multithreadé ?
Posté par Frédéric COIFFIER . Évalué à 3.
Mais je n'ai pas vérifié.
[^] # Re: multithreadé ?
Posté par WhiteCat . Évalué à 2.
[^] # Re: multithreadé ?
Posté par zaurus (site web personnel) . Évalué à 1.
d'en profiter pour ce genre de taches.
Pour info pour gzip en version parallele, c'est pigz le nom du package
(pbzip2 comme cite plus haut pour une version parallele de bzip2).
Bonne compression en parallele! ;)
[^] # Re: multithreadé ?
Posté par DLFP est mort . Évalué à 3.
DLFP >> PCInpact > Numerama >> LinuxFr.org
[^] # Re: multithreadé ?
Posté par Antoine . Évalué à 10.
# Comparaison avec 7z ?
Posté par whity . Évalué à 2.
Mes commentaires sont en wtfpl. Une licence sur les commentaires, sérieux ? o_0
[^] # Mais non
Posté par 🚲 Tanguy Ortolo (site web personnel) . Évalué à 6.
[^] # Re: Mais non
Posté par Aldoo . Évalué à 8.
Mais... LZMA et LZMA2, est-ce vraiment la même chose?
(réponse: oui, LZMA2 étant une évolution du format pour ajouter des fonctionalités liées à la vérification d'intrégrité)
[^] # Re: Mais non
Posté par WhiteCat . Évalué à 3.
LZMA2 is modified version of LZMA. it provides the following advantages over LZMA:
* Better compression ratio for data than can't be compressed. LZMA2 can store such blocks of data in uncompressed form. Also it decompresses such data faster.
* Better multithreading support. If you compress big file, LZMA2 can split that file to chunks and compress these chunks in multiple threads.
[^] # Re: Mais non
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 3.
Quand on peut pas compresser, on compresse mieux !
>> LZMA2 can store such blocks of data in uncompressed form.
En fait, on compresse pas
>> Also it decompresses such data faster.
Mais on décompresse quand même.
Eh ben… Je suis le seul à trouver que cette doc est bordélique ?
[^] # Re: Mais non
Posté par DLFP est mort . Évalué à 5.
DLFP >> PCInpact > Numerama >> LinuxFr.org
[^] # Re: Mais non
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 1.
2/ C'est quand même pas ce qui est écrit
# Benchmark plus récent
Posté par dems . Évalué à 2.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.