Les principaux formats d’archivage compressé

1 juillet 2025 Durée 10 minutes Difficulté Novice

Le format ZIP

Le format ZIP est l’un des formats d’archivage et de compression les plus utilisés. Il est pris en charge par la majorité des systèmes d’exploitation de manière native, notamment Windows, macOS et Linux. De nombreux logiciels et applications tierces permettent également de créer et d’extraire des archives ZIP, telles que WinRAR, 7-Zip, et même les outils de gestion de fichiers intégrés aux systèmes d’exploitation.

Différentes méthodes de compression

Le format ZIP peut utiliser différents algorithmes de compression chacun offrant des avantages différents en termes de vitesse, de taux de compression et de consommation des ressources. Il est ainsi possible d’avoir un fichier ZIP plus ou moins compressé qui sera plus ou moins long à être exploité.

Voici les différents algorithmes utilisables lors de la génération d’une archive ZIP :

  • DEFLATE : C’est l’algorithme de compression par défaut utilisé dans les fichiers ZIP, connu pour sa rapidité et son efficacité. Il combine les techniques de codage de Huffman et de LZ77. Si cet algorithme est le plus utilisé, c’est parqu’il offre un bon équilibre entre taux de compression et vitesse de compression/décompression.
  • BZIP2 : Cet algorithme combine la transformation de Burrows-Wheeler et le codage de Huffman. Il permet de générer généralement une meilleure compression que DEFLATE mais est plus lent lors de la compression.
  • LZMA : Cet algorithme utilise des dictionnaires et une modélisation statistique avancée pour une compression très efficace. Le taux de compression est particulièrement élevé, souvent supérieur à BZIP2 et DEFLATE, avec un temps de compression plus conséquent (le temps de décompression reste rapide).
  • PPMd : PPMd est un algorithme de compression basé sur le contexte et la prédiction (Prediction by Partial Matching). Il offre un taux de compression très élevé pour certains types de données, notamment les textes. La vitesse de compression et décompression peuvent être lentes, surtout pour les grandes quantités de données.
AlgorithmeTaux de compressionVitesse de compressionVitesse de décompressionScénarios d’utilisation
DEFLATEMoyenRapideRapideUsage général
BZIP2ÉlevéMoyenMoyenCompression maximale
LZMATrès élevéLentRapideCompression maximale
PPMdTrès élevéLentLentTextes et données compressibles
ZstandardÉlevéTrès rapideTrès rapideApplications nécessitant rapidité et efficacité

Le choix de l’algorithme de compression dépend des exigences spécifiques d’un projet. DEFLATE est généralement le meilleur choix pour une compatibilité maximale et une bonne performance générale. Pour des taux de compression plus élevés, BZIP2 et LZMA sont recommandés, bien qu’ils puissent être plus lents. PPMd et Zstandard offrent des options supplémentaires pour des cas d’utilisation spécifiques, avec Zstandard étant particulièrement intéressant pour des applications nécessitant rapidité et efficacité.

Autres caractéristiques

Les fichiers ZIP peuvent être protégés par mot de passe et chiffrés afin de garantir la confidentialité des données. Ainsi, seuls les détenteurs du mot de passe utilisé lors de la création de l’archive seront en mesure de la décompresser pour consulter les fichiers qu’elle contient.

À noter que les fonctions de chiffrement des archives ZIP ne sont pas disponibles systématiquement nativement dans les différents systèmes d’exploitation et peuvent nécessiter l’utilisation d’une application tierce.

Le format RAR

Le format RAR (Roshal Archive) offre souvent une meilleure compression que le format ZIP, ce qui signifie que les fichiers RAR peuvent être plus petits pour le même contenu. Cependant, il n’est pas aussi universellement compatible que le format ZIP. Les utilisateurs doivent généralement installer des logiciels spécifiques, comme WinRAR ou 7-Zip, pour créer ou extraire des fichiers RAR.

Le format RAR est particulièrement efficace pour archiver de grandes quantités de données et peut diviser une archive en plusieurs morceaux, facilitant ainsi le transfert de très grands fichiers. Ainsi dans l’exemple ci-dessous, nous avons une archive découpée en 5 fichiers pour un poids total de 4,325 Go. À noter qu’il est nécessaire d’avoir la totalité des morceaux de l’archive pour son extraction.

Images
C:\Users\Julien\Images
NomTypeTaille
mes_photos.part01.rarrar1 000 Mo
mes_photos.part02.rarrar1 000 Mo
mes_photos.part03.rarrar1 000 Mo
mes_photos.part04.rarrar1 000 Mo
mes_photos.part05.rarrar325 Mo
mes_photos.part01.rar1 000 Mo
mes_photos.part02.rar1 000 Mo
mes_photos.part03.rar1 000 Mo
mes_photos.part04.rar1 000 Mo
mes_photos.part05.rar325 Mo

Les fichiers RAR peuvent également inclure des fonctionnalités avancées telles que la récupération des erreurs, la réparation des archives endommagées, et le chiffrement par mot de passe.

Le format TAR.GZ

Le format TAR.GZ est couramment utilisé dans les environnements Unix et Linux pour l’archivage et la compression de fichiers. Il combine en réalité deux formats : TAR (Tape Archive) et GZ (GNU Zip). Les fichiers sont archivés en un seul fichier TAR, puis ce fichier est compressé à l’aide de Gzip, résultant en un fichier TAR.GZ. Cette méthode sépare donc l’archivage de la compression.

Ce format est extrêmement populaire dans les systèmes Unix/Linux en raison de son efficacité et de son intégration avec les outils en ligne de commande. Il est souvent utilisé dans les scripts de sauvegarde et les processus d’automatisation sur les serveurs Unix/Linux, facilitant la gestion de grandes quantités de fichiers.