Qu'est-ce que la compression de données ?

Qu'est-ce que la compression de données ?
26 juin 2020
Publié par Équipe NetExplorer

On utilise souvent au quotidien des fichiers ayant pour extension .rar ou .zip. Ce sont des fichiers qui résultent d'une compression de données. De quoi s'agit-il réellement ? Quelle est son utilité ? Comment fonctionne cette opération ? Découvrez dans cet article tout ce que vous devez savoir sur la compression des données.

Définition de la compression des données

La compression des données est une opération qui consiste à réduire l'espace occupé par l'ensemble des données concernées. Il s'agit d'un processus de modification, d'encodage ou de conversion de la structure des bits (représentation binaire des informations) qui peut s'appliquer à tous les types de fichiers à savoir :

  • Les textes ;
  • Les audio ;
  • Les images ;
  • Les graphiques ;
  • Les vidéos

Les données compressées sont omniprésentes dans les fichiers que vous utilisez fréquemment. Par exemple, sans la compression des données, une chanson de 4 minutes pourrait avoir une taille qui excède 150 Mo. De même, une vidéo de 5 minutes aurait une taille qui approche les 1 Go, voire plus.

La finalité de l'opération est de réduire au mieux le nombre de bits nécessaires pour conserver l'ensemble des données. Lors d'une compression, les informations réelles ne changent pas. C'est plutôt leur représentation interne sur l'espace de stockage qui change. Pour y arriver, les données inutiles sont simplement supprimées.

Le concept est donc simple à comprendre. Par contre, ce qui est moins simple, c'est la façon dont s'effectue la compression. Mais avant de développer cette notion, voyons d'abord les raisons pour lesquelles la compression des données est si importante.

compression de données

Pourquoi a-t-on besoin de la compression des données ?

La nécessité de compresser des fichiers informatiques est due au déséquilibre qui existe entre le volume des données que l'on peut stocker, le volume des données traitables et celui des données transférables. Ce déséquilibre est lui-même dû à l'évolution continue des innovations technologiques.

Concrètement, les processeurs intègrent une puissance de traitement dont la technologie évolue beaucoup plus vite que les capacités de stockage. Il en est de même avec la bande passante d'internet (dans une proportion plus importante). Ainsi, il est impératif de réduire la taille des données pour optimiser les capacités de stockage.

En pratique, cette opération peut vous permettre de réduire la taille d'un fichier de stockage de 10 Mo à 5 Mo ou de 10 Mo à 1 Mo. Dans le premier cas, on dira que le fichier a été compressé avec un taux de compression de 2, puisque le fichier originel a le double de la taille du fichier final. Dans le second cas, le taux de compression est de 10.

La qualité de la compression est proportionnelle au taux de compression. Cependant, pour avoir de bons résultats, il est important de bien choisir les fichiers à compresser. Par exemple, la compression d'un fichier déjà compressé n'aura aucun impact réel.

Outre le gain d'espace de stockage, la compression des données permet aussi de pallier les insuffisances des vitesses de transmission sur les divers réseaux, dont internet. Par ricochet, l'opération permet de réduire les coûts de stockage matériel, mais aussi les coûts liés à la bande passante réseau. Les administrateurs économisent donc de l'argent et du temps qu'ils consacreraient autrement au stockage des données.

Comment fonctionne la compression des données ?

On distingue deux catégories de compression de données. La première consiste à réduire la taille d'un seul fichier dans le but de gagner de l'espace de stockage. La seconde catégorie permet de compresser un groupe de fichiers pour la commodité de stockage, mais surtout pour faciliter les transmissions de données.

Dans ce contexte de compression de fichiers, on parle souvent d'archivage. Plus généralement, la notion de compression des données est basée sur le fait que la majorité des fichiers présente des données redondantes. Il suffit donc de réorganiser les bits de données d'un fichier pour le compresser (le rendre plus petit, plus compact). Cependant, la compression des données est une opération qui ne s'effectue pas seule. Le processus implique également une opération de décompression. On ne saurait parler de l'un sans l'autre.

Fonctionnement de la compression des données

Pour exécuter la première étape (compression), il faut appliquer un algorithme spécialement conçu pour cette tâche. Il existe de nombreux programmes de compression. En réalité, les procédures de réorganisation des bits de données sont aussi diverses que variées.

Les différents programmes de compression sont souvent dédiés à un type de donnée spécifique. Vous vous demandez probablement quelle en est la raison. Eh bien, il existe de nombreux algorithmes de compression parce que toutes les données ne peuvent pas être compressées de la même manière.

Pour compresser un texte, l'algorithme utilisé travaillera sur les diverses répétitions des caractères. Il supprimera dans certains cas tous les caractères inutiles. Dans d'autres cas, il insérera des caractères de répétition uniques. Cette manœuvre permet d'indiquer une chaîne de caractère répétée.

Il peut même agir sur des portions de phrases. Autrement dit, le programme remplace des chaînes de bits qui se répètent par des chaînes beaucoup plus petites. Grâce à ces techniques, vous pouvez réduire facilement de 50 %, voire plus, la taille originale d'un fichier texte. Quant à un algorithme dédié à la compression d'images, il visera notamment la différence entre les pixels. Il est donc presque inconcevable d'imaginer ce second algorithme dans le rôle d'un compresseur de texte.

Toutefois, il existe aujourd'hui des outils informatiques qui regroupent plusieurs algorithmes de compression. C'est par exemple le cas des programmes Windows populaires tels que WinRar ou WinZip qui compressent presque tous les types de fichiers et les conditionnent dans une archive.

Fonctionnement de la décompression des données

Après la compression des données, la récupération des informations nécessite l'application d'un processus de décompression. Pour retrouver les données dans leur forme d'origine, on utilise généralement le même programme de compression. Cependant, on lance le processus dans le sens inverse. Le programme de décompression est donc en mesure de détecter toutes les références préalablement effectuées dans le fichier codé. Il les remplace alors par leurs informations d'origine correspondantes.

Quelles sont les différentes méthodes de compression de données

Il existe deux méthodes de compression des données, à savoir : la compression avec ou sans perte de donnée. La compression sans perte de données est la plus efficace. Elle permet de restaurer un fichier compressé dans son état d'origine sans perdre le moindre bit de données lors de la décompression. C'est cette méthode de compression que l'on utilise souvent pour réduire la taille des fichiers comme :

  • Les documents textes ;
  • Les fichiers exécutables ;
  • Les feuilles de calcul…

Dans ces types de fichiers, la perte d'un chiffre ou d'un mot pourrait altérer l'information. Cependant, certains fichiers comme les images et les vidéos admettent la perte des données. Cette perte a peu d'incidence sur l'affichage du contenu. On peut donc leur appliquer la compression avec perte qui supprime les bits de données redondantes de façon définitive.

En somme, la compression des données permet de diminuer la taille des fichiers. On s'en sert pour gagner de l'espace de stockage et pour faciliter la transmission des données. Il existe aujourd'hui plusieurs outils qui facilitent la réalisation de cette opération.

Partager cet article :

Nous utilisons les cookies pour personnaliser le contenu et analyser notre trafic. Veuillez décider quel type de cookies vous êtes prêt à accepter.