« Compression de données/Introduction » : différence entre les versions

Contenu supprimé Contenu ajouté
imported>5afd4770411ca76c
(:Julien:) (discussion | contributions)
m On peut compresser un fichier généré aléatoirement, mais pas tous. On peut aussi compresser 2 fois un fichier : le tx entropique n'est pas forcément atteint dès la première compression (et en utilisant dtf on peut utiliser 2 logiciels).
Ligne 1 :
La '''compression de données''' ou '''codage de source''' est l'opération [[informatique]] qui consiste à transformer une suite de bits A en une suite de bits B plus courte, contenant les mêmes informations, en utilisant un [[algorithme]] particulier. Il s'agit d'une opération de [[codage]], c'est-à-dire changer la représentation de l'information, dans le but de rendre la représentation compressée plus courte que la représentation originale. La ''décompression'' est l'opération inverse de la compression.
 
Avec un algorithme de compression '''sans perte''', la suite de bits obtenue après les opérations successives de compression et de décompression est strictement identique à l'originale. Les algorithmes de compression sans perte sont utilisés pour de nombreux types de données notamment des documents, des [[Archive (informatique)|archives]], des [[fichier exécutable|fichiers exécutable]] ou des [[fichier texte|fichiers texte]].
Ligne 17 :
L'information à compresser est vue comme la sortie d'une source de symboles qui produit des textes finis selon certaines règles. Le but est de réduire la taille moyenne des textes obtenus après la compression tout en ayant la possibilité de retrouver exactement le message d'origine (on trouve aussi la dénomination ''codage de source'' en opposition au ''codage de canal'' qui désigne le codage correcteur d'erreurs).
 
Il n'existe pas de technique de [[compression de données universelle|compression de données sans perte universelle]], qui pourrait compresser n'importe quel fichier : si une technique sans perte compresse au moins un fichier, alors elle en « grossit » également au moins un. Il est ainsi impossible de compresser un fichier dont le contenu aurait été [[Générateur de nombres aléatoires|généré aléatoirement]], cas qui reste cependant assez rare pour une utilisation courante.
 
De même, il n'est pas possible de compresser deux fois de suite un même fichier. En effet, celui-ci prend une [[Théorie du chaos|structure chaotique]], donc incompressible, après sa première compression si celle si a été correctement effectuée.
 
Les formats de fichier de compression sans perte sont connus grâce à l'extension ajoutée à la fin du nom de fichier (« ''nomdefichier''.'''zip''' » par exemple), d'où leur dénomination très abrégée. Les formats les plus courants sont :