« Compression de données/Introduction » : différence entre les versions
Contenu supprimé Contenu ajouté
→Compression sans perte : +KGB |
Aucun résumé des modifications |
||
Ligne 41 :
Sur les limites de la compression sans perte, voir [[Paradoxe du compresseur]].
===Codage
{{Article détaillé|run-length encoding}}▼
Les lettres '''RLE''' signifient ''run-length encoding''. Il s'agit d'un mode de compression parmi les plus simples : toute suite de bits ou de caractères identiques est remplacée par un couple (nombre d'occurrences ; bit ou caractère répété).▼
===Compression CCITT===
{{Article détaillé|compression CCITT}}
C'est une compression d'images utilisée pour le [[télécopieur|fax]]. Elle peut être de type RLE (on code les suites de [[pixel]]s blancs et de pixels noirs) et bidirectionnelle (on déduit une ligne de la précédente). Il existe plusieurs types de compressions ("groupe") suivant l'algorithme utilisé et le nombre de couleurs du document (monochrome, niveau de gris, couleur).▼
{{Article détaillé|codage de Huffman}}
L'idée qui préside au [[codage de Huffman]] est voisine de celle utilisée dans le [[code Morse]] : coder ce qui est fréquent sur peu de place, et coder en revanche sur des séquences plus longues ce qui revient rarement ([[Entropie de Shannon|entropie]]). En morse le « e », lettre très fréquente, était codé par un simple point, le plus bref de tous les signes.
L'originalité de [[David A. Huffman]] est qu'il fournit un ''procédé d'agrégation objectif'' permettant de constituer son code dès lors qu'on possède les statistiques d'utilisation de chaque caractère.
Le [[Macintosh]] d'[[Apple, Inc.|Apple]] codait les textes dans un système inspiré de Huffman : les 15 lettres les plus fréquentes (dans la langue utilisée) étaient codées sur 4 bits, et la 16{{e}} combinaison était un code d'échappement indiquant que la lettre était codée en [[Code_ASCII|ASCII]] sur les 8 bits suivants. Ce système permettait une compression des textes voisine en moyenne de 30 % à une époque où la mémoire était extrêmement chère par rapport aux prix actuels (compter un facteur 1000).
▲===Codage RLE===
▲{{Article détaillé|run-length encoding}}
▲Les lettres '''RLE''' signifient ''run-length encoding''. Il s'agit d'un mode de compression parmi les plus simples : toute suite de bits ou de caractères identiques est remplacée par un couple (nombre d'occurrences ; bit ou caractère répété).
=== Lempel-Ziv-Welch (LZW) ===
Ligne 63 ⟶ 67 :
Il s'agit d'un mode de réorganisation des données et non un mode de compression. Il est principalement destiné à faciliter la compression de texte en langue naturelle, mais il est également utilisable pour compresser n'importe quelles données binaires. Cette transformation, qui est complètement réversible, effectue un tri sur toutes les rotations du texte source, ce qui tend à regrouper les caractères identiques ensemble en sortie, ce qui fait qu'une compression simple appliquée aux données produites permet souvent une compression très efficace.
===
{{Article détaillé|
Le codage arithmétique est assez similaire au codage de Huffman en ceci qu'il associe aux motifs les plus fréquents les codes les plus courts ([[Entropie de Shannon|entropie]]).
▲C'est une compression d'images utilisée pour le [[télécopieur|fax]]. Elle peut être de type RLE (on code les suites de [[pixel]]s blancs et de pixels noirs) et bidirectionnelle (on déduit une ligne de la précédente). Il existe plusieurs types de compressions ("groupe") suivant l'algorithme utilisé et le nombre de couleurs du document (monochrome, niveau de gris, couleur).
Contrairement au codage de Huffman qui produit au mieux des codes de 1 bit, le codage arithmétique peut produire des codes vides. Le taux de compression obtenu est par conséquent meilleur.
== Compression avec pertes ==
Ligne 139 ⟶ 144 :
*[http://www.compressionmax.fr Comparaison des logiciels de compressions de données sans perte.]
*[http://rlwpx.free.fr/WPFF/comploc.htm Comparatif de méthodes de compression de données]
*[http://cs.fit.edu/~mmahoney/compression Compression arithmétique (en anglais)]
{{Portail informatique}}
|