« Compression de données/Codage entropique » : différence entre les versions

Contenu supprimé Contenu ajouté
Aucun résumé des modifications
Ligne 11 :
 
{{Théorème|Définition|Un '''code de source C''' pour une variable aléatoire <math>X</math> de [[distribution de probabilité]] <math>p</math>, est une application de <math>\Omega</math> vers l'ensemble des chaînes de symboles d'un alphabet D-aire <math>A</math>.}}
L'ensemble des chaînes non nulles de symboles d'un alphabet D-aire <math>A</math> est noté <math>A^+</math>. En général, cet alphabet est binaire et on a <math>D=2</math>, <math>A=\{0,1\}</math>. <math>A^+</math> est alors l'ensemble des chaînes de caractères de taille finie formées de 0 et de 1, <math>A^+=\{0, 1, 00, 01, 10, 11, 000, \ldots\}</math>. Un code associe à un symbole de source <math>x</math> un mot de code <math>C(x)</math>. Ce mot de code est de longueur variable <math>l(x)</math>, la longueur étant son nombre de [[bit]]s. Ces codes sont appelés '''codes à longueur variable'''.
 
L'espérance de la longueur d'un code <math>C</math> (ou longueur moyenne, selon la loi de probabilité de X) est donnée par: