« À la découverte d'Unicode/La notion de caractère » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Unité de code et point de code : Ces notions sont reprises dans le glossaire en fin d'ouvrage. Toutefois elles sont tellement fondamentales dans la compréhension d'Unicode qu'il est indispensable de les comprendre dès le début.
Ligne 59 :
==Composition et équivalence de caractère==
Unicode contient de nombreux caractères. Pour maintenir la compatibilité avec des standards existants, certains d’entre eux sont équivalents à d’autres caractères ou à des séquences de caractères. Unicode fournit deux notions d’équivalence : canonique et de compatibilité, la première étant un sous-ensemble de la deuxième. Par exemple, le caractère n suivi du diacritique tilde ◌̃ est canoniquement équivalent et donc compatible au simple caractère Unicode ñ, tandis que la ligature typographique ff est seulement compatible avec la séquence de deux caractères f.
 
'''encoded characters'''
Le lien (ou les liens) entre un caractère abstrait et les représentations encodées.
Par exemple 0041 et 030A sont des formes encodées. A et Ȧ Å avant d'être affichés sont des abstractions. Elles peuvent être codées de différentes manières : 0041 et 030A, 00C5 ou 212B.
 
==Références==