« À la découverte d'Unicode/Présentation du répertoire de caractères Unicode » : différence entre les versions

Contenu supprimé Contenu ajouté
résumé
Ligne 1 :
[[Unicode]] et la norme ISO/CEI 10646 vise à donner à tout caractère un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le [[logiciel]].
 
Unicode et la norme [[ISO/CEI 10646]] attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée ''point de code'', identifiée généralement sous la forme U+xxxx (où xxxx est un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF). La plage définie permet d'attribuer jusqu'à {{unité|1114112|points de code}}.
 
Unicode ayant été construit par blocs, ces blocs forment un partitionnement du jeu de caractères.
=== Partitionnement ===
En soi, la connaissance de ce partitionnement n'a pas une grande utilité, il est donné dans cette l'annexe [[/Plans/]] à titre purement informatif, pour donner une idée de l'étendue de l'Unicode.
 
Le partitionnement à jour peut être trouvé sur le site officiel d’Unicode. Cependant, vu le rôle important d’Unicode, (ISO 10646) on décrira ici les principaux blocs de caractères. Les noms français sont les noms officiels de l’ISO/CEI 10646, la norme internationale bilingue qui reprend les mêmes caractères qu’Unicode. Ils sont aussi officiels que les noms anglais.
 
L'ancienne norme Unicode 1.0 est obsolète et incompatible avec la norme ISO 10646 et la norme Unicode 1.1 et toutes ses versions ultérieures ; la principale incompatibilité est celle des blocs de caractères Hangul utilisés pour l’écriture de la langue coréenne qui ont changé de position et dont les anciens points de code ont depuis été assignés à d’autres blocs. La table ci-dessous est compatible avec ISO 10646 (toutes versions) et Unicode 1.1 (ou ultérieur).
Note : La casse des noms de bloc n’est pas normative. « Latin de base » est donc équivalent à « LATIN DE BASE ».
 
[[/Plans/]]