« À la découverte d'Unicode/Unicode : institutions et versions » : différence entre les versions

Contenu supprimé Contenu ajouté
Style + Les anglophones pourront trouver des compléments d'information dans la spécification officielle disponible sur ce site.
Restructuration
Ligne 4 :
Le site web Unicode présente tout cela de manière très technique et en langue anglaise. Ce livre se veut plus pratique dans la mesure où il s'adresse à un public francophone. Les anglophones pourront trouver des compléments d'information dans la spécification officielle disponible sur ce site.
 
==ISO/CEILes 10646institutions==
 
===[[Wikipedia:Organisation internationale de normalisation]] (ISO)===
La norme '''ISO/CEI 10646''', intitulée '''Technologies de l'information — Jeu universel de caractères codés (JUC)''', tente de définir un système de [[codage]] universel pour tous les [[Système d'écriture|systèmes d’écriture]]. Cette norme est le fondement du standard [[Unicode]].
 
{{...}}
La [[Wikipedia:Normes et standards industriels|norme]] internationale '''[[Wikipedia:Organisation internationale de normalisation|ISO]]/[[Wikipedia:Commission électrotechnique internationale|CEI]] 10646''' définit le '''jeu universel de caractères''' (JUC), (en anglais '''Universal Character Set''' (UCS)) comme un jeu de caractères abstrait. Chaque caractère abstrait est identifié par un nom unique (un nom unique en [[anglais]] et un nom unique en [[français]]) et associé à un nombre entier naturel positif appelé son '''point de code''' (ou ''position de code'').
écrire ici quelques lignes à partir es informations de Wikipedia, en indiquant le rapport avec unicode.
 
Elle est à l'initiative de la norme '''ISO/CEI 10646''', intitulée '''Technologies de l'information — Jeu universel de caractères codés (JUC)''',
Environ {{formatnum:110000}} caractères (symboles, lettres, nombres, idéogrammes, logogrammes) issus de [[langues]], systèmes d’écriture, traditions du monde entier sont recensés dans le JUC. De nouveaux caractères provenant d’écritures plus rares ou plus anciennes, ou encore de systèmes nouveaux, sont fréquemment ajoutés ou mis à jour dans le JUC.
 
===[[Wikipedia:Commission électrotechnique internationale]] (CEI)==
Depuis [[1991]], le [[Consortium Unicode]] collabore avec l’ISO pour développer le ''[[Unicode|Standard Unicode]]'' (« Unicode ») et la norme '''ISO/CEI 10646'''.
Les répertoires, noms de caractères, et points de code de la Version 2.0 d’Unicode correspondent exactement à ceux de la norme '''ISO/CEI 10646-1:1993'''<ref>ISO/CEI 10646-1:1993: ''Technologies de l'information — Jeu universel de caractères codés à plusieurs octets — Partie 1: Architecture et table multilingue''</ref> avec ses sept premiers amendements publiés.
Chaque publication d’une nouvelle version d’Unicode donne ensuite lieu à une mise à jour de la norme, c’est-à-dire l’adjonction de nouveaux caractères et la mise à jour de ceux déjà présents.
Par exemple, la publication d’Unicode 3.0 en février 2000 correspond à la norme '''ISO/CEI 10646-1:2000'''. Voir la section [[#Relation avec Unicode|Relation avec Unicode]] pour plus de détails.
 
{{...}}
Le JUC comprend plus d’1,1 million de points de code, mais seuls les {{formatnum:65536}} premiers (le '''[[Table des caractères Unicode (0000-FFFF)|Plan Multilingue de Base]]''', ou PMB) ont été vulgarisés avant 2000. Cette situation commença à changer quand la [[République populaire de Chine|Chine populaire]] (RPC) légiféra en 2000 que les systèmes informatiques vendus sur son territoire devaient supporter le [[GB 18030]], ce qui nécessitait que les systèmes informatiques mis à la vente dans la RPC utilisent des caractères au-delà du PMB.
écrire ici quelques lignes à partir es informations de Wikipedia, en indiquant le rapport avec unicode.
 
Elle est à l'initiative de la norme '''ISO/CEI 10646''', intitulée '''Technologies de l'information — Jeu universel de caractères codés (JUC)''',
Le système laisse délibérément beaucoup de points de code non assignés à des caractères, même dans le PMB. Cela permet de ménager des extensions futures ou de minimiser les conflits avec d’autres codages.
 
===Le '''Consortium Unicode''' ===
 
==Le '''Consortium Unicode''' ==
Le '''Consortium Unicode''' est une organisation privée sans but lucratif qui coordonne le développement du standard Unicode. Elle a pour objectif ambitieux de succéder à terme aux codages de caractères pré-existants.
 
Ligne 31 ⟶ 30 :
Le consortium est aussi le bureau d’enregistrement officiel de quelques [[normes ISO]] relatives à ce domaine, telle que la norme [[Wikipedia:ISO 15924|ISO/CEI 15924]].
 
Le consortium Unicode est décrit plus en détail sur son site web ainsi que sur le site Wikipedia.
=== Lien externe ===
* [http://www.unicode.org Le Consortium Unicode]
 
 
== Normes et versions ==
==Les standards ==
 
===ISO/CEI 10646===
 
La norme '''ISO/CEI 10646''', intitulée '''Technologies de l'information — Jeu universel de caractères codés (JUC)''', tente de définir un système de [[codage]] universel pour tous les [[Système d'écriture|systèmes d’écriture]]. Cette norme est le fondement du standard [[Unicode]].
 
La [[Wikipedia:Normes et standards industriels|norme]] internationale '''[[WikipediaWikipedvia:Organisation internationale de normalisation|ISO]]/[[Wikipedia:Commission électrotechnique internationale|CEI]] 10646''' définit le '''jeu universel de caractères''' (JUC), (en anglais '''Universal Character Set''' (UCS)) comme un jeu de caractères abstrait. Chaque caractère abstrait est identifié par un nom unique (un nom unique en [[anglais]] et un nom unique en [[français]]) et associé à un nombre entier naturel positif appelé son '''point de code''' (ou ''position de code'').
 
Environ {{formatnum:110000}} caractères (symboles, lettres, nombres, idéogrammes, logogrammes) issus de [[langues]], systèmes d’écriture, traditions du monde entier sont recensés dans le JUC. De nouveaux caractères provenant d’écritures plus rares ou plus anciennes, ou encore de systèmes nouveaux, sont fréquemment ajoutés ou mis à jour dans le JUC.
 
Depuis [[1991]], le [[Consortium Unicode]] collabore avec l’ISO pour développer le ''[[Unicode|Standard Unicode]]'' (« Unicode ») et la norme '''ISO/CEI 10646'''.
Les répertoires, noms de caractères, et points de code de la Version 2.0 d’Unicode correspondent exactement à ceux de la norme '''ISO/CEI 10646-1:1993'''<ref>ISO/CEI 10646-1:1993: ''Technologies de l'information — Jeu universel de caractères codés à plusieurs octets — Partie 1: Architecture et table multilingue''</ref> avec ses sept premiers amendements publiés.
Chaque publication d’une nouvelle version d’Unicode donne ensuite lieu à une mise à jour de la norme, c’est-à-dire l’adjonction de nouveaux caractères et la mise à jour de ceux déjà présents.
Par exemple, la publication d’Unicode 3.0 en février 2000 correspond à la norme '''ISO/CEI 10646-1:2000'''. Voir la section [[#Relation avec Unicode|Relation avec Unicode]] pour plus de détails.
 
Le JUC comprend plus d’1,1 million de points de code, mais seuls les {{formatnum:65536}} premiers (le '''[[Table des caractères Unicode (0000-FFFF)|Plan Multilingue de Base]]''', ou PMB) ont été vulgarisés avant 2000. Cette situation commença à changer quand la [[République populaire de Chine|Chine populaire]] (RPC) légiféra en 2000 que les systèmes informatiques vendus sur son territoire devaient supporter le [[GB 18030]], ce qui nécessitait que les systèmes informatiques mis à la vente dans la RPC utilisent des caractères au-delà du PMB.
 
Le système laisse délibérément beaucoup de points de code non assignés à des caractères, même dans le PMB. Cela permet de ménager des extensions futures ou de minimiser les conflits avec d’autres codages.
 
 
=== Normes et versions ===
Le travail sur Unicode est parallèle et synchronisé avec celui sur la norme [[ISO/CEI 10646]] dont les buts sont les mêmes. L’[[ISO/CEI 10646]], une norme internationale publiée en français et en anglais, ne précise cependant ni les règles de composition de caractères, ni les propriétés sémantiques des caractères.
 
Ligne 54 ⟶ 74 :
La version 5.0 a été publiée en {{date||juillet|2006}}, la version 5.2 en {{date||octobre|2009}}, la version 6.0 en {{date||février|2011}} et la version 6.1 le {{date|31|janvier|2012}}.
 
=== Les couches d’Unicode ===
Unicode est défini suivant un modèle en couches (Note technique Unicode #17<ref>[http://www.unicode.org/reports/tr17/ Unicode Technical Report #17: Unicode Character Encoding Model]</ref>). Les autres normes ne faisaient typiquement pas de distinction entre le jeu de caractères et la représentation physique. Les couches sont ici présentées en partant de la plus haute (la plus éloignée de la machine).