« Les ASCII de 0 à 127/Avant l'ASCII » : différence entre les versions
Contenu supprimé Contenu ajouté
Création de la partie "Historique" Pour y regrouper plusieurs parties |
→Évolutions vers un jeu de caractères codés universel : Correction du paragraphe sur les variantes de l'ISO 8859, reformulation de ceraines parties (clarification) |
||
Ligne 60 :
La norme [[Unicode]] 1.0 voit le jour, mais est en partie incompatible avec la première version de l’ISO 10646, ce qui freine finalement le développement (d’autant que le Consortium Unicode convient rapidement que plus d’un plan sera finalement nécessaire, en observant les travaux de codification des sinogrammes faits par un comité technique spécifique [[UniHan]]). Différentes solutions sont envisagées et [[UTF-16]] est expérimenté (mais pas encore standardisé par Unicode, ni approuvé dans la norme ISO/IEC 10646), tandis qu’apparaissent d’autres difficultés techniques d’interopérabilité avec [[UTF-32]] (donc le développement initial a lui aussi connu plusieurs variantes) et [[UTF-8]] (l’ISO/IEC 10646 en normalise une variante légèrement différente de celle définie par le standard Unicode !).
De leur côté, les systèmes d'exploitation et logiciels pour PC ou Mac ne sont pas encore prêts à supporter des jeux de caractères codés sur plusieurs octets, et d’autres variantes de l’ISO 8859 voient le jour, par exemple l’[[ISO 8859-15|ISO/IEC 8859-14]] (nécessaire pour les langues celtiques dont l’irlandais, une des langues officielles de l‘Union européennes), l’[[ISO 8859-15|ISO/IEC 8859-15]]
Ce sera la dernière partie ajoutée à l’ISO 8859, l’ISO estimant que les besoins pour les autres langues étaient déjà couverts par les autres normes nationales ([[ISCII]] en Inde, [[VISCII]] au Viet Nâm, [[GB2312]] en Chine, [[EUC-JP]] au Japon, etc...) et préférant se consacrer au développement du jeu de caractères universel plutôt que
La norme ISO 10646 qui définit le jeu de caractères universel (conjointement avec le standard Unicode lui ajoutant des propriétés facilitant le traitement) a largement réussi son ambition de coder la majorité des systèmes d’écriture utilisés dans le monde (il reste encore à encoder quelques écritures complexes ou mal connues), et conserve son ambition de couvrir toutes les écritures utilisées dans l’histoire de l’humanité (donc y compris les écritures anciennes, ou des caractères rares dans des écritures déjà encodées, ou de nouveaux caractères qui apparaîtraient dans l’usage courant dans certains pays du monde ou qui seraient rendus nécessaires pour certains traitements afin de lever des ambiguïtes).
Le répertoire universel (d’ISO 10646-1 et Unicode) contenait en fin 2009 environ 100 000 caractères (dont plus de la moitié pour les seuls sinogrammes), chacun possédant un unique code entier compris entre 0 et 10FFFF en [[hexadécimal]]
== Jeux de caractères codés populaires, par pays ==
|