« Les ASCII de 0 à 127/Avant l'ASCII » : différence entre les versions

Contenu supprimé Contenu ajouté
Création de la partie "Historique" Pour y regrouper plusieurs parties
→‎Évolutions vers un jeu de caractères codés universel : Correction du paragraphe sur les variantes de l'ISO 8859, reformulation de ceraines parties (clarification)
Ligne 60 :
La norme [[Unicode]] 1.0 voit le jour, mais est en partie incompatible avec la première version de l’ISO 10646, ce qui freine finalement le développement (d’autant que le Consortium Unicode convient rapidement que plus d’un plan sera finalement nécessaire, en observant les travaux de codification des sinogrammes faits par un comité technique spécifique [[UniHan]]). Différentes solutions sont envisagées et [[UTF-16]] est expérimenté (mais pas encore standardisé par Unicode, ni approuvé dans la norme ISO/IEC 10646), tandis qu’apparaissent d’autres difficultés techniques d’interopérabilité avec [[UTF-32]] (donc le développement initial a lui aussi connu plusieurs variantes) et [[UTF-8]] (l’ISO/IEC 10646 en normalise une variante légèrement différente de celle définie par le standard Unicode !).
 
De leur côté, les systèmes d'exploitation et logiciels pour PC ou Mac ne sont pas encore prêts à supporter des jeux de caractères codés sur plusieurs octets, et d’autres variantes de l’ISO 8859 voient le jour, par exemple l’[[ISO 8859-15|ISO/IEC 8859-14]] (nécessaire pour les langues celtiques dont l’irlandais, une des langues officielles de l‘Union européennes), l’[[ISO 8859-15|ISO/IEC 8859-15]] introduit(introduisant en 1998 pour ajouter le symbole [[Euro (symbole)|€]] de l’[[euro]] qui allait devenir la monnaie unique d’une douzaine de pays de l’[[Union européenne]]), et l’[[ISO 8859-15|ISO/IEC 8859-16]] introduit(palliant pourl'absence pallier desde caractères nécessaires à la transcription correcte du [[roumain]]. Ce devait être la dernière variante, maisà une dernière variante [[ISO/IEC 8859-16]] sera créée en constatant qu’unesavoir des langues officielles d’un futur membre de l’Union européenne (le roumain) ne pouvait pas être correctement transcrite avec [[ISO 8859-15|ISO/IEC 8859-15]] car il y manquait quelques caractères utilisant une virgule souscrite et non une cédille).
 
Ce sera la dernière partie ajoutée à l’ISO 8859, l’ISO estimant que les besoins pour les autres langues étaient déjà couverts par les autres normes nationales ([[ISCII]] en Inde, [[VISCII]] au Viet Nâm, [[GB2312]] en Chine, [[EUC-JP]] au Japon, etc...) et préférant se consacrer au développement du jeu de caractères universel plutôt que ded'en définir de nouveaux jeux de caractères, codés sur 7 ou 8 bits et complètement incompatibles avec des jeux de caractèresceux déjà largement déployés et utilisés dans ces pays, les autres pays ayant déjà décidé d’adopter pour leurs langues directement le jeu universel de caractères codés. Cet abandon sera d’autant plus facilité que les normes ISO 10646 et Unicode ont rapidement décidé de fusionner leurs répertoires et y sont parvenusparvenues rapidement en produisant une mise à jour majeure pour [[Unicode]] 1.1 (rendant obsolète la version 1.0 du standard Unicode incompatible, mais en intégrant la forme de codage UTF-16 en tant que partie intégrante de son standard) et ISO 10646-1 (compatible avec ISO 10646, mais en abandonnant l’idée de supporter à l’avenir plus de 17 plans, et en acceptant d’intégrer et normaliser UTF-16), et en créant des procédures permettant aux deux comités techniques de collaborer et assurer leur coordination. De plus les systèmes d’exploitation, logiciels, polices de caractères et protocoles pour l’Internet ont également évolué pour accepter nativement le jeu universel.
 
La norme ISO 10646 qui définit le jeu de caractères universel (conjointement avec le standard Unicode lui ajoutant des propriétés facilitant le traitement) a largement réussi son ambition de coder la majorité des systèmes d’écriture utilisés dans le monde (il reste encore à encoder quelques écritures complexes ou mal connues), et conserve son ambition de couvrir toutes les écritures utilisées dans l’histoire de l’humanité (donc y compris les écritures anciennes, ou des caractères rares dans des écritures déjà encodées, ou de nouveaux caractères qui apparaîtraient dans l’usage courant dans certains pays du monde ou qui seraient rendus nécessaires pour certains traitements afin de lever des ambiguïtes).
 
Le répertoire universel (d’ISO 10646-1 et Unicode) contenait en fin 2009 environ 100 000 caractères (dont plus de la moitié pour les seuls sinogrammes), chacun possédant un unique code entier compris entre 0 et 10FFFF en [[hexadécimal]] 10FFFF (soit un peu plus de 1,1 million - il existe donc des entiers auxquels aucun caractère n'est associé). Deux autres répertoires fréquemment utilisés, les jeux de caractères codés [[ASCII]] (ISO 646, dans sa dernière variante américaine normalisée en 1984) et [[ISO 8859-1]], sont respectivement identiques aux 128 et 256 premiers caractères codés dans ce répertoire universel.
 
== Jeux de caractères codés populaires, par pays ==