« Les ASCII de 0 à 127/Avant l'ASCII » : différence entre les versions

Contenu supprimé Contenu ajouté
→‎Évolutions vers un jeu de caractères codés universel : Correction du paragraphe sur les variantes de l'ISO 8859, reformulation de ceraines parties (clarification)
m CEI
Ligne 37 :
Le premier codage largement répandu fut l'[[ASCII]]. Pour des raisons historiques (les grandes sociétés associées pour mettre au point l'ASCII étaient américaines) et techniques (7 bits disponibles seulement pour coder un caractère), ce codage ne prenait en compte que 2<sup>7</sup> soit 128 caractères. De ce fait, l'ASCII ne comporte pas les [[Diacritique|caractères accentués]], les [[cédille]]s, etc. utilisés par des langues comme le [[français]]. Ceci devint vite inadapté et un certain nombre de méthodes ad-hoc furent utilisées d’abord pour le modifier. Ainsi sont apparues des variantes multiples du codage ASCII, adaptées à des langues ou groupes de langues limités.
 
Pour mettre fin à leur profilération, l'[[organisation internationale de normalisation|ISO]] a d’abord créé la norme [[ISO 646|ISO/IECCEI 646]] formalisant un code normalisé sur 7 bits, où des positions ont été désignées comme invariantes, et quelques unes étaient autorisées à désigner d'autres caractères. Ce système a vite eu ses limites, car il n’était adapté qu'à un petit nombre de langues à écriture latine, et il y manquait de trop nombreux caractères, et ne permettait pas de représenter les écritures non latines.
 
Différentes solutions ont été envisagées : d’abord définir un système permettant de modifier dynamiquement le jeu de caractère codé utilisé ou le groupe de caractères utilisé dans une écriture complexe. ce système a pu fonctionner pour conserver la compatibilité avec les systèmes de communication restreints à 7 bits, et a donné lieu aux standards comme le [[Videotex]] ou les premiers systèmes de [[Télétexte]], et reprenait en fait l’idée déjà en place pour les [[télex]].
Ligne 49 :
L’[[Union des républiques socialistes soviétiques|Union soviétique]] quant à elle, n’a pas accès officiellement aux systèmes d’exploitation développés essentiellement aux [[États-Unis d'Amérique|États-Unis]] en raison de l’embargo technologique à la fin de la [[Guerre froide]] (et donc pas aux discussions et décisions liées à leur développement) et développe sa propre norme [[KOI8-R]] pour l’écriture cyrillique en russe, et parvient à l'imposer en [[Bulgarie]] et en ex-[[Yougoslavie]] pour l’écriture cyrillique du serbo-croate, ainsi que dans d’autres pays utilisant cette écriture. Pour l’Ukraine elle crée une variante [[KOI8-U]] destinée à la langue ukrainienne, au départ utilisés sur les systèmes gouvernementaux bien avant que les PC s’imposent chez les particuliers. Ces jeux de caractères codés auront finalement (et ont encore) plus de succès que les pages de codes pour DOS développées par IBM et Microsoft, même dans les pays non soumis à l’embargo américain et qui commencent à utiliser aussi les PC d’IBM et MS-DOS, ou les jeux de caractères cyrilliques utilisés sur les premiers Macintosh d’Apple (souvent encore trop chers pour ces marchés).
 
Face à ce désordre qui nuisait à l'interopérabilité, l’ISO a développé une norme mieux étudiée, la norme [[ISO 8859|ISO/IECCEI 8859]], selon les principes des pages de code DOS mais cette fois compatible avec [[ISO 646]] et [[ISO 2022]], mais là encore avec de multiples variantes, adaptées à des groupes de langue plus étendus qu'avec les pages de code pour PC. Une de ces variantes la plus connue est la page de code [[ISO 8859-1|ISO/IECCEI 8859-1]], développée sur la base du jeu de caractères MCS de DEC qui lui-même était basé sur la variante américaine (ASCII) du jeu ISO 646 normalisé mais seulement pour les langues européennes occidentales (le jeu dit « latin-1 »), les autres variantes étant créées de façon à réutiliser si possible les mêmes positions pour des caractères identiques ou proches lexicographiquement (cela n’a pas toujours été vrai pour toutes les variantes latines [[ISO 8859-2|ISO/IECCEI 8859-2]], etc. jusqu'à [[ISO 8859-13|ISO/IECCEI 8859-13]]), y compris pour d’autres écritures à alphabet simples (grec, cyrillique, arabe, thaï).
 
Windows intégrera cependant la norme [[ISO 8859]] en abandonnant les caractères de contrôle supplémentaires codés au delà des 128 premiers caractères ASCII (non nécessaires sous Windows qui abandonne au départ toute idée d'interopérabilité avec [[EBCDIC]]), pour y coder quelques autres signes de ponctuation ou lettres manquantes dans certains des volets de la norme ISO 8859 (puis en ajouter quelques autres, notamment le symbole de l’euro en 1998), réduisant ainsi le nombre de variantes nécessaires (notamment pour l’écriture latine).