« À la découverte d'Unicode/La notion de caractère » : différence entre les versions

Contenu supprimé Contenu ajouté
orthotypo
Ligne 1 :
{{À la découverte d'Unicode}}
 
[[Fichier:Garamond type fi-ligature 2.jpg|vignette|200px|Caractère de la police [[Garamond (police typographique)|Garamond]] en 12 [[Point Didot|points]] formant la [[Ligature (typographie)|ligature]] du s (s long) et du i]]
[[Image:Metal movable type.jpg|vignette|200px|Caractères en plomb dans une [[Casse (typographie)|casse]] avec le composteur posé sur le dessus.]]
[[Image:DidotSP.svg|vignette|200px|Caractère typographique [[Firmin Didot|Didot]].]]
 
Si de primprime abord, la '''notion de caractère''' peut sembler évidente et triviale, vouloir la considérer dans son universalité l'est moins. On s'en rend compte en se questionnant sur l'écriture.
 
==l'écriture==
L'écriture existe depuis environ 5 000 ans. Elle est apparue pour la première fois en Égypte (environ en 3300 av. J.-C.) et en Mésopotamie (environ en 3500 av. J.-C.). Pour la première fois, en 2400 av. J.-C., les Égyptiens écrivirent sur des papyrus. Le premier véritable alphabet naquit en 1400 av. J.-C. Au {{-s-|III|e}}, il y eut l'alphabet latin de 19 lettres, l'ancêtre de l'alphabet européen, qui fit son apparition.
 
La tradition veut que les caractères chinois aient été inventés par {{chinois|court=oui|t=倉頡|s=仓颉|p=[[Cang Jie]]}} (c. 2750 {{av. JC}}). Ses compositions étaient fondées sur l’observation de la nature. Une autre tradition fait remonter l’invention des caractères à {{chinois|court=oui|c=伏羲|p=[[Fuxi]]}}, le légendaire premier empereur<ref>. D’après [[Édouard Chavannes]] &dash; dans son essai sur « La divination par l’écaille de tortue » &dash; les caractères chinois seraient inspirés des dessins, que l’on trouve sur plusieurs milliers de fragments d’écaille de tortue et d’os, retrouvés près de la ville de Ngan Yang dans le nord du [[Hunan]] en 1899. D’après lui, ces fragments seraient antérieurs au premier millénaire {{av. JC}}. À l’origine, il semblerait que ces fragments servaient à la divination et aux augures. Les gouvernants s’en servaient pour régir leur destin et celui de leur peuple.</ref>.
 
Les sinogrammes connurent plusieurs formes. Leur forme actuelle, Kǎishū, remonte à la dynastie des Han.
 
Un '''texte''' est une succession de caractères organisée selon une langue.
 
==Le dessin du caractère==
En typographie, le ''caractère'' est, la petite pièce fondue, généralement en plomb, dont l’empreinte forme la lettre ou le signe qui permet d’imprimer des textes sur du papier. Un caractère alphabétique peut s'appeler simplement « [[Lettre (écriture)|lettre]]<ref>Comme dans « peintre en lettre »</ref> ».
 
La typographie avec ses caractères mobiles et réutilisables débute avec l’invention de l’imprimerie au {{s-|VII|e}} et s’achève avec l’avènement de la photocomposition dans les années 1970<ref>[http://www.worldlingo.com/ma/enwiki/fr/Phototypesetting Photocomposition]</ref>.
 
Un jeu de caractères typographiques cohérents porte aussi le nom de fonte de caractères ou police de caractères.
Ligne 31 :
 
==Questions de définition==
(:''où l'on parle de ligature, de diacritiques, de casse, et d'ordre alphabétique).''
 
Si à la lecture de textes latins et anglais la notion de caractères peut sembler simple. Lorsque l'on pose les notions de ligatures et de diactriques, la question se corse quelque peu.
 
Si les lettres e et o sont des caractères, la ligature œ formée par le positionnement de l'e dans l'o constitue-elle un caractère, ou bien deux ? De même la présence d'un accent sur la lettre e fait-elle de cette dernière un caractère différent, l'accent lui-même est-il un caractères ?
 
Toute lettre dispose-elle d'une graphie capitale et d'un graphie minuscule ? Si oui, cette graphie est-elle unique ?
 
La notion de caractère est-elle liée à la notion d'alphabet ? Si oui comment ? et qu'est ce que cela induit sur les algorithmes de tri informatique ?
 
Comment savoir si deux chaînes de caractères représentent le même texte ?
 
A toutes ces questions, Unicode apporte des réponses, tantôt issues d'un hérirtagehéritage, tantôt issues de compromis ou de situations de fait.
 
Cet ouvrage tente d'apporter les principales réponses à ces questions.
Ligne 49 :
==Unité de code et point de code==
 
Parce qu'il est plus complet et plus complexe, l'approche d'Unicode nécessite un vocabulaire précisant certaines notions très techniques absentes des autres codages de caractères. Ces notions sont reprises dans le glossaire en fin d'ouvrage ( [[../Glossaire/]] ).
 
Toutefois elles sont tellement fondamentales dans la compréhension d'Unicode qu'il est indispensable de les comprendre dès le début.
 
Unicode définit notamment les notions suivantes :
 
* Unité de code
Ligne 81 :
 
==Notes de bas de page==
<references/>
 
{{Modèle:Relire}}