Chinois/Saisie du chinois en utilisant la méthode Cangjie

Il existe différents types de méthodes pour saisir des sinogrammes sur un ordinateur :

  • méthodes phonétiques :
    • saisie du pinyin sur un clavier alphabétique ; il faut alors choisir le caractère correspondant dans une liste qui s'affiche
  • méthodes graphiques :
    • tracé du caractères à l'aide de la souris ou d'un pad tactile ; on peut être approximatif tant que le caractère est identifiable.
    • utilisation d'un code décomposant le caractère en éléments plus simples.
Les caractères utilisés pour écrire « la méthode Cangjie » (倉頡輸入法, cāngxié shūrù fǎ) décomposés en utilisant la dite méthode.

La méthode Cangjie (倉頡輸入法, cāngxié shūrù fǎ) est une des méthodes graphiques permettant de saisir des sinogrammes.

Racines

modifier
 
Clavier de la méthode Cangjie.

Les racines sont réparties sur 24 touches du clavier, complétées par 2 touches auxiliaires. Toutes les lettres de l'alphabet sont donc utilisées.

Groupe Touche Nom Formes associées Exemples
Philosophique A 日 soleil       
B 月 lune              
C 金 or          
D 木 bois           
E 水 eau           
F 火 feu              
G 土 terre        
Traits H 竹 bambou           
I 戈 arme          
J 十 dix       
K 大 grand           
L 中 milieu            
M 一 un              
N 弓 arc               
Anatomie O 人 personne              
P 心 cœur                
Q 手 main            
R 口 bouche     
Formes de caractères S 尸 cadavre                 
T 廿 vingt                 
U 山 montagne             
V 女 femme               
W 田 champ          
Y 卜 divination           

Règles de décomposition

modifier

Contrairement à l'ordre des traits dans les sinogrammes, la méthode Cangjie suit des règles proches mais légèrement différentes pour composer ses codes :

Direction de décomposition

modifier
  • de gauche à droite ;
  • de haut en bas ;
  • de l'extérieur vers l'intérieur.

Nombre de composants

modifier
  • pour les caractères composés d’1 élément où toutes les parties sont connectées, utiliser 4 codes (pas un de plus = omettre si nécessaire) : la première forme, la deuxième, la troisième et la dernière ;
  • pour les caractères composés de 2 sous-éléments, par exemple 你 :
    • utiliser le premier et le dernier code de la première forme ;
    • utiliser le premier, le deuxième et le dernier code de la seconde forme.
  • pour les caractères composés d’au moins 3 éléments, par exemple 謝 :
    • utiliser le premier et le dernier code de la première forme ;
    • utiliser le premier et le dernier code de la deuxième forme ;
    • utiliser le dernier code de la dernière forme.

La règle est appliquée même dans le cas où la première forme est plus compliquée que la seconde : 墜 弓人土 (NOG) et non 弓中人土 (NLOG)

Principes

modifier

Afin qu'il n'y ait qu'une décomposition possible pour chaque caractère, chaque code Cangjie est soumis à certains principes :

Concision (精簡)

modifier

Si deux décompositions sont possibles, la décomposition la plus courte est la bonne ;

Exhaustivité (完整)

modifier

Si deux décompositions de même longueur sont possibles, celle qui identifie des formes plus complexes est la décomposition correcte ;

Reflet de la forme des caractères (字型特徵)

modifier

Il faut éviter si possible d'utiliser le même code deux fois, et le caractère ne devrait pas être découpé au niveau des angles ;

Omission de codes (省略

modifier
  • Omission partielle (部分省略) : lorsque le nombre de codes de la décomposition complète dépasse le nombre autorisé de codes, les codes en trop sont ignorés ;
  • Omission des formes encloses (包含省略) : quand une partie du caractère à décomposer est incluse dans un autre, seule la forme extérieure est décomposée ; les formes encloses sont omises.

De même, le caractère 啇 (YCBR 卜金月口) donne les composés :

  • 摘 QYCB 手卜金月 et non QYCBR 手卜金月口
  • 滴 EYCB 水卜金月 et non EYCBR 水卜金月口
  • 謫 YRYCB 卜口卜金月 et non YRYCR 卜口卜金月口
  • 適 YYCB 卜手卜金月 et non YYCBR 卜手卜金月口

Le caractère 覽 est décomposé par 尸田月山山 (SWBUU).

Exceptions

modifier

Certains caractères sont considérés comme étant composé d'un « extérieur » et d'un « intérieur ».

Ainsi :

  • 巾 s'écrit avec LB (中月) et non BL (月中)
  • 末 s'écrit DJ (木十) et non JD (十木) qui est le code de 未

Mais pourtant : 吏 s'écrit JLK (十中乂) et non KKR (大大口)

 : 尸大口 (SKR) et non 尸手口.

 : 月尸木 (BSD) et non pas 月中弓.

 : 竹木廿 (HDT)

Sinogramme Schéma de la décomposition Décomposition figée et arbitraire
Version 2 Version 3 Version 5
  日 弓 (AN)
  月 山 (BU)
  竹 戈 (HI) 竹 戈 (HI) or HUI
竹 山 (HU) 竹 弓 (HN)
Caractères similaires à   卜 口 月 . . (YRB..) 卜 弓 月 . . (YNB..)
  卜 心 (YP)
  卜 口 (YR) 卜 女 口 (YVR)
  人 土 (OG)
  人 山 (OU) 人 弓 (ON) 人 一 弓 (OMN)
  女 戈 (VI)
  中 弓 (LN)
  弓 中 (NL)
  口卜尸水 (RYSE) 口尸尸水 (RSSE)

Certaines formes ne peuvent pas être décomposées et sont représentées par X, représentant la racine 難 (difficile).

Sinogramme Forme Décomposition fixée (version 5)
  HX
48px HXYC
48px HXBC
48px HXBT
Sous-élément de   LXH
  YX
  TXC
鹿   IXP
  HXH
  RXU
  NXU
  IXF
  IXE
𣶒   LXL
  LX

À ne pas confondre

modifier

Point(s)

modifier
  •  : la partie centrale ressemble à 罒, ce qui donnerait DWL (木田中) ou DWT (木田廿), mais c'est DWF (木田火)
  •  : 弓戈 (NI)
  •  : ressemble à CD 金木 mais il s'agit de 火木 (FD)
  •  : 人戈弓 (OIN) bien que le 3e trait puisse ressembler à 一 dans certaines polices.
  •  : 人戈弓戈 (OINI) bien que le 4e trait puisse ressembler à 中 dans certaines polices.
  •  : 十廿金卜 (JTCY)
  •  : 中一山人 (LMUO)
  •  : 人一田日 (OMWA)
  •  : 尸戈月廿 (SIBT) ou 尸一月廿 (SMBT)
  •  : 尸戈一 (SIM)
  •  : 火月口田 (FBRW)

U (山) ou P (心)

modifier
  •  : 心木 (PD)
  •  : 心心 (PP)
  •  : 口山 (RU)
  •  : 尸山 (SU) bien que que l'on ait envie d'écrire 心尸 (PS)
  •  : 心山 (PU)
  •  : 十山 (JU)
  •  : 山竹 (UH)
  •  : 人心 (OP)

Angles : V (女) ou S (尸) ou D (木)

modifier
  •  : 口尸尸水 (RSSE)
  •  : 一女木竹 (MVDH)
  •  : 中中一中(LLML) ou 中中一弓 (LLMN)
  •  : 女中一 (VLM)
  •  : 竹竹十 (HHJ)
  •  : 一木一 (MDM)
  •  : 木一口手 (DMRQ)
  •  : 廿一一女 (TMMV)
  •  : Quand il y a 3 barres horizontales, il s'agit de QJ (手十).
  •  : 一中中一 (MLLM)
  •  : 口女心 (RVP)
  •  : 十廿金卜 (JTCY)
  •  : 中一卜卜卜 (LMYYY) 中一尸卜 (LMSY)
  •  : 月尸木 (BSD) et non pas 月手弓 (BQN)

Crochets : N (弓) ou S (尸) ou P (心)

modifier
  •  : 大尸 (KS)
  •  : 尸竹 (SH)
  •  : 尸中 (SL)
  • : 弓中 (NL)
  •  : 卜竹尸 (YHS)
  •  : 一尸竹人 (MSHO)
  •  : 廿心竹人 (TPHO) bien que les premiers traits soient parfois représentés comme 人 dans certaines polices et les textes anciens.
  •  : 尸戈一 (SIM)
  •  : 弓竹尸 (NHS)
  •  : 竹弓水 (HNE) bien que 几 apparaisse sans son crochet dans les composés.
  •  : 弓竹水 (NHE) bien qu'il puisse sembler disjoint dans certaines polices.
  •  : 心竹竹 (PHH) mais  : 日一尸竹 (AMSH)
  •  : 人弓一大 (ONMK)

Boîtes

modifier
  •  : 月廿 (BT)
  •  : 廿月金 (TBC)
  •  : 十一中金 (JMLC) même si on serait tenté de mettre W 田.
  •  : BU (月山)
  •  : 月一 (BM)

H (竹) ou O (人) ou K (大)

modifier
  •  : 人大 (OK)
  •  : 人大 (OK)
  •  : 竹十木 (HJD)
  •  : 人一 (OM)
  •  : 竹尸 (HS) ou 人尸 (OS) en 5e génération
  •  : 竹女戈人 (HVIO)
  •  : 廿人弓人 (TONO)
  •  : 水廿中人 (ETLO)

Les inclassables

modifier
  •  : 大心月中月 (KPBLB)
  •  : 廿人戈日女 (TOIAV)
  •  : 戈一尸中中 (IMSLL)
  •  : 金大一土金 (CKMGC)
  •  : 竹月廿人 (HBTO) en Cangjie 3
  •  : forme un bloc unique : 戈戈戈竹 (IIIH), et non pas 戈戈人竹竹 (IIOHH)
  •  : 一一月月心 (MMBBP)
  •  : 金尸竹金 (CSHC), et non pas 金竹月山金 (CHBUC)
  •  : 尸大 (SK), et non pas 中 (L)
  •  : 女戈竹戈 (VIHI)
  •  : 卜月中月 (YBLB)
  •  : 中月大 (LBK)

Éléments de tête

modifier

Radicaux problématiques

modifier

Ces radicaux présent dans de nombreux caractères constituent les deux premiers codes d'un grand nombre de caractères.

Radical Dans un sinogramme composé
VI quand il est isolé mais I (戈) dans des composés. Comme dans : = IB (戈月) ; LI (中戈)

 : 女女竹 (VVH)

OI (人戈)
KI (大戈) avec 戈 considéré comme à l'intérieur de K, parfois IK dans certains caractères.
ou IF (戈火)
L (中)
KH (大竹) mais 豕 = MSHO (一尸竹人)
BH (月竹)
M (一)
𧾷 RM (口一)
NO (弓人)
partie haute du caractère 祭 BO (月人)
FQ (火手)
𡗗 QK (手大)
MB (一月)
WL (田中)
MW (一田)
JK (十大)
KD (大木) mais parfois KC (大金) en Cangjie 3.
HY (竹卜)
SH (尸竹) mais étrangement NH (弓竹) dans 剪 (廿月弓竹) alors que dans d'autres composés, il reste SH (尸竹)
Même si le caractère isolé s'écrit 弓金 (NC), sa forme est représentée par 火 (F).
Même si le caractère isolé s'écrit 口尸尸水 (RSSE), dans les composés, il est écrit 口卜水 (RYE)
Même si le caractère isolé (麻) s'écrit 戈木木 (IDD), les composés comme 麾 commencent par 戈金 (IC) en Cangjie 5.

Attention aux modernisations

modifier

Certains caractères ont des formes alternatives que l'on retrouve dans certains ouvrages anciens. Le code associé à de tels caractères correspond à la forme moderne.

  • Ainsi, le caractère écrit est codifié par 心日戈山 (PAIU) qui est aussi celui du caractère .
  •  : clairement CR (金口), mais dans le caractère 船, il est représenté par 几 dans certains affichages.
  • , qui ressemble à BMM 月一一 mais il s'agit de A 日 :
  • , dont la partie basse ressemble à 王 (MG 一土) mais il s'écrit 壬 (HG 竹土)
  • , dont la partie basse ressemble à 火 (F) mais il s'écrit avec 木 (D)
  • , dont le centre ressemble à 中 (L) mais il s'écrit 月 (B)
  • , dont la partie supérieure est dérivée de 敖 (土尸人大 GSOK), d'où 土大火 (GKF)
  • , la partie de gauche peut ressembler à 一[尸]口 (M[S]O) mais il faut bien utiliser HROK (竹口人大)

Ponctuation

modifier

Version 3

modifier
ZXAA  (espace idéographique) ZXAB ZXAC
ZXAD ZXAE ZXAF
ZXAG ZXAH ZXAI
ZXAJ ZXAK ︰(deux-points « vertical ») ZXAL

Sources

modifier