En Unicode, la collation est différente d'une mise dans un ordre particulier.

Cette page est considérée comme une ébauche à compléter . Si vous possédez quelques connaissances sur le sujet, vous pouvez les partager en éditant dès à présent cette page (en cliquant sur le lien « modifier »).

Ressources suggérées : Aucune (vous pouvez indiquer les ressources que vous suggérez qui pourraient aider d'autres personnes à compléter cette page dans le paramètre « ressources » du modèle? engendrant ce cadre)

Un algorithme a été défini par le consortium Unicode pour trier un texte en fonction de paramètres régionaux : il s'agit de l'Unicode Collation Algorithm[1] [2].

La langue française par exemple peut présenter des particularités[3].

En perl, il est possible d'ordonner un texte sur la base de l' Unicode Collation Algorithm (UCA). Pour cela, il faut recourir au module CPAN Unicode::Collate .

 use Unicode::Collate;
 my $col  = Unicode::Collate->new();
 my @list = $col->sort(@old_list);

En prenant en compte les paramètres régionaux allemands :

from PyICU import Collator, Locale

collator = Collator.createInstance(Locale('de'))
sorted = sorted(unsorted, cmp=collator.compare)

Références

modifier
  1. Technical standard : www.unicode.org/reports/tr10/
  2. Réponse aux questions fréquentes : www.unicode.org/faq/collation.html
  3. (anglais) Unicode Collation Case Study: Sorting French Topic Lists