« La documentation/Langages documentaires à structure combinatoire, thésaurus » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 50 :
 
Il s'agit de tous les mots utilisés dans le langage courant pour former des phrases mais qui, contrairement aux non-descripteurs, n'ont aucune signification propre : le, la, du, ou, un, une, par, etc. Ces mots peuvent faire partie d'un '''anti-dictionnaire''' ou dictionnaire de mots vides. Attention là encore à la synonymie et à la polysémie. La préposition ''vers'' peut être considérée comme un mot vide mais il n'en est pas de même des ''vers'' intestinaux ou des ''vers'' de Victor Hugo.
 
=== Concevoir un langage univoque et post-coordonné ===
 
Il ne suffit pas de décomposer toutes les notions en expressions simples pour permettre l'interrogation des corpus de données. Dans l'immense majorité des documents disponibles, les notions élémentaires sont associées de diverses manières et de différents points de vue, c'est pourquoi les aspects combinatoires prennent ici une importance considérable.
 
Ainsi, par exemple, un article de périodique concernant « les collections de cartes postales photographiques anciennes » conduira à utiliser des croisements de descripteurs tels que :
:* CARTE POSTALE (l'objet de la collection)
:* HISTOIRE DE LA PHOTOGRAPHIE (point de vue du temps pendant lequel l'objet a existé)
:* COLLECTION D'OBJETS (activité particulière)
:* et le cas échéant d'autres descripteurs permettant d'affiner la recherche, par exemple de la restreindre aux cartes françaises, aux photographies érotiques, etc. ; il faut bien entendu supposer, ce que nous faisons ici, que les descripteurs en question figurent bien dans le thésaurus utilisé pour l'indexation, faute de quoi on peut légitimement supposer que le corpus interrogé ne possède aucun document relatif au sujet recherché.
 
Cet aspect combinatoire correspond bien entendu aux opérateurs booléens classiques ET, OU, SAUF,... et il s'agit bien d'une '''post'''-coordination qui permet de relier les éléments d'une indexation préalable.
 
== Règles de choix des descripteurs ==