« La documentation/Langages documentaires à structure combinatoire, thésaurus » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 1 :
{{Techniques documentaires}}
 
 
== Historique ==
 
L'apparition des thésaurus est plus récente que celle des classifications et correspond à deux constats : les classifications ont des possibilités limitées par leur structure même, et par ailleurs le développement de l'informatique rend désormais possible les manipulations automatisées et combinatoires du langage.
 
Bien que l'on puisse parfaitement utiliser les thésaurus de manière non automatisée, ceux-ci doivent aujourd'hui être conçus en vue de leur exploitation par un logiciel documentaire, de façon à permettre leur intégration dans les systèmes automatisés.
 
== Définition ==
 
Selon l'Association Française de Normalisation (AFNOR), un thésaurus est « un langage documentaire fondé sur une structuration hiérarchisée d'un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d'une ou plusieurs langues naturelles et les relations entre les notions par des signes conventionnels. »
Par sa fonction, un thésaurus transpose en langage documentaire standardisé le langage naturel utilisé dans les documents. Par sa structure, c'est un dictionnaire de termes dotés de relations sémantiques, génériques ou hiérarchiques relevant d'un domaine particulier de la connaissance (sémantique : relatif à la signification, au sens).
 
Nous verrons par la suite que certaines classifications, comme la Classification Décimale Universelle, peuvent être utilisées en tant que thésaurus.
 
Par sa fonction, un thésaurus transpose donc en langage documentaire standardisé le langage naturel utilisé dans les documents. Par sa structure, c'est un dictionnaire de termes dotés de relations sémantiques, génériques ou hiérarchiques relevant d'un domaine particulier de la connaissance (sémantique : relatif à la signification, au sens).
 
Généralement, l'indexeur et l'interrogateur ne parlent pas le même langage. Le thésaurus fournit la liaison indispensable entre leurs vocabulaires. On élimine en particulier la '''synonymie''' (plusieurs termes pour un même concept, par exemple chose = machin = truc = objet = bidule = engin = fourbi = zinzin...!) et la '''polysémie''' (plusieurs sens pour un même mot, par exemple « fraise » : outil rotatif - fruit - collerette plissée et empesée du 16e siècle - membrane qui enveloppe les intestins du veau ou de l'agneau - couleur rouge - angiome - chair rouge et plissée sous le bec du dindon - pieu protégeant les piles des ponts - élément de fortification - ... ou encore trombine de celui qui la ramène quand il ferait mieux de la boucler !).
 
Ne pas confondre la polysémie avec l'homonymie, qui concerne des mots de même prononciation mais de sens différents (par exemple : ceint, sein, saint, sain, seing). On connaît le gag classique du sot qui, sur son cheval, portaittransportait le sceau du roi dans un seau. Lorsque le cheval, effrayé, fit un saut tous les ??? se retrouvèrent par terre !
 
== Règles de choix des descripteurs ==